Nouvelles données et nouveaux modèles
La science des données révolutionne la manière dont la recherche scientifique est menée, transformant non seulement les outils méthodologiques mais aussi les cadres théoriques à travers lesquels nous analysons les phénomènes.
Qu’est-ce que la science des données ?
Comment impacte-t-elle la recherche scientifique ?
La science des données est un domaine multidisciplinaire qui combine des techniques mathématiques, d’informatique et l’expertise au sein d’un domaine.
Les connaissances du domaine d’expertise (fintech, santétech, etc.) servent à collecter les données pertinentes dans le domaine.
Ces données sont numériques et sont souvent définies en deux groupes:
La combinaison entre la nouvelle puissance de calcul et les nouvelles données numériques a permis l’émergence de nouvelles méthodes en science des données.
Nous pouvons faire deux choses:
La science des données introduit des méthodologies novatrices qui dépassent les approches traditionnelles de recherche.
Utilisation des réseaux de neurones pour identifier des structures dans les données économiques ou linguistiques.
Quels sont les avantages de l’approche par apprentissage automatique?
Pour synthétiser:
Les données structurées sont des données tabulaires, des bases de données, des données spatiales, etc.
On peut maintenant utiliser ces nouvelles méthodes sur des données structurées.
Exemples:
On peut maintenant utiliser ces nouvelles méthodes sur des données non-structurées.
Exemples:
Frackmap est un exemple de combinaison de données structurées et non-structurées.
Objectif: comprendre l’impact des puits de gaz de schiste sur les communautés locales
Objectif : Identifier les relations entre les acteurs d’un réseau social.
Méthodes : Analyse des réseaux sociaux, détection de communautés, etc.
Applications : 43 499 directeurs de CA de banques
Objectif : Analyser des textes et des langages humains.
Méthodes : Analyse de sentiments, classification de textes, résumé automatique, etc.
Applications : 3.8 millions de tweets sur les élections présidentielles nigériennes.
Objectif : Analyser des images et des vidéos.
Méthodes : Reconnaissance d’images, détection d’objets, etc.
Applications : Haïti
Objectif : Analyser des données temporelles.
Méthodes : Modèles ARIMA, modèles LSTM, etc.
Applications : Prévisions économiques, etc.
La science des données modifie non seulement les méthodes d’investigation, mais aussi les fondements épistémologiques de la recherche scientifique.
Un des avantages cruciaux de la science des données est la capacité à reproduire et à valider les résultats.
Problèmes abordés :
Bien que prometteuse, la science des données pose aussi des défis éthiques et sociétaux :
La science des données représente un changement de paradigme dans la manière dont nous menons la recherche scientifique. Elle offre des outils puissants pour analyser des quantités massives de données, tout en posant des questions épistémologiques et éthiques importantes.
N’hésitez pas à partager vos réflexions et poser vos questions sur l’impact de la science des données dans vos propres recherches.
METH60018A - HEC Montréal