class: center, middle, inverse, title-slide # Séquence 3 : Science des données et recherche ### Thierry Warin, PhD --- <style> .col2 { columns: 2 200px; /* number of columns and width in pixels*/ -webkit-columns: 2 200px; /* chrome, safari */ -moz-columns: 2 200px; /* firefox */ } </style> --- ## Questions - Méthodes quantitatives, science des données et recherche en affaires internationales --- ## Table des matières 1. Exemples de recherche fondée sur des données structurées 2. Exemples de recherche fondée sur des données non-structurées --- # Projets de recherche utilisant la science des données --- ## 1. Exemples de recherche fondées sur des données structurées --- ### Données structurées Organisation industrielle / Politique monétaire <div class="col2"> <img src="./figures/fig5.png" width="300px" style="display: block; margin: auto;" /> <ul> <li>RQ : Comment détecter les différences systématiques de dispersion des prix entre les secteurs ? Quelles sont les raisons de ces différences ?</li> <li>Méthodologie : Économétrie, Web Scraping </li> <li>Catégorie : Prévisions immédiates, Inflation, Dispersion des prix</li> <li>L'effet Wow : A partir de millions de prix sur 30'000 produits, mesures en temps réel de l'épaisseur du marché et de la valeur de l'information</li> <li>Littérature:</li> - "Are Online and Offline Prices Similar? Evidence from Large Multi-Channel Retailers", Alberto Cavallo, American Economic Review, January 2017, Vol 107 (1) - "The Noisy Monopolist: Imperfect Information, Price Dispersion and Price Discrimination", Steven Salop, Review of Economic Studies, 1977, vol. 44, issue 3, 393-406 </ul> </div> --- ### Données structurées Finance <div class="col2"> <img src="./figures/fig6.png" width="400px" style="display: block; margin: auto;" /> <ul> <li>RQ : Développer des solutions à faible coût pour les investisseurs de la classe moyenne</li> <li>Méthodologie : Monte Carlo, réseaux bayésiens</li> <li>Partenaires auteurs et institutions : CIRANO, HEC Montréal, AMF (Régulateur des marchés financiers)</li> <li>L'effet Wow : Utilisation de robots pour fournir une allocation de portefeuille dynamique et sur mesure à chaque client au lieu d'un profil de risque générique</li> <li>Catégorie : Portefeuille des risques</li> </ul> </div> --- ### Données structurées Finance <div class="col2"> <img src="./figures/fig7.png" width="400px" style="display: block; margin: auto;" /> <ul> <li>RQ : En utilisant les conseils d'administration comme proxy pour les pipelines de connaissances entre les entreprises financières, comment peut-on représenter le risque systémique dans l'industrie financière ? </li> <li>Méthodologie : Analyse de réseau</li> <li>Partenaires auteurs et institutions : CIRANO, HEC Montréal, AMF (Régulateur des marchés financiers)</li> <li>The Wow Effect : 43.499 directeurs ; 2.209 sociétés financières ; 52 pays peuvent être visualisés pour révéler les liens sociaux entre les pays</li> <li>Catégorie : Risque systémique, Industrie financière, Gouvernance</li> <li>Littérature:</li> - Kogut, B. et Colomer, J. (2012) "Is there a global small world of owners and directors", in Kogut, B. (Ed.) : The Small Worlds of Corporate Governance, pp.259-299, The MIT Press, Cambridge. </ul> </div> --- ### Données structurées Intégration économique <div class="col2"> <img src="./figures/fig8.png" width="300px" style="display: block; margin: auto;" /> <ul> <li>Peut-on observer une dynamique de spécialisation régionale - ou de convergence - en Europe à travers le cycle de vie des clusters ? <li>L'effet Wow : +5M de données de clusters collectées ; 553'007 observations européennes utilisées (67 clusters, 279 régions, 36 pays, 20 ans, 6 indicateurs) ; plus de 10'000 cartes créées ; dynamique de spécialisation régionale dans les économies développées (Europe occidentale) ; dynamique de convergence dans les économies en développement (Europe orientale) en raison d'un effet de rattrapage </li> <li>Catégorie : Intégration régionale, Clusters, Convergence, Economie géographique, Science des données</li> <li>Littérature:</li> - Sala-i-Martin, Xavier. 1996a. “Regional Cohesion: Evidence and Theories of Regional Growth and Convergence.” European Economic Review 40:1325-1352. </ul> </div> --- ## 2. Exemple de recherche fondées sur des données non-structurées --- ### Données non structurées Sciences politiques <div class="col2"> <img src="./figures/fig9.png" width="400px" style="display: block; margin: auto;" /> <ul> <li>RQ : Dans les pays où les institutions n'ont pas le plus haut niveau de normes, pouvons-nous utiliser les médias sociaux pour recueillir des informations sur une élection à venir ? <li>Méthodologie : Econométrie, Text mining, 3,8 millions de tweets</li> <li>The Wow Effect : 2 jours avant l'élection, un changement dans la dynamique électorale a été remarqué, qui à la fin anticipait les résultats de l'élection</li> <li>Catégorie : Risque politique</li> <li>Littérature:</li> - KHEMANI, S. (2015): “Buying Votes vs. Supplying Public Services: Political Incentives to Under-Invest in Pro-Poor Policies,” Journal of Development Economics, 117, 84–93. </ul> </div> --- ### Données non structurées Sciences politiques <div class="col2"> <img src="./figures/fig10.png" width="500px" style="display: block; margin: auto;" /> <ul> <li>RQ : Bien qu'il ait été troisième en termes d'intention de vote au début de la campagne, Justin Trudeau a remporté une victoire majoritaire. Lors des élections générales de 2015 au Canada, comment chaque dirigeant politique a-t-il été perçu ? <li>Méthodologie : Apprentissage non supervisé, Analyse des médias sociaux, Linguistique</li> <li>L'effet Wow : Les scandales au début de la campagne ont duré un mois et ont été constamment associés au candidat sortant</li> <li>Catégorie : Risque politique, Risque de réputation</li> <li>Qu'en est-il de la réputation des entreprises ? </ul> </div> --- ### Données non structurées Migrations <div class="col2"> <img src="./figures/fig11.png" width="400px" style="display: block; margin: auto;" /> <ul> <li>RQ : Cartographier la conversation en Europe sur la crise des réfugiés.</li> <li>Méthodologie : Systèmes d'information géographique, analyse de textes, analyse des médias sociaux</li> <li>Partenaires auteurs et institutions : Jeffry Frieden, Université de Harvard, SKEMA Business School</li> <li>L'effet Wow : Possibilité d'ajouter une dimension spatiale aux conversations (données non structurées), ainsi que de les combiner avec des données traditionnelles telles que le nombre de réfugiés, le pays d'origine ou l'itinéraire de destination.</li> <li>Littérature:</li> - "Measuring the Reliability of Hate Speech Annotations: The Case of the European Refugee Crisis", Ross, Michael Rist, Guillermo Carbonell, Benjamin Cabrera, Nils Kurowsky, Michael Wojatzki, Arxiv, 2017. </ul> </div> --- ### Données non structurées Politique monétaire <div class="col2"> <img src="./figures/fig12.png" width="450px" style="display: block; margin: auto;" /> <ul> <li>Quelle est la réaction de la Banque centrale européenne et de ses présidents aux événements survenus dans la zone euro ? <li>Méthodologie : Linguistique, analyse de textes, LDA</li> <li>L'effet Wow : Guerre et paix + La richesse des nations</li> <li>Catégorie : Communication des institutions, Europe, Banque centrale</li> <li>Littérature:</li> - Amaya, J.-Y. Filbien "The similarity of ECB׳s communication" Social Science Research Network, Rochester, NY (2015) </ul> </div> --- ### Données non structurées Commerce international <div class="col2"> <img src="./figures/fig13.png" width="400px" style="display: block; margin: auto;" /> <ul> <li>RQ : Régionalisation ou mondialisation ? <li>Méthodologie : Analyse de contenu, analyse de réseau, regroupement</li> <li>L'effet Wow : Tous les accords commerciaux ATP entre pays</li> <li>Catégorie : Commerce international</li> </ul> </div> --- ### Données non structurées Innovation <div class="col2"> <img src="./figures/fig14.png" width="350px" style="display: block; margin: auto;" /> <ul> <li>RQ : Comment évaluer si les innovations de l'industrie pharmaceutique chinoise diffèrent des innovations d'autres pays en termes de nature et de valeur des brevets ? <li>Méthodologie : Analyse de texte, apprentissage non supervisé, LDA</li> <li>L'effet Wow : Plus de 100 000 brevets sont analysés pour révéler les entreprises et les institutions les plus importantes de l'industrie pharmaceutique en Chine, ainsi que la nature des brevets. </li> <li>Catégorie : Innovation, Marchés émergents</li> <li>Littérature:</li> - "Innovation assessment through patent analysis", BP Abraham, SD Moitra - Technovation, 2001) </ul> </div> --- ### Données non structurées Innovation <div class="col2"> <img src="./figures/fig15.png" width="400px" style="display: block; margin: auto;" /> <ul> <li>RQ : concernant l'intelligence artificielle, d'où vient l'innovation ? Quels sont les nouveaux développements dans une industrie perturbatrice ? <li>Méthodologie : Apprentissage non supervisé, LDA</li> <li>The Wow Effect : 55 109 brevets liés à l'IA ont été analysés ; de nouvelles tendances en matière d'intelligence informatique ont été révélées ; des entreprises de premier plan (IBM, Microsoft, Google) sont parmi les principaux contributeurs de brevets en matière d'IA</li> </ul> </div> --- ### Données non structurées GIS, drones et développement économique <div class="col2"> <img src="./figures/fig16.png" width="250px" style="display: block; margin: auto;" /> <ul> <li>Port-au-Prince, Spring 2018</li> </ul> </div> --- ### Données non structurées Projet Frackmap <div class="col2"> <img src="./figures/fig17.png" width="500px" style="display: block; margin: auto;" /> <br> <ul> <li>RQ : Dans les pays qui se lancent dans une industrie controversée en plein essor (fracturation), y a-t-il une résonance ou une dissonance entre la perception du risque par le public et l'état de la recherche universitaire ? <li>L'effet Wow : L'analyse de 60 000 tweets géo-localisés et (10 000 ; 600) d'articles évalués par des pairs a révélé une très grande acceptabilité malgré les préoccupations majeures de la communauté scientifique (sismicité, impacts sur la santé et l'environnement, santé au travail)</li> <li>Catégorie : Risques industriels, Perception du risque, Santé publique</li> </ul> </div>