Le webscraping, mythes et réalités

Le webscraping, mythes et réalités

Intervenant : Thomas Delclite, Direction générale de la statistique, Belgique

 

Le webscraping, ou extraction de données, s’est imposé depuis plusieurs années comme méthode de création de bases de données pour les sciences humaines et sociales. En effet, l’usage massif d’Internet dans tous les domaines, la programmation simplifiée et le faible coût de la méthode poussent les chercheures et chercheuses à s’approprier les outils de webscraping. Néanmoins, il ne faudrait pas voir le webscraping comme LA solution à tous les problèmes, et il s’agit avant tout de comprendre son fonctionnement pour ensuite lister les opportunités et les limites pour la recherche. Cette intervention vise à présenter ce qu’est le webscraping en théorie et en pratique à partir d’exemples simples. Nous discuterons des opportunités de cette méthode pour créer des bases de données originales, mais aussi des limites et risques de son utilisation, tant pour la réplicabilité que pour la généralisation des résultats.

 

La séance a lieu sur Zoom, à l’adresse suivante : https://univ-grenoble-alpes-fr.zoom.us/j/93026820476?pwd=Y2FTK2pVQnJDVGV5M2ZFeG1HRzRCUT09


Cycle de séminaire : 
Ouvert à tous