Qu’est ce qu’un corpus web ?

logo-inatheque
Ateliers du dépôt légal du Web à l’Ina
(saison 6, atelier 3)

Notion centrale de la recherche en SHS, le corpus voit ses contours redéfinis alors que les éléments qui le constituent sont aujourd’hui le plus souvent des contenus ou données issus du web. Quelles sont les possibilités offertes par le contexte numérique, pour constituer et traiter des corpus, les méthodes de recueil de données et d’observation en sont-elles modifiées ? La taille et la dimension de représentativité d’un corpus sont-elle revisitées quand les données accessibles s’inscrivent dans des flux et se mesurent en Giga ou Tera octets,  quelles unités retenir quand les données sont hétérogènes et  instables ? Quels sont les instruments à disposition du chercheur pour constituer, traiter et analyser ces corpus ?

Avec :

  • Nelly Quenemer, maître de conférence en sociologie des médias à la Sorbonne Nouvelle, et Anne-Sophie Béliard, docteur en sociologie des médias.
  • Raphaële Bertho, Maître de conférence  en information communication au laboratoire MICA de l’Université Bordeaux-Montaigne
  • Richard Walter Membre de l’équipe « Humanités numériques » de l’Institut des textes et manuscrits modernes (ITEM-CNRS).
  • Benjamin Ooghe-Tabanouingénieur au Medialab de Sciences Po

logo-dicenIDF-blanc1vendredi 17 avril 2015 de 14h30 à 17h30
Ina, Centre Pierre Sabbagh, Paris

Pad pour la prise de notes collective

Visiter le blog des Ateliers DL Web