Corpus web et archives scientifiques

logo-inatheque
Ateliers du dépôt légal du Web à l’Ina

Saison 5 – séance 5

De plus en plus structurées, formatées et interopérables, les données de la recherche contribuent elles-mêmes au développement du web des données. Mais qu’en est-il de leur préservation sur le long terme ? Comment conserver les archives scientifiques quand elles intègrent des corpus multimédias ou issus du Web ? Comment garantir les conditions d’un retour à la source dans le cadre de corpus issus du web  constitués spécifiquement pour des projets de recherche ?
Quel sont les outils, les plateformes, les projets qui concourent à partager et diffuser les fonds d’archives scientifiques et, inversement, à archiver les contenus en ligne quand ils sont constitués en objets d’étude ?
Dans quelle mesure les techniques et les politiques d’archivage du web peuvent-elles compléter ou interférer avec celles de l’archivage scientifique ? Y a-t-il une concurrence entre les acteurs, ou les plateformes sont-elles au contraire appelées à s’articuler en exploitant les nouvelles possibilités de partage et les nouvelles manières de construire des corpus ?

Avec :
Elifsu Sabuncu (@squintar), chercheuse en santé publique et épidémiologie, auteur du blog Penser/Classer et cofondatrice avec Antoine Blanchard de 2E LABO, agence de conseil pour le monde de la recherche (valorisation et visibilité) ;
Stéphane Pouyllau (@spouyllau), ingénieur de recherche au CNRS, spécialisé en informatisation des données de la recherche en sciences humaines et sociales. Co-concepteur de MédiHAL et ancien co-directeur d’ISIDORE, il est actuellement directeur-adjoint technique de la TGIR Huma-Num ;
Paul Girard (@paulanomalie), responsable du médialab de Sciences Po et Benjamin Ooghe Tabanou, ingénieur au médialab de Sciences Po. Également cofondateur de l’association Regards Citoyens qui cherche à faire comprendre le institutions politiques en redistribuant des corpus de données liés à l’activité du Parlement.

vendredi 13 juin 2014 – 14h30-17h30
Ina, Centre Pierre Sabbagh, Paris

Prise de notes collective (pad)

Visiter le blog des Ateliers DL Web