Corpus web et archives scientifiques

logo-inatheque
Ateliers du dépôt légal du Web à l’Ina

Saison 5 – séance 5

De plus en plus structurées, formatées et interopérables, les données de la recherche contribuent elles-mêmes au développement du web des données. Mais qu’en est-il de leur préservation sur le long terme ? Comment conserver les archives scientifiques quand elles intègrent des corpus multimédias ou issus du Web ? Comment garantir les conditions d’un retour à la source dans le cadre de corpus issus du web  constitués spécifiquement pour des projets de recherche ?
Quel sont les outils, les plateformes, les projets qui concourent à partager et diffuser les fonds d’archives scientifiques et, inversement, à archiver les contenus en ligne quand ils sont constitués en objets d’étude ?
Dans quelle mesure les techniques et les politiques d’archivage du web peuvent-elles compléter ou interférer avec celles de l’archivage scientifique ? Y a-t-il une concurrence entre les acteurs, ou les plateformes sont-elles au contraire appelées à s’articuler en exploitant les nouvelles possibilités de partage et les nouvelles manières de construire des corpus ?

Avec :
Elifsu Sabuncu (@squintar), chercheuse en santé publique et épidémiologie, auteur du blog Penser/Classer et cofondatrice avec Antoine Blanchard de 2E LABO, agence de conseil pour le monde de la recherche (valorisation et visibilité) ;
Stéphane Pouyllau (@spouyllau), ingénieur de recherche au CNRS, spécialisé en informatisation des données de la recherche en sciences humaines et sociales. Co-concepteur de MédiHAL et ancien co-directeur d’ISIDORE, il est actuellement directeur-adjoint technique de la TGIR Huma-Num ;
Paul Girard (@paulanomalie), responsable du médialab de Sciences Po et Benjamin Ooghe Tabanou, ingénieur au médialab de Sciences Po. Également cofondateur de l’association Regards Citoyens qui cherche à faire comprendre le institutions politiques en redistribuant des corpus de données liés à l’activité du Parlement.

vendredi 13 juin 2014 – 14h30-17h30
Ina, Centre Pierre Sabbagh, Paris

Prise de notes collective (pad)

Visiter le blog des Ateliers DL Web

Vers un Web temporel ?

logo-IIPC
Constituer des corpus pour la recherche contemporaine :
d
e l’archivage du web à son analyse

À la lumière des perceptions successives de l’instabilité numérique, on comprend que la « mémoire du Web » a longtemps été pensée avec des références spatiales. Procédant en surface (tout le .fr à un instant t) ou en carottage (tous les sites se rapportant à un événement), les stratégies de collecte ont d’abord reconduit une conception classique du corpus comme stabilisation et circonscription d’un terrain. Dès lors que les contenus en ligne sont envisagés comme des redocumentarisations incessantes, en revanche, le Web comme son archive deviennent temporels.

Conférence du consortium international pour la préservation de l’internet (IIPC)

19 mai 2014
Bibliothèque nationale de France, Paris

logo-pdfProgramme de la journée

logo-pdfAbstract de l’intervention

Captation vidéo (à partir de 4’50 ») [nécessite Flash]

IIPC-Merzeau

Compte rendu par Valérie Schafer et Camille Paloque-Berges sur le blog Binaire

• Interview

Visiter le site de la conférence

Dépôt légal du web : archiver l’instable

logo-cnrs
Histoire des sciences, histoire de l’innovation : circulations, communications et civilisations matérielles en Europe (XVIIIe-XXe s)


Le but du séminaire est de proposer une réflexion approfondie sur l’histoire de la circulation des sciences et des innovations en Europe, ainsi que sur l’histoire des civilisations matérielles que cette circulation transforme.

Intervention avec Claude Mussou, chef du service du Dépôt légal du web à l’Ina

mardi 4 mars 2014 – 17h30-19h30
ISSC, 20 rue Berbier-du-Mets, 75013 Paris

Consulter le carnet du séminaire

Web archivé et transmédia

logo-inatheque
Ateliers du dépôt légal du Web à l’Ina

Saison 5 – séance 3

De quoi le transmédia est-il le nom ? Tendance qui monte, expérience du tout support, extension des domaines du storytelling… c’est en tout cas l’invention d’une grammaire et d’une grammatisation des contenus liées aux technologies du numérique et aux usages qui en découlent.
Dans ses dimensions narrative, contributive ou documentaire, le transmédia interroge à nouveau frais le principe de convergence et brouille les  frontières entre contenus et programmes, utilisateurs et producteurs, œuvre de fiction et information, création et documentarisation… Alors qu’on parle désormais de Datatainment, il rebat les cartes entre les producteurs/diffuseurs de (meta)données, redéfinit le statut et les contours du document, élargit les horizons de la documentation… et a fortiori de l’archivage.
Que faut-il archiver du Web quand celui-ci se donne comme expérience transmédiatique ?

Avec :
Mélanie Bourdaa, Maître de conférence à l’Université Bordeaux3 Michel de Montaigne et membre du laboratoire MICA.

• Jean-Yves de Lepinay, directeur des programmes au Forum des images et organisateur du MashUp Film Festival.

• Danièle Sartori et Nicolas Bouy, chargés de mission à la Direction des études et de la prospective au CSA.

Manuel Zacklad, Professeur au Cnam et directeur du laboratoire Dicen-IDF.

vendredi 14 mars 2014 – 14h30-18h
Ina, Centre Pierre Sabbagh,
83-85 rue de Patay 75013 Paris

Mot-dièse #aidlw

Prise de notes collective (pad)

Visiter le blog des Ateliers DL Web

Cartographies de communautés

logo-inatheque
Ateliers du dépôt légal du Web à l’Ina

Saison 5 – séance 2

Les technologies du web 2.0 ont permis l’émergence d’une culture participative et  la construction  concomitante de communautés  et réseaux qui témoignent du développement de nouvelles  pratiques sociales d’échanges et interactions. Comment se constituent ou évoluent ces groupes, autour de qui ou de quels sujets sont-ils organisés ? Ces questions trouvent en partie réponse grâce aux outils de représentation, modélisation et cartographie issus de la théorie des réseaux et appliqués aux relations sociales en ligne.  Ils constituent des outils heuristiques de première importance  pour l’analyse de corpus issus du web.

Avec :

  • Sabrina Marchandise, doctorante en géographie à l’Université Montpellier III.
  • Jérôme Thièvre, Docteur en informatique et ingénieur R&D au DL web de l’Ina
  • Bernhard Rieder , professeur associé de l’université d’Amsterdam.
  • Christophe Prieur, Maître de conférence à l’Université Paris 7

vendredi 7 février 2014 – 14h30-17h30
Ina, Centre Pierre Sabbagh,
83-85 rue de Patay 75013 Paris

Pour suivre l’atelier sur Twitter : mot-dièse : #aidlw

Visiter le blog des Ateliers DL Web