20 ans d’archives du web : retour sur les ateliers du Dépôt Légal du Web à l’Ina

logo-inatheque
Il était une fois dans le web : 20 ans d’archives de l’internet en France

Journée professionnelle organisée par la Bibliothèque nationale de France et l’Institut national de l’audiovisuel.

23 novembre 2016
BnF, Site François-Mitterrand, Petit auditorium – Paris

20ansdlweb

Présentation avec Claude Mussou du bilan des Ateliers du Dépôt légal du web à l’Ina et du travail d’éditorialisation du blog des ateliers réalisé avec Boris Blanckemane :

Consulter le programme de la journée sur le site de la BnF

Visiter le blog des ateliers

À quoi sert l’archivage du web ?
Interview enregistrée par l’Atelier des médias en parallèle de cette journée

Le web des années 1990

Parcours guidé dans les archives du web de la BnF

Si aujourd’hui Internet Archive peut s’enorgueillir de conserver 487 milliards de pages, son effort a été rejoint notamment par celui de bibliothèques nationales. Il y a dix ans, au sein d’un mouvement européen de plus en plus préoccupé par la conservation de ce patrimoine nativement numérique, reconnu par une charte de l’Unesco de 2003, la France se lançait officiellement à son tour. Dès le début des années 2000 elle s’est penchée sur la question, mais c’est en 2006, au sein de la loi DADVSI (loi relative au droit d’auteur et aux droits voisins dans la société de l’information), que la Bibliothèque nationale de France (BnF) et l’Institut national de l’audiovisuel (Ina) se voient officiellement confier la mission de préserver et conserver le Web « français » au titre du dépôt légal : à l’Ina revient l’archivage des sites et contenus médiatiques liés au monde de l’audiovisuel, le reste est confié à la BnF.

Bien sûr il ne s’agit pas d’un archivage exhaustif : les captures des sites sont plus ou moins profondes, parfois qu’à un ou deux clics de profondeur. En outre à des collectes très régulières (les sites de presse sont par exemple archivés quotidiennement par la BnF), répondent des collectes plus ponctuelles, « collectes dites larges » qui, à la BnF, concernent en 2016 une fois par an quatre millions et demi de sites enregistrés en France ou produits par des Français.

Consultables aujourd’hui à la Bibliothèque nationale de France mais aussi dans plusieurs bibliothèques en région, les archives du Web de la BnF et de l’Ina gardent les traces de nos activités en ligne dans des domaines variés – personnels, professionnels, politiques, sociaux, économiques. Déjà le monde académique s’en empare, à l’instar de notre équipe de recherche, Web90, qui travaille à analyser le patrimoine, les mémoires et l’histoire du Web des années 1990 en France.

Lire la suite

Consultez les parcours guidés dans les archives de l’internet de la BnF
Consultez le carnet de recherche du projet web90

 

 

De l’éditorialisation à l’éditorialisation

affiche-edito17
Séminaire Écritures numériques et éditorialisation
édition 2016-17 : L’éditorialisation, entre maîtrise et déprise

À partir des années 2000 les chercheurs commencent à utiliser le terme d’éditorialisation. En 2007, Bruno Bachimont en propose une définition précise, comme processus de redocumentarisation de ressources en contexte numérique, et la relie explicitement au contexte des pratiques documentaires, en particulier dans le domaine des archives audiovisuelles. Dix ans après, comment la notion s’est-elle enrichie ou déplacée ? En quoi le terme est-il encore opérationnel ? Son inscription dans l’univers de la documentation doit-elle être repensée ? Nous avons invité Bruno Bachimont à revenir avec nous sur cette histoire du mot et de l’idée d’éditorialisation, pour l’interroger sur ce qu’il appelle « l’économie de la variante à l’ère du numérique » et pour mieux circonscrire les chantiers qui restent à explorer.

Conférence de Bruno Bachimont, suivie d’une discussion
Séminaire organisé par la chaire de recherche Écritures numériques de l’université de Montréal, Sens Public et le laboratoire Dicen-IDF

Jeudi 17 novembre 2016

À Paris : 17h30-19h30
Cnam 2 rue Conté, 75003 Paris, M° Arts-et-Métiers
Salle 33.3.20 (entrée au fond à gauche de la cour, 3e étage, porte en face de l’ascenseur)

À Montréal : 11h30-13h30
Université de Montréal – salle C-8041 (Pavillon Lionel-Groulx)

captation vidéo

visiter le site du séminaire
consulter les archives PolemicTweet du séminaire

Pratiques et enjeux de l’éditorialisation pour les “passés dans le présent”

labex-passes-present-logo
6e Atelier du labex Les Passés dans le Présent

Une partie substantielle des travaux du labex Les passés dans le présent porte sur l’exploitation de fonds numérisés ou nativement numériques. Une fois numérisées, les ressources ne peuvent être simplement diffusées sur Internet : elles doivent être formatées, indexées, enrichies, agrégées, partagées… en un mot éditorialisées. Afin d’accompagner ces travaux, le labex souhaite donc entamer une réflexion sur l’éditorialisation, conçue comme l’ensemble des opérations, dispositifs, acteurs ou médiations nécessaires à l’intégration et la valorisation des ressources au sein de l’environnement numérique.
C’est pour initier cette réflexion que nous vous invitons à cet Atelier labex destiné à croiser vos pratiques, vos questions, vos terrains avec ceux d’intervenants ayant mené à bien des projets d’éditorialisation dans différents domaines.
Autour de quelques opérations clés (annotation, scénarisation, appropriation, représentation), chaque session sera l’occasion de présenter des cas concrets, d’échanger sur les bonnes pratiques et d’esquisser ensemble des réponses pratiques et théoriques.

lundi 11 avril 2016
Université Paris Ouest
Salle des conférences du nouveau bâtiment Max Weber (en face du bâtiment A)

Pour alimenter le fil twitter : #editoPP

Programme

[version pdf]

10h Accueil
10h10-11h10 Session #1 Annotation
Les pratiques d’annotation sont au cœur de l’activité du chercheur, que ce soit l’annotation de données, de textes ou d’archives. Dans la mesure où l’annotation constitue un lien de continuité entre la lecture et l’écriture, les dispositifs d’annotation dans l’environnement numérique incarnent un rôle particulier dans l’éditorialisation des ressources, favorisant la circulation et l’interprétation de ces ressources.

  • Bertrand Lafont, Projet Assyronline
  • Vincent Puig (Iri), Dispositif Polemictweet

11h30-12h30 Session #2 Scénarisation
L’indexation fine et la fragmentation des contenus numériques ont ouvert de nouvelles pistes d’écriture qui consistent en l’agencement spatial et temporel d’éléments multimodaux (ou multimédia) dans un même document. Du CD-ROM au webdocumentaire, ce premier niveau d’éditorialisation relève dans une certaine mesure du montage (editing). Si cette écriture scénarisée organise effectivement l’accès et la consultation des ressources, elle ne constitue cependant qu’un aspect de l’éditorialisation, au risque de se figer dans un objet clos.

  • Céline Lèvre (BDIC), Cartable numérique
  • Nicolas Prévôt, Webdocumentaire Inouï, projet Patrimoine musical des Nanterriens

14h-15h Session #3 Appropriation
L’appropriation constitue le véritable enjeu de l’éditorialisation. Au-delà du simple accès aux ressources, l’éditorialisation met en œuvre les conditions de possibilités de réutilisation et de réécriture des ressources, autrement dit de leur appropriation. De l’accès à l’appropriation, les dispositifs de médiation mis en place par les institutions culturelles opèrent un changement de régime éditorial dans la mesure où le rôle de l’institution n’est plus de produire ou de commissionner un discours, mais d’offrir à ses publics la possibilité d’en produire de nouveaux.

  • Thomas Sagory, Musée d’archéologie nationale de Saint-Germain-en-Laye
  • Xavier Lemarchand, Editorialisation sur les sites de l’INA

15h15-16h15 Session #4 Représentation

Cette approche de l’éditorialisation concerne plus particulièrement les données de la recherche dont le destin n’est plus de demeurer sur les étagères des laboratoires. Avec l’Open Data et l’Open Science, mais aussi avec l’émergence d’infrastructures dédiées, les données de la recherche sont désormais publiables en tant que telles, c’est-à-dire comme matière première et ressource à exploiter. Sur le plan de l’éditorialisation, se pose alors la question de la représentation de ces données publiées, qui consiste à produire des formes intermédiaires susceptibles d’être analysées, dans un double objectif d’appréhension des bases de données parfois massives, et des données elles-mêmes.

  • Régis Stauder (BnF), Éditorialisation de Gallica
  • Gilles Bertin et Lisa Chupin (Dicen-IDF), projet e-ReColNat

Comité scientifique

  • Ghislaine Glasson Deschaumes (Labex Les Passés dans le présent),
  • Lionel Maurel, université Paris Lumières),
  • Louise Merzeau (université Paris Ouest – Dicen-IDF),
  • Nicolas Sauret (Paris Ouest – Dicen-IDF – Labex Les Passés dans le présent).

Visiter le site du labex
Fil Twitter de la journée #editoPP

Présence numérique du chercheur : de l’identité à l’environnement

logo-halshs
Vers une culture de la diffusion en sciences humaines et sociales : les 10 ans de HAL-SHS


Quel sens a le dépôt en archives ouvertes pour le chercheur en sciences humaines ? Suffit-il de lui parler diffusion et référencement pour le convaincre d’adopter une démarche d’auto-archivage ? Sans doute faut-il dépasser les performances de l’outil et les services qu’il peut lui rendre (automatisation de certaines tâches, fournitures de CV…), pour replacer le dépôt dans une pratique globale d’éditorialisation scientifique. Celle-ci va de la conversation entre chercheurs à la transmission des connaissances, en passant par la publication, l’indexation, la curation, la redocumentarisation, etc. Cette activité multimodale s’exerce désormais dans un environnement-support, où se croisent des communautés, des degrés d’expertise et des temporalités hétérogènes, et où la logique du partage (dimension sociale, viralité, temps court) n’est pas toujours compatible avec celle de la publication (évaluation, métadonnées, temps long). Dans ce contexte, le seul dénominateur commun n’est plus le document mais l’identité du chercheur, ou plus exactement, la présence numérique à travers laquelle il se manisfeste au autres. Attention, confiance, crédibilité, mais aussi contribution à un espace commun du savoir, que chaque acte éditorial contribue à configurer : l’auto-archivage relève bien d’un éthos numérique et d’une éthique scientifique.

Journée d’étude organisée par l’Institut des Sciences Humaines et Sociales (InSHS) du CNRS et le Centre pour la Communication Scientifique Directe (CCSD)

18 décembre 2015,  CNRS, Paris

captation vidéo

conf-hal-shs

• support de présentation

logo-pdf programme

Visiter le site de Hal-SHS