Journée d'étude BnF / AFNOR CG46 - 2008

From Blik
Jump to: navigation, search

Journée d'étude BnF / AFNOR CG46

Vendredi 28 Mars 2008, 9h30-17h30 - Bibliothèque nationale de France - Site François-Mitterrand – Petit auditorium.


Pour réfléchir au rôle des référentiels dans l'interopérabilité des systèmes d'information et dans le web sémantique.


Cette journée d'étude consacrée aux référentiels a connu un vif succès puisque 250 personnes s'y sont inscrites et 80 demandes n'ont pu être satisfaites. Le besoin d'interopérabilité entre les différents outils utilisés par les professionnels est souligné par la grande diversité des personnes réunies pour débattre de ce thème : des bibliothécaires, des archivistes, des documentalistes, des représentants du monde des musées, des consultants, des formateurs, des informaticiens, des représentants de la Délégation générale à la modernisation de l'Etat et des ministères de l'enseignement supérieur, de la culture.

Après avoir précisé la terminologie qui s'attache à cette grande famille que constituent les référentiels, et en avoir fait une typologie, quelques exemples de vocabulaires contrôlés ont mis en évidence la convergence des besoins entre différents secteurs professionnels. Puis la structuration même des données a été abordée : comment identifier et organiser les informations susceptibles de garantir l'interopérabilité entre des systèmes d'information hétérogènes ? Des pistes de réponses ont été exposées des points de vue documentaire, juridique et administratif.

Rendus publics sur le Web, les référentiels ont cessé d'être des outils réservés aux professionnels pour lesquels ils ont été conçus. Le point de vue des utilisateurs des données a été examiné en présenatnt des rapports d'enquêtes rendant compte de la diversité des usages des référentiels sur le Web, mais aussi en donnant la parole au retour d'expérience d'une librairie en ligne, la librairie Decitre.

Il n’est pas possible d’imposer à tous les mêmes référentiels. Pour y remédier, l'une des solutions consiste à exploiter les relations sémantiques entre différents vocabulaires contrôlés pour les rendre interopérables. La présentation du projet de recherche STITCH (Semantic Interoperability To access Cultural Heritage) sur ce thème a visé à démontrer la faisabilité d'une telle orientation.

En conclusion de cette journée, une table ronde a donné la parole à 5 experts d'horizons très divers (audiovisuel, archives, information géographique, information scientifique, description de l'image) pour exposer leurs points de vue sur le rôle des référentiels dans le développement du Web sémantique.


Contents

Ouverture de la journée[edit]

Introduction[edit]

par Raymond Bérard, Président de AFNOR CG46 et Directeur de l'Agence bibliographique nationale de l'enseignement supérieur
Télécharger Le texte de l’intervention [fichier .pdf – 24 Ko – 1 p.]

Point sur les travaux marquants de la Commission Générale "Information et documentation"[edit]

par Françoise Bourdon, Présidente de AFNOR CG46/CN357 et Bibliothèque nationale de France, Agence bibliographique nationale
Rappel de la structure de la Commission Générale CG46 "Information et documentation" et présentation des travaux en cours dans les différents groupes d'experts rattachés à la commission de normalisation 357 "Modélisation, production et accès aux documents".
Télécharger Le texte de l’intervention [fichier .pdf – 273 Ko – 5 p.]
Voir aussi Commission Générale CG46 - Information et documentation [fichier .pdf – 108 Ko – 10 p.]

Référentiels de représentation des contenus : typologie et terminologie[edit]

par Sylvie Dalbin, consultante, Assistance et Techniques documentaires
Référentiels, données d'autorité, thésaurus, ontologies, taxonomies … Quels sont ces outils, à quels besoins répondent-ils et quels sont les types de données qui s'y rattachent ? Cette première intervention explicite la terminologie en s'appuyant sur des exemples de vocabulaires contrôlés empruntés à différents secteurs professionnels, soulignant par là-même la convergence des besoins.
Sites pris en exemple :
Télécharger Le texte de l’intervention [fichier .pdf – 444 Ko – 21 p.]

La structuration des données : bibliothèques de composants et modèles[edit]

Comment organiser les données pour répondre au mieux aux besoins ? Quelle méthodologie suivre pour identifier et structurer les informations susceptibles d'être réutilisables d'un processus métier à un autre ? La définition de bibliothèques de composants peut-elle garantir l'interopérabilité entre des systèmes d'information hétérogènes ? La question est étudiée selon 3 points de vue : documentaire, juridique et administratif.

Le point de vue documentaire : Données d'autorité : structuration, modélisation interconnexion[edit]

par Anila Angjeli, Bibliothèque nationale de France, Agence bibliographique nationale
Dans l'univers de la documentation, la gestion des vocabulaires contrôlés est au coeur du métier. Aujourd'hui l'enjeu est d'utiliser ces référentiels de façon transverse dans les applications mises au service des bibliothèques, des centres d'archives, des musées, etc. Exemple des données d'autorité dans un contexte en évolution lié aux mutations technologiques, aux évolutions des usages et des usagers et au décloisonnement des secteurs.
Télécharger Le texte de l’intervention [fichier .pdf – 814 Ko – 14 p.]

Le point de vue juridique : La Confédération internationale des sociétés d'auteurs et compositeurs[edit]

par François-Xavier Nuttall, Confédération internationale des sociétés d'auteurs et compositeurs
Dans le monde juridique, la gestion des droits sur la propriété intellectuelle requiert une parfaite identification des protagonistes et des œuvres concernées. Le recours à des identifiants normalisés au niveau international et accompagnés d'un jeu de métadonnées est-il viable ? Exemple de la CISAC, organisation non gouvernementale à but non lucratif, qui s’attache à promouvoir et protéger les droits des auteurs depuis 1926 dans les domaines musical et audiovisuel.
Télécharger : Le texte de l’intervention [fichier .pdf – 485 Ko – 22 p.]
Voir aussi : Le site de la Confédération internationale des sociétés d’auteurs et compositeurs

Le point de vue administratif : Mission de la Direction générale de la modernisation de l'État[edit]

par Sylvie Colas et Sylvain Bellengier, Ministère du budget, des comptes publics et de la fonction publique
Dans le monde de l'administration, comment la définition de modèles de données pour les échanges électroniques contribue-t-elle à améliorer l'efficacité et la flexibilité des systèmes d'information? Comment favorise-t-elle l'interopérabilité au sein de l’administration, entre les administrations et les entreprises, au niveau national et international ?
Dans le cadre de la révision générale des politiques publiques, nouveau cadre de la réforme de l'Etat, la Direction générale de la modernisation de l'Etat (DGME) accompagne les ministères dans leurs actions de transformation en apportant une expertise sur les leviers les plus structurants (optimisation des organisations, des processus, des systèmes d'information...). Elle développe également des projets interministériels dans les domaines de la simplification, de l'accueil et de l'administration électronique basés sur l'harmonisation des échanges de données, notamment le projet ESOPE.
Télécharger : Le texte de l’intervention [fichier .pdf – 468 Ko – 16 p.]
Voir aussi - Le portail de la modernisation de l’État

Usages et utilisations : le point de vue de l'utilisateur des données[edit]

Rendus publics sur le Web, les référentiels ont cessé d'être des outils réservés aux professionnels pour lesquels ils avaient d'abord été conçus. Les usagers se les approprient et même s'en nourrissent pour en produire d'autres. Les usages se diversifient et influencent à leur tour la structuration des données.

Comptes rendus de différents rapports d'enquête sur l'utilisation des thésaurus et des vocabulaires contrôlés sur le Web[edit]

par Catherine Marandas, Bibliothèque nationale de France, Agence bibliographique nationale
Une enquête RLG lancée en juillet-août 2007 auprès de 18 institutions partenaires aux États-Unis et en Grande-Bretagne (bibliothèques, archives, musées) pour connaître les pratiques en matière de métadonnées descriptives révélait une très grande disparité des ces pratiques et des outils utilisés. Les résultats de cette enquête ont entraîné la mise en place de nouveaux axes de travail au niveau d'OCLC.
Consultation de l'enquête :
Et aussi :
Télécharger Le texte de l’intervention [fichier .pdf – 123 Ko – 16 p.]

Exemple d'une librairie en ligne, la librairie Decitre : utilisation des référentiels par le libraire et par ses clients (le Web 2.0)[edit]

par Guillaume Decitre et Françoise Julien, Librairie Decitre
Librairie centenaire, distributeur spécialisé de livres et de papeterie implanté dans la région Rhône-Alpes, la librairie Decitre a développé un espace de vente en ligne (5e en France) qui reçoit 8 000 visites par mois. Pourquoi un site en ligne, l'attente des internautes, la structuration des informations dans un souci de gestion et de satisfaction des clients ont été les thèmes abordés.
Télécharger :Le texte de l’intervention [fichier .pdf – 37 Ko – 10 p.]

Sémantique et interopérabilité[edit]

par Antoine Isaac, Bibliothèque nationale des Pays Bas, Division Recherche et développement et Vrije Universiteit Amsterdam
Quand les données sont fiables et bien structurées elles peuvent être exploitées pour créer de nouveaux outils. Il n'est pas envisageable d'imposer à tous le respect d'un même et unique référentiel pour indexer tous les documents. Faire dialoguer entre eux des vocabulaires hétérogènes pour faciliter l'accès à de multiples collections est beaucoup plus pragmatique. Le projet STITCH (Semantic Interoperability To access Cultural Heritage) donne l'occasion d'étudier comment peuvent être exploitées les relations sémantiques entre différents vocabulaires contrôlés pour les rendre interopérables et même susceptibles d'offrir un accès multilingue aux collections qu'ils référencent.
Accès au démonstrateur du projet STITCH permettant une interrogation simultanée de différentes bases de données (Mandragore base iconographique du département des Manuscrits de la BnF et la Collection d’enluminures de la Bibliothèque royale des Pays-Bas) à partir de la même interface.
Télécharger Le texte de l’intervention [fichier .pdf – 365 Ko – 28 p.]
Voir aussi Accès au démonstrateur STITCH pour les collections Mandragore de la BnF et Manuscrits enluminés de la KB


Référentiels existants et Web sémantique : table ronde[edit]

De gauche à droite : Antoine Isaac, Elizabeth Giuliani, Emmanuelle Bermès, Claire Sibille, Patrick Leboeuf, Christian Fluhr
© BnF - 28 mars 2008
Les référentiels existants ont-ils un rôle à jouer dans le Web sémantique ? Quelles étapes faut-il franchir pour les rendre plus faciles à exploiter par les moteurs de recherche ? Les nouveaux usages vont-ils générer de nouveaux besoins ? Etc. Cette table ronde a été l'occasion de revenir sur les thèmes marquants abordés tout au long de la journée par le témoignage d'intervenants venant d'horizons très divers sur la façon dont les référentiels, thésaurus ou données d’autorité sont utilisés dans leur secteur d’activité.
Débats animés par Emmanuelle Bermès, Bibliothèque nationale de France, Département de la Bibliothèque numérique.

Synthèse des interventions des participants[edit]

Christian Fluhr, Société NewPhenix[edit]

Christian Fluhr a été professeur à l'Institut national des sciences et techniques nucléaires (CEA) et a fait partie du Laboratoire d'intégration des systèmes et technologies (CEA-LIST). Il a dirigé le Laboratoire d'ingénierie de la connaissance multimédia multilingue (CEA-LIST/LIC2M), laboratoire qui développe des outils d'indexation textuelle multilingue des données images et multimédia et des outils d'analyse linguistique et sémantique permettant des requêtes en langage naturel. Il a piloté (avec la société Tribun et le pôle Nicéphore Cité) les campagnes d'évaluation de la reconnaissance automatique d'image ImagEVAL. Il travaille actuellement au sein de la société NewPhenix.
Christian Fluhr a évoqué l’utilisation des outils linguistiques automatiques pour le traitement des données structurées mais aussi des données brutes. Interrogé sur ce que ces traitements linguistiques peuvent apporter, du point de vue des usages, à l’utilisateur final, il a précisé les utilisations possibles de ces technologies dans le contexte de la recherche d’information. L’utilisateur final, qui ne connaît pas les langages normalisés que sont les référentiels, va poser ses questions en langage naturel : il s’agit donc d’analyser sa question pour lui répondre de manière précise grâce à une méthodologie proche de celle qui a été présentée au cours de la journée, si ce n’est que les vocabulaires normalisés employés sont plus abondants quantitativement. Christian Fluhr a aussi présenté la problématique particulière de l’indexation multilingue de corpus d’images, et les difficultés que pose l’utilisation de "mots-clés" pour décrire les images dans ce contexte.

Elizabeth Giuliani, Bibliothèque nationale de France/Département de l'Audiovisuel et Présidente de AFNOR[edit]

CG46/CN6 "Numérotation et identification
Conservateur général, adjointe au directeur du Département de l'Audiovisuel de la BnF, elle y coordonne les activités de contrôle bibliographique et les relations avec le Système d’information. Membre actif des instances de normalisation documentaire françaises, européennes et internationales, elle préside, au sein de la CG 46 de l’AFNOR, les commissions de normalisation relatives, l’une (CN6) à l’Identification et la numérotation des documents, l’autre (OCEAN) à l’élaboration d’une norme européenne d’identification des œuvres cinématographiques.
Elizabeth Giuliani a évoqué les tensions politiques qui sous-tendent la normalisation dans le contexte particulier de la mise en place de référentiels pour des contenus non textuels. Le contrôle des systèmes d’identifiants et des métadonnées associées apparaît comme un enjeu stratégique dans la mesure où il donne la maîtrise sur des contenus qui sont protégés à plusieurs niveaux, et dont les ayants droit veulent connaître l’utilisation précise. Dans ce contexte, la normalisation des référentiels apparaît comme un outil de pouvoir.

Antoine Isaac, Bibliothèque nationale des Pays Bas, Division Recherche et développement et Vrije Universiteit Amsterdam[edit]

Antoine Isaac est post-doctorant impliqué au Pays Bas dans le projet TEL+ (The European Library) et en partenariat avec la BnF dans le projet STITCH (Semantic Interoperability To access Cultural Heritage).
Impliqué au niveau du W3C dans les travaux autour du Web sémantique qui visent à proposer des formats communs pour intégrer des données provenant de sources différentes notamment le modèle SKOS (Simple Knowledge Organization System), Antoine Isaac a décrit ce processus de normalisation comme une structure légère, ouverte, se basant sur des cas d’utilisation. L’objectif est d’intéresser des communautés existantes à ces normes en leur proposant d’extraire de leurs pratiques des régularités d’usage.
Voir aussi

Patrick Leboeuf, Institut géographique national[edit]

Patrick Leboeuf, Ingénieur, Chef du Service Information en Ligne à l’Institut Géographique National et coordinateur du projet Géoportail. En charge du développement et de l’administration de ce portail des territoires et des citoyens, il a pour mission d’assurer la diffusion de tous les référentiels géographiques de l’IGN par les canaux traditionnels mais aussi sur Internet.
Patrick Leboeuf a présenté un secteur, celui de l’information géographique, qui est au cœur de bien des enjeux sur le web d’aujourd’hui. En effet, il existe beaucoup d’informations qui peuvent être référencées dans l’espace et l’information géographique permet de rendre un meilleur service à l’internaute, avec un contenu plus ciblé et une présentation simplifiée. Ce meilleur service rendu peut porter aussi bien sur une information promotionnelle que réglementaire. Les référentiels qui se basent sur des coordonnées géographiques permettent de lever les ambiguïtés qui peuvent résider dans l’homonymie des toponymes ou l’approximation des adresses postales.
Voir aussi


Claire Sibille, Direction des Archives de France et membre de la Section des normes et bonnes pratiques du Conseil international des archives[edit]

Claire Sibille est conservateur en chef à la direction des Archives de France depuis mai 2003. Archiviste-paléographe, elle a été en poste au Service historique de l'armée de terre puis à la section des archives privées du Centre historique des Archives nationales. Elle a contribué à la publication de plus de 3000 pages d'instruments de recherche, dont l'état des fonds privés des Archives nationales, et a été membre du conseil d'administration de l'Association des archivistes français de 1998 à 2004. Responsable du suivi de la normalisation de la description archivistique, elle contrôle l'élaboration des inventaires produits par les services d'archives publics français et participe à différentes commissions de normalisation.
Claire Sibille a présenté l’approche métier spécifique à l’archivistique et la mise en place des référentiels autour de normes plutôt récentes. Celles-ci s’élaborent dans une logique d’ouverture : complémentarité avec d’autres normes, dialogue avec d’autres professions. La modélisation est un élément clef de la convergence des référentiels.
Télécharger : Le texte de l’intervention [fichier .pdf – 182 Ko – 9 p.]
Voir aussi : Le site des Archives de France

Conclusion de la journée[edit]

par Françoise Bourdon, Présidente de AFNOR CG46/CN357 et Bibliothèque nationale de France, Agence bibliographique nationale