Indexation de ressources

1. Métadonnées

De quoi s'agit-il ?

Définition

Préfixe "meta"
Du grec "meta"

Ce qui dépasse, englobe un objet, une science.
(Le Robert)

Métadonnées
en anglais : metadata

Une métadonnée est littéralement une donnée sur une donnée
Plus précisément, c'est un ensemble structuré d'informations décrivant une ressource quelconque.
(Patrick Peccatte, Soft Expérience)
http://peccatte.karefil.com/Software/Metadata.htm

Les métadonnées sont
- des informations qui décrivent un contenu : des objets concrets ou abstraits ;
- des étiquettes qui permettent de retrouver des données.
(Stéphanie Delmotte / Présentation du LOM au MENESR, 24/10/2005)

En formation en ligne, les métadonnées servent à décrire les objets d'apprentissage. Elles comprennent un certain nombre de "descripteurs" qui permettent de les rendre plus facilement identifiables (accessibles) et plus manipulables (interopérables, réutilisables, durables, adaptables). 
(Bureau Amérique du Nord de l'Agence Universitaire de la Francophonie)

Balise meta
en anglais : meta tag

Balise insérée dans l'en-tête d'une page Web
"Balise HTML insérée dans l'en-tête d'une page Web, après le titre, qui permet de décrire le contenu de la page afin de la référencer correctement et plus facilement dans les moteurs de recherche."
(Office québécois de la langue française, 2002)
http://www.granddictionnaire.com/btml/fra/r_motclef/index1024_1.asp

Concernant HTML et XML
Voir le site Mutu-xml.org
http://www.mutu-xml.org/xml-base/shared/SHAREDBASE-METADATA-FR.html

Types de métadonnées

Un site pour se repérer dans le dédale des concepts
en guise d'introduction
La page "Métadonnées : une initiation" constitue un très bon point de départ.
Elle a pour but d'orienter le lecteur abordant le domaine des métadonnées dans le dédale des concepts, des recommandations et des initiatives qui ont trait à ce sujet.
Définition des métadonnées. Les métadonnées "métiers" - standards. Les métadonnées informatiques. Où sont les métadonnées ? Vers le Web sémantique.
(Patrick Peccatte, Soft Expérience)
http://peccatte.karefil.com/Software/Metadata.htm#Meta

Des métadonnées externes et internes
Marie-Elise Fréon dans un cours de l'INRIA  montre que les métadonnées  "peuvent être créées a priori en accompagnement de la ressource électronique ou... peuvent être retrouvées et combinées a posteriori par des systèmes de recherche."
"Leur création obéit à différentes approches (...) plus complémentaires que concurrentes, car elles ne rendent pas exactement les mêmes services. Elles correspondent à une gestion différente de la ressource électronique".
(INRIA. La recherche d'information sur les réseaux)
http://www.adbs.fr/la-recherche-d-information-sur-les-reseaux-19185.htm?RH=1226044920921

4 sortes de métadonnées
selon cette typologie de Marie-Elise Fréon.

 

Externes

- de type base de données
  externes aux ressources,
  utilisées séparément pour la recherche.

 

-  externes à la ressource
   mais fournies en même temps

Internes

- encapsulées,
  fournies dans la ressource.
  Ex : le Dublin Core

- englobantes,
  
pouvant inclure la ressource elle-même
   (entièrement ou partiellement) .

Dans quel but ?

Depuis quand utilise-t-on des métadonnées ?

Depuis longtemps déjà, sans le savoir...
comme Monsieur Jourdain

 "Les spécialistes de l'information créent des métadonnées sans qu'ils n'en sussent rien et ce, depuis quatre fois plus longtemps que monsieur Jourdain, soit 160 ans."
Un article plein d'humour...
(Lettre du Bibliothécaire Québécois, n° 21, janvier-mars 2000)
http://www.sciencepresse.qc.ca/lbq/lbq21.6.html 

Avec le développement d'Internet...
une nouvelle dynamique
"Par la dynamique conjointe des spécialistes d'Internet et des professionnels de la documentation, le Web fait évoluer ses langages de description et d'échange de données vers un formalisme plus structuré et plus adapté à la recherche."
(Les Dossiers de l'Ingénierie éducative, n° 29, octobre 1999, PDF)
http://www.cndp.fr/archivage/valid/8964/8964-852-899.pdf

Intérêt des métadonnées

Cinq points importants

1. Faciliter la recherche d'information
   
- décrire le contenu et les relations entre les fichiers d'un site,
    - classer le contenu suivant un degré de difficulté ou un public cible,
    - mieux référencer un site ou une page sur Internet.

2. Faciliter l'interopérabilité
   
- partager et échanger des informations.

3. Faciliter la gestion et l'archivage
   
- informer sur le cycle de vie des documents,
    - gérer des collections de ressources,
    - gérer des archives électroniques.

4. Gérer et protéger les droits 
   
- les droits de propriété intellectuelle,
    - les droits d'accès à des pages web (restrictions de consultation).

5. Authentifier un texte
    - encoder une signature électronique pour valider un texte sur Internet

Vers le web sémantique

Vers le web sémantique ?

anglais : semantic web
français : web sémantique

Présentation du web sémantique
"Sous l'expression Web sémantique, attribuée le plus souvent à Tim Berners-Lee, se regroupe un ensemble de programmes de recherche et de travaux variés. Leur objectif commun est de permettre aux machines d'exploiter automatiquement les contenus de sources d'information accessibles par le Web pour réaliser des tâches variées. La réalisation de cet objectif repose sur l'existence de données, accessibles par le Web, structurées ou semi-structurées, représentées dans un formalisme autorisant des traitements automatisés allant au delà des traitements liés à la présentation des données et mettant en oeuvre des mécanismes d'inférence puissants."
LALIC (Paris-Sorbonne, Université 4)
http://www.lalic.paris4.sorbonne.fr/stic/presentation5.html

Proclamé la prochaine évolution du Web par son créateur, Tim Berners-Lee, il s'agit d'arriver à un Web intelligent, où les informations ne seraient plus stockées mais comprises par les ordinateurs afin d'apporter à l'utilisateur ce qu'il cherche vraiment. D'après la définition de Tim Berners-Lee, le Web sémantique permettra (contrairement au Web actuel qui est vu comme un Web syntaxique) de rendre de contenu sémantique des ressources Web interprétables non seulement par l'homme mais aussi par la machine.
(Futura Sciences)
http://www.futura-sciences.com/comprendre/g/definition-web-semantique_3993.php

Portail Semanticweb.org
http://www.semanticweb.org/

Site du W3C
http://www.w3.org/2001/sw/

Urfist de Toulouse
http://www.urfist.cict.fr/lettres/lettre28/lettre28-22.html