ATTENTION : ces archives ne sont plus tenues à jour, des liens peuvent être brisés.

Indexation de ressources

Séminaire SDTICE 2007

Interventions du 27 mars

Le cas de l'indexation des vidéos

Philippe ISIDORI (Université Victor Segalen Bordeaux 2)
François KOHLER (UMVF et président de Canal-U médecine)
Marcel SPECTOR (UMVF)

"Il n'est pas possible de faire de la médecine sans image, quelle qu’elle soit", constate Philippe Isidori, de l'université Victor Segalen Bordeaux-2 et de l'UMVF. « Le support visuel est indissociable de la médecine et déjà dans les années 70 et 80, pas un cours ne se faisait sans que soit diffusé un film. On ne parlait pas de mutualisation mais d’échange, pas encore d’indexation mais de dépôt légal". Philippe Isidori rappelle l'histoire des productions audiovisuelles pour l'enseignement de la médecine, avec par exemple les actions du comité interministériel de coordination audio-visuel de la santé, au début des années 1970. "Il y a, depuis longtemps, des festivals de films médicaux, notamment les entretiens de Bichat, le festival d’Amiens, de San Francisco etc., regroupés dans la WAMHF (World association medical and health films, www.wamhf.info)". Philippe Isidori cite également AVESTEL, une opération menée à l’initiative du ministère sous la forme d'une base de données consultable sur minitel. Le système était "un peu trop complexe au moment où la télématique connaissait son déclin. Il donnait accès à plus de 500 productions audiovisuelles avec une appréciation qualitative de la ressource. Dans la foulée, en 1994, le colloque à Bordeaux sur les télévisions du savoir a abouti à la création des Amphis de la 5ème ".

L'université Bordeaux-2 dispose maintenant d'un catalogue en ligne, d'un moteur de recherche en texte libre ou par discipline et type de ressource, d'un affichage des notices. Il donne ainsi accès aux références importantes telles que le premier auteur et les spécialités. La préoccupation actuelle est de "valoriser les ressources", souligne Philippe Isidori, "mais ça manque de professionnalisme, le système qui correspond encore à un travail fait par desamateurs qui veulent rendre service à la communauté. Il n’y a pas de coopération avec les personnels des SCD. Par ailleurs, Canal U santé (www.canalu.fr/canalu/chainev2/?chaine_id=12) permet aux UNT d’avoir une webTv qui provient de l’UMVF, le Conservatoire numérique national du film médical, qui reprend le meilleur du patrimoine". Philippe Isidori pointe quelques « problèmes constants, liés à l’indexation classique avec les descripteurs : en procédant de la sorte, comment peut-on évaluer la valeur, la qualité ? Une démarche doit être initiée : créer des fiches d’évaluation des vidéogrammes selon leur valeur médicale, leur valeur didactique, etc. Il faut y faire intervenir les notions de document, de ressource, de produit, d’œuvre et ensuite élaborer une typologie. Quelle continuité y aura-t-il avec ce qui se passe quand on a des milliers de diapos et des outils d’indexation ? En amont, de grandes attentes sont exprimées pour l’indexation des productions médicales".

"Ce qui est important dans cette intervention, c’est l’expérience, le recul. L’analyse des faits pose le problème de savoir comment faire pour passer d’une indexation qui dure trois heures pour une vidéo à une indexation de masse, considère Marcel Spector, de l'UMVF. Comment est-on passé à l’indexation d’un millier de film sur Canal U en deux ans ? Comment procéder simplement tout en développant un aspect industriel ?"

François Kohler, de l'UMVF et président de Canal-U médecine, souligne que « dans le cadre du conservatoire numérique du film en santé et sport, Canal U 3S, il s’agit de ressources existantes avec de la vidéo enrichie (cours et congrès) et de la vidéo. Il y a parfois récupération automatique des contenus avec un peu de post-production. Les médias sont mis sur les serveurs de Canal U, avec la création d’une fiche indexation au moment de la mise en ligne. Il n'existe pas de vidéo téléchargée sans des mots-clés contrôlés. L'indexation secondaire est possible grâce à l’aide du service de documentation en médecine et des documentalistes professionnels. Lorsque la mise à jour de la fiche est effectuée et la mise en ligne est définitive, on arrive à quelque chose de plus détaillé ». En deux ans, 981 ressources ont été indexées avec une "bonne qualité de l’indexation", une « recherche sans trop de bruit ni de silence". Restent des problèmes, signale François Kohler : "ce qui manque, c’est une liaison avec un réseau sémantique ou une ontologie et un travail pour l'indexation, qui se fait manuellement (ce qui demande du temps". L'idée est aujourd'hui que « ce qui compte est le contenu, pas l’aspect vidéo avec ses transitions, ses plans, etc. La majorité du contenu est dans la bande son. Il faudrait des outils de reconnaissance vocale pour détacher les thèmes importants contenus dans les ressources et les rattacher aux groupes sémantiques utilisés : faire de l’assemblage avec les choses qui existent pour les valoriser". L'image seule ne permet pas forcément d'indexer correctement les contenus, car elle sert avant tout à « montrer un geste de praticien" plus qu'à expliquer un point de cours.

"Dans cette intervention, il est important de signaler que 1000 vidéos ont été indexées en deux ans, reprend Marcel Spector : on en est au passage à l’industrialisation de l’indexation. Reste que tant qu’on a pas reconnu les mots de la bande audio, il faut voir les vidéos en entier pour l’indexation, et ça prend du temps. Là, le temps a été réduit à l’extrême et les œuvres peuvent être regroupées. Ce n'est pas un point de détail car les unités de production reçoivent maintenant des vidéos à peine retravaillées (des cours) et le problème se pose maintenant pour les indexer en temps et en heure et les faire valider".

Un participant se dit "étonné d’entendre parler de futur pour l’audio alors qu’il y a de la reconnaissance directe d’images pour de la vidéo". François Kohler répond qu'il est "difficile sur une image d’intervention médicale d’avoir des éléments d'indexation, par exemple s'il s'agit seulement d'un gros plan sur une coronaire. L’image est intéressante pour le geste, pour l’apprentissage, mais pas tellement pour l’information. Ce n'est pas le même problème qu’un catalogue de diapositives. Il existe des solutions industrielles, mais le problème est le coût et le raccrochage avec les réseaux derrière".