Projet AVI-SON
Bienvenue sur le site du projet AVI-SON.
Le consortium
L'IRCAD/EITS a acquis depuis sa création en 1994 une réputation d'excellence dans la recherche fondamentale et appliquée, ainsi que dans l'enseignement des nouvelles technologies chirurgicales. Sa renommée est aujourd'hui mondiale et fait de l'IRCAD/EITS la première école de formation aux nouvelles technologies chirurgicales dans le monde.
Le LIA est composé de 4 équipes dont 3 travaillent, depuis de nombreuses années, dans le domaine du traitement automatique du langage écrit ou oral. L'équipe TAP (Traitement Automatique de la Parole), qui s'engage dans le projet AVI-SON, couvre le domaine de la reconnaissance de la parole et du locuteur. Plus précisément, les thèmes de recherche concernent la reconnaissance automatique de la parole continue ([MASS5], [NOC05], [LIN05]), les systèmes de reconnaissance embarqués (LEV06, LEV04]), l 'adaptation acoustique, la reconnaissance du locuteur (BON05) et l'indexation multimédia (FAV05]).
Xtensive Technologies SàRL est une jeune société créée en 2006 qui fournit des solutions verticales innovantes et optimisées pour la gestion, l'indexation et le traitement automatiques de l'information audiovisuelle (son, image, vidéo) des entreprises et des institutions.
Au terme d'une expérience pluriannuelle dans le domaine des nouvelles technologies de l'information et dans la gestion et l'indexation des données audiovisuelles, Xtensive Technologies fournit aujourd'hui, après 3 années de recherche et développement, une expertise à haute valeur-ajoutée autour de sa propre plate-forme innovante ARCHmedia. Xtensive Technologies sera en charge de réaliser la totalité de la plate-forme d'archivage des vidéos gérées par l'IRCAD, de l'intégration du système de reconnaissance automatique de la parole (SRAP) et de l'étude et de l'implantation du serveur d'indexation qui accueillera l'ensemble des données générées par le SRAP.
Objectifs et motivation
Le coût de l'annotation, étape indispensable à l'indexation des documents, peut dans ce cas devenir extrêmement élevé, ce qui constitue le principal obstacle à l'exploitation des grandes bases de données.
L'objectif du consortium du projet AVI-SON est de concevoir une plate forme d'indexation automatique de documents audio-visuels. Cette plate-forme doit permettre de gérer et de s'adapter à un flux important de documents entrants, de structurer et d'indexer la base en fournissant des représentations enrichies des documents, et d'accéder de façon conviviale et efficace aux documents archivés.
Le projet
La plate-forme AVI-SON sera mise en oeuvre dans le cadre de la gestion de la base de données IRCAD. Il s'agit un ensemble plusieurs milliers d'heures de documents audiovisuels destinés à la formation des chirurgiens et élèves chirurgiens; on y trouve des actes chirurgicaux filmés et commentés, et avis d'experts, des séminaires et des cours magistraux,...
Pour tirer parti de cette masse considérable de documents sans assumer le coût -prohibitif à cette échelle- d'une indexation manuelle, le système doit permettre l'archivage et l'indexation avec le moins d'interventions humaines possible. Cet objectif d'autonomie complète du système requiert la mise en oeuvre de mécanismes d'auto-adaptation à la forme et au contenu des documents; c'est dans cet aspect du projet que réside l'essentiel de sa plus-value scientifique.
La langue majoritairement utilisée dans cette base est l'anglais, qui sera le langage cible de la plate-forme. Des documents en différentes langues (chinois, japonais, espagnol, allemand, italien, ...) sont cependant collectés et archivés et pourraient faire l'objet de développements ultérieurs.