Raphaël Troncy, Formalisation des connaissances documentaires et des connaissances conceptuelles à l'aide d'ontologies : application à la description de documents audiovisuels, Thèse d'informatique, Université Joseph Fourier, Grenoble (FR), mars 2004
La manipulation de contenus audiovisuels est une tâche à la fois complexe et spécifique, qui nécessite le plus souvent de recourir à des représentations médiatrices. La nature temporelle de l'audiovisuel impose de passer par le biais de la description pour enrichir les documents et donc les exploiter. La numérisation des documents audiovisuels permet d'envisager de nouvelles exploitations des contenus telles que leur recherche "intelligente", leur recomposition dynamique ou la personnalisation de leur accès. Le système technique qui rend ces services doit alors être intégré et faire le lien entre le contenu et sa description. Nous soutenons qu'une représentation de la structure et du contenu des documents est nécessaire. Par structure, nous entendons la structure documentaire c'est-à-dire l'organisation méréologique des éléments qui composent le document, tandis que le contenu est une structure conceptuelle, c'est-à-dire une catégorisation de ces éléments. Cette double représentation fait ressortir le besoin d'un format de description homogène et exploitable par la machine, à la fois expressif et optimal en terme de manipulations. Après une revue des propositions actuelles de modélisation des documents audiovisuels, issues de l'ingénierie documentaire et de l'ingénierie des connaissances, nous montrons qu'aucun des langages étudiés ne permet de traiter ces deux aspects de manière satisfaisante. Nous proposons alors une architecture générale permettant la représentation formelle de la structure et du contenu des documents audiovisuels, qui engendrera une base de connaissances sur laquelle il est possible d'effectuer des raisonnements. Cette architecture se compose d'une ontologie de l'audiovisuel, dont on traduit une partie dans un langage documentaire pour contrôler la structure logique des documents, et d'une ontologie de domaine pour décrire formellement leur contenu. Deux ontologies ont donc été modélisées: l'ontologie générique de l'audiovisuel et une ontologie du cyclisme qui est le domaine d'application de notre architecture. Nous avons développé pour cela l'outil DOE (Differential Ontology Editor), qui implémente la méthodologie de construction d'ontologies utilisée. Nous montrons finalement la pertinence de l'approche à l'aide de deux expérimentations utilisant un corpus de vidéos annoté et pour lesquelles une implémentation de la base de connaissances est proposée, illustrant ainsi les types d'inférences possibles.
Modélisation de documents et de contenus audiovisuels, Ingénierie documentaire, Ingénierie des connaissances, Construction d'ontologies, Raisonnement, OWL, RDF, MPEG-7