MASTÈRE MATHÉMATIQUES ET INFORMATIQUE 2E ANNÉE
Spécialité "Intelligence Interaction Information"
ANNEE 2005/2006

PROPOSITION DE PROJET

RESPONSABLES : Jérôme Euzenat

TEL : 476 61 53 66

ADRESSE ELECTRONIQUE : Jerome:Euzenat#inrialpes:fr

LABORATOIRE ET EQUIPE : Équipe Exmo, INRIA Rhône-Alpes

PROFIL DU PROJET : Parcours intelligence artificielle

TITRE :

Évaluation sémantique des alignements d'ontologies

Référence: Proposition n°166

RÉSUMÉ :

Dans le futur, une quantité importante de ressources seront annotées par des marqueurs sémantiques. C'est le cas des pages du web qui peuvent ainsi être complétées de méta-données permettant aux ordinateurs d'en tirer parti ou de flux de données engendrés au fil de l'eau.

Ces annotations sont exprimées en fonction d'"ontologies": des structures formelles permettant la représentation de la connaissance qui décrivent les concepts utilisés dans les annotations. Mais il est vraissemblable que différentes sources utiliseront différentes ontologies.

Pour résoudre ce problème on procède à l'alignment d'ontologies: la mise en correspondance des concepts utilisés dans deux ontologies différentes. L'alignement d'ontologies utilise différents algorithmes basés sur des techniques de linguistique, d'analyse de donnée, de statistiques, ou de logique pour déterminer la correspondance entre différentes ontologies.

Afin d'évaluer les performances de ces algorithmes, il est nécessaire de les confronter à des suites de tests et de comparer les résultats. Les critères d'évaluation principaux sont le rappel (le rapport des bons résultats sur les résultats attendus) et la précision (le rapport des bons résultats sur les résultats obtenus) développés en recherche d'information. Ces critères sont très bien compris et largement acceptés.

Cependant, nous avons expérimentés lors de campagnes d'évaluation des algorithmes des problèmes dus au caractère tout-ou-rien de ces mesures. En effet, un alignment peut être très proche du résultat escompté et cependant avoir les mêmes valeurs de précision et de rappel qu'un alignement médiocre. La raison de cela est que ces critères ne considèrent que le fait que deux concepts on été correctement mis en correspondance (et non pas si l'un d'eux a été mis en correspondance avec un concept plus ou moins proche de l'autre).

Nous avons proposé un cadre généralisant la précision et le rappel à la proximité entre ontologies [Ehrig & Euzenat 2005]. Ce cadre retient les avantages du rappel et de la précision, mais permet de rendre compte de la qualité des correspondances (en mesurant sa distance à la correspondance escomptée). Il a été décliné sous quatre formes tirant parti de distances syntaxiques (mesure de distance dans le graphe de classe, mesure de l'effort pour corriger la correspondance).

Il nous semble cependant nécessaire de considérer l'instanciation ou l'extension de ce cadre à à la sémantique des langages considérés. Pour cela il faudra étudier les mesures en fonction de la correction et de la complétude. En effet, dans la configuration idéale, le rappel sera maximal si toutes les correspondances recherchées sont déductibles du résultat obtenu et le rappel sera maximal si seulement celles-ci en sont déductibles.

On se propose donc d'étudier les propriétés permettant de rendre compte sémantiquement de la distance entre deux alignments. On instanciera le cadre par des mesures spécifiques permettant de rendre compte de la proportion de conséquence préservées par les alignements.

Résultats attendus

Proposer des contraintes sémantique pesant sur l'évaluation ;
Proposer quelques mesures satisfaisant ces contraintes;
Implémentation des mesures proposées dans l'API d'alignment;
Évaluation des résultats obtenus sur les alignments de l'Ontology Alignment Evaluation Initiative 2005

Références:
Ehrig & Euzenat 2005: Marc Ehrig, Jérôme Euzenat, Relaxed Precision and Recall for Ontology Matching, Proceedings 3^rd K-Cap workshop on ontology integration, Banff (CA), 2005

http://exmo.inria.fr/training/M2MI-2005-measure.html

$Id: M2MI-2005-measure.html,v 1.6 2021/12/17 16:02:27 euzenat Exp $