MASTÈRE MATHÉMATIQUES ET INFORMATIQUE 2E ANNÉE
Spécialité "Intelligence Interaction Information"
ANNEE 2003/2004

PROPOSITION DE PROJET


RESPONSABLES : Jean-François Baget & Jérôme Euzenat

TEL : 476 61 53 66 &

ADRESSE ELECTRONIQUE : Jean - Francois . Baget À inrialpes . fr,Jerome . Euzenat À inrialpes . fr

LABORATOIRE ET EQUIPE : Équipe Exmo, INRIA Rhône-Alpes

PROFIL DU PROJET : Parcours intelligence artificielle

TITRE :

Parcourir le web sémantique

Référence: Proposition n° 13

RÉSUMÉ :

RDF est un langage de représentation de connaissances développé par le W3C pour le web sémantique. Les connaissances y sont décrites par des graphes étiquetés, munis d'une sémantique formelle qui permet de définir les inférences valides.

A terme, le web sémantique pourrait être un immense graphe étiqueté, exprimant les connaissances décrites par l'ensemble des documents RDF. Alors que les documents du web ne sont aujourd'hui accessibles qu'à partir de leur texte (par les moteurs de recherche), il sera possible de poser des requêtes beaucoup plus évoluées sur le web sémantique: en posant un document RDF comme une requête/question, on cherche à savoir si ce document est une généralisation de connaissances déjà présentes : celles-ci forment la réponse à la question. Nous pouvons par exemple rechercher des informations sur un livre dont le sujet est E. Hemingway. Contrairement à une recherche textuelle (où le moteur de recherche ne s'intéresse qu'aux termes « livre » et « Hemingway », cette recherche, prenant en compte les relations entre les termes, ne retournera pas les livres écrits par cet auteur. Il est possible de poser des questions dont la structure peut être celle d'un graphe quelconque (dans cet exemple, il n'y a qu'un arc entre deux sommets), afin d'obtenir des réponses plus pertinentes.

Alors que des algorithmes efficaces sont déjà connus pour répondre à la question : « est-ce-qu'un document RDF est la généralisation d'un autre ? », le web sémantique présente un véritable défi : le passage à l'échelle. Une adaptation de ces algorithmes aux conditions particulières du web sémantique nécessite une expérimentation dans des conditions aussi réalistes que possibles. C'est à une mise en place de cette expérimentation que vise ce stage de DEA. Pour cela, il faudra travailler sur un corpus de documents aussi large que possible (par exemple, la plupart des documents mis à disposition par le W3C sont en RDF).

L'étudiant devra mettre en oeuvre l'architecture d'un système distribué permettant de répondre à des requêtes élémentaires sur le web sémantique. Il devra mettre en place des mécanismes d'indexation permettant d'accélérer le traitement de ces requêtes, tout en maintenant une taille raisonable pour cet index.

Ce travail permettra par la suite de tester des algorithmes permettant de répondre à des requêtes quelconques.


http://exmo.inria.fr/training/M2MI-2003-parcours.html

$Id: M2MI-2003-parcours.html,v 1.9 2017/01/13 20:07:45 euzenat Exp $