Compte rendu de la réunion Escrire du
05/05/2000
9h-18h à l'INRIA Rhône-Alpes, Montbonnot
Présents
Rim Al-Hulou (O), Olivier Brunet (E), Hacène Cherfi (O),
Olivier Corby (A), Rose Dieng (A),
Jérôme Euzenat (E), Carolina Medina (A), Emmanuel Nauer (O),
Yannick Toussaint (O), Raphaël Troncy (E)
Point sur les débuts d'implémentation et retour sur les formats
- ORPAILLEUR
- en est au choix de la plate-forme de DL (entre BACK, FaCT et
Cyclop). Le test de subsomption y est complet pour AND/OR/NOT et la
transitivité. Le codage des roles dans les relations pose des problèmes.
- EXMO
- a beaucoup investigué l'aspect requête au détriment de la traduction
des ontologies qui s'avère délicate (pour des raisons purement
programmatiques et d'ordonnancement des tâches). On est en train de réintégrer
le parseur XML dans Troeps et en C ce qui prend plus de temps que prévu.
- ACACIA
- dispose d'un environnement complet en graphes conceptuels dont le
langage pivot est RDF et non celui d'Escrire. Il est donc très avancé mais
parallèlement à Escrire.
Une longue discussion a eu lieu sur d'une part la non utilisation des ID dans
l'ontologie et d'autre part l'utilisation/création des objets dans les
annotations. Il en est ressorti que:
- pour les ID, personne n'est sûr de toutes les implications de leur
utilisation une étude complémentaire serait nécessaire.
- pour la création d'objets dans les annotations, il s'agit de présupposés qui doivent être rendus explicites lors de l'expérimentation (-> rédaction de ces
points par Olivier Corby). On a décidé que (a) il est possible d'avoir des
objets créés dans l'ontologie: ils peuvent alors être référés par les requêtes et les annotations, (b) il est possible d'avoir des objets créés dans les annotations: il ne peuvent être référés par d'autres annotations que si les
résumés font clairement référence à l'article en question.
Discussion sur l'utilisation des préfixes dénotant le namespace dans les
balises? Peu conclusive mais
si quelqu'un établi où les supprimer, on agira en conséquence.
Décision d'avoir un espace de nom global dans les objets (-> objref ne
contient pas d'attribut type).
Concernant les types de base, on suppose que sont implémentés integer, float, string et boolean.
Présentation des requètes (RT)
La DTD des requêtes et des exemples de requêtes sur la base biologique
ont été présentés.
Ils nécessitent quelques corrections de forme. On les trouvera respectivement en:
http://escrire.inrialpes.fr/dtd/qesc.dtd
et
http://escrire.inrialpes.fr/biointer/ qui devient la base de l'expérience
interaction.
Une DTD pour le format des réponses aux requêtes en XML sera bientôt
disponible en
http://escrire.inrialpes.fr/dtd/resc.dtd
Démonstration sur l'annotation RDF dans Amaya (Jose Kahan, W3C)
Point sur les données biologiques (JE)
- récupération de 75+ résumés avec interactions (annotées par les
biologistes) sous forme lisible. Ces interactions ne sont pas toujours
orientées et ne disposent pas de toutes les informations disponibles dans
la base.
JE se propose d'engendrer des annotations XML automatiquement à partir
de ces données puis de les compléter à la main.
- les 11-12 mai, à Xerox, workshop sur "information extraction in genomics"
avec en présence tous les gens qui nous fournissent les données, JE en
profitera pour leur demander des requêtes.
- il n'y a pas actuellement de forte pression pour aller au delà des 10
résumés annotés disponibles. JE ne produiera de nouvelles annotations que
pour début juillet. Sans doute avec une nouvelle manière d'accéder aux
données et résumées via le serveur de servlet.
Publications
Il est temps de chercher à publier (même si l'on ne peut encore parler de
résultats):
- les principes de l'action (dans des présentations de type workshop);
- la méthodologie (pour laquelle on pourra penser à des conférences).
Il est intéressant d'être alerté sur les conférences de type "web sémantique",
"recherche d'info sur le web", "IA"...
Il est temps de commencer à rédiger des choses qui pourront à moyen terme
être partie intégrante d'un article.
Se fixer l'objectif d'avoir quelque chose de prêt pour l'IJCAI 2001 semble
raisonnable (même si ça doit ensuite aller dans les workshops, etc.).
Divers
- ajout sur le site d'une série de transparents concernant Escrire:
http://www.inrialpes.fr/exmo/cooperation/escrire/Pres-escrire-2000/
- le corpus Stress est en stand-by dans l'attende de la signature d'une
convention INRS-LORIA.
- une présentation d'Escrire a été insérée dans le dernier Ercim news:
http://www.ercim.org/publication/Ercim_News/enw41/euzenat2.html
elle devrait être intégrée au site Web.
- un papier intéressant/concurent/... (à la mode Karp) sur la comparaison
de langages d'écriture d'ontologies pour la génétique moléculaire
http://smi-web.stanford.edu/projects/bio-ontology/
- Proposition de réseau thématique européan OntoWeb dans lequel les trois
projet d'Escrire sont impliqués. Le noeud INRIA dirigerait les relations avec
les autres initiatives non Européennes.
- papier d'Acacia sur leur plate-forme RDF-GC à ICCS-2000
Olivier Corby, Rose Dieng, Cédric Hébert
A Conceptual Graph Model for W3C Resource Description Framework
Actions
- OC: synthèse de nos discussions sur recherche documentaite/recherche ontologique
- RT: mise à jour des DTD (qesc, resc, escrire)
- ?: étude sur l'utilisation d'ID/IDREF dans les ontologies
- JE: obtenir des informations de biologistes sur (a) les nouveaux gènes du corpus, (b) le corpus obtenu et (c) les requêtes qu'ils voudraient poser.
- JE: rendre accessible les nouvelles annotations (--> début juillet).
Le 5 juillet à Paris (salle Yannick Toussaint)
ou (si celle de juillet n'est pas nécessaire): 13 septembre.
Le 13 septembre étant une date au cours de laquelle se déroulent à Lyon
les Rencontres des Jeunes Chercheurs en IA (à laquelle certain se sont
engagés à participer) on pourrais retenir plutôt le 14 septembre à Lyon
(si tout le monde est d'accord avec cette proposition, elle est
entérinée).
À voir si l'on fait quelque chose à Sophia en connexion avec EKAW.
http://www.inrialpes.fr/exmo/cooperation/escrire/private/cr-20000505.html
Feel free to comment to Jerome
. Euzenat À inrialpes . fr,
$Id: cr-20000505.html,v 1.2 2003/08/20 10:43:24 euzenat Exp $