Compte rendu de la réunion de démarrage
de l'ARC ESCRIRE de l'INRIA
CPE, Villeurbanne, 10/9/1999, 9h-17h

Présents:
Amedeo Napoli, Olivier Corby, Rose Dieng, Yannick Toussaint, Jérôme Euzenat
Invités:
Béatrice Fuchs, Pierre-Antoine Champin

Cette réunion a fait suite à une réunion un peu plus ouverte concernant les rapports entre XML et objets (voir compte rendu séparé). On y a abordé toute sorte de questions:

Annoter des documents XML.

Le schéma proposé consiste à utiliser RDF pour poser les annotations et une DTD XML spécifique pour chacune des représentations. Ce qui donnera le schéma suvant:

<Xhtml>
...
	<RDF>
		<DESCRIPTION about="/">
			<PROPERTY>
				<GC>
				...
				</GC>
			</PROPERTY>
			...
		</DESCRIPTION>
		...
	</RDF>
...
</XHTML>

Comme nous ne sommes pas sûr de la compatibilité des analyseurs XML et RDF en géréral (mais SAX permettrait plusieurs DTD dont RDF), on pourra définir pour ce besoin une DTD pseudo-RDF qui permettra d'utiliser un analyseur XML.

ACTION: en attente des textes pour réaliser un exemple.

Analyseurs, clients

Concernant les clients à utiliser, il semble qu'il y ait trois solutions:

On laisse la réponse à cette question en suspend car la situation risque d'évoluer très vite mais l'approche serveur de servlet est à creuser. En particulier elle permettrait de réaliser un serveur global à partir duquel les résultats du projets seraient intégrés.

ACTION: suivre l'évolution, voir les serveurs de Servlets.

Textes

Amedeo a présenté le CD-ROM sur l'acier que nous pourrions utiliser, au moins en ce qui concerne la connaissance de fond permettant de créer le schéma des bases. Les textes peuvent être extraits (au moins partiellement en SGML)

Il manque cependant les textes que nous pourrions réellement représenter et qui doivent présenter un caractère d'homogénéité dans le contenu et dans la forme.

Sont proposées quelques solutions de repli comme des bases sur le stress ou des résumés de l'INIST.

ACTION: Amedeo/Yannick tentent de récupérer les textes de comptes-rendus d'expérience que nous pourrions utiliser. Sinon, chacun pense à des solutions de repli.

Europe

Yannick présente l'état de la proposition FET (Future Emergent Technologies) qui a circulée en juin. Il propose de la reformuler avec la fouille de textes comme sujet principal et la comparaison de formalisme en veuilleuse (rappel, on n'apparaitrait dans cette proposition que comme INRIA).

ACTION: Yannick rédige une nouvelle version et la fait de nouveau circuler.

Méthodologie

Une discussion sur la méthodologie d'évaluation des système a été entamée. Elle est résumée ci-dessous mais fera l'objet d'un rapport plus détaillé. La discussion a été divisée en trois points: méthodologie (déroulement des évluations), Critères (d'évaluation), Requêtes (le type de requêtes à évaluer et leurs caractéristiques).

Méthodologie

Critères:

Requêtes

Les opérateurs (=, domaine, <=, contraintes, appartient...) sont aussi à considérer.

ACTION: Chacun à un devoir à faire qui consiste à récupérer des informations sur les types de requêtes disponibles dans un système:

ACTION: Jérôme doit rédiger le début du rapport sur l'aspect méthodologique.

Planning

Prochaine réunion: 8-9(voire 10 novembre):
Déliverable véritables de l'ARC (indépendant des CR d'avancement):
- méthodologie (fin 1999)
- résultats (mi 2001)
Les échéances que l'on se fixe sont les suivantes:
Février-Mars 2000
fin de définition du langage pivot;
fin de construction d'ontologie;
Septembre 2000
synchronisation des protos;
Début 2001
évaluation (puis rédaction du rapport).

Divers

Amedeo a evoqué l'aspect LD et XML, Jérôme a évoqué RCO et XML. Ces deux points feront partie du résumé de la journée du 9/9/99.
http://www.inrialpes.fr/exmo/cooperation/escrire/private/cr-990910.html

Feel free to comment to Jerome . Euzenat inrialpes . fr, $Id: cr-19990910.html,v 1.2 2003/08/20 10:40:08 euzenat Exp $