DEFT'08
▸ appel
▸ tâche
▸ comités et calendrier
▸ corpus
▸ inscription
▸ questions fréquentes/FAQ
▸ soumissions
▸ résultats et publication
▸ programme et actes

Foire aux questions    

Adressez vos questions, nous y répondrons au plus vite et les publierons sur cette page.

[Corpus d'apprentissage]

Question : Nous sommes quelques-uns à avoir remarqué que dans la description des tâches il est dit qu'il y a pour la tâche 2, un jeu de 5 classes thématiques en réalité le corpus d'apprentissage en comporte 9. Est-ce volontaire (destiné à complexifier le test pour lequel il n'y aura que 5 classes) ou une erreur involontaire de description de la tâche 2. En ce cas la page http://deft08.limsi.fr/corpus-desc.php mériterait d'être corrigée.

Réponse : Il y a effectivement une erreur au niveau de la constitution du corpus d'apprentissage. Conformément à ce qui est indiqué sur le site, il n'aurait dû y avoir que 5 catégories dans le corpus d'apprentissage de la tâche 2. Nous recherchons actuellement l'erreur et vous préviendrons de la mise en ligne des nouveaux corpus. [29/01/08, corpus corrigé].


Question : Est-il possible d'employer des stratégies de recherche dans un corpus plus large que celui qui est fourni ?

Réponse : comme pour la campagne précédente, des connaissances linguistiques supplémentaires (lexiques de mots, connaissances sémantiques extraites de grands corpus, etc.) peuvent être utilisées ; en revanche, seuls les corpus d'apprentissage fournis doivent être utilisés pour l'entraînement à la tâche.


Question : Est-ce normal que le nombre de documents pour la tache 2 soit reduit à 23550 documents ?

Réponse : La réduction du nombre de documents à 23 550 dans le corpus d'apprentissage de la tâche 2 est tout-à-fait normale. Le premier corpus comprenait des articles en excès n'appartenant pas aux 5 catégories de la tâche 2 (FRA, INT, LIV, SCI, SOC). Après élimination des articles en dehors de ces 5 catégories, il est normal d'avoir 23 550 documents.


Question : j'ai essayé de télécharger le corpus 2, mais je n'y suis pas arrivée, malgrès plusieurs tentatives. Mes login et mot de passe sont reconnus, mais j'ai ensuite le message d'erreur ci-dessous :
La page XML ne peut pas être affichée. Impossible d'afficher l'entrée XML en utilisant la feuille de style. Corrigez l'erreur, puis cliquez sur le bouton Actualiser ou réessayez ultérieurement. Échec du téléchargement de la ressource spécifiée. Erreur de traitement de la ressource http://deft08.limsi.fr/corpus/deft08.dtd

Réponse : D'après le message d'erreur, je me demande si le problème de vient pas de la DTD associée au corpus. Je viens de mettre à jour cette DTD qui comprenait deux éléments erronés. Peut-être ces erreurs constituaient-elles la cause de votre problème ? [31/01/08 : DTD modifiée]

[Traitements des corpus]

Question

Réponse


LIMSI-CNRS