DEFT'09
Chiamata       Compito       Comitati e calendario       Corpo
Risultati e pubblicazione       Programma ed atti
 
  [Aiuto]

Corpus

Descrizione del corpo

Il corpus è costituito da due distinte fonti: i dibattiti del Parlamento europeo e una serie di articoli dai giornali Le Monde (Francia), The Financial Times (UK) e Il Sole 24 Ore (Italia).

Corpus "parlamento"

Questo organismo comprende 32 289 interventi dei parlamentari, tenutasi al Parlamento europeo tra il 1999 e il 2004. Solo l'intervento del parlamento affiliati a una delle cinque parti sono stati estratti:

Esempi

Corpus "giornale"

L'assegnazione dei valori "obiettivo" e "soggettiva" di cui agli articoli è stato realizzato in modi diversi secondo i giornali:

Esempi "Le Monde"

Esempi "The Financial Times"

Esempi "Il Sole 24 Ore"

corpus formato

Il corpo è in formato XML DTD cui è disponibile qui (aggiornamento: 12/11/08).

Gli elenchi di valori per le proprietà di questo tipo (compito 1) e dei partiti politici (task 3) sono le seguenti:

Per i compiti 1 e 3 che abbiamo di riferimento file disponibili, il processo di apprendimento può essere stabilita. Tuttavia, per i task 2, non abbiamo alcun file di riferimento.

Esempi

Scarica il corpus

La codifica del corpo è stato modificato per avere standard di codifica UTF-8. Qualsiasi ortografia o di punteggiatura non sono stati corretti.

La login e password necessarie per l'accesso al corpus saranno inviate alle persone che sono registrate e che hanno firmato e restituito il contratto.

Corpus di apprendimento

Aggiornamento: mercoledi' 21 gennaio 2009.

Corpus di prova

Aggiornamento: mercoledi' 18 marzo 2009.

I dati di riferimento

Aggiornamento: Venerdì 24 aprile 2009.