Description des données

Note : les formats décrits ici sont valables pour la référence et les résultats attendus des systèmes.

Liste des identifiants des tweets

Le format du fichier est un identifiant de tweet par ligne :

	  
535745777336086528
535175951156776960
535113272543178753
...
	  
	

Tâche 1

Les données de référence et les réponses sont des fichiers tabulaires à 2 colonnes : identifiant du tweet, polarité. La polarité est décrite sous forme de 3 caractères : + (positif), - (négatif), = (mixte ou neutre).

Par exemple :

	  
520568490739392513	-
	  
	

Tâche 2

Tâche 2.1

Les données de référence et les réponses sont des fichiers tabulaires à 2 colonnes : identifiant du tweet, classe générique de l'information exprimée. La classe générique de l'information exprimée est identifiée de la manière suivante : INFORMATION, OPINION, SENTIMENT, EMOTION.

Par exemple :

520568490739392513	EMOTION
	    
	    
	  

Tâche 2.2

Les données de référence et les réponses sont des fichiers tabulaires à 2 colonnes : identifiant du tweet, classe spécifique de l'information exprimée. La classe spécifique de l'information exprimée est identifiée de la manière suivante : COLÈRE, PEUR, TRISTESSE, DÉGOÛT, ENNUI, DÉRANGEMENT, DÉPLAISIR, SURPRISE NÉGATIVE, APAISEMENT, AMOUR, PLAISIR, SURPRISE POSITIVE, INSATISFACTION, SATISFACTION, ACCORD, VALORISATION, DÉSACCORD, DÉVALORISATION.

Par exemple :

	    
520568490739392513	ENNUI
	    
	  

Tâche 3

Les données de référence et les réponses sont des fichiers tabulaires à 4 ou 6 colonnes (le séparateur est la barre verticale |).

Par exemple :

	  
520568490739392513|SUR|OSEE|42-52|TARG|1-35
488731397788413952|SUR|OSEE|1-6|TARG|8-28
488731397788413952|SUR|OSEE|30-39|TARG|8-28
520687975739715584|GRP|DEVALORISATION|57-65
520687975739715584|GRP|NEGATIF|123-126
520812775497793536|GRP|CIBLE|1-20