Le format du fichier est un identifiant de tweet par ligne :
535745777336086528
535175951156776960
535113272543178753
...
Les données de référence et les réponses sont des fichiers tabulaires
à 2 colonnes : identifiant du tweet, polarité. La polarité est décrite sous forme de 3 caractères : +
(positif), -
(négatif), =
(mixte ou neutre).
Par exemple :
520568490739392513 -
Les données de référence et les réponses sont des fichiers tabulaires
à 2 colonnes : identifiant du tweet, classe générique de
l'information exprimée. La classe générique de l'information exprimée
est identifiée de la manière suivante : INFORMATION
, OPINION
,
SENTIMENT
, EMOTION
.
Par exemple :
520568490739392513 EMOTION
Les données de référence et les réponses sont des fichiers tabulaires
à 2 colonnes : identifiant du tweet, classe spécifique de
l'information exprimée. La
classe spécifique de l'information exprimée est identifiée de la manière suivante : COLÈRE
, PEUR
, TRISTESSE
, DÉGOÛT
, ENNUI
, DÉRANGEMENT
, DÉPLAISIR
, SURPRISE NÉGATIVE
, APAISEMENT
, AMOUR
, PLAISIR
, SURPRISE POSITIVE
, INSATISFACTION
, SATISFACTION
, ACCORD
, VALORISATION
, DÉSACCORD
, DÉVALORISATION
.
Par exemple :
520568490739392513 ENNUI
Les données de référence et les réponses sont des fichiers
tabulaires à 4 ou 6 colonnes (le séparateur est la barre verticale
|
).
GRP
,
catégorie spécifiques (cf. tableau 1), empan de texte (voir
ci-dessous).DIT
, SUR
,
MOD
, NEG
. Les groupes sont décrits
sous forme de deux colonnes qui correspondent au
type du groupe (SRC
(SOURCE),
TARG
(TARGET), OSEE
,
MOD
, NEG
) et à l'empan de texte du
tweet correspondant au groupe. L'empan est décrit de la
manière suivante :
start_offset-end_offset(,start_offset-end_offset)*
. L'offset
de début (start_offset
) et l'offset de fin
(end_offset
) correspondent aux caractères dans le
texte du tweet (le premier offset est 1).
Par exemple :
520568490739392513|SUR|OSEE|42-52|TARG|1-35
488731397788413952|SUR|OSEE|1-6|TARG|8-28
488731397788413952|SUR|OSEE|30-39|TARG|8-28
520687975739715584|GRP|DEVALORISATION|57-65
520687975739715584|GRP|NEGATIF|123-126
520812775497793536|GRP|CIBLE|1-20