Ecole thématique

Imprimer PDF

L'école thématique du CNRS sur l'annotation de données langagières est organisée conjointement par les laboratoires CNRS LATTICE et MODYCO. Elle se déroulera du 10 au 16  septembre 2011 à Biarritz.

 

La linguistique mais aussi d’autres domaines au sein des sciences sociales font de plus en plus appel à l’utilisation de corpus (ou au moins de données écrites ou orales attestées) pour effectuer des recherches très diverses. Malgré cette diversité, des besoins communs sont avérés, notamment au niveau de l’enrichissement de ces données par des annotations (syntaxiques, sémantiques, pragmatiques). Or ces pratiques s’apprennent largement « sur le tas ». C’est pourquoi il paraît important de répondre à un besoin de formation et de dialogue autour de la notion d’annotation, pour unifier les pratiques, faire émerger une communauté et faire profiter les uns et les autres de retours d’expérience.

Par le passé, des écoles thématiques (ou des événements similaires) ont été organisées sur la notion de corpus (voir par exemple F. Rastier et F. Ballabriga, 2006) ou sur l’analyse statistique de corpus (école thématique « méthodes informatiques et statistiques en analyse de textes », organisée à Besançon en 2009, à Nice en 2010 et à Besançon en 2011, http://laseldi.univ-fcomte.fr/ecole/).

Cette école thématique porte quant à elle plus spécifiquement sur l’annotation de corpus de données langagières. Il s’agit d’un aspect tout à fait complémentaire des événements cités supra (l’annotation suppose l’existence de corpus ; les annotations peuvent ensuite être exploitées par des méthodes statistiques). L'originalité de cette école est de se focaliser sur la notion même d’annotation, qui demande un ensemble de compétences et de pratiques spécifiques.