Search & Find

Ressources

Liste de ressources électroniques et outils développés dans le cadre des projets

  1. Corpus français étiqueté et lemmatisé corrigé manuellement (environ 900000 tokens), pour l'entraînement de l'étiqueteur TTL (Ion 2007) et de l'analyseur syntaxique de Bohnet (Bohnet 2009);
  2. Corpus parallèle aligné au niveau lexical FR-EN; EN-RO (1000 phrases);
  3. RefGen – outil de détection automatique de chaînes de réference, dévéloppé en Java (comprenant une base de patrons d'extraction des entités nommées et des emplois impersonnels de 'il');
  4. Corpus annoté en relations de coréférence (10000 tokens), en format XML;
  5. Corpus français de textes scientifiques-textes de vulgarisation (1000000 tokens), analysé syntaxiquement avec l'analyseur syntaxique de Bohnet (2009);
  6. Dictionnaire multilingue de collocations (français-roumain, 250 entrées);
  7. Prototype pour un dictionnaire bilingue pour la traduction français-espagnol (Transverb);
  8. Logiciel d'annotation XmlCat, développé dans le cadre du projet Représentations (Guide d'utilisation) ;
Investissements Avenir
Université de Strasbourg

Flux RSS

Du 6 septembre 2017 au 31 décembre 2017
Du 9 novembre 2017 au 10 novembre 2017
Strasbourg

Flux RSS

avril 7 2017

Interview de Julie Glikman sur recherche.unistra.fr