Search & Find

Ressources

Liste de ressources électroniques et outils développés dans le cadre des projets

  1. Corpus français étiqueté et lemmatisé corrigé manuellement (environ 900000 tokens), pour l'entraînement de l'étiqueteur TTL (Ion 2007) et de l'analyseur syntaxique de Bohnet (Bohnet 2009);
  2. Corpus parallèle aligné au niveau lexical FR-EN; EN-RO (1000 phrases);
  3. RefGen – outil de détection automatique de chaînes de réference, dévéloppé en Java (comprenant une base de patrons d'extraction des entités nommées et des emplois impersonnels de 'il');
  4. Corpus annoté en relations de coréférence (10000 tokens), en format XML;
  5. Corpus français de textes scientifiques-textes de vulgarisation (1000000 tokens), analysé syntaxiquement avec l'analyseur syntaxique de Bohnet (2009);
  6. Dictionnaire multilingue de collocations (français-roumain, 250 entrées);
  7. Prototype pour un dictionnaire bilingue pour la traduction français-espagnol (Transverb);
  8. Logiciel d'annotation XmlCat, développé dans le cadre du projet Représentations (Guide d'utilisation)
     
Investissements Avenir
Université de Strasbourg

Flux RSS

Le 10 mai 2019
De 09h00 à 17h30
Salles des conférences, MISHA
Du 20 juin 2019 au 22 juin 2019
Université Pavol Jozef Safarik de Kosice (Slovaquie)

Flux RSS

janv. 23 2019

Le colloque "Langues minoritaires » : quels acteurs pour quel avenir ?" aura lieu à Strasbourg les...

déc. 11 2018

  LiLPa et le GEO organisent, en collaboration avec l'Université de Lettonie, le colloque...