Search & Find

Ressources

Liste de ressources électroniques et outils développés dans le cadre des projets

  1. Corpus français étiqueté et lemmatisé corrigé manuellement (environ 900000 tokens), pour l'entraînement de l'étiqueteur TTL (Ion 2007) et de l'analyseur syntaxique de Bohnet (Bohnet 2009);
  2. Corpus parallèle aligné au niveau lexical FR-EN; EN-RO (1000 phrases);
  3. RefGen – outil de détection automatique de chaînes de réference, dévéloppé en Java (comprenant une base de patrons d'extraction des entités nommées et des emplois impersonnels de 'il');
  4. Corpus annoté en relations de coréférence (10000 tokens), en format XML;
  5. Corpus français de textes scientifiques-textes de vulgarisation (1000000 tokens), analysé syntaxiquement avec l'analyseur syntaxique de Bohnet (2009);
  6. Dictionnaire multilingue de collocations (français-roumain, 250 entrées);
  7. Prototype pour un dictionnaire bilingue pour la traduction français-espagnol (Transverb);
  8. Logiciel d'annotation XmlCat, développé dans le cadre du projet Représentations (Guide d'utilisation)
     
Investissements Avenir
Université de Strasbourg

Flux RSS

Le 16 novembre 2018
De 15h00 à 18h00
Le Patio, Bâtiment IV, Salle 4402
Du 22 novembre 2018 au 24 novembre 2018
Université de Strasbourg

Flux RSS

déc. 7 2018

Journée d'étudeorganisée par Fonctionnements Discursifs et TraductionLe 07 décembre 2018"La...

déc. 6 2018

Le colloque "CE disant, que fait-on ? Aspects grammaticaux et discursifs de ce en français"  aura...