Search & Find
Accueil
Accueil   >   Ressources

Ressources

Liste de ressources électroniques et outils développés dans le cadre des projets

  1. Corpus français étiqueté et lemmatisé corrigé manuellement (environ 900000 tokens), pour l'entraînement de l'étiqueteur TTL (Ion 2007) et de l'analyseur syntaxique de Bohnet (Bohnet 2009);
  2. Corpus parallèle aligné au niveau lexical FR-EN; EN-RO (1000 phrases);
  3. RefGen – outil de détection automatique de chaînes de réference, dévéloppé en Java (comprenant une base de patrons d'extraction des entités nommées et des emplois impersonnels de 'il');
  4. Corpus annoté en relations de coréférence (10000 tokens), en format XML;
  5. Corpus français de textes scientifiques-textes de vulgarisation (1000000 tokens), analysé syntaxiquement avec l'analyseur syntaxique de Bohnet (2009);
  6. Dictionnaire multilingue de collocations (français-roumain, 250 entrées);
  7. Prototype pour un dictionnaire bilingue pour la traduction français-espagnol (Transverb);
  8. Logiciel d'annotation XmlCat, développé dans le cadre du projet Représentations (Guide d'utilisation)
     
Investissements Avenir
Université de Strasbourg

Flux RSS

Le 22 mars 2024
De 09h45 à 15h30
Patio, salle 4402

Flux RSS

sept. 21 2023

LiLPa organise six séminaires au cours de l'année.Les séminaires de l'UR LiLPa ont lieu le vendredi...