Le traitement des données langagières est complexe et le développement de ressources et outils de Traitement Automatique des Langues est donc très lourd et gourmand en ressources humaines et, de fait, financières. Ceci explique le peu de ressources et outils existants pour les langues minoritaires ou les dialectes. Pourtant, dans le cas des dialectes, la proximité avec la langue "standard" fait qu'il est possible d'utiliser les outils développés pour celle-ci, à condition de pouvoir faire le lien entre variantes dialectales et formes "standard" à l'aide de ressources spécifiques. En effet, les outils du TAL sont peu robustes aux déviances de la norme standard (différentes conventions orthographiques, fautes d'orthographe, langage SMS ou tchatté, et également variantes dialectales) et il est donc nécessaire de normaliser les données pour pouvoir appliquer les outils.
Ce besoin de normalisation vers une langue standard pose de nombreuses questions scientifiques qui vont au-delà de purs problèmes d'ingénierie et s'étendent à des domaines tels que la didactique des langues, lorsqu'il s'agit d'enseigner un dialecte.
Le projet se propose de répondre à cette problématique en trois étapes :
Conseil scientifique de l'université de Strasbourg, appel à projets 2012
- Jinwoo Cha : 7 novembre 2024 - Anaïs Koehler : 6 décembre 2024 - Amandine Robert : 7 décembre...
Le laboratoire LiLPa a le grand plaisir d’annoncer la parution d’un livre en l’honneur de notre...