Search & Find
Accueil
Accueil   >   Parole et cognition

PC


Responsable : Béatrice VAXELAIRE

L'EQUIPE

Actuellement, l’E.R. Parole et Cognition est l’une des équipes de recherche les plus performantes, au niveau mondial, dans le traitement et l’analyse de phénomènes articulatoires, à l’aide de données cinéradiographiques.

SAUVEGARDE, NUMERISATION ET VALORISATION DE DONNEES PATRIMONIALES CINERADIOGRAPHIQUES : MOYENS MIS EN ŒUVRE ET RESULTATS OBTENUS

Grâce aux deux contrats financés INTERREG « DANOK » (Datenbank- und Archivierungsnetzwerk oberrheinischer Kulturträger ou « Banque de données et réseau d’archivage de porteurs de projets culturels du Rhin Supérieur », 2005/2006-2007 porté par l’E.R. Parole et Cognition et l’E.R. GEPE) et l’ANR DOCVACIM nous avons réussi à sauvegarder et à numériser plus de 30 films cinéradiographiques.

Il s’agit de données uniques au monde, indispensables pour la compréhension de phénomènes coarticulatoires en production et en perception de la parole. Ces données manquent cruellement à la communauté phonétique. Leur intégration dans une base (hébergée à la Maison Inter-universitaire des Sciences de l’Homme Alsace-MISHA, dans le cadre du contrat « Perturbations et réajustements : parole normale vs. parole pathologique, 2008-2012) est en cours. Les interactions multiples entre les laboratoires partenaires, dans le cadre de contrats communs (MISHA, ANR-DOCVACIM et européens), ont permis de développer des outils d’extraction automatique des contours sagittaux du conduit vocal, à partir des films radiologiques : X-Articulator.

Le développement de ces outils a été fait parallèlement à la réalisation manuelle d'un certain nombre de tracés de ces contours par des experts phonéticiens de l’E.R. Parole et Cognition ; ces contours ont été exploités comme données de référence. De tels traitements automatiques, effectués conjointement au LORIA et dans l’E.R. Parole et Cognition, ont sensiblement facilité l'exploitation systématique des données cinéradiographiques, que ce soit pour le développement de modèles géométriques du conduit vocal, pour la mise au point de méthodes d'inversion du signal de parole (de l'acoustique vers les commandes articulatoires), ou encore pour l'étude des phénomènes coarticulatoires, grâce à une possibilité, toute novatrice, de visualisation dynamique et de suivi des gestes audibles et visibles du conduit vocal, lors de la production de la parole.

Ces avancées ont été rendues possibles par notre collaboration avec le LORIA, dans le cadre d’un contrat européen entre le CNRS et la Commission Européenne n° 2005-021324, intitulé « Audiovisual to Articulatory SPeech Inversion » - ASPI, 2006 -2009, l’E.R. Parole et Cognition étant sous-traita

Axe 1. CARACTERISATION DES PHENOMENES DE COARTI- CULATION : MOYENS MIS EN ŒUVRE ET RESULTATS OBTENUS

En ce qui concerne la caractérisation des phénomènes de coarticulation, un des intérêts potentiels de la base de données cinéradiographiques de l’Institut de Phonétique de Strasbourg est son aspect multilingue.

A titre d’exemple, nous collaborons sur la spécificité phonologique des langues avec le Laboratoire de Phonétique et de Phonologie (LPP) de Paris III – Sorbonne Nouvelle et menons des travaux et des publications communs sur des faits phonétiques et phonologiques (Lab Phon) de la gémination du tarifit : une variante du berbère parlée au nord du Maroc (thèse de F. Bouarourou en cours, en collaboration avec R. Ridouane, CR1 au LPP). Nous avons, dans cette optique, effectué un travail sur la coarticulation (et plus précisément sur la coarticulation anticipatoire) et sa variabilité, en fonction de la densité des systèmes phonologiques. Cela nous a permis de procéder relativement aisément à une étude des interactions entre le niveau de la production de la parole et celui de la perception de la parole.

En effet, nous avons pu relier la variabilité des phénomènes de coarticulation selon les langues à des contraintes perceptives imposées par les systèmes phonologiques des langues. Nous avons proposé un modèle sur la perception anticipatoire d’événements (Anticipatory Perception of Events – APE Hypothesis). Le modèle APE a été développé dans ce cadre conceptuel des interactions perceptivo-motrices. Il montre, pour la première fois, à partir de données articulatoires géométriques et cinématiques, et acoustiques, comment le comportement auditif et visuel de l’interlocuteur est calé sur des événements articulatoires géométriques, cinématiques et acoustiques, déterminés.

C’est l’organisation spatio-temporelle de ces événements articulatoires géométriques (l’aire aux lèvres minimale ou maximale, l’écartement minimal ou maximal des maxillaires, la protrusion maximale, l’étirement maximal, positions et diamètres des constrictions linguales…), cinématiques (début du mouvement, maximum d’accélération, maximum de vitesse, maximum de décélération, maximum ou fin du mouvement) et acoustiques (début et fin du voisement, apparition et disparition d’une structure formantique clairement définie, l’explosion-friction…) qui conditionne la perception auditive et visuelle des sujets.

Cette thématique de recherche a été conduite dans le cadre du contrat de la MISHA, « Anticiper pour construire des modalités sémiotiques » 2005-2008, attribué à l’E.R. Parole et Cognition, et menée en collaboration avec le Gipsa-Lab de Grenoble.

Nous avons pu, toujours préoccupés par la thématique de l’anticipation, comparer des données de sujets sains à celles de sujets pathologiques, atteints de cancers endobuccaux et de divisions labio-palatines chez l’enfant. Ces travaux ont été possibles grâce à nos collaborations avec les Centres des Hôpitaux Universitaires de Strasbourg (CHU-Hautepierre) et de Grenoble (CHU-Grenoble), dans le cadre d’un contrat de recherche de la MISHA, intitulé « Perturbations et réajustements : parole normale vs parole pathologique). La collecte de données auprès de sujets atteints de divisions labio-palatines a été faite au CHU de Strasbourg (thèse de M. Béchet en cours) et la collecte de données sur les cancers endobuccaux a pu être effectuée grâce à une collaboration entre notre équipe et les CHU de Strasbourg et de Grenoble.

Nous avons pu comparer, toujours pour l’analyse de faits anticipatoires, les productions de sujets sains à celles d’anciens sujets bègues (qui ont suivi une rééducation) et à des sujets bègues sévères. La réalisation de films et le collectage de données nasofibroscopiques auprès de sujets bègues ont été conduits, en collaboration avec l’Hôpital Européen Georges Pompidou à Paris, dans le cadre de la thèse de F. Hirsch, soutenue en 2007. Depuis le départ de F. Hirsch en 2010 (nommé MCF à Montpellier), ces derniers travaux ont été poursuivis en collaboration avec le Laboratoire PRAXILING de l’Université de Montpellier 3, dans le cadre du Programme de la MISHA « Perturbations et réajustements : parole normale vs parole pathologique » 2009-2012 et l’ANR DOCVACIM, 2009-2011. L’étude de phénomènes coarticulatoires dans les pathologies de la parole a été élargie au domaine des parésies et des paralysies récurrentielles, grâce à notre collaboration avec le Centre Paul Strauss-Centre de lutte contre le cancer à Strasbourg (doctorat de C. Fauth en cours). Etant donné que la parole pathologique produite est perturbée dans son organisation spatio-temporelle, à des degrés de sévérités variables, nos résultats montrent, de manière inédite, que les événements étudiés sur le signal de parole (articulatoire et acoustique) le sont également. Cela entraîne, dans de tels contextes, une réorganisation du calage du comportement perceptif (auditif et visuel) sur les événements moteurs, par rapport au contexte de production normale (cf. par ex. HIRSCH F. MONFRAIS-PFAUWADEL M.-C. SOCK R. VAXELAIRE B. (2009) Revue de Laryngologie, Otologie, rhinologie, numéro spécial de Phono-Audiologie, 17-22 ; BECHET M. FERBACH-HECKER V. HIRSCH F. SOCK R. VAXELAIRE B. STIERLE J.-L. (2008) In Proceedings of the 8th International Seminar on Speech Production 2008, 8th-12th December 2008, Strasbourg, 265-268 ; FAUTH C. VAXELAIRE B. RODIER J.-F. VOLKMAR P.-P. BOUAROUROU F. HIRSCH F. SOCK R. (2011) In Proceedings of 9th International Seminar on Speech Production, Montréal, 20-23 juin 2011), validant ainsi la prédiction de notre modèle APE.

Axe 2. INVERSION DES DONNEES ACOUSTIQUES : MOYENS MIS EN ŒUVRE ET RESULTATS OBTENUS

L’élaboration de modèles de contrôle a été faite par inversion des données acoustiques. L’inversion est un procédé mathématique qui consiste à récupérer des formes articulatoires à partir du signal acoustique. Pour y parvenir, nous avons procédé à la définition de contraintes coarticulatoires, à partir d’images du conduit vocal, extraites de la base de données cinéradiographiques. La dimension multilingue du corpus a permis de confronter diverses stratégies coarticulatoires, imposées largement par des contraintes phonologiques spécifiques aux langues. Le développement et l’évaluation des méthodes d’inversion sont en train d’être enrichis par la nature diversifiée du corpus (publications sur cette thématique en cours). Cette thématique de recherche a bénéficié principalement de l’expertise du LORIA de Nancy et de ParisTech pour ce qui concerne l’analyse de données cinéradiographiques, cinématiques et acoustiques, et la synthèse de la parole. Elle fait partie d’une des thématiques de notre ANR « DOCVACIM ».

Axe 3. EVALUATION DE MODELES PHYSIQUES : MOYENS MIS EN ŒUVRE ET RESULTATS OBTENUS

La compréhension des mécanismes de contrôle de la production de la parole, c'est-à-dire du passage de la chaîne phonémique au déplacement des articulateurs du conduit vocal et à la production du signal acoustique, passe, selon nous, par le développement et l'évaluation de modèles du contrôle moteur (modèle de la génération des commandes musculaires, à partir de la chaîne de phonèmes) et de modèles physiques de l'appareil de production de la parole (génération du mouvement des articulateurs, puis du son à partir des commandes musculaires).

C'est la comparaison de données mesurées sur des locuteurs, dans des conditions bien contrôlées avec les prédictions proposées par ces modèles qui permet d'évaluer, de manière quantitative et objective, les différentes hypothèses proposées dans la littérature sur le contrôle de la production de la parole (existence de cibles en parole, nature de ces cibles, modèle de coarticulation, d'anticipation…). De ce point de vue, les données cinéradiographiques présentent un intérêt tout particulier, puisqu'elles offrent une vue complète du conduit vocal, dans le plan sagittal et cela, à une cadence relativement importante (50 Hz au minimum).

Cet objectif d'évaluation des modèles physiques est en cours. Il constitue l’une des applications les plus naturelles et les plus attendues de notre travail de formatage et de mise à disposition de nos données. Il est mené en collaboration avec le Zentrum für Allgemeine Sprachwissenschaft (ZAS) à Berlin, dans le cadre du projet de recherche DGF « SPRECHART: SPRECHerspezifische ARTikulation als Adaptation an individuelle Vokaltraktgeometrien » (projet en cours sur « l’étude des effets de la forme du conduit vocal sur la biomécanique et la précision articulatoire »).

Ce projet réunit le Gipsa-Lab de Grenoble (modélisation biomécanique), le LORIA de Nancy (développement de modèles), l’Institut für Phonetik und Sprachliche Kommunikation der Universität München (mise en forme de données IRM et cinéradiographiques) et Haskins Laboratories, New Haven, Connecticut, USA (mise en forme de données cinéradiographiques). L’évaluation de modèles physiques est aussi une des problématiques de recherche de notre ANR « DOCVACIM ». Notre collaboration avec Max Planck Institute for Human Cognitive and Brain Sciences pour la collecte de données sur l’acquisition du langage a permis de contribuer aux connaissances sur la cinématique des gestes chez le bébé de 6 à 12 mois. Il s’agit là d’informations importantes pour la modélisation de l’évolution du conduit vocal de l’âge tendre jusqu’à l’âge adulte. Cette collaboration a abouti à la thèse de M. Canault, soutenue en 2007.

Les échanges se sont déroulés largement dans le cadre d’ateliers ou workshops satellites lors de manifestations nationales ou internationales sur la valorisation de bases de données et dans le cadre d’ateliers sur la coarticulation, l’inversion et l’évaluation de modèles physiques (cf. International German-French Summerschool on “Cognitive and Physical Models of speech production, perception and perception-production interaction. Part II: Brain and Speech, Autrans, 16-21 septembre 2007 ; 2èmes Journées de Phonétique Clinique-JPC2, Grenoble, 13-14 décembre 2007 ; 8th International Seminar on Speech Production-ISSP’08, organisé à Strasbourg, en décembre 2008 ; Séminaire d’Ouverture à la Phonétique Clinique : Perturbations et Réajustements : parole normale vs parole pathologique, Programme de la MISHA, 10 décembre 2009, Strasbourg ; International Summerschool on Cognitive and Physical Models of Speech Production, Speech Perception and Production-Perception Interaction, Berlin, du 27 septembre au 1er octobre 2010).

Notre approche des problèmes de production-perception de la parole est empreinte de cet héritage transdisciplinaire propre aux Sciences du Langage : de l’exploitation de systèmes d’acquisition numériques et analogiques hautement performants, en passant par l’élaboration de contraintes spatio-temporelles, pour une meilleure connaissance du code linguistique, par la modélisation, des différentes langues étudiées. La multidisciplinarité de nos problématiques de recherche, notamment dans le domaine de la Phonétique Clinique, sollicite des compétences en phonétique générale et expérimentale, en phonétique clinique, en chirurgie, en médecine, en orthophonie, en modélisation et en phonologie.

Cette multidisciplinarité, incontournable en phonétique générale et expérimentale, témoigne de l’importance de la problématique abordée. Elle apporte un éclairage multiple et novateur, qui met en lumière, de manière stimulante et motivante, à la fois les différentes formes que peuvent prendre les phénomènes de relations perception et action et les différents niveaux où ils se manifestent : la production de la parole ; la perception de la parole ; la compréhension du langage et la qualité de vie.

Institut de Phonétique de Strasbourg

En savoir plus: IPS


Investissements Avenir
Université de Strasbourg

Flux RSS

Du 1 décembre 2017 au 31 janvier 2018
Le 15 décembre 2017
De 15h00 à 18h00
Le Patio, bâtiment IV, salle 4402

Flux RSS

janv. 10 2018

Le Colloque pluridisciplinaire organisé par LiLPa et l’ UMR 7354 DRES (Droit, Religion, Entreprise...