Photo TEDonnées
Ludovic Faure
Auteur 
Ludovic Faure

Humains et machines : et si nous parlions la même langue ?

Vendredi 16 novembre, la Maison des sciences de l'Homme et de l'environnement de l’université de Franche-Comté a accueilli la 2ème édition des TEDonnées, journée d’études consacrées au traitement automatique des langues.

TEDonnées est une journée d’études organisée par des doctorants du centre de recherche Lucien Tesnière du CRIT1 et par les étudiants de 2ème année de master LLCER2 parcours Traitement automatique des langues. L’objectif de cette initiative étudiante est « de réunir étudiants, chercheurs et professionnels, de créer des liens entre des entreprises, notre formation universitaire et nos recherches », explique Youcef Morsi, doctorant-entrepreneur du CRIT. Pour cette 2ème édition, cette journée s’est concentrée sur les « villes intelligentes3 », où le traitement automatique des langues (TAL) pourrait avoir son mot à dire.

Aider les ordinateurs à comprendre le langage humain

Selon Iana Atanassova, chercheuse au CRIT, le traitement automatique des langues (TAL) est un domaine de recherche alliant linguistique et informatique. Il a pour but de « doter les ordinateurs d’une intelligence leur permettant de comprendre et de manipuler le langage humain ». Il s’agit de lui transmettre le sens des mots, des phrases, des expressions et tout autre particularités d’une langue. « Lorsqu’il est face à un texte, un ordinateur ne voit qu’une succession de caractères, souligne la chercheuse. Le traitement automatique des langues doit permettre de donner du sens à cette suite de caractères. »

Bien que peu connu, le TAL est une méthode qui peut s’avérer utile pour de nombreuses applications présentes dans notre quotidien : traduction automatique, applications de commande vocale, moteurs de recherches intelligents, rédaction automatique de textes… Tous ces outils ayant pour but de faciliter la communication entre humains et machines.

À la pointe de la veille concurrentielle

Par rapport à d’autres méthodes se focalisant uniquement sur des aspects mathématiques et informatiques, la particularité du TAL est de s’intéresser d’abord à la langue pour développer ce type d’applications. « On crée des théories linguistiques et ensuite on cherche à les traduire sous forme d’outils informatiques, explique François Rey, doctorant au CRIT. C’est un travail manuel, qui nécessite beaucoup plus de temps et d’efforts. Mais une fois construit, on est sûr d’obtenir des résultats solides. »

Actuellement, les chercheurs du centre Lucien Tesnière du CRIT, se consacrent surtout à l’extraction d’information4, appliquée notamment à la veille concurrentielle. En moins de 10 ans, 5 entreprises spécialisées dans les TAL ont été créées par des doctorants issus du laboratoire. Quant au développement de nouveaux projets de recherches, cette 2ème édition des TEDonnées pourrait donner des idées aux chercheurs et étudiants présents à cette journée.

 

1 Centre de recherches interdisciplinaires et transculturelles

2 Langues, littératures et civilisations étrangères et régionales

3 Du concept anglo-saxon « Smart city » :espaces urbains connectés, utilisant de nouvelles technologies pour améliorer la qualité de vie de ses habitants, réduire les coûts financiers et énergétiques liés au service que la ville

4 L’objectif de l’extraction d’information est de parvenir à extraire d’un très grand corpus de textes un type d’informations spécifiques.

Contact

Centre de recherches interdisciplinaires et transculturelles - CRIT

Articles relatifs