FRE 1149H-S

Outils computationnels pour linguistes

Modalités de diffusion du cours

En ligne

Horaire :

Lundi 11h - 13h

Instructeur :

E. Dunbar

Endroit :

 

Salle :

 

Description :

Les analyses automatiques ainsi que les modèles computationnels ont pris une importance accrue en linguistique au cours des dix dernières années, permettant aux linguistes d’accéder à des données beaucoup plus volumineuses et à des analyses beaucoup plus nuancées qu’auparavant. Les méthodes computationnelles deviennent de plus en plus indispensables aux études linguistiques. Ce séminaire consiste en la découverte des outils computationnels pertinents à la recherche sur le langage ou sur les langues, à travers les sous-domaines de la linguistique (phonétique et phonologie, syntaxe et morphologie, sémantique).

Les objectifs principaux sont de fournir aux étudiantes et étudiants de nouveaux outils, de leur donner de l’inspiration pour de nouveaux projets et de leur donner l’occasion de monter un mini-projet exploitant des outils computationnels. Le cours fournira également les connaissances théoriques pour comprendre l’essentiel des articles de recherche actuels dans le domaine de la linguistique computationnelle. Nous étudierons également des articles qui exploitent ou qui développent les techniques et les théories sous-jacentes.

Le cours abordera en détail : des outils pour l’analyse automatique de corpus acoustique (extractions de paramètres acoustiques) et pour le calcul de similarité acoustique/phonétique ; des outils pour l’annotation automatique de propriétés syntaxiques ; des outils pour l’analyse de la sémantique lexicale ; ainsi que des applications courantes en linguistique de chacun de ces types d’analyse. L’ordre de présentation de chacun de ces sujets sera adapté au groupe, afin de permettre à chaque étudiante et étudiant d’être en mesure de développer un projet final pertinent à ses intérêts de recherche.

Aucune compétence préalable en programmation n’est requise pour s’inscrire à ce cours.

Bibliographie :

Bases théoriques.

Jurafsky, D., & Martin, J. H. (À paraitre). Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition. 3e édition.

Kübler, S., McDonald, R., & Nivre, J. (2009). Dependency parsing. Synthesis lectures on human language technologies, 1(1), 1-127.

Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781.

Mohamed, A. R. (2014). Deep neural network acoustic models for ASR (Doctoral dissertation, University of Toronto).

Applications en linguistique

Gaume, B., Ho-Dac, L.M., Tanguy, L., Fabre, C., Pierrejean, B., Hathout, N., Farinas, J., Pinquier, J., Danet, L., Péran, P. & De Boissezon, X. 2019. Toward a Computational Multidimensional Lexical Similarity Measure for Modeling Word Association Tasks in Psycholinguistics. In Proceedings of the Workshop on Cognitive Modeling and Computational Linguistics (pp. 71-76).

Gupta, S., & DiPadova, A. (2019). Deep Learning and Sociophonetics: Automatic Coding of Rhoticity Using Neural Networks. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (pp. 92-96).

Hale, J. (2001). A probabilistic Earley parser as a psycholinguistic model. In Second Meeting of the North American Chapter of the Association for Computational Linguistics.

Jimerson, R., & Prud’hommeaux, E. (2018). ASR for documenting acutely under-resourced indigenous languages. In Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018).

Mickus, T., Constant, M., & Paperno, D. (2020). Génération automatique de définitions pour le français. In Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 31e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 2: Traitement Automatique des Langues Naturelles (p. 66-80). ATALA.

Travaux requis :

Travaux pratiques pour s’exercer avec des techniques fondamentales (25%) ; résumé critique d’un article (15%) ; projet final (total de 60%, distribué sur la proposition, la première version et la version finale).