Perl pour les linguistes

Programmes en Perl pour l'exploitation des données langagières

Ludovic Tanguy
Nabil Hathout

Editions Hermès


Adressé aux linguistes qui souhaitent travailler sur corpus, cet ouvrage de programmation en Perl analyse, d'un point de vue pratique, les principales techniques informatiques d'exploitation des données textuelles et lexicales à des fins linguistiques.
Accessible sans connaissances préalables en informatique grâce à une approche progressive et didactique, Perl pour les linguistes propose des programmes directement applicables et pouvant être adaptés à un grand nombre de besoins. Il contient une présentation des différentes données utilisables (types, formats et principales sources disponibles) ainsi qu'une prise en main du langage de programmation Perl et des expressions régulières. L'accent est mis sur les méthodes de base (recherche de mots ou de séquences, calculs de fréquences, opérations sur les lexiques), avant d'aborder des problématiques plus avancées comme la manipulation de données structurées en XML et l'exploitation du Web comme source de données linguistiques.
Un environnement de travail complet ainsi que tous les programmes présentés sont disponibles sur ce site.

Les auteurs

Ludovic Tanguy est maître de conférences en sciences du langage à l'université de Toulouse 2.
Nabil Hathout est chargé de recherche au CNRS.
Les deux auteurs sont membres de l'équipe de recherche en linguistique CLLE-ERSS (CNRS & université de Toulouse 2).