Perl pour les linguistes

Liste des programmes

L'ensemble des programmes de l'ouvrage est présent dans l'environnement de travail. Vous pouvez également accéder au code d'un programme particulier à l'aide de la liste ci-dessous.
ProgrammeDescriptionPage
3.1 flex-nom-masc.pl Premier programme Perl : flexion d'un nom masculin114
3.2 flex-nom-masc2.pl Variante simplifiée de flex-nom-masc.pl : flexion d'un nom masculin123
3.3 flex-nom-mf.pl Exemple d'utilisation des conditionnelles : gestion du genre pour la flexion des noms124
3.4 flex-nom-mf2.pl Version simplifiée de flex-nom-mf.pl utilisant elsif127
3.5 flex-nom-invar.pl Exemple d'utilisation des connecteurs logiques : gestion de quelques noms invariables129
3.6 flex-verb.pl Exemple d'utilisation des tableaux : la flexion des verbes132
3.7 flex-nom-irreg.pl Exemple d'utilisation des hachages : le traitement des pluriels défectifs135
3.8 flex-liste-noms-masc1.pl Exemple d'utilisation des boucles while : la flexion d'une liste de noms masculins saisis par l'utilisateur138
3.9 flex-liste-noms-masc2.pl Exemple d'utilisation des boucles while : flexions d'une liste de noms contenue dans un fichier140
3.10 flex-verb2.pl Exemple d'utilisation des boucles : flexion d'un verbe143
3.11 flex-verb3.pl Exemple d'utilisation des boucles foreach : flexion d'un verbe145
3.12 flex-nom-invar-fichier.pl Exemple d'utilisation d'un fichier en lecture : flexion des noms avec prise en compte d'une liste de noms invariables149
3.13 flex-verbe-fichier.pl Exemple d'utilisation de fichiers en écriture : flexion d'un verbe au présent et à l'imparfait152
3.14 flex-nom-masc-argument.pl Exemple d'utilisation d'arguments : flexion d'un nom masculin singulier155
3.15 flex-nom-fonction.pl Exemple d'utilisation d'une fonction : flexion d'un nom157
4.1 termine-s.pl Test d'une terminaison en s par expression régulière173
4.2 extraire-s.pl Test d'une terminaison en s et extraction de sous-chaîne180
4.3 radical-able.pl Extraction du radical d'un adjectif en -able 181
4.4 extraction-mots.pl Extraction des mots d'une ligne de texte183
5.1 recherche-exacte-simple.pl Recherche d'un mot exact dans un fichier de texte segmenté ou un lexique simple192
5.2 recherche-exacte-liste.pl Recherche d'une liste de mots dans un fichier de texte segmenté ou un lexique194
5.3 recherche-expreg-simple.pl Recherche par expression régulière dans une liste de mots197
5.4 recherche-expreg-tri.pl Recherche par expression régulière dans une liste de mots, avec tri des résultats199
5.5 recherche-lemme.pl Recherche par lemme dans un texte étiqueté202
5.6 adjectifs-able.pl Extraction des adjectifs en -able d'un texte étiqueté205
5.7 recherche-categorie-lemme.pl Recherche dans un texte étiqueté sur la catégorie et le lemme207
5.8 adjectifs-able-non-prefixes.pl Recherche dans un texte étiqueté des adjectifs en -able non préfixés par dé- ni in-208
5.9 recherche-able-texte-brut.pl Recherche des mots finissant par able ou ables dans un texte brut210
5.10 recherche-det-X.pl Recherche en texte brut d'une séquence composée d'un article défini suivi d'un mot quelconque212
5.11 recherche-X-de-X.pl Recherche de séquences du type X de X et X de Det X dans un texte brut215
5.12 recherche-N-de-N.pl Recherche de séquences N de N dans un texte étiqueté217
5.13 automate-N-de-N.pl Recherche de séquences N de (DET) N de (DET) N... par automate à états finis dans un texte étiqueté221
5.14 recherche-lemme-fichiers.pl Recherche d'un lemme dans un ensemble de textes étiquetés225
6.1 frequences-formes.pl Table de fréquence des formes triées par ordre de fréquence décroissante, puis par ordre lexicographique231
6.2 frequences-formes-categories.pl Table de fréquences des couples forme/catégorie triée par ordre de fréquence décroissante, puis par ordre lexicographique de la forme, puis par ordre lexicographique de l'étiquette234
6.3 rang-lemme.pl Rang des lemmes triés par fréquence décroissante237
6.4 cooccurrences-formes.pl Cooccurrents des formes simples d'un texte étiqueté241
6.5 cooccurrences-lemmes-filtre.pl Cooccurrents filtrés des lemmes d'un texte étiqueté246
6.6 infomutuelle.pl Cooccurrents des lemmes d'un texte étiqueté triés par information mutuelle250
7.1 concord-brut-simple.pl Concordances simples sur texte brut257
7.2 concord-brut-expreg.pl Concordances par expressions régulières sur texte brut265
8.1 noms-ite.pl Extraction des noms en -eté et -ité du lexique Morphalou271
8.2 caracterisation-lexique.pl Caractérisation quantitative d'un lexique273
8.3 fusion-lexiques.pl Fusion de deux lexiques au même format276
8.4 fusion-tri-lexiques.pl Fusion de deux lexiques au format GRACE puis tri des entrées du lexique résultat277
8.5 comparaison-lexiques-formes.pl Comparaison de deux lexiques au format GRACE relativement aux formes, aux catégories et aux lemmes280
8.6 verbes-defectifs.pl Repérage des verbes défectifs dans un lexique au format GRACE283
8.7 dictionnaire-rimes.pl Construction d'un dictionnaire de rimes à partir de Lexique.org286
8.8 instances-construction.pl Enumération des instances d'une construction syntagmatique288
8.9 neologismes.pl Détection des néologismes contenus dans un texte catégorisé290
8.10 determination-categorie.pl Prédiction déterministe de la catégorie d'une liste de mots inconnus293
8.11 determination-categories-multi.pl Prédiction non déterministe de la catégorie d'une liste de mots inconnus295
8.12 flexion-inconnu.pl Flexion d'un lemme inconnu299
8.13 prefixation-in.pl Préfixation en in- des formes lues sur l'entrée standard304
8.14 suffixation-age.pl Suffixation en -age à partir de formes au participe présent305
8.15 apprentissage-suffixation.pl Apprentissage de schémas de suffixation308
8.16 suffixation.pl Suffixation des mots bases312
9.1 analyse-XML-simple.pl Analyse d'un texte étiqueté au format XML via le module XML::Simple330
9.2 extraction-noms-morphalou.pl Extraction des formes nominales du lexique Morphalou333
9.3 extraction-Ozkan-flux.pl Extraction du texte d'un dialogue du corpus Ozkan via un traitement par flux337
9.4 expressions-Ozkan-DOM.pl Extraction des expressions référentielles et de leurs caractéristiques d'un dialogue du corpus Ozkan via le module XML::DOM340
9.5 conversion-tag-XML.pl Conversion d'un fichier de texte étiqueté en format XML343
9.6 modification-Ozkan.pl Modification d'un document XML du corpus Ozkan : suppression des éléments kinesic_action et ajout de traces de la modification dans l'entête348
10.1 URL-HTML.pl Récupération du code HTML complet d'une page Web364
10.2 URL-texte.pl Récupération d'une page Web et transformation en texte brut366
10.3 recherche-Yahoo.pl Interrogation de Yahoo via Yahoo Web Search Services375
10.4 recherche-Live.pl Interrogation de Live Search via Live Search API382
10.4 recherche-Live-V2.pl Version mise à jour de l'interrogation de Live Search via Live Search API382
10.5 frequences-Yahoo.pl Calcul du nombre de documents indexés par Yahoo pour une liste de mots387
10.6 contextes-Yahoo.pl Extraction des contextes des résultats de Yahoo pour une requête donnée389
A1.1 conversion-fins-ligne.pl Conversion des fins de ligne Windows sous Unix396
A1.2 segmentation-mots-simple.pl Segmentation grossière d'un texte en mots et signes de ponctuation397
A1.3 segmentation-mots-exceptions.pl Segmentation en mots fine qui respecte une liste d'exceptions définie par l'utilisateur400
A1.3 segmentation-mots-exceptions-5_12.pl Segmentation en mots fine qui respecte une liste d'exceptions définie par l'utilisateur (version utilisable avec Perl 5.12)400
A1.4 suppression-entete-ABU.pl Suppression des entêtes des fichiers du corpus de l'ABU405
A1.5 desambiguisation-lemmatisation.pl Désambiguïsation de la lemmatisation du TreeTagger408
A1.6 suppression-entetes-ABU-repertoire.pl Suppression des entêtes de tous les fichiers ABU qui se trouvent dans un répertoire411
A1.7 categorisation-repertoire.pl Catégorisation des fichiers qui se trouvent dans un répertoire413
A2.1 extrait-oe.pl Extraction de ligatures codées en Latin9 sous Windows avec sortie en CP1252436
A2.2 extrait-oe-CP850.pl Extraction de ligatures codées en Latin9 sous Windows avec sortie en CP850437