Les séquences (suite) - Université Côte d'Azur Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Les séquences (suite)

Résumé

Nous proposons ici une démarche exploratoire où cinq fonctions relèvent de la même approche, orientée vers l'étude des séquences plutôt que des fréquences. On y considère les mots (ou d'autres objets) dans leur environnement immédiat (paragraphes ou pages) en ignorant la partition en textes. 1- La fonction Topologie représente la distribution, aléatoire ou non, d'un ou de deux objets dans l'espace du corpus, et, le cas échéant, mesure la distance entre les deux distributions, le calcul relevant de la loi hypergéométrique. 2- La fonction Corrélats regroupe les substantifs ou les mots sémantiques qui sont les plus fréquents dans le corpus et établit la carte synthétique de leurs cooccurrences (par une analyse factorielle des correspondances). 3- La fonction Alceste établit un pont avec le logiciel Alceste. Elle lui fournit les données convenablement formatées, en lui transmettant la liste des substantifs les plus fréquents qu’on trouve associés dans un contexte étroit, paragraphe après paragraphe. Après traitement, elle en reçoit les résultats sous forme de « classes ». 4- La fonction Thème recense et assemble tous les passages où un mot (ou autre objet) est rencontré dans le corpus et oppose ces passages au reste du corpus. Il en résulte une liste de spécificités associée à l'objet de la recherche, graphie ou lemme. Ces mots associés au mot-pôle peuvent avoir entre eux des liaisons qui sont explorées, phrase après phrase dans le texte. Il en résulte un tableau de cooccurrences, représenté dans un graphe. 5- La fonction Associations généralise cette démarche et l’étend au corpus entier. En s’appuyant sur la fréquence, une liste des mots pleins est d’abord constituée et donne lieu à un tableau carré de cooccurrences. Quand le tableau est rempli par un balayage complet du corpus, le détail des associations deux à deux est trié et analysé, et une représentation, sous forme de graphe est proposée pour rendre compte des liens préférentiels qui tissent un réseau autour de chaque élément du tableau.
Fichier principal
Vignette du fichier
15_séquences.pdf (643.8 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01362726 , version 1 (09-09-2016)

Identifiants

  • HAL Id : hal-01362726 , version 1

Citer

Etienne Brunet. Les séquences (suite). JADT 2008, 2008, Lyon, France. pp.253-266. ⟨hal-01362726⟩
76 Consultations
75 Téléchargements

Partager

Gmail Mastodon Facebook X LinkedIn More