Statistique textuelle:
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Buch |
Sprache: | French |
Veröffentlicht: |
Paris
Dunod
1994
|
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | VIII, 342 S. graph. Darst. |
ISBN: | 2100022393 |
Internformat
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV010436113 | ||
003 | DE-604 | ||
005 | 00000000000000.0 | ||
007 | t | ||
008 | 951020s1994 d||| |||| 00||| fre d | ||
020 | |a 2100022393 |9 2-10-002239-3 | ||
035 | |a (OCoLC)37024064 | ||
035 | |a (DE-599)BVBBV010436113 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a fre | |
049 | |a DE-824 |a DE-12 |a DE-188 | ||
050 | 0 | |a P302.85 | |
082 | 0 | |a 401/.41/021 |2 21 | |
084 | |a ID 2380 |0 (DE-625)54705: |2 rvk | ||
100 | 1 | |a Lebart, Ludovic |e Verfasser |4 aut | |
245 | 1 | 0 | |a Statistique textuelle |c L. Lebart ; A. Salem |
264 | 1 | |a Paris |b Dunod |c 1994 | |
300 | |a VIII, 342 S. |b graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
650 | 4 | |a Discourse analysis |x Statistical methods | |
650 | 0 | 7 | |a Textlinguistik |0 (DE-588)4124307-9 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Sprachstatistik |0 (DE-588)4182534-2 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Computerlinguistik |0 (DE-588)4035843-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Französisch |0 (DE-588)4113615-9 |2 gnd |9 rswk-swf |
689 | 0 | 0 | |a Französisch |0 (DE-588)4113615-9 |D s |
689 | 0 | 1 | |a Computerlinguistik |0 (DE-588)4035843-4 |D s |
689 | 0 | |5 DE-604 | |
689 | 1 | 0 | |a Französisch |0 (DE-588)4113615-9 |D s |
689 | 1 | 1 | |a Sprachstatistik |0 (DE-588)4182534-2 |D s |
689 | 1 | 2 | |a Textlinguistik |0 (DE-588)4124307-9 |D s |
689 | 1 | |5 DE-604 | |
700 | 1 | |a Salem, André |e Verfasser |4 aut | |
856 | 4 | 2 | |m HEBIS Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=006954596&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-006954596 |
Datensatz im Suchindex
_version_ | 1804124869416189952 |
---|---|
adam_text | L Lebart A Salem
Directeur de Recherche au CNRS, Ingénieur à l École
École nationale supérieure normale supérieure de
des Télécommunications Fontenay-Saint-Cloud
STATISTIQUE
TEXTUELLE
Préface de Christian Baudelot
Professeur à l École normale supérieure
DUNOD
Sommaire
Introduction 7
Chapitre 1 : Domaines et problèmes 11
1 1 Approches du texte 11
111 Le courant linguistique 12
112 Analyse de contenu 13
113 Intelligence artificielle 14
1 2 Les rencontres de la statistique et du texte 15
121 Les premiers travaux 16
122 Les banques de données textuelles 17
123 La recherche documentaire 18
13 Approche statistique du texte 18
131 La chaîne de traitement 19
132 Connaissances internes et externes 20
133 Une méta-information exceptionnelle 21
1 4 Des textes particuliers : les questions ouvertes 23
141 Les questions ouvertes : un outil de recherche 24
142 Questions ouvertes et questions fermées 25
143 Quand utiliser les questions ouvertes ? 27
144 Traitement pratique des réponses libres 28
145 Les regroupements de réponses 30
Chapitre 2 : Les unités de la statistique textuelle 33
2 1 Le choix des unités de décompte 33
211 Le texte en machine 35
212 Les dépouillements en formes graphiques 35
213 Les dépoui 1 lements lemmatisés 3 6
214 Les dépouillements à visée sémantique 38
215 Très brève comparaison avec d autres langues 40
2 2 Segmentation et numérisation d un texte 42
221 Numérisation sur le corpus Enfants 44
222 Le corpus P 45
2 3 L étude quantitative du vocabulaire 46
231 Fréquences, gamme des fréquences 46
232 LaloideZipf 47
233 Mesures de la richesse du vocabulaire 49
STATISTIQUE TEXTUELLE
2 4 Documents lexicométriques 51
241 Index d un corpus 52
242 Contextes, concordances 53
243 L accroissement du vocabulaire 55
244 Partitions du corpus 56
245 Tableaux lexicaux 57
2 5 Les segments répétés 58
251 Phrases, séquences 59
252 Segments, polyformes 60
253 Quelques propriétés relatives aux segments 62
2 6 Les inventaires de segments répétés 63
261 Inventaire alphabétique des segments répétés 64
262 Inventaire hiérarchique des segments répétés 66
263 Inventaires distributionnels des segments répétés 68
264 Tableau des segments répétés 69
2 7 Recherche de cooccurrences, quasi-segments 70
271 Recherche autour d une forme-pôle 70
272 Recherches de cooccurrences multiples 72
273 Quasi-segments 72
2 8 Incidence d une lemmatisation sur les comptages 73
281 Le corpus Discours 73
282 Principales caractéristiques quantitatives 75
Chapitre 3 : L analyse des correspondances 79
3 1 Principes de base de l analyse des données 80
3 2 L analyse des correspondances 81
321 Bref historique 81
322 L analyse des correspondances
exposée à partir d un exemple simple 8 2
323 Validité de la représentation 89
324 Variables actives et illustratives 92
3 3 Analyse des correspondances multiples 98
331 Structure de base d un échantillon d enquête 100
332 Validité de la représentation 105
333 Positionnement des variables illustratives 106
Chapitre 4 : La classification automatique des formes
et des textes ni
4 1 Rappel sur la classification hiérarchique 112
411 Le dendrogramme 113
412 Coupures du dendrogramme 115
413 Adjonction d éléments supplémentaires 116
414 Filtrage sur les premiers facteurs 116
Sommaire
4 2 Classification des éléments d un tableau lexical 117
421 Classification des formes 117
422 Classification des textes 120
423 Remarques sur les classifications de formes 123
4 3 La Classification des fichiers d enquête 127
431 Les algorithmes de classification mixte 128
432 Séquence des opérations 130
433 Exemple d application 130
Chapitre 5 : Typologies, visualisations 135
5 1 Analyse des correspondances sur tableau lexical 137
511 Les tableaux lexicaux de base 137
512 Les tableaux lexicaux agrégés 138
513 Seuil de fréquence pour les formes 139
514 Présentation de l exemple 139
515 Construction du tableau lexical agrégé 139
516 Analyse et interprétation du tableau lexical 144
5 2 Les noyaux factuels 148
5 3 Analyse directe des réponses ou documents 152
531 Comment interpréter les distances ? 152
532 Analyse du tableau clairsemé T 153
533 Exemple d application 154
5 4 Analyse des correspondances à partir d une
juxtaposition de tableaux lexicaux 160
5 5 Analyse des correspondances à partir du tableau
des segments répétés 162
Chapitre 6 : Eléments caractéristiques,
réponses ou textes modaux 171
6 1 Formes caractéristiques, spécificités 172
611 Le calcul des spécificités 172
612 Un exemple de calcul des spécificités 177
613 Liste des formes spécifiques 180
6 2 Les réponses modales 184
621 La sélection des réponses modales 184
622 Mise en oeuvre et exemples 186
623 Autres exemples 190
! Chapitre 7 : Partitions longitudinales, contiguïté 197
i71 Les trois structures de base 197
7 2 Homogénéité des valeurs d une variable 199
STATISTIQUE TEXTUELLE
721 Graphe associé à une structure de contiguïté 200
722 Matrices de contiguïté 200
723 Le coefficient de contiguïté 202
724 Moments du coefficient de contiguïté 204
725 Un cas particulier : les séries temporelles 204
726 Utilisation du coefficient c 205
7 3 Homogénéité des facteurs en fonction
d une structure a priori 205
731 Homogénéité d un facteur 206
732 Homogénéité des k premiers facteurs 206
7 4 Les agrégats et l analyse de la contiguïté 207
7 5 Partitions longitudinales d un corpus 209
751 Exemple de partition longitudinale 210
752 Analyse de la gradation classe d âge 211
753 Spécificités connexes 213
7 6 Séries textuelles chronologiques 217
761 La série chronologique Discours 218
762 Spécificités chronologiques 220
763 Les accroissements spécifiques 221
764 Etude parallèle sur un corpus lemmatisé 224
7 7 Recherches en homogénéité d auteur 226
771 Le corpus informatisé 229
772 Validation des résultats 234
773 Fragments de n chapitres consécutifs 236
774 Classification des chapitres 238
Chapitre 8 : Analyse discriminante textuelle 241
8 1 Deux grandes familles de problèmes 242
811 Discrimination à partir de la forme : la stylométrie 243
812 Discrimination globale 244
8 2 Les unités et indices de la stylométrie 245
821 Mots outil, parties du discours 245
822 La richesse du vocabulaire 247
8 3 Modèles statistiques en stylométrie : un exemple 248
831 Modélisations de la gamme des fréquences 248
832 Le problème d attribution 249
833 Un modèle non-paramétrique d estimation 252
834 Autres approches du problème 254
8 4 Analyses discriminantes globales 256
841 Principe général 256
842 Unités pour la discrimination globale 258
843 Discrimination et réponses modales 259
Sommaire
844 Discrimination régularisée par analyse des
correspondances préalable 261
845 Validation d une discrimination 262
8 5 Discrimination globale et validation 263
851 L exemple et le problème 263
852 Vocabulaire et analyse pour Tokyo 266
853 Réalité des configurations 272
854 Analyse discriminante et matrices de confusion 276
855 Conclusions 282
Annexe A Description sommaire de quatre logiciels 283
Annexe B Esquisse des algorithmes et structures de données 299
Glossaire 311
Références bibliographiques 321
Bibliographie complémentaire 332
Index des auteurs 335
Index des matières v 339
|
any_adam_object | 1 |
author | Lebart, Ludovic Salem, André |
author_facet | Lebart, Ludovic Salem, André |
author_role | aut aut |
author_sort | Lebart, Ludovic |
author_variant | l l ll a s as |
building | Verbundindex |
bvnumber | BV010436113 |
callnumber-first | P - Language and Literature |
callnumber-label | P302 |
callnumber-raw | P302.85 |
callnumber-search | P302.85 |
callnumber-sort | P 3302.85 |
callnumber-subject | P - Philology and Linguistics |
classification_rvk | ID 2380 |
ctrlnum | (OCoLC)37024064 (DE-599)BVBBV010436113 |
dewey-full | 401/.41/021 |
dewey-hundreds | 400 - Language |
dewey-ones | 401 - Philosophy and theory |
dewey-raw | 401/.41/021 |
dewey-search | 401/.41/021 |
dewey-sort | 3401 241 221 |
dewey-tens | 400 - Language |
discipline | Sprachwissenschaft Romanistik |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01728nam a2200457 c 4500</leader><controlfield tag="001">BV010436113</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">00000000000000.0</controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">951020s1994 d||| |||| 00||| fre d</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">2100022393</subfield><subfield code="9">2-10-002239-3</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)37024064</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV010436113</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">fre</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-824</subfield><subfield code="a">DE-12</subfield><subfield code="a">DE-188</subfield></datafield><datafield tag="050" ind1=" " ind2="0"><subfield code="a">P302.85</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">401/.41/021</subfield><subfield code="2">21</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ID 2380</subfield><subfield code="0">(DE-625)54705:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Lebart, Ludovic</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Statistique textuelle</subfield><subfield code="c">L. Lebart ; A. Salem</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Paris</subfield><subfield code="b">Dunod</subfield><subfield code="c">1994</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">VIII, 342 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Discourse analysis</subfield><subfield code="x">Statistical methods</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Textlinguistik</subfield><subfield code="0">(DE-588)4124307-9</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Sprachstatistik</subfield><subfield code="0">(DE-588)4182534-2</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Computerlinguistik</subfield><subfield code="0">(DE-588)4035843-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Französisch</subfield><subfield code="0">(DE-588)4113615-9</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Französisch</subfield><subfield code="0">(DE-588)4113615-9</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Computerlinguistik</subfield><subfield code="0">(DE-588)4035843-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="689" ind1="1" ind2="0"><subfield code="a">Französisch</subfield><subfield code="0">(DE-588)4113615-9</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="1"><subfield code="a">Sprachstatistik</subfield><subfield code="0">(DE-588)4182534-2</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="2"><subfield code="a">Textlinguistik</subfield><subfield code="0">(DE-588)4124307-9</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Salem, André</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">HEBIS Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=006954596&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-006954596</subfield></datafield></record></collection> |
id | DE-604.BV010436113 |
illustrated | Illustrated |
indexdate | 2024-07-09T17:52:31Z |
institution | BVB |
isbn | 2100022393 |
language | French |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-006954596 |
oclc_num | 37024064 |
open_access_boolean | |
owner | DE-824 DE-12 DE-188 |
owner_facet | DE-824 DE-12 DE-188 |
physical | VIII, 342 S. graph. Darst. |
publishDate | 1994 |
publishDateSearch | 1994 |
publishDateSort | 1994 |
publisher | Dunod |
record_format | marc |
spelling | Lebart, Ludovic Verfasser aut Statistique textuelle L. Lebart ; A. Salem Paris Dunod 1994 VIII, 342 S. graph. Darst. txt rdacontent n rdamedia nc rdacarrier Discourse analysis Statistical methods Textlinguistik (DE-588)4124307-9 gnd rswk-swf Sprachstatistik (DE-588)4182534-2 gnd rswk-swf Computerlinguistik (DE-588)4035843-4 gnd rswk-swf Französisch (DE-588)4113615-9 gnd rswk-swf Französisch (DE-588)4113615-9 s Computerlinguistik (DE-588)4035843-4 s DE-604 Sprachstatistik (DE-588)4182534-2 s Textlinguistik (DE-588)4124307-9 s Salem, André Verfasser aut HEBIS Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=006954596&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Lebart, Ludovic Salem, André Statistique textuelle Discourse analysis Statistical methods Textlinguistik (DE-588)4124307-9 gnd Sprachstatistik (DE-588)4182534-2 gnd Computerlinguistik (DE-588)4035843-4 gnd Französisch (DE-588)4113615-9 gnd |
subject_GND | (DE-588)4124307-9 (DE-588)4182534-2 (DE-588)4035843-4 (DE-588)4113615-9 |
title | Statistique textuelle |
title_auth | Statistique textuelle |
title_exact_search | Statistique textuelle |
title_full | Statistique textuelle L. Lebart ; A. Salem |
title_fullStr | Statistique textuelle L. Lebart ; A. Salem |
title_full_unstemmed | Statistique textuelle L. Lebart ; A. Salem |
title_short | Statistique textuelle |
title_sort | statistique textuelle |
topic | Discourse analysis Statistical methods Textlinguistik (DE-588)4124307-9 gnd Sprachstatistik (DE-588)4182534-2 gnd Computerlinguistik (DE-588)4035843-4 gnd Französisch (DE-588)4113615-9 gnd |
topic_facet | Discourse analysis Statistical methods Textlinguistik Sprachstatistik Computerlinguistik Französisch |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=006954596&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT lebartludovic statistiquetextuelle AT salemandre statistiquetextuelle |