Pratique des segments répétés: essai de statistique textuelle
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Buch |
Sprache: | French |
Veröffentlicht: |
Paris
Klincksieck
1987
|
Schriftenreihe: | Institut National de la Langue Française <Nancy>: [Publications de l'INALF / Collection "Saint-Cloud"]
4 |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | 333 S. |
ISBN: | 2252025492 |
Internformat
MARC
LEADER | 00000nam a2200000 cb4500 | ||
---|---|---|---|
001 | BV004196602 | ||
003 | DE-604 | ||
005 | 20160306 | ||
007 | t | ||
008 | 910110s1987 |||| 00||| freod | ||
020 | |a 2252025492 |9 2-252-02549-2 | ||
035 | |a (OCoLC)22176303 | ||
035 | |a (DE-599)BVBBV004196602 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a fre | |
049 | |a DE-12 |a DE-473 |a DE-188 | ||
050 | 0 | |a P143.3 | |
082 | 0 | |a 443 | |
084 | |a ES 910 |0 (DE-625)27927: |2 rvk | ||
100 | 1 | |a Salem, André |e Verfasser |4 aut | |
245 | 1 | 0 | |a Pratique des segments répétés |b essai de statistique textuelle |c André Salem |
264 | 1 | |a Paris |b Klincksieck |c 1987 | |
300 | |a 333 S. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 1 | |a Institut National de la Langue Française <Nancy>: [Publications de l'INALF / Collection "Saint-Cloud"] |v 4 | |
650 | 4 | |a Français (Langue) - Informatique | |
650 | 4 | |a Lexicométrie | |
650 | 4 | |a Französisch | |
650 | 4 | |a Statistik | |
650 | 4 | |a French language |x Word frequency |v Statistics | |
650 | 4 | |a Lexicostatistics | |
650 | 0 | 7 | |a Französisch |0 (DE-588)4113615-9 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Lexikologie |0 (DE-588)4114409-0 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Lexikostatistik |0 (DE-588)4167532-0 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Statistik |0 (DE-588)4056995-0 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Wiederholung |0 (DE-588)4065972-0 |2 gnd |9 rswk-swf |
689 | 0 | 0 | |a Französisch |0 (DE-588)4113615-9 |D s |
689 | 0 | 1 | |a Wiederholung |0 (DE-588)4065972-0 |D s |
689 | 0 | 2 | |a Lexikostatistik |0 (DE-588)4167532-0 |D s |
689 | 0 | |5 DE-604 | |
689 | 1 | 0 | |a Lexikologie |0 (DE-588)4114409-0 |D s |
689 | 1 | 1 | |a Statistik |0 (DE-588)4056995-0 |D s |
689 | 1 | |5 DE-604 | |
810 | 2 | |a Collection "Saint-Cloud"] |t Institut National de la Langue Française <Nancy>: [Publications de l'INALF |v 4 |w (DE-604)BV004862129 |9 4 | |
856 | 4 | 2 | |m HEBIS Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=002614217&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-002614217 |
Datensatz im Suchindex
_version_ | 1804118400113311744 |
---|---|
adam_text | INSTITUT NATIONAL DE LA LANGUE FRANÇAISE
URL LEXICOMETRIE ET TEXTES POLITIQUES
André SALEM
PRATIQUE DES SEGMENTS
RÉPÉTÉS
Essai de statistique textuelle
—
©
les 35ème et 36ème congrès ont tiré les enseignements
«p ©
d
une
© © ©
période
caractérisée
2*
par
la
montée
2*
et la
généralisation
i
Publications de L INaLF, collection SA1NT-CLOUD
KLINCKSIECK
Paris
Table des matières
Introduction
0 1 Statistique et texte 9
0 2 Les banques de données textuelles 13
0 3 Quelles unités pour la statistique textuelle? 15
Segmentation, identification, lemmatisation, dés-
ambiguïsation
031 Segmentation du texte et identification des formes
032 Les dépouillements lemmatisés
033 Les dépouillements en formes graphiques
0 4 Des formes graphiques aux segments répétés 21
0 5 Les problèmes de terminologie 24
Notes et bibliographie de l introduction 26
Première partie : Les segments répétés :
définitions, classements, comptages
Chapitre 1 : Terminologie
1 0 La segmentation automatique
101 Le texte en machine
102 Formes, occurrences
103 Lexicométrie
1 1 Terminologie pour l étude quantitative des formes
111 Fréquences, gamme des fréquences
112 Index d un corpus
113 Contextes, concordances
114 L accroissement du vocabulaire
115 Partitions du corpus
116 Tableaux lexicaux
1 2 Terminologie pour l étude des segments répétés
121 Phrases, séquences
122 Places, k-places
123 Segments, polyformes
124 Fréquence et localisation d un segment
125 Eléments d un segment, sous-segments
126 Expansions, voisinages, expansions récurrentes,
expansions contraintes
127 Segments contraints, segments libres
128 Tableau des segments répétés
Notes et bibliographie du chapitre 1 55
211 Principales caractéristiques quantitatives
212 Quelques difficultés
213 La gamme des fréquences Le diagramme de Pareto
214 Partitions du corpus SYND
2141 Les problèmes de calibrage
2142 Les tranches de 20 000 occurrences
2143 Statistiques sur les parties et les tranches de SYND
2144 Longueur des phrases et des séquences
2 2 Les segments répétés du corpus SYND 79
220 Remarques sur le choix des délimiteurs de séquence
221 Les segments longs
222 Les segments les plus fréquents
223 Les segments longs les plus fréquents
2 3 Le volume des segments répétés 86
Notes et bibliographie du chapitre 2 90
Chapitre 3 : Les Inventaires de Segments Répétés 93
3 1 Inventaire alphabétique des segments répétés 97
3 2 Inventaire hiérarchique des segments répétés 100
3 3 Inventaire hiérarchique par partie 101
3 4 Tableau des segments répétés 104
Notes du chapitre 3 105
Chapitre 2 : Le corpus SYND
2 0 Présentation du corpus
2 1 Les formes du corpus SYND
Chapitre 4 : Compter les segments répétés 107
4 1 Comptages bruts en occurrences de segments
répétés 108
411 Gamme de fréquences des segments de longueur k
412 Le Diagramme des récurrences (DR)
4 2 Difficultés liées aux comptages bruts 115
4 3 Les comptages en surface couverte 116
431 Segments de longueur k attestés deux fois et plus
432 Segments de longueur k attestés r fois et plus
433 Un exemple de comptage en surface couverte
Notes du chapitre 4 124
Chapitre 5 : Descriptions locales et problèmes de
segmentation automatique
5 1 Description des voisinages d une occurrence 125
511 Marquage des segments répétés
512 Editions sélectives
513 Comptages sur les surfaces sélectionnées
5 2 Description des voisinages d une forme 135
521 Inventaire distributionnel des expansions récurrentes
après une forme-pôle
522 Inventaire distributionnel des expansions récurrentes
avant une forme-pôle
523 Inventaire des voisinages récurrents autour d une forme
524 Quantification des possibilités d expansion
525 Description des voisinages d une polyforme
5 3 Le problème de la segmentation contextuelle 142
531 Segmentation soustractive
532 Sélection de voisinages récurrents pour une forme
à l aide de critères lexicométriques
Notes et bibliographie du chapitre 5 153
Deuxième partie : Segments répétés
amp; analyses statistiques
Chapitre 6: Les unités de la Statistique textuelle • 157
6 1 Lemmatisation et dépouillement lexicométrique 158
611 Le regroupement des formes fléchies relevant
d un même lemme
612 Problèmes de désambiguïsation
6 2 Trois études de cas 160
621 Le cas de la forme TRAVAILLEURS
622 Le cas de la forme POLITIQUE
623 Le cas de la forme ACTION
624 Conclusion sur ces trois cas
6 3 La recherche des unités caractéristiques 169
6 4 Unités principales et unités supplémentaires 170
641 Les unités principales
642 Les unités supplémentaires
6 5 Segments répétés, voisinages récurrents 173
6 6 L Analyse statistique des voisinages récurrents 174
Notes et bibliographie du chapitre 6 175
Chapitre 7 : Segments répétés et Analyse
Factorielle des Correspondances
7 0 Rappel sur L AFC 177
7 1 Segments répétés et techniques de
mise en élément supplémentaire 183
7 2 AFC sur les formes du corpus SYND9 184
7 3 Documentation par les données segmentâtes 187
7 4 AFC à partir du tableau des segments répétés 200
7 5 AFC et voisinages récurrents d une forme 201
Notes et bibliographie du chapitre 7 203
Chapitre 8 : Segments répétés et méthode des
Spécificités
8 0 Rappel sur la méthode 207
801 Le modèle hypergéométrique
802 La méthode des spécificités
803 Spécificités et calibrage du corpus
8 1 Un exemple de calcul des spécificités 215
8 2 Le cas des unités supplémentaires 217
8 3 Liste des termes spécifiques pour une partie 220
8 4 Spécificités et voisinages récurrents d une forme 228
Notes et bibliographie du chapitre 8 231
Chapitre 9 : Quelques éléments de comparaison 233
9 1 Le corpus SYRTES 234
9 2 Les formes simples de SYRTES 235
921 Comparaison des gammes de fréquence
922 La zone des hautes fréquences
923 La zone des basses fréquences
9 3 Les segments répétés du corpus SYRTES 244
9 4 Comptages en surface 248
Notes et bibliographie du chapitre 9 250
Conclusion 253
Annexes, glossaire, bibliographie
Annexe AO : Travaux antérieurs autour de la notion de
segment répété
AO 1 Travaux soviétiques dans le domaine de
la traduction automatique 261
t
AO 2 Travaux du Trésor de la Langue Française 264
Annexe A1 : Documents concernant le corpus SYND 266
A1 1 Gammes des fréquences de formes
A1 2 Segmentation automatique du corpus SYND
Annexe A2 : Le statut de la virgule dans les procédures de
repérage des segments répétés 273
Annexe A3 : Comptages en surface pour l ensemble des
tranches des corpus SYND9T et SYRT5T 275
Annexe A4 : Inventaires des expansions récurrentes après
les formes TOUS et LUTTE dans le corpus SYND 281
A4 1 Expansions récurrentes droites de la forme
TOUS
A4 2 Expansions récurrentes droites de la forme
LUTTE
Annexe A5 : Analyse des voisinages récurrents pour les
formes ACTION et TRAVAILLEURS 287
A5 1 Les voisinages récurrents de la forme ACTION
A5 1 1, Les voisinages récurrents de la forme ACTION
dans l AFC sur les formes de fréquence supérieure à 9
A5 1 2 Voisinages spécifiques de la forme ACTION
A5 2 Analyse des voisinages récurrents de la forme
TRAVAILLEURS
A5 2 1 Les voisinages récurrents de la forme
TRAVAILLEURS dans l AFC sur les formes
de fréquence supérieure à 9
A5 2 2 Voisinages spécifiques de la forme TRAVAILLEURS
Annexe A6 : Analyse sur des décomptes de catégories
syntaxiques pour les formes POLITIQUE et
POLITIQUES 303
Annexe A7 : Les programmes du Lexicloud 307
Glossaire pour l analyse lexicométrique et
l analyse statistique des segments répétés 309
Principales notations utilisées 324
Index des principaux sigles 325
Bibliographie générale 327
|
any_adam_object | 1 |
author | Salem, André |
author_facet | Salem, André |
author_role | aut |
author_sort | Salem, André |
author_variant | a s as |
building | Verbundindex |
bvnumber | BV004196602 |
callnumber-first | P - Language and Literature |
callnumber-label | P143 |
callnumber-raw | P143.3 |
callnumber-search | P143.3 |
callnumber-sort | P 3143.3 |
callnumber-subject | P - Philology and Linguistics |
classification_rvk | ES 910 |
ctrlnum | (OCoLC)22176303 (DE-599)BVBBV004196602 |
dewey-full | 443 |
dewey-hundreds | 400 - Language |
dewey-ones | 443 - Dictionaries of standard French |
dewey-raw | 443 |
dewey-search | 443 |
dewey-sort | 3443 |
dewey-tens | 440 - French & related Romance languages |
discipline | Sprachwissenschaft Literaturwissenschaft Romanistik |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>02166nam a2200541 cb4500</leader><controlfield tag="001">BV004196602</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20160306 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">910110s1987 |||| 00||| freod</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">2252025492</subfield><subfield code="9">2-252-02549-2</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)22176303</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV004196602</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">fre</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-12</subfield><subfield code="a">DE-473</subfield><subfield code="a">DE-188</subfield></datafield><datafield tag="050" ind1=" " ind2="0"><subfield code="a">P143.3</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">443</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 910</subfield><subfield code="0">(DE-625)27927:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Salem, André</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Pratique des segments répétés</subfield><subfield code="b">essai de statistique textuelle</subfield><subfield code="c">André Salem</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Paris</subfield><subfield code="b">Klincksieck</subfield><subfield code="c">1987</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">333 S.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Institut National de la Langue Française <Nancy>: [Publications de l'INALF / Collection "Saint-Cloud"]</subfield><subfield code="v">4</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Français (Langue) - Informatique</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Lexicométrie</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Französisch</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Statistik</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">French language</subfield><subfield code="x">Word frequency</subfield><subfield code="v">Statistics</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Lexicostatistics</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Französisch</subfield><subfield code="0">(DE-588)4113615-9</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Lexikologie</subfield><subfield code="0">(DE-588)4114409-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Lexikostatistik</subfield><subfield code="0">(DE-588)4167532-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Statistik</subfield><subfield code="0">(DE-588)4056995-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Wiederholung</subfield><subfield code="0">(DE-588)4065972-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Französisch</subfield><subfield code="0">(DE-588)4113615-9</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Wiederholung</subfield><subfield code="0">(DE-588)4065972-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Lexikostatistik</subfield><subfield code="0">(DE-588)4167532-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="689" ind1="1" ind2="0"><subfield code="a">Lexikologie</subfield><subfield code="0">(DE-588)4114409-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="1"><subfield code="a">Statistik</subfield><subfield code="0">(DE-588)4056995-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="810" ind1="2" ind2=" "><subfield code="a">Collection "Saint-Cloud"]</subfield><subfield code="t">Institut National de la Langue Française <Nancy>: [Publications de l'INALF</subfield><subfield code="v">4</subfield><subfield code="w">(DE-604)BV004862129</subfield><subfield code="9">4</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">HEBIS Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=002614217&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-002614217</subfield></datafield></record></collection> |
id | DE-604.BV004196602 |
illustrated | Not Illustrated |
indexdate | 2024-07-09T16:09:41Z |
institution | BVB |
isbn | 2252025492 |
language | French |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-002614217 |
oclc_num | 22176303 |
open_access_boolean | |
owner | DE-12 DE-473 DE-BY-UBG DE-188 |
owner_facet | DE-12 DE-473 DE-BY-UBG DE-188 |
physical | 333 S. |
publishDate | 1987 |
publishDateSearch | 1987 |
publishDateSort | 1987 |
publisher | Klincksieck |
record_format | marc |
series2 | Institut National de la Langue Française <Nancy>: [Publications de l'INALF / Collection "Saint-Cloud"] |
spelling | Salem, André Verfasser aut Pratique des segments répétés essai de statistique textuelle André Salem Paris Klincksieck 1987 333 S. txt rdacontent n rdamedia nc rdacarrier Institut National de la Langue Française <Nancy>: [Publications de l'INALF / Collection "Saint-Cloud"] 4 Français (Langue) - Informatique Lexicométrie Französisch Statistik French language Word frequency Statistics Lexicostatistics Französisch (DE-588)4113615-9 gnd rswk-swf Lexikologie (DE-588)4114409-0 gnd rswk-swf Lexikostatistik (DE-588)4167532-0 gnd rswk-swf Statistik (DE-588)4056995-0 gnd rswk-swf Wiederholung (DE-588)4065972-0 gnd rswk-swf Französisch (DE-588)4113615-9 s Wiederholung (DE-588)4065972-0 s Lexikostatistik (DE-588)4167532-0 s DE-604 Lexikologie (DE-588)4114409-0 s Statistik (DE-588)4056995-0 s Collection "Saint-Cloud"] Institut National de la Langue Française <Nancy>: [Publications de l'INALF 4 (DE-604)BV004862129 4 HEBIS Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=002614217&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Salem, André Pratique des segments répétés essai de statistique textuelle Français (Langue) - Informatique Lexicométrie Französisch Statistik French language Word frequency Statistics Lexicostatistics Französisch (DE-588)4113615-9 gnd Lexikologie (DE-588)4114409-0 gnd Lexikostatistik (DE-588)4167532-0 gnd Statistik (DE-588)4056995-0 gnd Wiederholung (DE-588)4065972-0 gnd |
subject_GND | (DE-588)4113615-9 (DE-588)4114409-0 (DE-588)4167532-0 (DE-588)4056995-0 (DE-588)4065972-0 |
title | Pratique des segments répétés essai de statistique textuelle |
title_auth | Pratique des segments répétés essai de statistique textuelle |
title_exact_search | Pratique des segments répétés essai de statistique textuelle |
title_full | Pratique des segments répétés essai de statistique textuelle André Salem |
title_fullStr | Pratique des segments répétés essai de statistique textuelle André Salem |
title_full_unstemmed | Pratique des segments répétés essai de statistique textuelle André Salem |
title_short | Pratique des segments répétés |
title_sort | pratique des segments repetes essai de statistique textuelle |
title_sub | essai de statistique textuelle |
topic | Français (Langue) - Informatique Lexicométrie Französisch Statistik French language Word frequency Statistics Lexicostatistics Französisch (DE-588)4113615-9 gnd Lexikologie (DE-588)4114409-0 gnd Lexikostatistik (DE-588)4167532-0 gnd Statistik (DE-588)4056995-0 gnd Wiederholung (DE-588)4065972-0 gnd |
topic_facet | Français (Langue) - Informatique Lexicométrie Französisch Statistik French language Word frequency Statistics Lexicostatistics Lexikologie Lexikostatistik Wiederholung |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=002614217&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
volume_link | (DE-604)BV004862129 |
work_keys_str_mv | AT salemandre pratiquedessegmentsrepetesessaidestatistiquetextuelle |