Wissensrohstoff Text: Eine Einführung in das Text Mining
Gespeichert in:
Vorheriger Titel: | Heyer, Gerhard Text mining: Wissensrohstoff Text |
---|---|
Hauptverfasser: | , , |
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
Wiesbaden
Springer Vieweg
[2022]
|
Ausgabe: | 2., wesentlich überarbeitete Auflage |
Schlagworte: | |
Online-Zugang: | Inhaltstext http://www.springer.com/ Inhaltsverzeichnis |
Beschreibung: | XV, 385 Seiten Illustrationen, Diagramme 24 cm x 16.8 cm, 807 g |
ISBN: | 9783658359683 3658359684 |
Internformat
MARC
LEADER | 00000nam a22000008c 4500 | ||
---|---|---|---|
001 | BV048255846 | ||
003 | DE-604 | ||
005 | 20230315 | ||
007 | t | ||
008 | 220607s2022 gw a||| |||| 00||| ger d | ||
015 | |a 21,N40 |2 dnb | ||
016 | 7 | |a 1242283846 |2 DE-101 | |
020 | |a 9783658359683 |c Festeinband : circa EUR 34.99 (DE), circa EUR 35.97 (AT), circa CHF 39.00 (freier Preis), circa EUR 32.70 |9 978-3-658-35968-3 | ||
020 | |a 3658359684 |9 3-658-35968-4 | ||
024 | 3 | |a 9783658359683 | |
028 | 5 | 2 | |a Bestellnummer: 978-3-658-35968-3 |
028 | 5 | 2 | |a Bestellnummer: 89048548 |
035 | |a (OCoLC)1273491435 | ||
035 | |a (DE-599)DNB1242283846 | ||
040 | |a DE-604 |b ger |e rda | ||
041 | 0 | |a ger | |
044 | |a gw |c XA-DE-HE | ||
049 | |a DE-473 |a DE-188 |a DE-739 |a DE-521 | ||
084 | |a ST 306 |0 (DE-625)143654: |2 rvk | ||
084 | |a ST 300 |0 (DE-625)143650: |2 rvk | ||
084 | |a ST 530 |0 (DE-625)143679: |2 rvk | ||
084 | |a ST 302 |0 (DE-625)143652: |2 rvk | ||
084 | |a ES 900 |0 (DE-625)27926: |2 rvk | ||
084 | |8 1\p |a 400 |2 23sdnb | ||
100 | 1 | |a Biemann, Chris |d 1977- |e Verfasser |0 (DE-588)13395255X |4 aut | |
240 | 1 | 0 | |a Text Mining: Wissensrohstoff Text: Konzepte, Algorithmen, Ergebnisse |
245 | 1 | 0 | |a Wissensrohstoff Text |b Eine Einführung in das Text Mining |c Chris Biemann, Gerhard Heyer, Uwe Quasthoff |
250 | |a 2., wesentlich überarbeitete Auflage | ||
264 | 1 | |a Wiesbaden |b Springer Vieweg |c [2022] | |
264 | 4 | |c © 2022 | |
300 | |a XV, 385 Seiten |b Illustrationen, Diagramme |c 24 cm x 16.8 cm, 807 g | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
650 | 0 | 7 | |a Computerlinguistik |0 (DE-588)4035843-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Text Mining |0 (DE-588)4728093-1 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Automatische Sprachanalyse |0 (DE-588)4129935-8 |2 gnd |9 rswk-swf |
653 | |a Text Mining | ||
653 | |a Linguistische Repräsentationen | ||
653 | |a Sprachstatistik | ||
653 | |a Maschinelles Lernen | ||
653 | |a Sprachverarbeitung | ||
653 | |a Terminologie-Extraktion | ||
653 | |a Sentimentanalyse | ||
653 | |a Kontextvolatilität | ||
653 | |a Korpora | ||
653 | |a End-to-end Learning | ||
653 | |a Linguistische Pipeline | ||
653 | |a Data Science | ||
653 | |a Computerlinguistik | ||
653 | |a Textanalyse | ||
653 | |a Annotation | ||
653 | |a Maschinelles Lernen | ||
655 | 7 | |0 (DE-588)4123623-3 |a Lehrbuch |2 gnd-content | |
689 | 0 | 0 | |a Text Mining |0 (DE-588)4728093-1 |D s |
689 | 0 | 1 | |a Automatische Sprachanalyse |0 (DE-588)4129935-8 |D s |
689 | 0 | 2 | |a Computerlinguistik |0 (DE-588)4035843-4 |D s |
689 | 0 | |5 DE-604 | |
689 | 1 | 0 | |a Text Mining |0 (DE-588)4728093-1 |D s |
689 | 1 | |5 DE-604 | |
700 | 1 | |a Heyer, Gerhard |d 1955- |e Verfasser |0 (DE-588)132381028 |4 aut | |
700 | 1 | |a Quasthoff, Uwe |d 1956- |e Verfasser |0 (DE-588)13238129X |4 aut | |
710 | 2 | |a Springer Fachmedien Wiesbaden |0 (DE-588)1043386068 |4 pbl | |
776 | 0 | 8 | |i Erscheint auch als |n Online-Ausgabe |z 978-3-658-35969-0 |w (DE-604)BV048251533 |
780 | 0 | 0 | |i Fortsetzung von |a Heyer, Gerhard |t Text mining: Wissensrohstoff Text |d 2006 |
856 | 4 | 2 | |m X:MVB |q text/html |u http://deposit.dnb.de/cgi-bin/dokserv?id=0fd6e2469bf3408193494e7ef791d5db&prov=M&dok_var=1&dok_ext=htm |3 Inhaltstext |
856 | 4 | 2 | |m X:MVB |u http://www.springer.com/ |
856 | 4 | 2 | |m HEBIS Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=033636085&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-033636085 | ||
883 | 1 | |8 1\p |a vlb |d 20211001 |q DE-101 |u https://d-nb.info/provenance/plan#vlb |
Datensatz im Suchindex
_version_ | 1804184056161632256 |
---|---|
adam_text | Chris Biemann • Gerhard Heyer • Uwe Quasthoff
Wissensrohstoff Text
Eine Einführung in das Text Mining
2 , wesentlich überarbeitete Auflage
Springer Vieweg
Inhaltsverzeichnis
1 Text und Text Mining 1
1 1 Text Mining 1
111 Text ist Wissensrohstoff 1
112 Text Mining und Text-Mining-Werkzeuge 3
113 Text-Mining-Umgebungen 4
114 Was leistet Text Mining? 6
1 2 Text und Big Data 8
1 3 Aufbau und Struktur von Text 10
131 Arten von Text und ihre Merkmale
132 Zeiehen, Types und Wörter
133 Nachricht, Information
134 Information und Wissen
135 Beispieltexte und Textressourcen
1 4 Redundanz in Texten
141 Arten von Redundanz 18
1411 Nahe Wiederholung von Wörtern im Text 18
1412 Wiederholung von Wortteilen 19
1413 Wiederholung in der Struktur: Eigennamen 19
1414 Kongruenz 20
1415 Feste Wendungen 20
1416 Explizite Wiederholung typischer Zusammenhänge
in verschiedenen Sätzen oder Texten 21
142 Wirkung von Redundanz 21
1421 Wiederholte Wörter: Wichtige Namen oder
Schlagwörter 22
1422 Wiederholte Substrings im Text: Klassifikation
von Texten und Wörtern 22
1 5 Linguistische Strukturen 23
151 Texte und linguistische Ebenen 23
IX
X Inhaltsverzeichnis
152 Warum erfordert die Verarbeitung natürlicher Sprache
linguistisches Wissen? 24
153 Zwei Ansätze für die Repräsentation und Verarbeitung
linguistischen Wissens 27
Literatur 31
2 Linguistische Repräsentationen 35
2 1 Theoretische Grundlage: Strukturalismus 36
211 Was ist die Grundidee des Strukturalismus? 36
212 Kontexte 37
2 2 Morphologie 40
221 Grundbegriffe 40
222 Verarbeitungsparadigmen für die Morphologie 43
2 3 Syntaktische Repräsentationen 46
231 Begriffsbestimmung: Was sind syntaktische Strukturen? 46
232 Konstituenten-Syntax 47
233 Dependenzen 50
234 Probabilistisches Parsen 51
2 4 Semantische Repräsentationen 53
241 Grundbegriffe und Definition 53
242 Semantische Relationen 57
2 5 Fachtexte und Terminologie 62
251 Fachtexte 62
252 Terminologie 63
2 6 Die Rolle von Ausnahmen in der Sprache 65
261 Falsche Schreibweisen 65
262 Seltene Ausnahmen 66
263 Auswirkungen dieser Sonderfälle 67
Literatur 68
3 Maschinelle Verarbeitung von Text 73
3 1 Verarbeitungsparadigmen für Text 73
311 Regelbasierte Verarbeitung 75
312 Überwachte Statistische Verarbeitung 79
313 Neuronale Verarbeitung 81
3 2 Die Linguistische Pipeline 85
321 Pipeline-Modell 85
322 Einlesen und Vorverarbeitung 89
323 Segmentierung 93
324 Morphologische und Syntaktische Verarbeitung 99
3241 Grundformreduktion und Stammformreduktion 99
3242 Tagging mit Wortarten 101
Inhaltsverzeichnis XI
3 2 43 Chunking 102
3244 Syntaxparsing 103
325 Semantische Verarbeitung 106
3251 Eigennamenerkennung 106
3252 Entity Linking 107
3253 Koreferenzauflösung 108
3254 Wortbedeutungsdisambiguierung 109
326 Anwendungsorientierte Verarbeitung HO
3261 Pipeline für Terminologieextraktion 111
3262 Pipeline für Entitätenzentriertes Retrieval und
Facettierte Suche 111
3263 Pipeline für Sentimentanalyse 112
3264 Pipeline für Open Information Extraction 113
3 3 Skalierung auf große Datenmengen 114
331 Datenparallelität 114
332 Zusammenhang von Korpusgröße und Qualität 117
3321 Der More-Data-Effect 118
3322 Quantitatives Wachstum von Resultatmengen 119
3323 Qualitative Verbesserung von Resultatmengen 122
Literatur 123
4 Sprachdaten: Lexika und Korpora 131
4 1 Korpusauswahl 131
411 Generische Korpora 132
412 Selbst erstelltes Korpus 133
413 Dokumente oder Sätze? Nur wohlgeformte Sätze? 134
414 Repräsentativität und Ausgewogenheit der
Zusammensetzung oder zufällige Auswahl? 135
415 Parallele Korpora 136
4 2 Satzkorpuserstellung auf Webdaten 136
421 Crawling 137
422 Beschränkung auf HTML-Dokumente 137
423 Text aus HTML-Dokumenten extrahieren 137
424 Qualitätssicherung 138
4241 Sprachseparierung auf Dokumentenebene 139
4242 Sprachüberprüfung auf Satzebene 140
4243 Umgang mit Dubletten und Quasidubletten 140
4244 Musterbasierte Entfernung nicht-wohlgeformter
Sätze 146
425 Evaluierung und Ranking von Sätzen 149
4251 Ranking mittels GDEX 149
4252 Typische Sätze 152
XII Inhaltsverzeichnis
4 3 Speicherformate 153
4 4 Indexierung 156
441 Indexstrukturen 157
4411 Klassisch: Einzelwort-Index, evtl, mit zusätzlichen
Wortgruppen 157
4412 Klassisch: Einzelwort-Index mit genauer Position 157
4413 Spezielle Datenstrukturen für Textsuche: PAT Trees
und die Anwendung in der NoSketch-Engine 157
4414 Ranking der Suchergebnisse 158
442 Verschiedene Typen von Suchanfragen 158
4421 Beispielsätze für Wörter, Wortgruppen oder
Kookkurrenzen 158
4422 Beispielsätze für Grundformen 159
4423 KombinationmehrererSuchkriterien 159
4424 Extraktion von Wortlisten mit bestimmten
Eigenschaften 159
4425 Extraktion von Relationen 160
4426 Suche unter Verwendung von Satzsignaturen 160
4 5 Manuell erstellte lexikalische Ressourcen 162
451 Klassische Wörterbücher 163
452 Verzeichnisse 164
4521 Verzeichnisse von Personen 165
4522 Verzeichnisse von Vornamen und Nachnamen 165
4523 Geographische Eigennamen 165
453 Relationen zwischen Mengen von Wörtern 166
4531 Synsets 166
4532 Erweiterung von Wortnetzen: Semantische
Ähnlichkeit mit Word Embeddings 167
4 6 Automatische Erweiterung lexikalischer Ressourcen 167
461 Klassische Wörterbuchangaben 168
4611 Lemmatisierung: Vollform zu Grundform 168
4612 Flexionsklasse zu Grundform 168
4613 Wortart zu Grundform: POS-Tagging und NER 169
4614 Grammatisches Geschlecht zu Nomen 170
4615 Kompositazerlegung 170
462 Statistische Angaben 171
4621 Worthäufigkeiten 171
4622 Wortpaare: Kookkurrenzen 172
4623 Sentiment 173
4624 Sachgebietsangaben 173
Literatur 174
Inhaltsverzeichnis XIII
5 Sprachstatistik 177
5 1 Statistische Messungen und ihre Zuverlässigkeit 178
511 Aufgaben aus der Sprachstatistik 178
512 Messgrößen der Sprachstatistik 179
513 Präsentation der Ergebnisse 179
514 Messungen und Messwerte 180
5141 Beschreibung und Nachvollziehbarkeit
der Messung 180
5142 Abhängigkeit von der Wortdefinition am
Beispiel der Type-Token-Ratio 181
5143 Abhängigkeit von der Korpusgröße 182
5144 Zählen mit oder ohne Wiederholungen: Mittlere
Wortlänge 183
515 Abhängigkeit von der Zusammensetzung des Korpus 185
5151 Abhängigkeit vom Text-Genre 185
5152 Fehlen gesprochener Sprache 186
516 Abhängigkeit von Optionen bei der der Korpuserstellung 186
5161 Verzerrte Ergebnisse durch mangelnde Qualität
der Rohdaten 186
5162 Fragwürdige Optionen 188
5163 Umgang mit seltenen Ereignissen 188
5 2 Zipfsches Gesetz 189
521 Zusammenhang zwischen Rang Häufigkeit und Wortlänge 189
522 Vorhersagen und Anwendungen 192
5 3 Kookkurrenzen 195
531 Struktur von signifikanten Kookkurrenzen 195
532 Maße für die statistische Signifikanz einer Kookkurrenz 197
533 Plausibilität der Ergebnisse 200
534 Andere Signifikanzmaße 200
535 Signifikante Kookkurrenzen - Beispiele und Anwendungen 201
536 Erste Anwendungen für signifikante Kookkurrenzen 203
5361 Fremdsprachliche Daten im Text 203
5362 Mundart 203
537 Signifikante Kookkurrenzen und Polysemie 204
538 Semantische Relationen zwischen signifikanten
Kookkurrenzen 205
539 Visualisierung von signifikanten Kookkurrenzen 206
5 4 Distributionellc Semantik 208
5 5 Sprachmodelle 212
5 6 Dense Vector Embeddings 218
561 Statische Word Embeddings 219
562 Statische Word Embeddings: Wortähnlichkeit und Analogie 222
XIV Inhaltsverzeichnis
563 Kontextualisierte Word Embeddings 224
564 Embeddings für Sätze und Texte 226
565 Evaluation von Embeddings 227
5 7 Wortbedeutungsinduktion 228
5 8 Qualitätsmaße für Korpora 231
581 Statistische Abweichungen von der erwarteten Verteilung 232
582 Verwendung von Vergleichskorpora 236
583 Musterbasierte Abweichungen 240
5 9 Statistischer Korpusvergleich 242
591 Voraussetzungen und Ziele 242
592 Wortvergleiche 243
5921 Log-likelihood-Ratio 244
5922 tl idf (term frequency/inverse document
frequency) 246
5923 Statistische Hypothesentests und Burrows Zeta 246
593 Kontextvergleiche 247
5931 Embeddingbasierte Verfahren 247
5932 Kookkurrenzstatistik 248
Literatur 251
6 Maschinelles Lernen für Sprachverarbeitung 257
6 1 Merkmalsextraktion 258
6 2 Clustering 261
6 3 Beispiele für Clustering 264
631 Hierarchisches Clustern von Wortarten 265
632 Wortbedeutungsinduktion mit Graph Clustering 267
633 Eventerkennung mit inkrementellem Clustering 268
634 Dokumentclustering mit k-Means 269
6 4 Topic-Modelle 270
641 Dokumente enthalten Themenstränge (Topics) 270
642 Modellierung von Topics 272
643 Evaluation und Best Practices 275
6 5 Evaluation von Clustering 277
6 6 Klassifikation 279
661 Definition und Arten von Klassifikation 280
662 Aufteilung der Beispieldaten 280
663 Beispiele für Klassifikationsalgorithmen 283
6631 Naive Bayes 283
6632 Entscheidungsbäume 284
6633 Neuronale Netzwerke für die Klassifikation 285
6 7 Annotation: Erstellung von Trainingsdaten 286
671 Durchführen von Annotationsprojekten 286
Inhaltsverzeichnis XV
672 Annotationsebenen und Tools zur manuellen Annotation 288
673 Datensatzerstellung mit Crowdsourcing 290
6 8 Sequenzklassifikation 291
6 9 Evaluation von Klassifikation 295
691 Mengenorientierte Evaluationsmaße 296
692 Andere Evaluationsmaße im Text Mining 298
6 10 Neuronale Methoden: End-to-End Transfer Learning 299
6 10 1 End-to-End-Lernen 299
6 10 2 Transferlernen 301
Literatur 302
7 Beispielanwendungen 311
7 1 Terminologieextraktion 312
711 Arbeitsablauf der Terminologieextraktion 312
712 Verfahren der Terminologieextraktion 313
7 2 Facettierte Suche mit Eigennamen 317
721 Tagesnetzwerk: Visuelle Nachrichtenzusammenfassung 318
722 Storyfinder: Eigene Lesehistorie 319
723 Investigativtool New/s/leak 319
724 Zusammenfassung 321
7 3 Sentimentanalyse 322
731 Begriffsbestimmung Einsatzbereiche, Herausforderungen 322
732 Lösungsansätze und Aufgaben 323
7 4 Trendanalysen und News Monitoring 327
741 Trends und schwache Signale 327
742 News Monitoring 327
743 Wörter des Tages 328
7 5 Neologismen 332
751 Neologismenwörterbücher 333
752 Hochfrequente Neologismen 2010-2020 337
7 6 Kontextvolatilität 338
761 Kurze Zusammenfassung des Verfahrens 338
762 Beispielanwendung 340
Literatur 342
Glossar 347
Stichwortverzeichnis 381
|
adam_txt |
Chris Biemann • Gerhard Heyer • Uwe Quasthoff
Wissensrohstoff Text
Eine Einführung in das Text Mining
2 , wesentlich überarbeitete Auflage
Springer Vieweg
Inhaltsverzeichnis
1 Text und Text Mining 1
1 1 Text Mining 1
111 Text ist Wissensrohstoff 1
112 Text Mining und Text-Mining-Werkzeuge 3
113 Text-Mining-Umgebungen 4
114 Was leistet Text Mining? 6
1 2 Text und Big Data 8
1 3 Aufbau und Struktur von Text 10
131 Arten von Text und ihre Merkmale
132 Zeiehen, Types und Wörter
133 Nachricht, Information
134 Information und Wissen
135 Beispieltexte und Textressourcen
1 4 Redundanz in Texten
141 Arten von Redundanz 18
1411 Nahe Wiederholung von Wörtern im Text 18
1412 Wiederholung von Wortteilen 19
1413 Wiederholung in der Struktur: Eigennamen 19
1414 Kongruenz 20
1415 Feste Wendungen 20
1416 Explizite Wiederholung typischer Zusammenhänge
in verschiedenen Sätzen oder Texten 21
142 Wirkung von Redundanz 21
1421 Wiederholte Wörter: Wichtige Namen oder
Schlagwörter 22
1422 Wiederholte Substrings im Text: Klassifikation
von Texten und Wörtern 22
1 5 Linguistische Strukturen 23
151 Texte und linguistische Ebenen 23
IX
X Inhaltsverzeichnis
152 Warum erfordert die Verarbeitung natürlicher Sprache
linguistisches Wissen? 24
153 Zwei Ansätze für die Repräsentation und Verarbeitung
linguistischen Wissens 27
Literatur 31
2 Linguistische Repräsentationen 35
2 1 Theoretische Grundlage: Strukturalismus 36
211 Was ist die Grundidee des Strukturalismus? 36
212 Kontexte 37
2 2 Morphologie 40
221 Grundbegriffe 40
222 Verarbeitungsparadigmen für die Morphologie 43
2 3 Syntaktische Repräsentationen 46
231 Begriffsbestimmung: Was sind syntaktische Strukturen? 46
232 Konstituenten-Syntax 47
233 Dependenzen 50
234 Probabilistisches Parsen 51
2 4 Semantische Repräsentationen 53
241 Grundbegriffe und Definition 53
242 Semantische Relationen 57
2 5 Fachtexte und Terminologie 62
251 Fachtexte 62
252 Terminologie 63
2 6 Die Rolle von Ausnahmen in der Sprache 65
261 Falsche Schreibweisen 65
262 Seltene Ausnahmen 66
263 Auswirkungen dieser Sonderfälle 67
Literatur 68
3 Maschinelle Verarbeitung von Text 73
3 1 Verarbeitungsparadigmen für Text 73
311 Regelbasierte Verarbeitung 75
312 Überwachte Statistische Verarbeitung 79
313 Neuronale Verarbeitung 81
3 2 Die Linguistische Pipeline 85
321 Pipeline-Modell 85
322 Einlesen und Vorverarbeitung 89
323 Segmentierung 93
324 Morphologische und Syntaktische Verarbeitung 99
3241 Grundformreduktion und Stammformreduktion 99
3242 Tagging mit Wortarten 101
Inhaltsverzeichnis XI
3 2 43 Chunking 102
3244 Syntaxparsing 103
325 Semantische Verarbeitung 106
3251 Eigennamenerkennung 106
3252 Entity Linking 107
3253 Koreferenzauflösung 108
3254 Wortbedeutungsdisambiguierung 109
326 Anwendungsorientierte Verarbeitung HO
3261 Pipeline für Terminologieextraktion 111
3262 Pipeline für Entitätenzentriertes Retrieval und
Facettierte Suche 111
3263 Pipeline für Sentimentanalyse 112
3264 Pipeline für Open Information Extraction 113
3 3 Skalierung auf große Datenmengen 114
331 Datenparallelität 114
332 Zusammenhang von Korpusgröße und Qualität 117
3321 Der More-Data-Effect 118
3322 Quantitatives Wachstum von Resultatmengen 119
3323 Qualitative Verbesserung von Resultatmengen 122
Literatur 123
4 Sprachdaten: Lexika und Korpora 131
4 1 Korpusauswahl 131
411 Generische Korpora 132
412 Selbst erstelltes Korpus 133
413 Dokumente oder Sätze? Nur wohlgeformte Sätze? 134
414 Repräsentativität und Ausgewogenheit der
Zusammensetzung oder zufällige Auswahl? 135
415 Parallele Korpora 136
4 2 Satzkorpuserstellung auf Webdaten 136
421 Crawling 137
422 Beschränkung auf HTML-Dokumente 137
423 Text aus HTML-Dokumenten extrahieren 137
424 Qualitätssicherung 138
4241 Sprachseparierung auf Dokumentenebene 139
4242 Sprachüberprüfung auf Satzebene 140
4243 Umgang mit Dubletten und Quasidubletten 140
4244 Musterbasierte Entfernung nicht-wohlgeformter
Sätze 146
425 Evaluierung und Ranking von Sätzen 149
4251 Ranking mittels GDEX 149
4252 Typische Sätze 152
XII Inhaltsverzeichnis
4 3 Speicherformate 153
4 4 Indexierung 156
441 Indexstrukturen 157
4411 Klassisch: Einzelwort-Index, evtl, mit zusätzlichen
Wortgruppen 157
4412 Klassisch: Einzelwort-Index mit genauer Position 157
4413 Spezielle Datenstrukturen für Textsuche: PAT Trees
und die Anwendung in der NoSketch-Engine 157
4414 Ranking der Suchergebnisse 158
442 Verschiedene Typen von Suchanfragen 158
4421 Beispielsätze für Wörter, Wortgruppen oder
Kookkurrenzen 158
4422 Beispielsätze für Grundformen 159
4423 KombinationmehrererSuchkriterien 159
4424 Extraktion von Wortlisten mit bestimmten
Eigenschaften 159
4425 Extraktion von Relationen 160
4426 Suche unter Verwendung von Satzsignaturen 160
4 5 Manuell erstellte lexikalische Ressourcen 162
451 Klassische Wörterbücher 163
452 Verzeichnisse 164
4521 Verzeichnisse von Personen 165
4522 Verzeichnisse von Vornamen und Nachnamen 165
4523 Geographische Eigennamen 165
453 Relationen zwischen Mengen von Wörtern 166
4531 Synsets 166
4532 Erweiterung von Wortnetzen: Semantische
Ähnlichkeit mit Word Embeddings 167
4 6 Automatische Erweiterung lexikalischer Ressourcen 167
461 Klassische Wörterbuchangaben 168
4611 Lemmatisierung: Vollform zu Grundform 168
4612 Flexionsklasse zu Grundform 168
4613 Wortart zu Grundform: POS-Tagging und NER 169
4614 Grammatisches Geschlecht zu Nomen 170
4615 Kompositazerlegung 170
462 Statistische Angaben 171
4621 Worthäufigkeiten 171
4622 Wortpaare: Kookkurrenzen 172
4623 Sentiment 173
4624 Sachgebietsangaben 173
Literatur 174
Inhaltsverzeichnis XIII
5 Sprachstatistik 177
5 1 Statistische Messungen und ihre Zuverlässigkeit 178
511 Aufgaben aus der Sprachstatistik 178
512 Messgrößen der Sprachstatistik 179
513 Präsentation der Ergebnisse 179
514 Messungen und Messwerte 180
5141 Beschreibung und Nachvollziehbarkeit
der Messung 180
5142 Abhängigkeit von der Wortdefinition am
Beispiel der Type-Token-Ratio 181
5143 Abhängigkeit von der Korpusgröße 182
5144 Zählen mit oder ohne Wiederholungen: Mittlere
Wortlänge 183
515 Abhängigkeit von der Zusammensetzung des Korpus 185
5151 Abhängigkeit vom Text-Genre 185
5152 Fehlen gesprochener Sprache 186
516 Abhängigkeit von Optionen bei der der Korpuserstellung 186
5161 Verzerrte Ergebnisse durch mangelnde Qualität
der Rohdaten 186
5162 Fragwürdige Optionen 188
5163 Umgang mit seltenen Ereignissen 188
5 2 Zipfsches Gesetz 189
521 Zusammenhang zwischen Rang Häufigkeit und Wortlänge 189
522 Vorhersagen und Anwendungen 192
5 3 Kookkurrenzen 195
531 Struktur von signifikanten Kookkurrenzen 195
532 Maße für die statistische Signifikanz einer Kookkurrenz 197
533 Plausibilität der Ergebnisse 200
534 Andere Signifikanzmaße 200
535 Signifikante Kookkurrenzen - Beispiele und Anwendungen 201
536 Erste Anwendungen für signifikante Kookkurrenzen 203
5361 Fremdsprachliche Daten im Text 203
5362 Mundart 203
537 Signifikante Kookkurrenzen und Polysemie 204
538 Semantische Relationen zwischen signifikanten
Kookkurrenzen 205
539 Visualisierung von signifikanten Kookkurrenzen 206
5 4 Distributionellc Semantik 208
5 5 Sprachmodelle 212
5 6 Dense Vector Embeddings 218
561 Statische Word Embeddings 219
562 Statische Word Embeddings: Wortähnlichkeit und Analogie 222
XIV Inhaltsverzeichnis
563 Kontextualisierte Word Embeddings 224
564 Embeddings für Sätze und Texte 226
565 Evaluation von Embeddings 227
5 7 Wortbedeutungsinduktion 228
5 8 Qualitätsmaße für Korpora 231
581 Statistische Abweichungen von der erwarteten Verteilung 232
582 Verwendung von Vergleichskorpora 236
583 Musterbasierte Abweichungen 240
5 9 Statistischer Korpusvergleich 242
591 Voraussetzungen und Ziele 242
592 Wortvergleiche 243
5921 Log-likelihood-Ratio 244
5922 tl' idf (term frequency/inverse document
frequency) 246
5923 Statistische Hypothesentests und Burrows Zeta 246
593 Kontextvergleiche 247
5931 Embeddingbasierte Verfahren 247
5932 Kookkurrenzstatistik 248
Literatur 251
6 Maschinelles Lernen für Sprachverarbeitung 257
6 1 Merkmalsextraktion 258
6 2 Clustering 261
6 3 Beispiele für Clustering 264
631 Hierarchisches Clustern von Wortarten 265
632 Wortbedeutungsinduktion mit Graph Clustering 267
633 Eventerkennung mit inkrementellem Clustering 268
634 Dokumentclustering mit k-Means 269
6 4 Topic-Modelle 270
641 Dokumente enthalten Themenstränge (Topics) 270
642 Modellierung von Topics 272
643 Evaluation und Best Practices 275
6 5 Evaluation von Clustering 277
6 6 Klassifikation 279
661 Definition und Arten von Klassifikation 280
662 Aufteilung der Beispieldaten 280
663 Beispiele für Klassifikationsalgorithmen 283
6631 Naive Bayes 283
6632 Entscheidungsbäume 284
6633 Neuronale Netzwerke für die Klassifikation 285
6 7 Annotation: Erstellung von Trainingsdaten 286
671 Durchführen von Annotationsprojekten 286
Inhaltsverzeichnis XV
672 Annotationsebenen und Tools zur manuellen Annotation 288
673 Datensatzerstellung mit Crowdsourcing 290
6 8 Sequenzklassifikation 291
6 9 Evaluation von Klassifikation 295
691 Mengenorientierte Evaluationsmaße 296
692 Andere Evaluationsmaße im Text Mining 298
6 10 Neuronale Methoden: End-to-End Transfer Learning 299
6 10 1 End-to-End-Lernen 299
6 10 2 Transferlernen 301
Literatur 302
7 Beispielanwendungen 311
7 1 Terminologieextraktion 312
711 Arbeitsablauf der Terminologieextraktion 312
712 Verfahren der Terminologieextraktion 313
7 2 Facettierte Suche mit Eigennamen 317
721 Tagesnetzwerk: Visuelle Nachrichtenzusammenfassung 318
722 Storyfinder: Eigene Lesehistorie 319
723 Investigativtool New/s/leak 319
724 Zusammenfassung 321
7 3 Sentimentanalyse 322
731 Begriffsbestimmung Einsatzbereiche, Herausforderungen 322
732 Lösungsansätze und Aufgaben 323
7 4 Trendanalysen und News Monitoring 327
741 Trends und schwache Signale 327
742 News Monitoring 327
743 Wörter des Tages 328
7 5 Neologismen 332
751 Neologismenwörterbücher 333
752 Hochfrequente Neologismen 2010-2020 337
7 6 Kontextvolatilität 338
761 Kurze Zusammenfassung des Verfahrens 338
762 Beispielanwendung 340
Literatur 342
Glossar 347
Stichwortverzeichnis 381 |
any_adam_object | 1 |
any_adam_object_boolean | 1 |
author | Biemann, Chris 1977- Heyer, Gerhard 1955- Quasthoff, Uwe 1956- |
author_GND | (DE-588)13395255X (DE-588)132381028 (DE-588)13238129X |
author_facet | Biemann, Chris 1977- Heyer, Gerhard 1955- Quasthoff, Uwe 1956- |
author_role | aut aut aut |
author_sort | Biemann, Chris 1977- |
author_variant | c b cb g h gh u q uq |
building | Verbundindex |
bvnumber | BV048255846 |
classification_rvk | ST 306 ST 300 ST 530 ST 302 ES 900 |
ctrlnum | (OCoLC)1273491435 (DE-599)DNB1242283846 |
discipline | Informatik Sprachwissenschaft Literaturwissenschaft |
discipline_str_mv | Informatik Sprachwissenschaft Literaturwissenschaft |
edition | 2., wesentlich überarbeitete Auflage |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>03634nam a22008658c 4500</leader><controlfield tag="001">BV048255846</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20230315 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">220607s2022 gw a||| |||| 00||| ger d</controlfield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">21,N40</subfield><subfield code="2">dnb</subfield></datafield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">1242283846</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9783658359683</subfield><subfield code="c">Festeinband : circa EUR 34.99 (DE), circa EUR 35.97 (AT), circa CHF 39.00 (freier Preis), circa EUR 32.70</subfield><subfield code="9">978-3-658-35968-3</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3658359684</subfield><subfield code="9">3-658-35968-4</subfield></datafield><datafield tag="024" ind1="3" ind2=" "><subfield code="a">9783658359683</subfield></datafield><datafield tag="028" ind1="5" ind2="2"><subfield code="a">Bestellnummer: 978-3-658-35968-3</subfield></datafield><datafield tag="028" ind1="5" ind2="2"><subfield code="a">Bestellnummer: 89048548</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)1273491435</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)DNB1242283846</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE-HE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-473</subfield><subfield code="a">DE-188</subfield><subfield code="a">DE-739</subfield><subfield code="a">DE-521</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 306</subfield><subfield code="0">(DE-625)143654:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 300</subfield><subfield code="0">(DE-625)143650:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 530</subfield><subfield code="0">(DE-625)143679:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 302</subfield><subfield code="0">(DE-625)143652:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 900</subfield><subfield code="0">(DE-625)27926:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="8">1\p</subfield><subfield code="a">400</subfield><subfield code="2">23sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Biemann, Chris</subfield><subfield code="d">1977-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)13395255X</subfield><subfield code="4">aut</subfield></datafield><datafield tag="240" ind1="1" ind2="0"><subfield code="a">Text Mining: Wissensrohstoff Text: Konzepte, Algorithmen, Ergebnisse</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Wissensrohstoff Text</subfield><subfield code="b">Eine Einführung in das Text Mining</subfield><subfield code="c">Chris Biemann, Gerhard Heyer, Uwe Quasthoff</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">2., wesentlich überarbeitete Auflage</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Wiesbaden</subfield><subfield code="b">Springer Vieweg</subfield><subfield code="c">[2022]</subfield></datafield><datafield tag="264" ind1=" " ind2="4"><subfield code="c">© 2022</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">XV, 385 Seiten</subfield><subfield code="b">Illustrationen, Diagramme</subfield><subfield code="c">24 cm x 16.8 cm, 807 g</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Computerlinguistik</subfield><subfield code="0">(DE-588)4035843-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Text Mining</subfield><subfield code="0">(DE-588)4728093-1</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Automatische Sprachanalyse</subfield><subfield code="0">(DE-588)4129935-8</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Text Mining</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Linguistische Repräsentationen</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Sprachstatistik</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Maschinelles Lernen</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Sprachverarbeitung</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Terminologie-Extraktion</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Sentimentanalyse</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Kontextvolatilität</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Korpora</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">End-to-end Learning</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Linguistische Pipeline</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Data Science</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Computerlinguistik</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Textanalyse</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Annotation</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Maschinelles Lernen</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4123623-3</subfield><subfield code="a">Lehrbuch</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Text Mining</subfield><subfield code="0">(DE-588)4728093-1</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Automatische Sprachanalyse</subfield><subfield code="0">(DE-588)4129935-8</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Computerlinguistik</subfield><subfield code="0">(DE-588)4035843-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="689" ind1="1" ind2="0"><subfield code="a">Text Mining</subfield><subfield code="0">(DE-588)4728093-1</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Heyer, Gerhard</subfield><subfield code="d">1955-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)132381028</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Quasthoff, Uwe</subfield><subfield code="d">1956-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)13238129X</subfield><subfield code="4">aut</subfield></datafield><datafield tag="710" ind1="2" ind2=" "><subfield code="a">Springer Fachmedien Wiesbaden</subfield><subfield code="0">(DE-588)1043386068</subfield><subfield code="4">pbl</subfield></datafield><datafield tag="776" ind1="0" ind2="8"><subfield code="i">Erscheint auch als</subfield><subfield code="n">Online-Ausgabe</subfield><subfield code="z">978-3-658-35969-0</subfield><subfield code="w">(DE-604)BV048251533</subfield></datafield><datafield tag="780" ind1="0" ind2="0"><subfield code="i">Fortsetzung von</subfield><subfield code="a">Heyer, Gerhard</subfield><subfield code="t">Text mining: Wissensrohstoff Text</subfield><subfield code="d">2006</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">X:MVB</subfield><subfield code="q">text/html</subfield><subfield code="u">http://deposit.dnb.de/cgi-bin/dokserv?id=0fd6e2469bf3408193494e7ef791d5db&prov=M&dok_var=1&dok_ext=htm</subfield><subfield code="3">Inhaltstext</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">X:MVB</subfield><subfield code="u">http://www.springer.com/</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">HEBIS Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=033636085&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-033636085</subfield></datafield><datafield tag="883" ind1="1" ind2=" "><subfield code="8">1\p</subfield><subfield code="a">vlb</subfield><subfield code="d">20211001</subfield><subfield code="q">DE-101</subfield><subfield code="u">https://d-nb.info/provenance/plan#vlb</subfield></datafield></record></collection> |
genre | (DE-588)4123623-3 Lehrbuch gnd-content |
genre_facet | Lehrbuch |
id | DE-604.BV048255846 |
illustrated | Illustrated |
index_date | 2024-07-03T19:58:24Z |
indexdate | 2024-07-10T09:33:16Z |
institution | BVB |
institution_GND | (DE-588)1043386068 |
isbn | 9783658359683 3658359684 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-033636085 |
oclc_num | 1273491435 |
open_access_boolean | |
owner | DE-473 DE-BY-UBG DE-188 DE-739 DE-521 |
owner_facet | DE-473 DE-BY-UBG DE-188 DE-739 DE-521 |
physical | XV, 385 Seiten Illustrationen, Diagramme 24 cm x 16.8 cm, 807 g |
publishDate | 2022 |
publishDateSearch | 2022 |
publishDateSort | 2022 |
publisher | Springer Vieweg |
record_format | marc |
spelling | Biemann, Chris 1977- Verfasser (DE-588)13395255X aut Text Mining: Wissensrohstoff Text: Konzepte, Algorithmen, Ergebnisse Wissensrohstoff Text Eine Einführung in das Text Mining Chris Biemann, Gerhard Heyer, Uwe Quasthoff 2., wesentlich überarbeitete Auflage Wiesbaden Springer Vieweg [2022] © 2022 XV, 385 Seiten Illustrationen, Diagramme 24 cm x 16.8 cm, 807 g txt rdacontent n rdamedia nc rdacarrier Computerlinguistik (DE-588)4035843-4 gnd rswk-swf Text Mining (DE-588)4728093-1 gnd rswk-swf Automatische Sprachanalyse (DE-588)4129935-8 gnd rswk-swf Text Mining Linguistische Repräsentationen Sprachstatistik Maschinelles Lernen Sprachverarbeitung Terminologie-Extraktion Sentimentanalyse Kontextvolatilität Korpora End-to-end Learning Linguistische Pipeline Data Science Computerlinguistik Textanalyse Annotation (DE-588)4123623-3 Lehrbuch gnd-content Text Mining (DE-588)4728093-1 s Automatische Sprachanalyse (DE-588)4129935-8 s Computerlinguistik (DE-588)4035843-4 s DE-604 Heyer, Gerhard 1955- Verfasser (DE-588)132381028 aut Quasthoff, Uwe 1956- Verfasser (DE-588)13238129X aut Springer Fachmedien Wiesbaden (DE-588)1043386068 pbl Erscheint auch als Online-Ausgabe 978-3-658-35969-0 (DE-604)BV048251533 Fortsetzung von Heyer, Gerhard Text mining: Wissensrohstoff Text 2006 X:MVB text/html http://deposit.dnb.de/cgi-bin/dokserv?id=0fd6e2469bf3408193494e7ef791d5db&prov=M&dok_var=1&dok_ext=htm Inhaltstext X:MVB http://www.springer.com/ HEBIS Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=033636085&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis 1\p vlb 20211001 DE-101 https://d-nb.info/provenance/plan#vlb |
spellingShingle | Biemann, Chris 1977- Heyer, Gerhard 1955- Quasthoff, Uwe 1956- Wissensrohstoff Text Eine Einführung in das Text Mining Computerlinguistik (DE-588)4035843-4 gnd Text Mining (DE-588)4728093-1 gnd Automatische Sprachanalyse (DE-588)4129935-8 gnd |
subject_GND | (DE-588)4035843-4 (DE-588)4728093-1 (DE-588)4129935-8 (DE-588)4123623-3 |
title | Wissensrohstoff Text Eine Einführung in das Text Mining |
title_alt | Text Mining: Wissensrohstoff Text: Konzepte, Algorithmen, Ergebnisse |
title_auth | Wissensrohstoff Text Eine Einführung in das Text Mining |
title_exact_search | Wissensrohstoff Text Eine Einführung in das Text Mining |
title_exact_search_txtP | Wissensrohstoff Text Eine Einführung in das Text Mining |
title_full | Wissensrohstoff Text Eine Einführung in das Text Mining Chris Biemann, Gerhard Heyer, Uwe Quasthoff |
title_fullStr | Wissensrohstoff Text Eine Einführung in das Text Mining Chris Biemann, Gerhard Heyer, Uwe Quasthoff |
title_full_unstemmed | Wissensrohstoff Text Eine Einführung in das Text Mining Chris Biemann, Gerhard Heyer, Uwe Quasthoff |
title_old | Heyer, Gerhard Text mining: Wissensrohstoff Text |
title_short | Wissensrohstoff Text |
title_sort | wissensrohstoff text eine einfuhrung in das text mining |
title_sub | Eine Einführung in das Text Mining |
topic | Computerlinguistik (DE-588)4035843-4 gnd Text Mining (DE-588)4728093-1 gnd Automatische Sprachanalyse (DE-588)4129935-8 gnd |
topic_facet | Computerlinguistik Text Mining Automatische Sprachanalyse Lehrbuch |
url | http://deposit.dnb.de/cgi-bin/dokserv?id=0fd6e2469bf3408193494e7ef791d5db&prov=M&dok_var=1&dok_ext=htm http://www.springer.com/ http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=033636085&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT biemannchris textminingwissensrohstofftextkonzeptealgorithmenergebnisse AT heyergerhard textminingwissensrohstofftextkonzeptealgorithmenergebnisse AT quasthoffuwe textminingwissensrohstofftextkonzeptealgorithmenergebnisse AT springerfachmedienwiesbaden textminingwissensrohstofftextkonzeptealgorithmenergebnisse AT biemannchris wissensrohstofftexteineeinfuhrungindastextmining AT heyergerhard wissensrohstofftexteineeinfuhrungindastextmining AT quasthoffuwe wissensrohstofftexteineeinfuhrungindastextmining AT springerfachmedienwiesbaden wissensrohstofftexteineeinfuhrungindastextmining |