Linguistische Datenverarbeitung: ein Lehrbuch
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
Opladen
Westdt. Verl.
1998
|
Ausgabe: | 2., neu bearb. u. erw. Aufl. |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | Vorname des Verf. in Vorlage fälschl.: Wilfried |
Beschreibung: | 220 S. graph. Darst. CD-ROM (12 cm) |
ISBN: | 3531131885 |
Internformat
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV012138077 | ||
003 | DE-604 | ||
005 | 20030116 | ||
007 | t | ||
008 | 980904s1998 d||| |||| 00||| ger d | ||
020 | |a 3531131885 |9 3-531-13188-5 | ||
035 | |a (OCoLC)634833768 | ||
035 | |a (DE-599)BVBBV012138077 | ||
040 | |a DE-604 |b ger |e rakwb | ||
041 | 0 | |a ger | |
049 | |a DE-29 |a DE-824 |a DE-473 |a DE-739 |a DE-384 |a DE-19 |a DE-M347 |a DE-634 |a DE-83 |a DE-11 |a DE-188 | ||
084 | |a ES 900 |0 (DE-625)27926: |2 rvk | ||
084 | |a ST 510 |0 (DE-625)143676: |2 rvk | ||
084 | |a ST 670 |0 (DE-625)143689: |2 rvk | ||
100 | 1 | |a Lenders, Winfried |d 1943- |e Verfasser |0 (DE-588)124415717 |4 aut | |
245 | 1 | 0 | |a Linguistische Datenverarbeitung |b ein Lehrbuch |c Wilfried Lenders ; Gerd Willée |
250 | |a 2., neu bearb. u. erw. Aufl. | ||
264 | 1 | |a Opladen |b Westdt. Verl. |c 1998 | |
300 | |a 220 S. |b graph. Darst. |e CD-ROM (12 cm) | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
500 | |a Vorname des Verf. in Vorlage fälschl.: Wilfried | ||
650 | 0 | 7 | |a Computerlinguistik |0 (DE-588)4035843-4 |2 gnd |9 rswk-swf |
655 | 7 | |8 1\p |0 (DE-588)4123623-3 |a Lehrbuch |2 gnd-content | |
689 | 0 | 0 | |a Computerlinguistik |0 (DE-588)4035843-4 |D s |
689 | 0 | |5 DE-604 | |
700 | 1 | |a Willée, Gerd |e Verfasser |4 aut | |
856 | 4 | 2 | |m HBZ Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008221201&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-008221201 | ||
883 | 1 | |8 1\p |a cgwrk |d 20201028 |q DE-101 |u https://d-nb.info/provenance/plan#cgwrk |
Datensatz im Suchindex
_version_ | 1804126747062435840 |
---|---|
adam_text | Inhalt
Vorwort 9
1 Umfeld und Entwicklung 11
1.1 Das wissenschaftliche Umfeld 11
1.2 Das Anwendungsumfeld 12
1.3 Entwicklung des Faches 15
1.4 Das Ausbildungsumfeld 19
1.5 Gesellschaften 19
1.6 Informationsquellen zur Computerlinguistik 20
1.6.1 Bibliographien 20
1.6.2 Handbucher 20
1.6.3 Lehrbiicher 20
1.6.4 Zeitschriften 21
1.6.5 Elektronische Dienste 21
2 Forschungs- und Aufgabenbereiche 25
2.1 Die Lautsprache 25
2.2 Geschriebene Sprache 27
2.3 InformationserschlieBung aus Texten 28
2.4 Maschinelle Sprachubersetzung (MU) 30
2.4.1 Die heutige Bedeutung der MU 30
2.4.2 Hauptprobleme der MU 31
2.4.3 Ablauf maschineller Ubersetzungsprozesse 32
2.5 Natiirlichsprachliche Kommunikation mit Computern .. 37
3 Korpora geschriebener Sprache -
Entwicklung und Auswertung 42
3.1 Die Idee der Korpuslinguistik 42
3.2 Das Problem der Textauswahl 43
3.3 Typologie von Korpora 44
3.3.1 Korpora gesprochener Sprache 44
3.3.2 Korpora geschriebener Sprache 44
3.4 Verwendung von Korpora 45
3.5 Methoden der Kodierung 47
3.5.1 Kodierung und Transkription 48
3.5.2 Allgemeine Merkmale von Kodierungssystemen 50
6 Inhalt
3.5.3 Friihe Markierungssysteme fiir sprachliche Daten 52
3.5.4 Standard Generalized Markup Language (SGML) 54
3.5.5 Text Encoding Initiative 56
3.6 Erfassung von Korpustexten 58
3.6.1 Wiederverwendung 58
3.6.2 Optische Erfassung 59
3.7 Beispiele verfiigbarer Sprachkorpora (Auswahlkorpora) 59
4 Auswertung von Korpora 62
4.1 Verarbeitungstechniken 62
4.1.1 Algorithmen 63
4.1.1.1 Begriffsbestimmung 63
4.1.1.2 Darstellungsformen von Algorithmen 63
4.2 Einheiten und Strukturen von Korpora 70
4.2.1 Das Problem der sprachlichen Einheit 70
4.2.2 Strukturen und Strukturbeschreibung 71
4.2.2.1 Klassifikation von Segmenten als Voraussetzung der
Strukturbeschreibung 71
4.2.2.2 Beschreibung von Beziehungen 73
4.2.3 Darstellung von Information: Listen, Baume, Netze .... 74
4.2.3.1 Einfache, einfache lineare und einfache lineare sortierte
Listen 74
4.2.3.2 Strukturierte Listen und Baume 75
4.2.3.3 Netze 78
4.3 Verfahren zur Isolierung und Klassifikation sprachlicher
Segmente 81
4.3.1 Isolierung von Graphemen 81
4.3.2 Isolierung von Lauten 83
4.3.3 Isolierung von Silben 84
4.3.4 Isolierung von Morphen 88
4.3.5 Isolierung von Wortern 91
4.3.6 Isolierung von Satzteilen und Satzen 95
4.4 Lexikalische Auswertung von Korpora 97
4.4.1 Vom H-Text zum V-Text 97
4.4.2 Vom V-Text zum sortierten V-Text 98
4.4.2.1 Der Wortformenindex 98
4.4.2.2 Listen 99
4.4.2.3 Stoppworter 100
4.4.3 Erweiterungen des sortierten V-Textes: Die Konkordanz 101
4.4.4 Erweiterungen des sortierten V-Textes: Der lemmatisierte
Index 102
Inhalt 7
4.4.5 Lexikalische Auswertung von Korpora durch online-Suche
und Textbrowser 104
4.4.6 Vom Korpus zum Worterbuch 105
4.5 Deskriptive Grammatiken 106
4.5.1 Allgemeine Grundlagen 106
4.5.2 Fragment einer deskriptiven Grammatik 107
4.5.3 Nutzen deskriptiver Grammatiken Ill
4.6 Grammatische Beschreibung von Korpora 112
4.6.1 Begriffsbestimmung und allgemeine Voraussetzungen .. 112
4.6.2 Formenbestimmung durch morphologische Analyse ... 113
4.6.2.1 Analyseverfahren 116
4.6.2.2 Morphologische Lexika 117
4.6.3 Lemmatisierung 119
4.6.3.1 Wortformenbezogene Lemmatisierung 120
4.6.3.2 Satzbezogene Lemmatisierung 122
4.6.4 Syntaktische Analyse 123
4.6.4.1 Morphologische Markierung 124
4.6.4.2 Parser und Parsing-Strategien 126
4.6.5 Tagging 130
4.6.5.1 Linguistisches Tagging 130
4.6.5.2 Taggingverfahren 132
4.7 Statistische Auswertungen von Korpora 137
4.7.1 Statistische Auswertungen auf der Ausdrucksseite 139
4.7.1.1 Haufigkeiten und Haufigkeitsbeziehungen
(Haufigkeiten von einzelnen Tokens/Types) 139
4.7.1.2 Langen von Einheiten 140
4.7.1.3 Haufigkeit und Haufigkeitsbeziehungen von n-Tokens . 141
4.7.2 Haufigkeiten und Wahrscheinlichkeiten auf der kategorialen
und strukturellen Ebene 143
4.7.2.1 Haufigkeit und Haufigkeitsbeziehungen von n-Tokens auf der
kategorialen Ebene 144
4.7.2.2 Statistische Untersuchungen auf struktureller Ebene ... 144
4.7.3 Anwendungen und Probleme statistischer Korpus-
analysen 144
5 Praktische Umsetzung von Algorithmen in Programme 146
5.1 Einleitung 146
5.2 Stringhandling unter Turbo Pascal 148
5.2.1 Zeichenkettenverarbeitung 148
5.2.2 Zeichenkettenverarbeitung unter Turbo Pascal 149
8 Inhalt
5.2.3 Beschreibung der verwendeten Routinen zum String-
handling 151
5.3 Textmanipulation 154
5.3.1 Verarbeitung von Texten 154
5.3.2 Segmentierung 154
5.3.3 Kodierung und Umkodierung 157
5.3.4 Register 161
5.3.5 Lexikonvergleich 167
5.3.6 Index und Konkordanz 172
5.3.6.1 KWIC 172
5.3.6.2 Wortstellenindex 176
5.3.7 Suche nach Zeichenketten 179
5.4 Textanalyse 184
5.4.1 Morphologische Analysen 185
5.4.1.1 Verbformenbestimmung 185
5.4.1.2 Flexionsformengenerierung 192
5.4.2 Parser 196
5.4.2.1 Bottom-up-Parser 196
5.4.2.2 Top-down-Parser 201
Register 206
Literaturverzeichnis 216
|
any_adam_object | 1 |
author | Lenders, Winfried 1943- Willée, Gerd |
author_GND | (DE-588)124415717 |
author_facet | Lenders, Winfried 1943- Willée, Gerd |
author_role | aut aut |
author_sort | Lenders, Winfried 1943- |
author_variant | w l wl g w gw |
building | Verbundindex |
bvnumber | BV012138077 |
classification_rvk | ES 900 ST 510 ST 670 |
ctrlnum | (OCoLC)634833768 (DE-599)BVBBV012138077 |
discipline | Sprachwissenschaft Informatik Literaturwissenschaft |
edition | 2., neu bearb. u. erw. Aufl. |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01680nam a2200397 c 4500</leader><controlfield tag="001">BV012138077</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20030116 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">980904s1998 d||| |||| 00||| ger d</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3531131885</subfield><subfield code="9">3-531-13188-5</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)634833768</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV012138077</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakwb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-29</subfield><subfield code="a">DE-824</subfield><subfield code="a">DE-473</subfield><subfield code="a">DE-739</subfield><subfield code="a">DE-384</subfield><subfield code="a">DE-19</subfield><subfield code="a">DE-M347</subfield><subfield code="a">DE-634</subfield><subfield code="a">DE-83</subfield><subfield code="a">DE-11</subfield><subfield code="a">DE-188</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 900</subfield><subfield code="0">(DE-625)27926:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 510</subfield><subfield code="0">(DE-625)143676:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 670</subfield><subfield code="0">(DE-625)143689:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Lenders, Winfried</subfield><subfield code="d">1943-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)124415717</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Linguistische Datenverarbeitung</subfield><subfield code="b">ein Lehrbuch</subfield><subfield code="c">Wilfried Lenders ; Gerd Willée</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">2., neu bearb. u. erw. Aufl.</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Opladen</subfield><subfield code="b">Westdt. Verl.</subfield><subfield code="c">1998</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">220 S.</subfield><subfield code="b">graph. Darst.</subfield><subfield code="e">CD-ROM (12 cm)</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Vorname des Verf. in Vorlage fälschl.: Wilfried</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Computerlinguistik</subfield><subfield code="0">(DE-588)4035843-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="8">1\p</subfield><subfield code="0">(DE-588)4123623-3</subfield><subfield code="a">Lehrbuch</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Computerlinguistik</subfield><subfield code="0">(DE-588)4035843-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Willée, Gerd</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">HBZ Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008221201&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-008221201</subfield></datafield><datafield tag="883" ind1="1" ind2=" "><subfield code="8">1\p</subfield><subfield code="a">cgwrk</subfield><subfield code="d">20201028</subfield><subfield code="q">DE-101</subfield><subfield code="u">https://d-nb.info/provenance/plan#cgwrk</subfield></datafield></record></collection> |
genre | 1\p (DE-588)4123623-3 Lehrbuch gnd-content |
genre_facet | Lehrbuch |
id | DE-604.BV012138077 |
illustrated | Illustrated |
indexdate | 2024-07-09T18:22:22Z |
institution | BVB |
isbn | 3531131885 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-008221201 |
oclc_num | 634833768 |
open_access_boolean | |
owner | DE-29 DE-824 DE-473 DE-BY-UBG DE-739 DE-384 DE-19 DE-BY-UBM DE-M347 DE-634 DE-83 DE-11 DE-188 |
owner_facet | DE-29 DE-824 DE-473 DE-BY-UBG DE-739 DE-384 DE-19 DE-BY-UBM DE-M347 DE-634 DE-83 DE-11 DE-188 |
physical | 220 S. graph. Darst. CD-ROM (12 cm) |
publishDate | 1998 |
publishDateSearch | 1998 |
publishDateSort | 1998 |
publisher | Westdt. Verl. |
record_format | marc |
spelling | Lenders, Winfried 1943- Verfasser (DE-588)124415717 aut Linguistische Datenverarbeitung ein Lehrbuch Wilfried Lenders ; Gerd Willée 2., neu bearb. u. erw. Aufl. Opladen Westdt. Verl. 1998 220 S. graph. Darst. CD-ROM (12 cm) txt rdacontent n rdamedia nc rdacarrier Vorname des Verf. in Vorlage fälschl.: Wilfried Computerlinguistik (DE-588)4035843-4 gnd rswk-swf 1\p (DE-588)4123623-3 Lehrbuch gnd-content Computerlinguistik (DE-588)4035843-4 s DE-604 Willée, Gerd Verfasser aut HBZ Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008221201&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis 1\p cgwrk 20201028 DE-101 https://d-nb.info/provenance/plan#cgwrk |
spellingShingle | Lenders, Winfried 1943- Willée, Gerd Linguistische Datenverarbeitung ein Lehrbuch Computerlinguistik (DE-588)4035843-4 gnd |
subject_GND | (DE-588)4035843-4 (DE-588)4123623-3 |
title | Linguistische Datenverarbeitung ein Lehrbuch |
title_auth | Linguistische Datenverarbeitung ein Lehrbuch |
title_exact_search | Linguistische Datenverarbeitung ein Lehrbuch |
title_full | Linguistische Datenverarbeitung ein Lehrbuch Wilfried Lenders ; Gerd Willée |
title_fullStr | Linguistische Datenverarbeitung ein Lehrbuch Wilfried Lenders ; Gerd Willée |
title_full_unstemmed | Linguistische Datenverarbeitung ein Lehrbuch Wilfried Lenders ; Gerd Willée |
title_short | Linguistische Datenverarbeitung |
title_sort | linguistische datenverarbeitung ein lehrbuch |
title_sub | ein Lehrbuch |
topic | Computerlinguistik (DE-588)4035843-4 gnd |
topic_facet | Computerlinguistik Lehrbuch |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008221201&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT lenderswinfried linguistischedatenverarbeitungeinlehrbuch AT willeegerd linguistischedatenverarbeitungeinlehrbuch |