Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora: Strategien und Performanzevaluierungen
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Abschlussarbeit Buch |
Sprache: | German |
Veröffentlicht: |
Leipzig
[2017?]
|
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis Inhaltsverzeichnis |
Beschreibung: | 262 Seiten Illustrationen, Diagramme |
Internformat
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV045280778 | ||
003 | DE-604 | ||
005 | 20190213 | ||
007 | t | ||
008 | 181109s2017 gw a||| m||| 00||| ger d | ||
015 | |a 18,H03 |2 dnb | ||
016 | 7 | |a 1150863773 |2 DE-101 | |
035 | |a (OCoLC)1135369495 | ||
035 | |a (DE-599)DNB1150863773 | ||
040 | |a DE-604 |b ger |e rda | ||
041 | 0 | |a ger | |
044 | |a gw |c XA-DE | ||
049 | |a DE-188 |a DE-355 | ||
084 | |a ST 306 |0 (DE-625)143654: |2 rvk | ||
084 | |a 004 |2 sdnb | ||
084 | |a 430 |2 sdnb | ||
100 | 1 | |a Schneider, Roman Friedrich |d 1969- |e Verfasser |0 (DE-588)1150875011 |4 aut | |
245 | 1 | 0 | |a Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora |b Strategien und Performanzevaluierungen |c vorgelegt von Dr. phil. Roman Friedrich Schneider |
264 | 1 | |a Leipzig |c [2017?] | |
300 | |a 262 Seiten |b Illustrationen, Diagramme | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
502 | |b Habilitationsschrift |c Universität Leipzig |d 2017 | ||
650 | 0 | 7 | |a Künstliche Intelligenz |0 (DE-588)4033447-8 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Text Mining |0 (DE-588)4728093-1 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Künstliche Intelligenz |0 (DE-588)4033447-8 |D s |
689 | 0 | 1 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |D s |
689 | 0 | 2 | |a Text Mining |0 (DE-588)4728093-1 |D s |
689 | 0 | |5 DE-604 | |
856 | 4 | 2 | |m B:DE-101 |q application/pdf |u http://d-nb.info/1150863773/04 |3 Inhaltsverzeichnis |
856 | 4 | 2 | |m DNB Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030668348&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-030668348 |
Datensatz im Suchindex
_version_ | 1804179054560018432 |
---|---|
adam_text | INHALTSVERZEICHNIS
1 EINFUEHRUNG UND MOTIVATION 7
2 LINGUISTISCHE ANFORDERUNGEN AN SPRACHKORPORA 17
2.1 NATUERLICHSPRACHLICHE KORPORA IN DER SPRACHWISSENSCHAFT 20
2.1.1 UMFANG UND ZUSAMMENSETZUNG VON SPRACHKORPORA 24
2.1.2 SEKUNDAERDATEN 28
2.2 DEUTSCHSPRACHIGE KORPORA IM INTERNATIONALEN KONTEXT 37
2.3 RECHERCHE IN AUSGEWAEHLTEN KORPUSSAMMLUNGEN 45
2.3.1 DEREKO/COSMAS 48
2.3.2 DEUTSCHER WORTSCHATZ / LEIPZIG CORPORA COLLECTION 51
2.3.3 DWDS 56
2.4 MULTIDIMENSIONALE SUCHKRITERIEN 59
2.5 ANFORDERUNGSKATALOG FUER LINGUISTISCH MOTIVIERTE KORPUSABFRAGEN 72
3 DESIGN UND IMPLEMENTIERUNG EINES KORPUSABFRAGESYSTEMS 76
3.1 SPEKTRUM DER SPEICHERUNGSMODELLE 77
3.1.1 DATEISYSTEMBASIERTE LOESUNGEN 78
3.1.2 HAUPTSPEICHERBASIERTE LOESUNGEN 79
3.1.3 VOLLTEXTSUCHMASCHINEN 80
3.1.4 DATENBANKBASIERTE KORPUSVERWALTUNG 81
3.2 EIN REFERENZSYSTEM FUER DIE RELATIONALE KORPUSSPEICHERUNG 83
3.2.1 BEHANDLUNG VON PRIMAER-UND SEKUNDAERDATEN 84
3.2.2 KONZEPTUELLE DATENMODELLIERUNG 87
3.2.3 PHYSISCHES DATENBANKSCHEMA 90
3.2.4 HARD- UND SOFTWARE 95
3.2.5 DATENIMPORT 96
3.3 EVALUIERUNG EINZELNER DESIGNENTSCHEIDUNGEN 106
3.3.1 DATENMODELL 107
3.3.2 PLATZHALTEROPERATOREN UND REGULAERE AUSDRUECKE 124
3.3.3 NUMERISCHE UND TEXTUELLE SCHLUESSELWEITE 129
3.3.4 HOCHFREQUENTE PHAENOMENE 136
3.3.5 FAZIT 140
4 EVALUATION DES ANFORDERUNGSKATALOGS 142
4.1 ABFRAGE 1: EINFACHES SUCHMUSTER 145
4.2 ABFRAGE 2: SUFFIXSUCHE MIT PLATZHALTERZEICHEN 147
4.3 ABFRAGE 3: KOMPLEXES RELATIVSATZ-MUSTER 149
4.4 ABFRAGE 4: ACI-KONSTRUKTIONEN 151
4.5 ABFRAGE 5: W-FRAGEN OHNE VERB 153
4.6 ABFRAGE 6: MOVIERUNG IN VIRTUELLEN SUBKORPORA 155
4.7 ABFRAGE 7: GENITIVOBJEKTE 158
4.8 ABFRAGE 8: PARTIZIPIALPHRASE VOR NIEDERFREQUENTEM NOMEN 160
4.9 ABFRAGE 9: REGULAERER AUSDRUCK MIT RECHTS-TRUNKIERUNG 163
4.10 ABFRAGE 10: REGULAERER AUSDRUCK MIT UNKS-TRUNKIERUNG 165
4.11 EINFLUSSFAKTOREN AUF DIE ABFRAGE-LAUFZEITEN 167
4.11.1 BELEGZAHLEN UND DATENVOLUMEN 168
4.11.2 ANZAHL DER SUCHKRITERIEN 171
4.11.3 MODELLIERUNG DER ABHAENGIGKEITEN 173
4.11.4 FAZIT 175
5 VERSUCH EINER LAUFZEITOPTIMIERUNG DURCH SEGMENTIERTE ABFRAGEN 177
5.1 PARALLELISIERUNG ALS CHANCE FUER DAS KORPUSRETRIEVAL 179
5.2 PROBLEMORIENTIERTE ALGORITHMISIERUNG 183
5.2.1 MODELLIERUNG AUF WORTEBENE 189
5.2.2 ABFRAGE AUF WORTEBENE MIT SPEZIFIZIERTEN ABSTAENDEN 195
5.2.3 ABFRAGE UNTER EINBEZIEHUNG TEXTBEZOGENER METADATEN 205
5.2.4 ABFRAGE UNTER EINBEZIEHUNG SYNTAKTISCHER STRUKTUREN U. FREQUENZEN
208
5.3 EVALUATION DES ALTERNATIVEN SUCHALGORITHMUS 209
5.3.1 NEUEVALUATION ABFRAGE 3
211
5.3.2 NEUEVALUATION ABFRAGE 4 214
5.3.3 NEUEVALUATION ABFRAGE 5 217
5.3.4 NEUEVALUATION ABFRAGE 6 219
5.3.5 NEUEVALUATION ABFRAGE 8 222
6 INTEGRATION IN EIN ONLINE-FRAMEWORK 225
6.1 SUCHFORMULARE 225
6.2 SPEICHERUNG VON BELEGLISTEN 227
6.3 SCHNITTSTELLEN ZU STATISTIKWERKZEUGEN 229
6.4 UEBERSICHTSLISTEN 231
7 ZUSAMMENFASSUNG UND FAZIT 234
A ANHANG: SKRIPT ZUR VERIFIZIERUNG VON SUCHKRITERIUMSABSTAENDEN 238
LITERATURVERZEICHNIS 243
|
any_adam_object | 1 |
author | Schneider, Roman Friedrich 1969- |
author_GND | (DE-588)1150875011 |
author_facet | Schneider, Roman Friedrich 1969- |
author_role | aut |
author_sort | Schneider, Roman Friedrich 1969- |
author_variant | r f s rf rfs |
building | Verbundindex |
bvnumber | BV045280778 |
classification_rvk | ST 306 |
ctrlnum | (OCoLC)1135369495 (DE-599)DNB1150863773 |
discipline | Germanistik / Niederlandistik / Skandinavistik Informatik |
format | Thesis Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01888nam a2200445 c 4500</leader><controlfield tag="001">BV045280778</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20190213 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">181109s2017 gw a||| m||| 00||| ger d</controlfield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">18,H03</subfield><subfield code="2">dnb</subfield></datafield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">1150863773</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)1135369495</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)DNB1150863773</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-188</subfield><subfield code="a">DE-355</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 306</subfield><subfield code="0">(DE-625)143654:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">004</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">430</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Schneider, Roman Friedrich</subfield><subfield code="d">1969-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)1150875011</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora</subfield><subfield code="b">Strategien und Performanzevaluierungen</subfield><subfield code="c">vorgelegt von Dr. phil. Roman Friedrich Schneider</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Leipzig</subfield><subfield code="c">[2017?]</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">262 Seiten</subfield><subfield code="b">Illustrationen, Diagramme</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="502" ind1=" " ind2=" "><subfield code="b">Habilitationsschrift</subfield><subfield code="c">Universität Leipzig</subfield><subfield code="d">2017</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4033447-8</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Text Mining</subfield><subfield code="0">(DE-588)4728093-1</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4033447-8</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Text Mining</subfield><subfield code="0">(DE-588)4728093-1</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">B:DE-101</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://d-nb.info/1150863773/04</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">DNB Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030668348&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-030668348</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV045280778 |
illustrated | Illustrated |
indexdate | 2024-07-10T08:13:46Z |
institution | BVB |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-030668348 |
oclc_num | 1135369495 |
open_access_boolean | |
owner | DE-188 DE-355 DE-BY-UBR |
owner_facet | DE-188 DE-355 DE-BY-UBR |
physical | 262 Seiten Illustrationen, Diagramme |
publishDate | 2017 |
publishDateSearch | 2017 |
publishDateSort | 2017 |
record_format | marc |
spelling | Schneider, Roman Friedrich 1969- Verfasser (DE-588)1150875011 aut Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora Strategien und Performanzevaluierungen vorgelegt von Dr. phil. Roman Friedrich Schneider Leipzig [2017?] 262 Seiten Illustrationen, Diagramme txt rdacontent n rdamedia nc rdacarrier Habilitationsschrift Universität Leipzig 2017 Künstliche Intelligenz (DE-588)4033447-8 gnd rswk-swf Text Mining (DE-588)4728093-1 gnd rswk-swf Automatische Spracherkennung (DE-588)4003961-4 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Künstliche Intelligenz (DE-588)4033447-8 s Automatische Spracherkennung (DE-588)4003961-4 s Text Mining (DE-588)4728093-1 s DE-604 B:DE-101 application/pdf http://d-nb.info/1150863773/04 Inhaltsverzeichnis DNB Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030668348&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Schneider, Roman Friedrich 1969- Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora Strategien und Performanzevaluierungen Künstliche Intelligenz (DE-588)4033447-8 gnd Text Mining (DE-588)4728093-1 gnd Automatische Spracherkennung (DE-588)4003961-4 gnd |
subject_GND | (DE-588)4033447-8 (DE-588)4728093-1 (DE-588)4003961-4 (DE-588)4113937-9 |
title | Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora Strategien und Performanzevaluierungen |
title_auth | Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora Strategien und Performanzevaluierungen |
title_exact_search | Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora Strategien und Performanzevaluierungen |
title_full | Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora Strategien und Performanzevaluierungen vorgelegt von Dr. phil. Roman Friedrich Schneider |
title_fullStr | Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora Strategien und Performanzevaluierungen vorgelegt von Dr. phil. Roman Friedrich Schneider |
title_full_unstemmed | Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora Strategien und Performanzevaluierungen vorgelegt von Dr. phil. Roman Friedrich Schneider |
title_short | Strukturierte Speicherung und Abfrage mehrfach annotierter Textkorpora |
title_sort | strukturierte speicherung und abfrage mehrfach annotierter textkorpora strategien und performanzevaluierungen |
title_sub | Strategien und Performanzevaluierungen |
topic | Künstliche Intelligenz (DE-588)4033447-8 gnd Text Mining (DE-588)4728093-1 gnd Automatische Spracherkennung (DE-588)4003961-4 gnd |
topic_facet | Künstliche Intelligenz Text Mining Automatische Spracherkennung Hochschulschrift |
url | http://d-nb.info/1150863773/04 http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030668348&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT schneiderromanfriedrich strukturiertespeicherungundabfragemehrfachannotiertertextkorporastrategienundperformanzevaluierungen |
Es ist kein Print-Exemplar vorhanden.
Inhaltsverzeichnis