Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken:
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Abschlussarbeit Buch |
Sprache: | English |
Veröffentlicht: |
Passau
2016
|
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | VI, 60 Seiten Diagramme |
Internformat
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV043739615 | ||
003 | DE-604 | ||
005 | 00000000000000.0 | ||
007 | t | ||
008 | 160829s2016 |||| m||| 00||| eng d | ||
035 | |a (OCoLC)958164934 | ||
035 | |a (DE-599)BVBBV043739615 | ||
040 | |a DE-604 |b ger |e rda | ||
041 | 0 | |a eng | |
049 | |a DE-739 | ||
100 | 1 | |a Kober, Maria |e Verfasser |4 aut | |
245 | 1 | 0 | |a Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken |c Maria Kober |
264 | 1 | |a Passau |c 2016 | |
300 | |a VI, 60 Seiten |b Diagramme | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
502 | |b Bachelorarbeit |c Universität Passau |d 2016 | ||
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
856 | 4 | 2 | |m Digitalisierung UB Passau - ADAM Catalogue Enrichment |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=029151375&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-029151375 |
Datensatz im Suchindex
_version_ | 1804176540050653184 |
---|---|
adam_text | Inhaltsverzeichnis
Tabellenverzeichnis vii
Abbildungsverzeichnis ix
1 Motivation 1
1.1 Fragestellung....................................................... 2
1.2 Aufbau der Arbeit .................................................. 2
2 Grundlagen 3
2.1 Automatisierte Text-Fehlererkennung................................. 3
2.1.1 Fehlererkennung ohne Wortkontext............................. 3
2.1.2 Fehlererkennung mit Wort- oder Satzkontext................... 4
2.1.3 Einordnung dieser Arbeit..................................... 5
2.2 Fehlerkorrektur im OCR Postprocessing .............................. 5
2.2.1 Probleme bei der Digitalisierung historischer Texte ......... 5
2.2.2 Automatisierte Fehler ko rrektur ............................ 6
2.3 Verteilte Wort Vektoren............................................. 7
2.4 Word2Vec............................................................ 8
3 Schwellwert-basierte Klassifikatoren 13
3.1 Word2Vec-Wahrscheinlichkeitsbasierte Klassifikatoren............... 14
3.1.1 Kontext-basierter Klassifikator............................. 14
3.1.2 Vorgänger-basierter Klassifikator .......................... 14
3.1.3 Mittelvektor Klassifikator.................................. 15
3.2 Wortvektorbasierte Klassifikatoren ................................ 15
3.2.1 Kosinus-Ähnlichkeit Klassifikator........................... 16
3.2.2 Euklidische Distanz Klassifikator........................... 16
4 Experimente 19
4.1 Versuchsaufbau..................................................... 19
4.2 Vorverarbeitung.................................................... 23
4.3 Allgemeine Eingabe-Parameter ...................................... 24
4.4 Ausgabe-Kennzahlen................................................. 24
5 Evaluierung 27
5.1 Ergebnisse......................................................... 27
5.1.1 Word2Vec-Wahrscheinlichkeitsbasierte Klassifikatoren........ 30
5.1.2 Wortvektorbasierte Klassifikatoren ......................... 43
5.2 Diskussion......................................................... 49
5.2.1 Wörter, die nicht im Vokabular enthalten sind............... 49
5.2.2 Diskussion der Klassifikatoren.............................. 50
5.2.3 Fazit....................................................... 52
VI
Inhal tsverzei chnis
6 Zusammenfassung
55
Literaturverzeichnis
56
|
any_adam_object | 1 |
author | Kober, Maria |
author_facet | Kober, Maria |
author_role | aut |
author_sort | Kober, Maria |
author_variant | m k mk |
building | Verbundindex |
bvnumber | BV043739615 |
ctrlnum | (OCoLC)958164934 (DE-599)BVBBV043739615 |
format | Thesis Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01082nam a2200277 c 4500</leader><controlfield tag="001">BV043739615</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">00000000000000.0</controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">160829s2016 |||| m||| 00||| eng d</controlfield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)958164934</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV043739615</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">eng</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-739</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Kober, Maria</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken</subfield><subfield code="c">Maria Kober</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Passau</subfield><subfield code="c">2016</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">VI, 60 Seiten</subfield><subfield code="b">Diagramme</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="502" ind1=" " ind2=" "><subfield code="b">Bachelorarbeit</subfield><subfield code="c">Universität Passau</subfield><subfield code="d">2016</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UB Passau - ADAM Catalogue Enrichment</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=029151375&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-029151375</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV043739615 |
illustrated | Not Illustrated |
indexdate | 2024-07-10T07:33:48Z |
institution | BVB |
language | English |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-029151375 |
oclc_num | 958164934 |
open_access_boolean | |
owner | DE-739 |
owner_facet | DE-739 |
physical | VI, 60 Seiten Diagramme |
publishDate | 2016 |
publishDateSearch | 2016 |
publishDateSort | 2016 |
record_format | marc |
spelling | Kober, Maria Verfasser aut Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken Maria Kober Passau 2016 VI, 60 Seiten Diagramme txt rdacontent n rdamedia nc rdacarrier Bachelorarbeit Universität Passau 2016 (DE-588)4113937-9 Hochschulschrift gnd-content Digitalisierung UB Passau - ADAM Catalogue Enrichment application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=029151375&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Kober, Maria Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken |
subject_GND | (DE-588)4113937-9 |
title | Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken |
title_auth | Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken |
title_exact_search | Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken |
title_full | Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken Maria Kober |
title_fullStr | Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken Maria Kober |
title_full_unstemmed | Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken Maria Kober |
title_short | Text-Fehlerkorrektur durch word2vec mit numerischen Klassifikations-Schranken |
title_sort | text fehlerkorrektur durch word2vec mit numerischen klassifikations schranken |
topic_facet | Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=029151375&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT kobermaria textfehlerkorrekturdurchword2vecmitnumerischenklassifikationsschranken |