Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen:
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
München
Utz, Wiss.
1999
|
Schriftenreihe: | Mensch - Maschine - Kommunikation
|
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | Zugl.: München, Techn. Univ., Diss., 1998 |
Beschreibung: | XII, 130 S. graph. Darst. |
ISBN: | 3896754866 |
Internformat
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV012481642 | ||
003 | DE-604 | ||
005 | 20120315 | ||
007 | t | ||
008 | 990323s1999 gw d||| m||| 00||| ger d | ||
016 | 7 | |a 955725348 |2 DE-101 | |
020 | |a 3896754866 |c brosch. : DM 86.06 (freier Pr.), EUR 44.00 (freier Pr.) |9 3-89675-486-6 | ||
035 | |a (OCoLC)76003571 | ||
035 | |a (DE-599)BVBBV012481642 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
044 | |a gw |c DE | ||
049 | |a DE-12 |a DE-91 |a DE-355 | ||
084 | |a ES 945 |0 (DE-625)27935: |2 rvk | ||
084 | |a ELT 533d |2 stub | ||
100 | 1 | |a Bub, Udo |e Verfasser |0 (DE-588)121018105 |4 aut | |
245 | 1 | 0 | |a Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen |c Udo Bub |
264 | 1 | |a München |b Utz, Wiss. |c 1999 | |
300 | |a XII, 130 S. |b graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 0 | |a Mensch - Maschine - Kommunikation | |
500 | |a Zugl.: München, Techn. Univ., Diss., 1998 | ||
650 | 0 | 7 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Echtzeitsystem |0 (DE-588)4131397-5 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Anpassung |0 (DE-588)4128128-7 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Hidden-Markov-Modell |0 (DE-588)4352479-5 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |D s |
689 | 0 | 1 | |a Hidden-Markov-Modell |0 (DE-588)4352479-5 |D s |
689 | 0 | 2 | |a Echtzeitsystem |0 (DE-588)4131397-5 |D s |
689 | 0 | 3 | |a Anpassung |0 (DE-588)4128128-7 |D s |
689 | 0 | |5 DE-604 | |
689 | 1 | 0 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |D s |
689 | 1 | 1 | |a Hidden-Markov-Modell |0 (DE-588)4352479-5 |D s |
689 | 1 | |5 DE-604 | |
856 | 4 | 2 | |m Digitalisierung UB Regensburg |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008472448&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-008472448 |
Datensatz im Suchindex
_version_ | 1804127124582301696 |
---|---|
adam_text | Inhaltsverzeichnis
1 Einführung 1
1.1 Interaktion zwischen Mensch und Maschine mit automatischer Spracher¬
kennung ................................... 1
1.2 Automatische Sprachverarbeitung..................... 2
1.2.1 Teilgebiete der Sprachverarbeitung................ 3
1.2.2 Automatische Spracherkennung.................. 3
1.3 Anpassungsfähigkeit eines Spracherkennungssystems........... 7
1.4 Stand der Technik ............................. 10
1.5 Zielsetzung und Gliederung der Arbeit.................. 16
2 Vorgehensweise bei der automatischen Spracherkennung 21
2.1 Überblick.................................. 21
2.2 Vorverarbeitung............................... 22
2.3 Kontinuierliche Hidden-Markov-Modelle................. 25
2.4 Akustisch-phonetische Modellierung.................... 28
2.4.1 Wortmodellierung.......................... 28
2.4.2 Phonembasierter Ansatz...................... 28
2.4.3 Behandlung von Verschleifungen.................. 29
2.4.4 Wahl und Bestimmung der freien Parameter........... 30
2.5 Lineare Diskriminanzanalyse........................ 31
2.6 Erkennung.................................. 32
2.6.1 Klassifikatoren ........................... 33
2.6.2 Mustervergleich mit dynamischer Programmierung ....... 34
2.6.3 Suche ................................ 35
ix
χ
Inhal ts
Verzeichnis
3 Training und
Adaption fttr flexible
Wortschätze 37
3.1
Training versus Adaption
.......................... 38
3.2 Erstellung von Datenbanken für das Lernen ............... 39
3.3 Schätzung der Parameter.......................... 43
3.3.1 Vorwärts- und Rückwärtswahrscheinlichkeitea.......... 43
3.3.2 Maximum
a
posteriori Schätzung................. 44
3.3.3 Maximum
Likelihood
Schätzung.................. 45
3.4 Realisierung................................. 47
3.4.1 Durchfuhrung des Trainings.................... 47
3.4.2 Generalist versus Spezialist .................... 49
3.4.3 Rückweisung ............................ 53
3.4.4 Das Prinzip der Taskadaption................... 54
4 Adaption der Parameterwerte
·>9
4.1 Herleitung der Theorie........................... 59
4.1.1 Adaption der Mittelwerte ..................... 60
4.1.2 Adaption der Mixturkoeffizienten................. 60
4.2 Diskussion der Adaptionsformeln..................... 61
4.2.1 Geometrische Interpretation.................... 61
4.2.2 Lereverhalten............................ 62
4.3 Realisierung................................. 65
4.3.1 Initialisierung und Ablauf der Adaption ............. 65
4.3.2 Versuchsumgebung......................... 66
4.3.3 Adaption der
Kontextzustânde
.................. 67
4.3.4 Dimensionierung der Lernrate................... 68
4.3.5 Adaption von Monophonmodellen................. 69
4.3.6 Adaption von Diphonmodellen................... 71
4.4 Vergleich der Verfahren........................... 71
5 Adaption der Struktur der Wahrscheinlicbkeitsdichtemodellierung 75
5.1 Motivation und Überblick......................... 75
5.2 Entropie in der Spracherkennung..................... 76
5.3 Entropie von approximierten Gaußverteilungen.............. 78
Inhaltsverzeichnis xi
5.4 Adaptives Aufteilen............................. 78
5.5 Algorithmische Umsetzung......................... 80
5.6 Kombination von Aufspalten und inkrementeller Adaption....... 83
5.7 Experimente zum Aufspalten ....................... 84
5.8 Erhöhung der Parameterzahl durch Auffüllen von Diphonmodellen ... 89
5.9 Experimente zum Auffüllen ........................ 91
5.10 Vergleich der Verfahren........................... 92
6 Transfer auf andere Aufgabenstellungen 95
6.1 Taskadaption versus Sprecheradaption .................. 95
6.2 Kanaladaption................................ 96
6.3 Multilingual Adaption........................... 97
7 Abschlußbetrachtung 99
7.1 Zusammenfassung und Diskussion..................... 99
7.2 Ausblick................................... 104
7.2.1 Zusammenfassen von wenig benutzten Moden.......... 104
7.2.2 Dialogüberwachte Adaption.................... 104
A
Nomenklatur und Formeln 105
A.l Nomenklatur ................................ 105
A.2 Vollständige Schätzung der Parameter .................. 108
A.2.1 Bestimmung der Vorwärts- und Rückwärtswahrscheinlichkeiten 108
A.2.2 MAP-Schätzung.......................... 109
A.2.3 ML-Schätzung........................... 109
8
Ergänzungen 111
B.l Einordnung von Adaptionsverfahren.................... 111
B.2 Sprachmodelle................................ 113
С
Datenbanken und Phoneminventar 115
C.l Verwendete Sprachdatenbanken...................... 115
C.l.l Voicemail.............................. 115
C.1.2 Sietül ................................ 116
Inhaltsverzeichnis
C.1.3 SpeechdatfM) Deutsch....................... 116
G.1.4 Voicemail Amerikanisch ...................... 117
C.1.5 OGI MLTSC ............................ 117
C.1.6 Slowenische Ziffern......................... 118
0.1.7
TI
Digits...............................
118
0.1.8 Phondat............................... 119
C.1.9 SZ.................................. 119
CLIO
Verbmobil (CD 1).......................... 120
C.2 Phoneminventar der deutschen Sprache.................. 121
Literaturverzeichnis 123
|
any_adam_object | 1 |
author | Bub, Udo |
author_GND | (DE-588)121018105 |
author_facet | Bub, Udo |
author_role | aut |
author_sort | Bub, Udo |
author_variant | u b ub |
building | Verbundindex |
bvnumber | BV012481642 |
classification_rvk | ES 945 |
classification_tum | ELT 533d |
ctrlnum | (OCoLC)76003571 (DE-599)BVBBV012481642 |
discipline | Sprachwissenschaft Elektrotechnik Literaturwissenschaft |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>02087nam a2200493 c 4500</leader><controlfield tag="001">BV012481642</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20120315 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">990323s1999 gw d||| m||| 00||| ger d</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">955725348</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3896754866</subfield><subfield code="c">brosch. : DM 86.06 (freier Pr.), EUR 44.00 (freier Pr.)</subfield><subfield code="9">3-89675-486-6</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)76003571</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV012481642</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">DE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-12</subfield><subfield code="a">DE-91</subfield><subfield code="a">DE-355</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 945</subfield><subfield code="0">(DE-625)27935:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ELT 533d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Bub, Udo</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)121018105</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen</subfield><subfield code="c">Udo Bub</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">München</subfield><subfield code="b">Utz, Wiss.</subfield><subfield code="c">1999</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">XII, 130 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="0" ind2=" "><subfield code="a">Mensch - Maschine - Kommunikation</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Zugl.: München, Techn. Univ., Diss., 1998</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Echtzeitsystem</subfield><subfield code="0">(DE-588)4131397-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Anpassung</subfield><subfield code="0">(DE-588)4128128-7</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Hidden-Markov-Modell</subfield><subfield code="0">(DE-588)4352479-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Hidden-Markov-Modell</subfield><subfield code="0">(DE-588)4352479-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Echtzeitsystem</subfield><subfield code="0">(DE-588)4131397-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="3"><subfield code="a">Anpassung</subfield><subfield code="0">(DE-588)4128128-7</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="689" ind1="1" ind2="0"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="1"><subfield code="a">Hidden-Markov-Modell</subfield><subfield code="0">(DE-588)4352479-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UB Regensburg</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008472448&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-008472448</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV012481642 |
illustrated | Illustrated |
indexdate | 2024-07-09T18:28:22Z |
institution | BVB |
isbn | 3896754866 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-008472448 |
oclc_num | 76003571 |
open_access_boolean | |
owner | DE-12 DE-91 DE-BY-TUM DE-355 DE-BY-UBR |
owner_facet | DE-12 DE-91 DE-BY-TUM DE-355 DE-BY-UBR |
physical | XII, 130 S. graph. Darst. |
publishDate | 1999 |
publishDateSearch | 1999 |
publishDateSort | 1999 |
publisher | Utz, Wiss. |
record_format | marc |
series2 | Mensch - Maschine - Kommunikation |
spelling | Bub, Udo Verfasser (DE-588)121018105 aut Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen Udo Bub München Utz, Wiss. 1999 XII, 130 S. graph. Darst. txt rdacontent n rdamedia nc rdacarrier Mensch - Maschine - Kommunikation Zugl.: München, Techn. Univ., Diss., 1998 Automatische Spracherkennung (DE-588)4003961-4 gnd rswk-swf Echtzeitsystem (DE-588)4131397-5 gnd rswk-swf Anpassung (DE-588)4128128-7 gnd rswk-swf Hidden-Markov-Modell (DE-588)4352479-5 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Automatische Spracherkennung (DE-588)4003961-4 s Hidden-Markov-Modell (DE-588)4352479-5 s Echtzeitsystem (DE-588)4131397-5 s Anpassung (DE-588)4128128-7 s DE-604 Digitalisierung UB Regensburg application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008472448&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Bub, Udo Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen Automatische Spracherkennung (DE-588)4003961-4 gnd Echtzeitsystem (DE-588)4131397-5 gnd Anpassung (DE-588)4128128-7 gnd Hidden-Markov-Modell (DE-588)4352479-5 gnd |
subject_GND | (DE-588)4003961-4 (DE-588)4131397-5 (DE-588)4128128-7 (DE-588)4352479-5 (DE-588)4113937-9 |
title | Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen |
title_auth | Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen |
title_exact_search | Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen |
title_full | Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen Udo Bub |
title_fullStr | Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen Udo Bub |
title_full_unstemmed | Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen Udo Bub |
title_short | Anwendungsspezifische Online-Anpassung von Hidden-Markov-Modellen in automatischen Spracherkennungssystemen |
title_sort | anwendungsspezifische online anpassung von hidden markov modellen in automatischen spracherkennungssystemen |
topic | Automatische Spracherkennung (DE-588)4003961-4 gnd Echtzeitsystem (DE-588)4131397-5 gnd Anpassung (DE-588)4128128-7 gnd Hidden-Markov-Modell (DE-588)4352479-5 gnd |
topic_facet | Automatische Spracherkennung Echtzeitsystem Anpassung Hidden-Markov-Modell Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008472448&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT bubudo anwendungsspezifischeonlineanpassungvonhiddenmarkovmodelleninautomatischenspracherkennungssystemen |