Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung:
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Abschlussarbeit Buch |
Sprache: | German |
Veröffentlicht: |
Aachen
Shaker
2000
|
Ausgabe: | Als Ms. gedr. |
Schriftenreihe: | Berichte aus der Informatik
|
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | V, 158 S. graph. Darst. : 21 cm |
ISBN: | 3826571541 |
Internformat
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV013086774 | ||
003 | DE-604 | ||
005 | 20120801 | ||
007 | t | ||
008 | 000328s2000 gw d||| m||| 00||| ger d | ||
016 | 7 | |a 958667098 |2 DE-101 | |
020 | |a 3826571541 |c kart. : DM 94.00, sfr 94.00, S 659.00 |9 3-8265-7154-1 | ||
035 | |a (OCoLC)76091505 | ||
035 | |a (DE-599)BVBBV013086774 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
044 | |a gw |c DE | ||
049 | |a DE-91 |a DE-12 |a DE-634 |a DE-355 | ||
084 | |a ES 945 |0 (DE-625)27935: |2 rvk | ||
084 | |a ELT 533d |2 stub | ||
100 | 1 | |a Köhler, Joachim |e Verfasser |4 aut | |
245 | 1 | 0 | |a Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung |c Joachim Köhler |
250 | |a Als Ms. gedr. | ||
264 | 1 | |a Aachen |b Shaker |c 2000 | |
300 | |a V, 158 S. |b graph. Darst. : 21 cm | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 0 | |a Berichte aus der Informatik | |
502 | |a Zugl.: München, Techn. Univ., Diss., 2000 | ||
650 | 0 | 7 | |a Hidden-Markov-Modell |0 (DE-588)4352479-5 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Mehrsprachigkeit |0 (DE-588)4038403-2 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Merkmalsextraktion |0 (DE-588)4314440-8 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Sprachsignal |0 (DE-588)4056494-0 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Laut |0 (DE-588)4166932-0 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |D s |
689 | 0 | 1 | |a Sprachsignal |0 (DE-588)4056494-0 |D s |
689 | 0 | 2 | |a Merkmalsextraktion |0 (DE-588)4314440-8 |D s |
689 | 0 | 3 | |a Mehrsprachigkeit |0 (DE-588)4038403-2 |D s |
689 | 0 | 4 | |a Laut |0 (DE-588)4166932-0 |D s |
689 | 0 | 5 | |a Hidden-Markov-Modell |0 (DE-588)4352479-5 |D s |
689 | 0 | |5 DE-604 | |
856 | 4 | 2 | |m Digitalisierung UB Regensburg |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008915033&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-008915033 |
Datensatz im Suchindex
_version_ | 1804127784086274048 |
---|---|
adam_text | Inhaltsverzeichnis
1 Einführung 1
1.1 Multilingualität in der Spracherkennung ................... 3
1.2 Motivation und Zielsetzung .......................... 6
1.3 Stand der Technik ............................... 8
1.3.1 Automatische Sprachenidentifizierung................. 8
1.3.2 Monolinguale mehrsprachige Spracherkennungssysteme....... 10
1.3.3 Sprachübergreifendes
Bootstrapping
.................. 11
1.4 Gliederung der Arbeit ............................. 12
2 Methoden zur automatischen Spracherkennung 13
2.1 Grundaufbau eines Spracherkennungssystems................. 13
2.2 Merkmalsextraktion............................... 14
2.3 Akustisch-phonetische Modellierung...................... 21
2.3.1 Hidden-Markov-Modelle........................ 21
2.3.2 Wahl der Spracheinheit......................... 29
2.3.3 Trainingsverfaliren........................... 32
2.4 Statistische Sprachmodelle........................... 35
2.5 Klassifikations- und Suchverfahren....................... 36
3 Aspekte zur Multilingualität 38
3.1 Sprachen und Sprachfamilien der Welt.................... 38
3.1.1 Einteilung in Sprachfamilien...................... 39
3.1.2 Bedeutung der Sprachen........................ 40
3.2 Multilinguale Sprachdatenbanken....................... 41
3.2.1 Anforderungen an multilinguale Sprachdatenbanken......... 41
iii
iv INHALTSVERZEICHNIS
3.2.2 Übersicht multilingualer Datenbanken ................ 42
3.3 Phonetische Lautklassen............................ 45
3.3.1 Konsonanten .............................. 46
3.3.2 Vokale.................................. 47
3.4 Internationale phonologische
Inventare
.................... 48
3.4.1
IPA ...................................
50
3.4.2 SAMPA................................. 50
3.4.3 WORLDBET.............................. 51
3.5 Sprachspezifische Eigenschaften von Sprachlauten.............. 52
4 Modellierung multilingualer Sprachlaute 54
4.1 Ähnlichkeiten.................................. 54
4.1.1 Log-Likelihood Abstand........................ 55
4.1.2 Delta-Log-Likelihood.......................... 58
4.1.3 Gaußsche Abstandsmaße........................ 59
4.2 Optimierungskriterien ............................. 62
4.2.1 Maße für die Parameterreduktion................... 62
4.2.2 Akustische Modellierungsgenauigkeit................. 64
4.2.3 Transferierbarkeit und Erweiterbarkeit................ 67
4.3 Multilingual Vorverarbeitung......................... 67
4.4 IPA-basierte Lautmodelle (IPA-MAP) .................... 68
4.5 Multilingual Lautclustering (MUL-CLUS)................. 69
4.6 Codebuchüberlappende IPA-Modelle (IPA-OVL)............... 73
5 Experimente 77
5.1
Monolinguale
Mehrsprachensysteme...................... 77
5.1.1 Test: OGI-Sprachdatenbank...................... 79
5.1.2 Test: SpeechDatfM) & Macrophone.................. 80
5.1.3 Tests zur kontextabhängigen Lautmodellierung............ 84
5.1.4 Cross-Datenbank Test......................... 85
5.2 Sprachenunabhängige Merkmalsextraktion.................. 86
5.3 Lautmodellierungsverfahren.......................... 88
INHALTSVERZEICHNIS v
5.3.1 Test: IPA-MAP............................. 88
5.3.2 Test: MUL-CLUS............................ 90
5.3.3 Test: IPA-OVL............................. 92
5.3.4 Gesamtvergleich der Verfahren:
IPA, MUL-CLUS,
IPA-OVL .... 95
5.3.5 Verhalten der Verfahren bei variierender Codebuchgröße...... 97
6 Sprachportierung 99
6.1
Bootstrapping
.................................. 99
6.2 Sprachenadaption................................101
6.2.1 Prinzip der Adaptionsverfahren....................101
6.2.2 Adaption von kontinuierlichen Hidden-Markov-Modellen mit dem
MAP-Ansatz ..............................104
6.3 Experimente...................................105
6.4 Sprachenähnlichkeit...............................110
6.4.1 Definition der Sprachenähnlichkeit ..................110
6.4.2 Experimente zur Sprachenähnlichkeit.................111
7 Diskussion und Ausblick 113
Anhang: 116
A Lautinventare
116
8
Sprachspeziflsche Informationen 120
B.l Amerikanisches Englisch............................ 121
B.2 Deutsch..................................... 125
B.3 Französisch ................................... 130
B.4 Italienisch.................................... 134
B.5 Portugiesisch .................................. 138
B.6 Spanisch..................................... 142
Literaturverzeichnis 146
|
any_adam_object | 1 |
author | Köhler, Joachim |
author_facet | Köhler, Joachim |
author_role | aut |
author_sort | Köhler, Joachim |
author_variant | j k jk |
building | Verbundindex |
bvnumber | BV013086774 |
classification_rvk | ES 945 |
classification_tum | ELT 533d |
ctrlnum | (OCoLC)76091505 (DE-599)BVBBV013086774 |
discipline | Sprachwissenschaft Elektrotechnik Literaturwissenschaft |
edition | Als Ms. gedr. |
format | Thesis Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>02172nam a2200517 c 4500</leader><controlfield tag="001">BV013086774</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20120801 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">000328s2000 gw d||| m||| 00||| ger d</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">958667098</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3826571541</subfield><subfield code="c">kart. : DM 94.00, sfr 94.00, S 659.00</subfield><subfield code="9">3-8265-7154-1</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)76091505</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV013086774</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">DE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-91</subfield><subfield code="a">DE-12</subfield><subfield code="a">DE-634</subfield><subfield code="a">DE-355</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 945</subfield><subfield code="0">(DE-625)27935:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ELT 533d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Köhler, Joachim</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung</subfield><subfield code="c">Joachim Köhler</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">Als Ms. gedr.</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Aachen</subfield><subfield code="b">Shaker</subfield><subfield code="c">2000</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">V, 158 S.</subfield><subfield code="b">graph. Darst. : 21 cm</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="0" ind2=" "><subfield code="a">Berichte aus der Informatik</subfield></datafield><datafield tag="502" ind1=" " ind2=" "><subfield code="a">Zugl.: München, Techn. Univ., Diss., 2000</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Hidden-Markov-Modell</subfield><subfield code="0">(DE-588)4352479-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Mehrsprachigkeit</subfield><subfield code="0">(DE-588)4038403-2</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Merkmalsextraktion</subfield><subfield code="0">(DE-588)4314440-8</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Sprachsignal</subfield><subfield code="0">(DE-588)4056494-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Laut</subfield><subfield code="0">(DE-588)4166932-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Sprachsignal</subfield><subfield code="0">(DE-588)4056494-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Merkmalsextraktion</subfield><subfield code="0">(DE-588)4314440-8</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="3"><subfield code="a">Mehrsprachigkeit</subfield><subfield code="0">(DE-588)4038403-2</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="4"><subfield code="a">Laut</subfield><subfield code="0">(DE-588)4166932-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="5"><subfield code="a">Hidden-Markov-Modell</subfield><subfield code="0">(DE-588)4352479-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UB Regensburg</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008915033&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-008915033</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV013086774 |
illustrated | Illustrated |
indexdate | 2024-07-09T18:38:51Z |
institution | BVB |
isbn | 3826571541 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-008915033 |
oclc_num | 76091505 |
open_access_boolean | |
owner | DE-91 DE-BY-TUM DE-12 DE-634 DE-355 DE-BY-UBR |
owner_facet | DE-91 DE-BY-TUM DE-12 DE-634 DE-355 DE-BY-UBR |
physical | V, 158 S. graph. Darst. : 21 cm |
publishDate | 2000 |
publishDateSearch | 2000 |
publishDateSort | 2000 |
publisher | Shaker |
record_format | marc |
series2 | Berichte aus der Informatik |
spelling | Köhler, Joachim Verfasser aut Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung Joachim Köhler Als Ms. gedr. Aachen Shaker 2000 V, 158 S. graph. Darst. : 21 cm txt rdacontent n rdamedia nc rdacarrier Berichte aus der Informatik Zugl.: München, Techn. Univ., Diss., 2000 Hidden-Markov-Modell (DE-588)4352479-5 gnd rswk-swf Mehrsprachigkeit (DE-588)4038403-2 gnd rswk-swf Automatische Spracherkennung (DE-588)4003961-4 gnd rswk-swf Merkmalsextraktion (DE-588)4314440-8 gnd rswk-swf Sprachsignal (DE-588)4056494-0 gnd rswk-swf Laut (DE-588)4166932-0 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Automatische Spracherkennung (DE-588)4003961-4 s Sprachsignal (DE-588)4056494-0 s Merkmalsextraktion (DE-588)4314440-8 s Mehrsprachigkeit (DE-588)4038403-2 s Laut (DE-588)4166932-0 s Hidden-Markov-Modell (DE-588)4352479-5 s DE-604 Digitalisierung UB Regensburg application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008915033&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Köhler, Joachim Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung Hidden-Markov-Modell (DE-588)4352479-5 gnd Mehrsprachigkeit (DE-588)4038403-2 gnd Automatische Spracherkennung (DE-588)4003961-4 gnd Merkmalsextraktion (DE-588)4314440-8 gnd Sprachsignal (DE-588)4056494-0 gnd Laut (DE-588)4166932-0 gnd |
subject_GND | (DE-588)4352479-5 (DE-588)4038403-2 (DE-588)4003961-4 (DE-588)4314440-8 (DE-588)4056494-0 (DE-588)4166932-0 (DE-588)4113937-9 |
title | Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung |
title_auth | Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung |
title_exact_search | Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung |
title_full | Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung Joachim Köhler |
title_fullStr | Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung Joachim Köhler |
title_full_unstemmed | Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung Joachim Köhler |
title_short | Erstellung einer statistisch modellierten multilingualen Lautbibliothek für die Spracherkennung |
title_sort | erstellung einer statistisch modellierten multilingualen lautbibliothek fur die spracherkennung |
topic | Hidden-Markov-Modell (DE-588)4352479-5 gnd Mehrsprachigkeit (DE-588)4038403-2 gnd Automatische Spracherkennung (DE-588)4003961-4 gnd Merkmalsextraktion (DE-588)4314440-8 gnd Sprachsignal (DE-588)4056494-0 gnd Laut (DE-588)4166932-0 gnd |
topic_facet | Hidden-Markov-Modell Mehrsprachigkeit Automatische Spracherkennung Merkmalsextraktion Sprachsignal Laut Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=008915033&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT kohlerjoachim erstellungeinerstatistischmodelliertenmultilingualenlautbibliothekfurdiespracherkennung |