Parametrisierung und Klassifikation gesprochener Sprache:
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
Düsseldorf
VDI-Verl.
1995
|
Ausgabe: | Als Ms. gedr. |
Schriftenreihe: | Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10]
353 |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | Zugl.: Erlangen-Nürnberg, Univ., Diss., 1994 |
Beschreibung: | VII, 201 S. graph. Darst. |
ISBN: | 3183353105 |
Internformat
MARC
LEADER | 00000nam a2200000 cb4500 | ||
---|---|---|---|
001 | BV010198043 | ||
003 | DE-604 | ||
005 | 19951102 | ||
007 | t | ||
008 | 950526s1995 d||| ma|| 00||| ger d | ||
016 | 7 | |a 944876242 |2 DE-101 | |
020 | |a 3183353105 |9 3-18-335310-5 | ||
035 | |a (OCoLC)75605207 | ||
035 | |a (DE-599)BVBBV010198043 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
049 | |a DE-29 |a DE-91 |a DE-210 |a DE-83 | ||
084 | |a ST 306 |0 (DE-625)143654: |2 rvk | ||
084 | |a DAT 710d |2 stub | ||
084 | |a DAT 776d |2 stub | ||
100 | 1 | |a Rieck, Stefan |e Verfasser |4 aut | |
245 | 1 | 0 | |a Parametrisierung und Klassifikation gesprochener Sprache |c Stefan Rieck |
250 | |a Als Ms. gedr. | ||
264 | 1 | |a Düsseldorf |b VDI-Verl. |c 1995 | |
300 | |a VII, 201 S. |b graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 1 | |a Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10] |v 353 | |
500 | |a Zugl.: Erlangen-Nürnberg, Univ., Diss., 1994 | ||
650 | 0 | 7 | |a Klassifikator |g Informatik |0 (DE-588)4288547-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Sprachsignal |0 (DE-588)4056494-0 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Merkmalsextraktion |0 (DE-588)4314440-8 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Neuronales Netz |0 (DE-588)4226127-2 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |D s |
689 | 0 | 1 | |a Sprachsignal |0 (DE-588)4056494-0 |D s |
689 | 0 | 2 | |a Merkmalsextraktion |0 (DE-588)4314440-8 |D s |
689 | 0 | 3 | |a Klassifikator |g Informatik |0 (DE-588)4288547-4 |D s |
689 | 0 | 4 | |a Neuronales Netz |0 (DE-588)4226127-2 |D s |
689 | 0 | |5 DE-604 | |
810 | 2 | |a 10] |t Verein Deutscher Ingenieure: [Fortschrittberichte VDI |v 353 |w (DE-604)BV000897204 |9 353 | |
856 | 4 | 2 | |m HBZ Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=006776714&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-006776714 |
Datensatz im Suchindex
_version_ | 1804124603232026624 |
---|---|
adam_text | Titel: Parametrisierung und Klassifikation gesprochener Sprache
Autor: Rieck, Stefan
Jahr: 1995
Inhalt sver zeichnis 1 Einführung 1 1.1 Motivation.................................... 1 1.2 Grundlagen der Sprachwissenschaft...................... 3 1.2.1 Sprachproduktion............................ 4 1.2.2 Sprachperzeption............................ 6 1.2.3 Kategorisierung............................. 8 1.3 Stand der Technik ............................... 11 1.4 Beitrag dieser Arbeit zur Forschung...................... 13 2 Parametrisierung 15 2.1 Diskretisierung................................ 15 2.2 Spektrale Analyse................................ 16 2.3 Lineare Vorhersage............................... 19 2.4 Perzeptionsmodelle............................... 22 2.5 Cepstrale Analyse................................ 25 2.6 Berücksichtigung von zeitlichem Kontext................... 28 3 Klassifikation 32 3.1 Entscheidungstheoretischer Ansatz ...................... 33 3.2 Klassifikation bei vorgegebener Form der Wahrscheinlichkeitsdichte .... 34 3.2.1 Klassenweise normalverteilte Merkmale................ 35 3.2.2 Schätzung der Parameter........................ 36 3.3 Klassifikation mit direkter Schätzung der a-posteriori Wahrscheinlichkeiten 39 3.4 Klassifikation mit neuronalen Netzwerken................... 42 3.4.1 Zusammenhang mit parametrischen Klassifikatoren......... 43 3.4.2 Vorwärtsgerichtete Netze........................44 3.4.3 Zeitverzögernde und rückgekoppelte Netze.............. 46 3.4.4 Phonotopische Karten......................... 49 3.5 Integrierte Ansätze mit Hidden-Markov-Modellen.............. 52 3.5.1 Hidden-Markov-Modelle........................ 53 3.5.2 Semi-kontinuierliche Hidden-Markov-Modelle............ 56 3.5.3 Kombination von HMM und Neuronalen Netzen........... 58 V
4 Merkmalstransformationen 60 4.1 Lineare Transformationen ........................... 60 4.2 Nichtlineare TVansformationen......................... 63 5 Kompensation von Schwankungen 68 5.1 Modifikationen auf der Ebene der Merkmalsberechnung ........... 69 5.1.1 Normierungen.............................. 71 5.1.2 Adaption ................................ 79 5.2 Modifikationen auf der Ebene der Klassifikation............... 82 5.2.1 Robuster Ansatz....._....................... 82 5.2.2 Adaption ................................ 85 6 Stichproben 90 6.1 Beispiele für derzeit verfügbare Stichproben ................. 91 6.2 Die ERBA-Stichprobe.............................. 94 6.2.1 Entwurf und Generierung des Korpus.................94 6.2.2 Festlegung der Größe der Stichprobe.................100 6.2.3 Aufnahme der Stichprobe..............rr~.......101 6.2.4 Automatische Etikettierung......................102 6.3 Beschreibung der in dieser Arbeit verwendeten Stichproben.........103 7 Experimente
und Ergebnisse 105 7.1 Kriterien zur Leistungsbewertung.......................105 7.2 Parametrisierung................................109 7.2.1 Untersuchungen zu statischen Merkmalen...............110 7.2.2 Berücksichtigung von Kontext.....................118 7.3 Klassifikation..................................122 7.3.1 Vokalklassifikation mit Neuronalen Netzen..............122 7.3.2 Vektorquantisierung mit Kohonen-Netzen..............128 7.3.3 Zusammenfassung............................135 7.4 Merkmalstransformationen...........................135 7.4.1 Vergleich verschiedener linearer Transformationen..........135 7.4.2 Untersuchungen zur Linearen Diskriminanzanalyse (LDA) .....138 7.4.3 Einsatz von MLPs zur Diskriminanzanalyse (NLDA)........139 7.4.4 Zusammenfassung............................142 7.5 Kompensation von Schwankungen auf der Ebene der Merkmalsberechnung 142 7.5.1 Vergleich der Normierungsverfahren zur Reduktion der Sprecherabhängigkeit ...............................142
7.5.2 Einsatz der Normierungsverfahren zum Ausgleich von Kanalschwankungen ..............................146 7.5.3 Zusammenfassung............................149 7.6 Kompensation von Schwankungen auf der Ebene der Klassifikation.....149 VI
7.6.1 Sprechergruppen............................149 7.6.2 Codebuchadaption...........................151 7.6.3 Vergleich von Codebuchadaption und dynamischer Cepstraler Subtraktion .................................152 7.6.4 Zusammenfassung............................154 7.7 Beschleunigung der Verfahren.........................154 7.7.1 Parametrisierung............................155 7.7.2 Klassifikation..............................156 7.7.3 Zusammenfassung............................158 7.8 Ergebnis.....................................159 8 Zusammenfassung 161 A Verwendete Lautinventare 167 A.l Die Phoneme des Deutschen..........................167 A.2 Liste der vereinbarten Lautkomponentenklassen der ERBA-Stichprobe . . . 169 A. 3 Lautklassen der TlMIT-Stichprobe .......................171 B Beschreibung der Merkmalberechnung 173 B. l Mel-Cepstrum..................................173 B. 2 Mel-Cepstrum mit DACS............................176 C Die ERBA-Stichprobe 178 C. l Liste aller verwendeten Schablonen......................178 C.2 Vollständige Liste der Regeln .........................179 C.3 Informationen zur Stichprobe.........................187 Literaturverzeichnis 188 VII
|
any_adam_object | 1 |
author | Rieck, Stefan |
author_facet | Rieck, Stefan |
author_role | aut |
author_sort | Rieck, Stefan |
author_variant | s r sr |
building | Verbundindex |
bvnumber | BV010198043 |
classification_rvk | ST 306 |
classification_tum | DAT 710d DAT 776d |
ctrlnum | (OCoLC)75605207 (DE-599)BVBBV010198043 |
discipline | Informatik |
edition | Als Ms. gedr. |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>02142nam a2200505 cb4500</leader><controlfield tag="001">BV010198043</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">19951102 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">950526s1995 d||| ma|| 00||| ger d</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">944876242</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3183353105</subfield><subfield code="9">3-18-335310-5</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)75605207</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV010198043</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-29</subfield><subfield code="a">DE-91</subfield><subfield code="a">DE-210</subfield><subfield code="a">DE-83</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 306</subfield><subfield code="0">(DE-625)143654:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 710d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 776d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Rieck, Stefan</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Parametrisierung und Klassifikation gesprochener Sprache</subfield><subfield code="c">Stefan Rieck</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">Als Ms. gedr.</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Düsseldorf</subfield><subfield code="b">VDI-Verl.</subfield><subfield code="c">1995</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">VII, 201 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10]</subfield><subfield code="v">353</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Zugl.: Erlangen-Nürnberg, Univ., Diss., 1994</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Klassifikator</subfield><subfield code="g">Informatik</subfield><subfield code="0">(DE-588)4288547-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Sprachsignal</subfield><subfield code="0">(DE-588)4056494-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Merkmalsextraktion</subfield><subfield code="0">(DE-588)4314440-8</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Neuronales Netz</subfield><subfield code="0">(DE-588)4226127-2</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Sprachsignal</subfield><subfield code="0">(DE-588)4056494-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Merkmalsextraktion</subfield><subfield code="0">(DE-588)4314440-8</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="3"><subfield code="a">Klassifikator</subfield><subfield code="g">Informatik</subfield><subfield code="0">(DE-588)4288547-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="4"><subfield code="a">Neuronales Netz</subfield><subfield code="0">(DE-588)4226127-2</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="810" ind1="2" ind2=" "><subfield code="a">10]</subfield><subfield code="t">Verein Deutscher Ingenieure: [Fortschrittberichte VDI</subfield><subfield code="v">353</subfield><subfield code="w">(DE-604)BV000897204</subfield><subfield code="9">353</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">HBZ Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=006776714&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-006776714</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV010198043 |
illustrated | Illustrated |
indexdate | 2024-07-09T17:48:17Z |
institution | BVB |
isbn | 3183353105 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-006776714 |
oclc_num | 75605207 |
open_access_boolean | |
owner | DE-29 DE-91 DE-BY-TUM DE-210 DE-83 |
owner_facet | DE-29 DE-91 DE-BY-TUM DE-210 DE-83 |
physical | VII, 201 S. graph. Darst. |
publishDate | 1995 |
publishDateSearch | 1995 |
publishDateSort | 1995 |
publisher | VDI-Verl. |
record_format | marc |
series2 | Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10] |
spelling | Rieck, Stefan Verfasser aut Parametrisierung und Klassifikation gesprochener Sprache Stefan Rieck Als Ms. gedr. Düsseldorf VDI-Verl. 1995 VII, 201 S. graph. Darst. txt rdacontent n rdamedia nc rdacarrier Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10] 353 Zugl.: Erlangen-Nürnberg, Univ., Diss., 1994 Klassifikator Informatik (DE-588)4288547-4 gnd rswk-swf Automatische Spracherkennung (DE-588)4003961-4 gnd rswk-swf Sprachsignal (DE-588)4056494-0 gnd rswk-swf Merkmalsextraktion (DE-588)4314440-8 gnd rswk-swf Neuronales Netz (DE-588)4226127-2 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Automatische Spracherkennung (DE-588)4003961-4 s Sprachsignal (DE-588)4056494-0 s Merkmalsextraktion (DE-588)4314440-8 s Klassifikator Informatik (DE-588)4288547-4 s Neuronales Netz (DE-588)4226127-2 s DE-604 10] Verein Deutscher Ingenieure: [Fortschrittberichte VDI 353 (DE-604)BV000897204 353 HBZ Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=006776714&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Rieck, Stefan Parametrisierung und Klassifikation gesprochener Sprache Klassifikator Informatik (DE-588)4288547-4 gnd Automatische Spracherkennung (DE-588)4003961-4 gnd Sprachsignal (DE-588)4056494-0 gnd Merkmalsextraktion (DE-588)4314440-8 gnd Neuronales Netz (DE-588)4226127-2 gnd |
subject_GND | (DE-588)4288547-4 (DE-588)4003961-4 (DE-588)4056494-0 (DE-588)4314440-8 (DE-588)4226127-2 (DE-588)4113937-9 |
title | Parametrisierung und Klassifikation gesprochener Sprache |
title_auth | Parametrisierung und Klassifikation gesprochener Sprache |
title_exact_search | Parametrisierung und Klassifikation gesprochener Sprache |
title_full | Parametrisierung und Klassifikation gesprochener Sprache Stefan Rieck |
title_fullStr | Parametrisierung und Klassifikation gesprochener Sprache Stefan Rieck |
title_full_unstemmed | Parametrisierung und Klassifikation gesprochener Sprache Stefan Rieck |
title_short | Parametrisierung und Klassifikation gesprochener Sprache |
title_sort | parametrisierung und klassifikation gesprochener sprache |
topic | Klassifikator Informatik (DE-588)4288547-4 gnd Automatische Spracherkennung (DE-588)4003961-4 gnd Sprachsignal (DE-588)4056494-0 gnd Merkmalsextraktion (DE-588)4314440-8 gnd Neuronales Netz (DE-588)4226127-2 gnd |
topic_facet | Klassifikator Informatik Automatische Spracherkennung Sprachsignal Merkmalsextraktion Neuronales Netz Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=006776714&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
volume_link | (DE-604)BV000897204 |
work_keys_str_mv | AT rieckstefan parametrisierungundklassifikationgesprochenersprache |