Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung:
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
Düsseldorf
VDI-Verl.
1997
|
Ausgabe: | Als Ms. gedr. |
Schriftenreihe: | Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10]
461 |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | Zugl.: Bochum, Univ., Diss. |
Beschreibung: | VII, 181 S.: graph. Darst. |
ISBN: | 3183461102 |
Internformat
MARC
LEADER | 00000nam a2200000 cb4500 | ||
---|---|---|---|
001 | BV011220134 | ||
003 | DE-604 | ||
005 | 19970627 | ||
007 | t | ||
008 | 970225s1997 m||| 00||| gerod | ||
016 | 7 | |a 949706744 |2 DE-101 | |
020 | |a 3183461102 |9 3-18-346110-2 | ||
035 | |a (OCoLC)45584245 | ||
035 | |a (DE-599)BVBBV011220134 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
049 | |a DE-91 |a DE-210 |a DE-83 | ||
084 | |a ZN 6070 |0 (DE-625)157501: |2 rvk | ||
084 | |a ELT 533d |2 stub | ||
100 | 1 | |a Knohl, Lars |e Verfasser |0 (DE-588)115244670 |4 aut | |
245 | 1 | 0 | |a Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung |c Lars Knohl |
250 | |a Als Ms. gedr. | ||
264 | 1 | |a Düsseldorf |b VDI-Verl. |c 1997 | |
300 | |a VII, 181 S.: graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 1 | |a Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10] |v 461 | |
500 | |a Zugl.: Bochum, Univ., Diss. | ||
650 | 0 | 7 | |a Prosodie |0 (DE-588)4047500-1 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Sprecheradaption |0 (DE-588)4327834-6 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Sprecheradaption |0 (DE-588)4327834-6 |D s |
689 | 0 | |5 DE-604 | |
689 | 1 | 0 | |a Prosodie |0 (DE-588)4047500-1 |D s |
689 | 1 | 1 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |D s |
689 | 1 | |5 DE-604 | |
810 | 2 | |a 10] |t Verein Deutscher Ingenieure: [Fortschrittberichte VDI |v 461 |w (DE-604)BV000897204 |9 461 | |
856 | 4 | 2 | |m HBZ Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007527648&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-007527648 |
Datensatz im Suchindex
_version_ | 1804125718755409920 |
---|---|
adam_text | Titel: Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen S
Autor: Knohl, Lars
Jahr: 1997
SCHRITT-m MM^M BERICHTEUljl Dipl.-Ing. Lars Knohl, Schermbeck Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung Reihe 10 : Informatik/ Kommunikationstechni k Nr. 461
Inhaltsverzeichnis 1 Einleitung 1 2 Grundlagen der Sprecheradaption 4 2.1 Sprechervariabilität 6 2.1.1 Sprecherspezifische Variabilität 7 2.1.2 Umweltspezifische Variabilität 10 2.2 Konzepte der Spracherkennung 11 2.2.1 Sprecheradaptive Spracherkennung 14 2.2.2 Technische Komponenten der Spracherkennung 17 2.3 Konzepte der Sprecheradaption 21 2.3.1 Textunabhängige (unüberwachte) Sprecheradaption 24 2.3.1.1 Spektrale Subtraktion 24 2.3.1.2 Kanal-Kompensation (Channel Equalization) 25 2.3.1.3 Frequenzachsentransformation 27 2.3.1.4 Kodebuchadaption 29 2.3.2 Textabhängige (überwachte) Sprecheradaption 32 2.3.2.1 Frequenzachsentransformation 32 2.3.2.2 Kodebuchadaption 41 2.3.2.3 HMM-Adaption 50 2.4 Zusammenfassung 53 3 Prosodiegesteuerte Sprecher- und Umweltadaption 56 3.1 Nicht-lineare Zeitachsentransformation in der textabhängigen Sprecheradaption 57 3.2 Das Adaptionsverfahren 63 3.2.1 Extraktion der Log-F1 -Energie als prosodisches Flilfsmerkmal 68 -V-
3.2.2 Segmentierung des Log-F1-Energieverlaufes 71 3.3 Experimentelle Untersuchungen 74 3.3.0. 1 Die Testumgebung 75 3.3.0. 2 Das Testkorpus 77 3.3.1 Optimierung der Verfahrensparameter 80 3.3.2 Performanz in störungsarmer Sprechumgebung 86 3.3.3 Performanz in störungsbehafteter Sprechumgebung 88 3.3.3.1 Trainingsfremde Sprechumgebung 88 3.3.3.2 Sprecheradaption vs. sprecherunabhängiger und sprecherabhängiger Erkennung in trainingsgetreuer Sprechumgebung 94 3.4 Zusammenfassung 96 4 Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur 99 4.1 Die Mehrsprecher-Architektur 103 4.1.1 Methoden der Kodebuch-Selektion 105 4.2 Experimentelle Untersuchungen 108 4.2.0. 1 Das Testkorpus 109 4.2.1 Bestimmung des Selektionsverfahrens und einer Identifikationsäußerung 111 4.2.2 Performanz in störungsarmer Sprechumgebung 113 4.2.3 Performanz in störungsbehafteter Sprechumgebung 115 4.2.3.1 Trainingsfremde Sprechumgebung 115 4.2.3.2 Sprecheradaption vs. sprecherunabhängiger und sprecherabhängiger Erkennung in trainingsgetreuer Sprechumgebung 119 4.3 Zusammenfassung 120 5 Zusammenfassung 123 A Die Testumgebung 130 A.1 Der Preprozessor 131 A.2 Der Vektorquantisierer 133 A.2.1 Vektorquantisierung mit kohonschen Merkmalskarten 134 - VI -
A.3 Der Erkenner 138 B Das Testkorpus 141 C Sprechumgebungen 144 C.1 Umgebungsrauschen 145 C.1.1 SUN-SPARC10 Lüfterrauschen 148 C.2 Übertragungsstrecken 149 C.2.1 Raum 149 C.2.2 Telefon 153 C.3 Kombinierte Szenarien 155 C.3.1 Telefon + Leitungsrauschen 156 C.3.2 Lüfterrauschen + Raum + Telefon + Leitungsrauschen 158 D Erkennungsergebnisse 161 E Literaturverzeichnis 167 F Stichwortverzeichnis 179 -VII-
|
any_adam_object | 1 |
author | Knohl, Lars |
author_GND | (DE-588)115244670 |
author_facet | Knohl, Lars |
author_role | aut |
author_sort | Knohl, Lars |
author_variant | l k lk |
building | Verbundindex |
bvnumber | BV011220134 |
classification_rvk | ZN 6070 |
classification_tum | ELT 533d |
ctrlnum | (OCoLC)45584245 (DE-599)BVBBV011220134 |
discipline | Elektrotechnik Elektrotechnik / Elektronik / Nachrichtentechnik |
edition | Als Ms. gedr. |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01911nam a2200457 cb4500</leader><controlfield tag="001">BV011220134</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">19970627 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">970225s1997 m||| 00||| gerod</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">949706744</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3183461102</subfield><subfield code="9">3-18-346110-2</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)45584245</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV011220134</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-91</subfield><subfield code="a">DE-210</subfield><subfield code="a">DE-83</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ZN 6070</subfield><subfield code="0">(DE-625)157501:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ELT 533d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Knohl, Lars</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)115244670</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung</subfield><subfield code="c">Lars Knohl</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">Als Ms. gedr.</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Düsseldorf</subfield><subfield code="b">VDI-Verl.</subfield><subfield code="c">1997</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">VII, 181 S.: graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10]</subfield><subfield code="v">461</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Zugl.: Bochum, Univ., Diss.</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Prosodie</subfield><subfield code="0">(DE-588)4047500-1</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Sprecheradaption</subfield><subfield code="0">(DE-588)4327834-6</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Sprecheradaption</subfield><subfield code="0">(DE-588)4327834-6</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="689" ind1="1" ind2="0"><subfield code="a">Prosodie</subfield><subfield code="0">(DE-588)4047500-1</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="1"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="810" ind1="2" ind2=" "><subfield code="a">10]</subfield><subfield code="t">Verein Deutscher Ingenieure: [Fortschrittberichte VDI</subfield><subfield code="v">461</subfield><subfield code="w">(DE-604)BV000897204</subfield><subfield code="9">461</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">HBZ Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007527648&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-007527648</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV011220134 |
illustrated | Not Illustrated |
indexdate | 2024-07-09T18:06:01Z |
institution | BVB |
isbn | 3183461102 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-007527648 |
oclc_num | 45584245 |
open_access_boolean | |
owner | DE-91 DE-BY-TUM DE-210 DE-83 |
owner_facet | DE-91 DE-BY-TUM DE-210 DE-83 |
physical | VII, 181 S.: graph. Darst. |
publishDate | 1997 |
publishDateSearch | 1997 |
publishDateSort | 1997 |
publisher | VDI-Verl. |
record_format | marc |
series2 | Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10] |
spelling | Knohl, Lars Verfasser (DE-588)115244670 aut Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung Lars Knohl Als Ms. gedr. Düsseldorf VDI-Verl. 1997 VII, 181 S.: graph. Darst. txt rdacontent n rdamedia nc rdacarrier Verein Deutscher Ingenieure: [Fortschrittberichte VDI / 10] 461 Zugl.: Bochum, Univ., Diss. Prosodie (DE-588)4047500-1 gnd rswk-swf Sprecheradaption (DE-588)4327834-6 gnd rswk-swf Automatische Spracherkennung (DE-588)4003961-4 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Sprecheradaption (DE-588)4327834-6 s DE-604 Prosodie (DE-588)4047500-1 s Automatische Spracherkennung (DE-588)4003961-4 s 10] Verein Deutscher Ingenieure: [Fortschrittberichte VDI 461 (DE-604)BV000897204 461 HBZ Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007527648&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Knohl, Lars Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung Prosodie (DE-588)4047500-1 gnd Sprecheradaption (DE-588)4327834-6 gnd Automatische Spracherkennung (DE-588)4003961-4 gnd |
subject_GND | (DE-588)4047500-1 (DE-588)4327834-6 (DE-588)4003961-4 (DE-588)4113937-9 |
title | Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung |
title_auth | Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung |
title_exact_search | Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung |
title_full | Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung Lars Knohl |
title_fullStr | Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung Lars Knohl |
title_full_unstemmed | Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung Lars Knohl |
title_short | Prosodiegesteuerte Sprecher- und Umweltadaption in einer Mehrsprecher-Architektur zur maschinellen Spracherkennung |
title_sort | prosodiegesteuerte sprecher und umweltadaption in einer mehrsprecher architektur zur maschinellen spracherkennung |
topic | Prosodie (DE-588)4047500-1 gnd Sprecheradaption (DE-588)4327834-6 gnd Automatische Spracherkennung (DE-588)4003961-4 gnd |
topic_facet | Prosodie Sprecheradaption Automatische Spracherkennung Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007527648&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
volume_link | (DE-604)BV000897204 |
work_keys_str_mv | AT knohllars prosodiegesteuertesprecherundumweltadaptionineinermehrsprecherarchitekturzurmaschinellenspracherkennung |