Grundkurs Spracherkennung: vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
Wiesbaden
Vieweg
2006
|
Ausgabe: | 1. Aufl. |
Schriftenreihe: | Computational Intelligence
|
Schlagworte: | |
Online-Zugang: | Inhaltstext Inhaltsverzeichnis |
Beschreibung: | Auch als Internetausgabe |
Beschreibung: | X, 200 S. graph. Darst. |
ISBN: | 3834800031 9783834800039 |
Internformat
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV019808585 | ||
003 | DE-604 | ||
005 | 20190121 | ||
007 | t | ||
008 | 050512s2006 gw d||| |||| 00||| ger d | ||
016 | 7 | |a 974197092 |2 DE-101 | |
020 | |a 3834800031 |9 3-8348-0003-1 | ||
020 | |a 9783834800039 |9 978-3-8348-0003-9 | ||
035 | |a (OCoLC)179881832 | ||
035 | |a (DE-599)BVBBV019808585 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
044 | |a gw |c XA-DE-HE | ||
049 | |a DE-859 |a DE-739 |a DE-1050 |a DE-1046 |a DE-1102 |a DE-92 |a DE-1047 |a DE-573 |a DE-862 |a DE-Aug4 |a DE-634 |a DE-83 |a DE-11 |a DE-525 |a DE-898 |a DE-B768 |a DE-1051 |a DE-Po75 | ||
082 | 0 | |a 004 | |
084 | |a ST 306 |0 (DE-625)143654: |2 rvk | ||
084 | |a ZN 6070 |0 (DE-625)157501: |2 rvk | ||
084 | |a 004 |2 sdnb | ||
100 | 1 | |a Euler, Stephan |e Verfasser |0 (DE-588)1063743265 |4 aut | |
245 | 1 | 0 | |a Grundkurs Spracherkennung |b vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen |c Stephen Euler |
250 | |a 1. Aufl. | ||
264 | 1 | |a Wiesbaden |b Vieweg |c 2006 | |
300 | |a X, 200 S. |b graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 0 | |a Computational Intelligence | |
500 | |a Auch als Internetausgabe | ||
650 | 0 | 7 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4123623-3 |a Lehrbuch |2 gnd-content | |
689 | 0 | 0 | |a Automatische Spracherkennung |0 (DE-588)4003961-4 |D s |
689 | 0 | |5 DE-604 | |
856 | 4 | 2 | |q text/html |u http://deposit.dnb.de/cgi-bin/dokserv?id=2611747&prov=M&dok_var=1&dok_ext=htm |3 Inhaltstext |
856 | 4 | 2 | |m Digitalisierung UBPassau |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=013134048&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-013134048 |
Datensatz im Suchindex
DE-BY-862_location | 2000 |
---|---|
DE-BY-FWS_call_number | 2000/ZN 6070 E88 |
DE-BY-FWS_katkey | 265958 |
DE-BY-FWS_media_number | 083000405348 |
_version_ | 1806174324859600896 |
adam_text | Inhaltsverzeichnis
1 Einführung 1
1.1 Einleitung............................... 1
1.2 Was macht Sprache so schwierig?.................. 2
1.3 Literatur................................ 4
2 Sprachverarbeitung 5
2.1 Spracherzeugung........................... 5
2.1.1 Quelle-Filter-Modell..................... 8
2.2 Einheiten............................... 8
2.3 yariabilität.............................. 11
2.4 Übungen................................ 13
3 Spracherkennung 15
3.1 Techniken und Anwendungen.................... 15
3.2 Schwierigkeitsstufen.......................... 18
3.3 Aufbau eines komplexen Systems.................. 19
3.4 Fehlerarten .............................. 21
3.4.1 Spracherkennung....................... 21
3.4.2 Sprecherverifikation...................... 23
3.5 Übungen................................ 27
4 Vorverarbeitung 29
4.1 Sprachdetektion............................ 29
4.2 Merkmalsextraktion.......................... 30
4.2.1 Blockbildung......................... 30
4.2.2 Diskrete
4.2.3 Anpassung des Frequenzbereiches.............. 34
4.2.4 Lineare Prädiktion...................... 36
4.2.5 Cepstrale Darstellung..................... 43
4.2.6 Dynamische Merkmale.................... 45
4.2.7 Andere Merkmale....................... 47
4.3 Vektor-Quantisierung......................... 48
4.4 Übungen............................... . 51
5 Mustervergleich 53
5.1 Grundprinzip............................. 53
5.2 Dynamische Zeitverzerrung...................... 55
5.3 Suche ................................. 57
5.3.1 Aufwand............................ 63
5.4 Bewertung............................... 64
5.5 Übungen................................ 65
6 Hidden-Markov-Modelle 67
6.1 Einleitung............................... 67
6.2 Ein anschauliches Beispiel...................... 67
6.2.1 Übertragung auf Sprachsignale ............... 69
6.3 Mathematische Grundlagen..................... 70
6.3.1 Wahrscheinlichkeiten..................... 70
6.3.2 Grundstruktur von HMM.................. 71
6.4 Ausgabesymbole ........................... 74
6.5 Anwendung.............................. 75
6.5.1 Viterbi-Algorithmus ..................... 79
6.5.2 Modelltraining ........................ 82
6.5.3 Kontinuierliche Symbole................... 85
6.6 Diskriminatives Modelltraining ................... 89
6.6.1 Merkmalstransformation................... 94
6.7 Vergleich zwischen HMM und DTW ................. 96
6.8 Übungen................................ 97
7 Einsatz von Hidden-Maxkov-Modellen 99
7.1 Einleitung............................... 99
7.2 Ganzwortmodelle........................... 99
7.3 Phonemmodelle............................ 101
7.3.1 Aussprachelexikon ...................... 101
7.3.2 Kombination zu Wortmodellen................ 103
7.3.3 Kontextabhängige Modelle.................. 104
7.3.4 Training und Erkennung................... 107
7.4 Datenbanken............................. 108
7.5 Kontinuierliche Erkennung...................... 109
7.5.1 Netzwerke........................... 109
7.5.2 Statistische Sprachmodelle.................. 112
7.5.3 Effiziente Suche........................ 118
7.6 Schnittstelle zu anderen Modulen.................. 118
7.6.1 N-Besten Wortfolgen..................... 118
7.6.2 Wordhypothesengraph.................... 120
7.7 Übungen................................ 121
8 Syntax 123
8.1 Einleitung............................... 123
8.2 Grundlagen.............................. 123
8.3 Grammatiken............................. 125
8.3.1 Einseitig lineare Grammatiken................ 127
8.3.2 Kontextfreie Grammatiken.................. 128
8.3.3 Wortproblem......................... 129
8.4 Grammatiken für Sprachanwendungen ............... 130
8.4.1 Java Speech
8.4.2 Speech
8.4.3 HTK-Grammatik....................... 133
8.5 Merkmalsstukturen.......................... 133
8.6 Übungen................................ 135
9 HTK 137
9.1 Sprachdaten und Vorbereitungen .................. 138
9.2 Merkmalsextraktion.......................... 140
9.3 Ganzwortmodelle........................... 142
9.3.1 Initialisierung......................... 142
9.3.2 Einzelne Wörter........................ 143
9.3.3 Wortketten.......................... 147
9.4 Phonemmodelle............................ 147
9.5 Übungen................................ 151
10 Dialogsysteme 153
10.1 Einleitung............................... 153
10.2 Dialogtypen.............................. 153
10.3 Programmierschnittstellen...................... 156
10.4 Beschreibungssprachen........................ 157
10.5 Speech Application
10.6
10.6.1 Grundelemente........................ 159
10.6.2 Ereignisse........................... 163
10.6.3 Gemischte Initiative ..................... 164
10.7 Übungen................................ 166
11 Friedberger Java-Sprach-Tools 167
11.1 Einleitung............................... 167
11.2 DTW-Erkenner fbdtw ........................ 167
11.3 FBVIEW............................... 169
11.3.1 Dateiformate......................... 171
11.3.2 Signalanalyse......................... 172
11.3.3 Transkriptionen........................ 172
x INHALTSVERZEICHNIS
11.3.4 TCP-Schnittstelle.......................173
11.4 FBGenerator .............................173
11.5 VoiceXML Interpreter ........................174
A
A.l Baum-Welch-Algoritnmus ......................175
A.2 Skalierung...............................179
B Abkürzungen 183
Literaturverzeichnis 187
Index 198
|
any_adam_object | 1 |
author | Euler, Stephan |
author_GND | (DE-588)1063743265 |
author_facet | Euler, Stephan |
author_role | aut |
author_sort | Euler, Stephan |
author_variant | s e se |
building | Verbundindex |
bvnumber | BV019808585 |
classification_rvk | ST 306 ZN 6070 |
ctrlnum | (OCoLC)179881832 (DE-599)BVBBV019808585 |
dewey-full | 004 |
dewey-hundreds | 000 - Computer science, information, general works |
dewey-ones | 004 - Computer science |
dewey-raw | 004 |
dewey-search | 004 |
dewey-sort | 14 |
dewey-tens | 000 - Computer science, information, general works |
discipline | Informatik Elektrotechnik / Elektronik / Nachrichtentechnik |
edition | 1. Aufl. |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01894nam a2200445 c 4500</leader><controlfield tag="001">BV019808585</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20190121 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">050512s2006 gw d||| |||| 00||| ger d</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">974197092</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3834800031</subfield><subfield code="9">3-8348-0003-1</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9783834800039</subfield><subfield code="9">978-3-8348-0003-9</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)179881832</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV019808585</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE-HE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-859</subfield><subfield code="a">DE-739</subfield><subfield code="a">DE-1050</subfield><subfield code="a">DE-1046</subfield><subfield code="a">DE-1102</subfield><subfield code="a">DE-92</subfield><subfield code="a">DE-1047</subfield><subfield code="a">DE-573</subfield><subfield code="a">DE-862</subfield><subfield code="a">DE-Aug4</subfield><subfield code="a">DE-634</subfield><subfield code="a">DE-83</subfield><subfield code="a">DE-11</subfield><subfield code="a">DE-525</subfield><subfield code="a">DE-898</subfield><subfield code="a">DE-B768</subfield><subfield code="a">DE-1051</subfield><subfield code="a">DE-Po75</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">004</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 306</subfield><subfield code="0">(DE-625)143654:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ZN 6070</subfield><subfield code="0">(DE-625)157501:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">004</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Euler, Stephan</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)1063743265</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Grundkurs Spracherkennung</subfield><subfield code="b">vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen</subfield><subfield code="c">Stephen Euler</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">1. Aufl.</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Wiesbaden</subfield><subfield code="b">Vieweg</subfield><subfield code="c">2006</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">X, 200 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="0" ind2=" "><subfield code="a">Computational Intelligence</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Auch als Internetausgabe</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4123623-3</subfield><subfield code="a">Lehrbuch</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Automatische Spracherkennung</subfield><subfield code="0">(DE-588)4003961-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="q">text/html</subfield><subfield code="u">http://deposit.dnb.de/cgi-bin/dokserv?id=2611747&prov=M&dok_var=1&dok_ext=htm</subfield><subfield code="3">Inhaltstext</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UBPassau</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=013134048&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-013134048</subfield></datafield></record></collection> |
genre | (DE-588)4123623-3 Lehrbuch gnd-content |
genre_facet | Lehrbuch |
id | DE-604.BV019808585 |
illustrated | Illustrated |
indexdate | 2024-08-01T10:47:44Z |
institution | BVB |
isbn | 3834800031 9783834800039 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-013134048 |
oclc_num | 179881832 |
open_access_boolean | |
owner | DE-859 DE-739 DE-1050 DE-1046 DE-1102 DE-92 DE-1047 DE-573 DE-862 DE-BY-FWS DE-Aug4 DE-634 DE-83 DE-11 DE-525 DE-898 DE-BY-UBR DE-B768 DE-1051 DE-Po75 |
owner_facet | DE-859 DE-739 DE-1050 DE-1046 DE-1102 DE-92 DE-1047 DE-573 DE-862 DE-BY-FWS DE-Aug4 DE-634 DE-83 DE-11 DE-525 DE-898 DE-BY-UBR DE-B768 DE-1051 DE-Po75 |
physical | X, 200 S. graph. Darst. |
publishDate | 2006 |
publishDateSearch | 2006 |
publishDateSort | 2006 |
publisher | Vieweg |
record_format | marc |
series2 | Computational Intelligence |
spellingShingle | Euler, Stephan Grundkurs Spracherkennung vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen Automatische Spracherkennung (DE-588)4003961-4 gnd |
subject_GND | (DE-588)4003961-4 (DE-588)4123623-3 |
title | Grundkurs Spracherkennung vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen |
title_auth | Grundkurs Spracherkennung vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen |
title_exact_search | Grundkurs Spracherkennung vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen |
title_full | Grundkurs Spracherkennung vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen Stephen Euler |
title_fullStr | Grundkurs Spracherkennung vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen Stephen Euler |
title_full_unstemmed | Grundkurs Spracherkennung vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen Stephen Euler |
title_short | Grundkurs Spracherkennung |
title_sort | grundkurs spracherkennung vom sprachsignal zum dialog grundlagen und anwendung verstehen mit praktischen ubungen |
title_sub | vom Sprachsignal zum Dialog - Grundlagen und Anwendung verstehen - mit praktischen Übungen |
topic | Automatische Spracherkennung (DE-588)4003961-4 gnd |
topic_facet | Automatische Spracherkennung Lehrbuch |
url | http://deposit.dnb.de/cgi-bin/dokserv?id=2611747&prov=M&dok_var=1&dok_ext=htm http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=013134048&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT eulerstephan grundkursspracherkennungvomsprachsignalzumdialoggrundlagenundanwendungverstehenmitpraktischenubungen |
Beschreibung
THWS Schweinfurt Zentralbibliothek Lesesaal
Signatur: |
2000 ZN 6070 E88 |
---|---|
Exemplar 1 | ausleihbar Verfügbar Bestellen |