Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen:
Saved in:
Main Author: | |
---|---|
Format: | Thesis Book |
Language: | German |
Published: |
1992
|
Subjects: | |
Online Access: | Inhaltsverzeichnis |
Physical Description: | 105 S. graph. Darst. |
Staff View
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV008166863 | ||
003 | DE-604 | ||
005 | 20040219 | ||
007 | t | ||
008 | 930811s1992 d||| m||| 00||| gerod | ||
016 | 7 | |a 940159945 |2 DE-101 | |
035 | |a (OCoLC)50178211 | ||
035 | |a (DE-599)BVBBV008166863 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
049 | |a DE-91 |a DE-29T |a DE-355 |a DE-634 |a DE-83 |a DE-11 | ||
084 | |a DAT 717d |2 stub | ||
084 | |a ELT 533d |2 stub | ||
100 | 1 | |a Zhu, Ming |e Verfasser |4 aut | |
245 | 1 | 0 | |a Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen |c Ming Zhu |
264 | 1 | |c 1992 | |
300 | |a 105 S. |b graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
502 | |a Berlin, Techn. Univ., Diss., 1992 | ||
650 | 0 | 7 | |a Vektorquantisierung |0 (DE-588)4297551-7 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Neuronales Netz |0 (DE-588)4226127-2 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Sprecherunabhängige Worterkennung |0 (DE-588)4271269-5 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Sprecherunabhängige Worterkennung |0 (DE-588)4271269-5 |D s |
689 | 0 | 1 | |a Vektorquantisierung |0 (DE-588)4297551-7 |D s |
689 | 0 | 2 | |a Neuronales Netz |0 (DE-588)4226127-2 |D s |
689 | 0 | |5 DE-604 | |
856 | 4 | 2 | |m DNB Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=005388832&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
943 | 1 | |a oai:aleph.bib-bvb.de:BVB01-005388832 |
Record in the Search Index
_version_ | 1807321361576624128 |
---|---|
adam_text |
INHALTSVERZEICHNIS
1.
EINLEITUNG
1
2.
STANDARDVERFAHREN
DER
SPRACH
ERKENNUNG
5
2.1
VERARBEITUNG
VON
SPRACHSIGNALEN
.
5
2.2
VQ
(VEKTORQUANTISIERUNG)
.
6
2.3
DP
(DYNAMIC
PROGRAMMING)
.
10
2.3.1
PROBLEMFORMULIERUNG
.
10
2.3.2
DTW
(DYNAMIC
TIME
WARPING)
.
11
2.4
DTW-BASIERENDE
SIR
.
16
2.4.1
ISOD
ATA-CLUSTERUNGSALGORITHMUS
.
16
2.4.2
KNN-ENTSCHEIDUNGSREGEL
.
21
2.5
HMMS
(HIDDEN
MARKOV
MODELLE)
.
21
3
DASEXPERIMENTALSYSTEM
32
3.1
STRUKTUR
DES
EXPERIMENTALSYSTEMS
.
32
3.2
VERARBEITUNGSUMGEBUNG
.
33
3.2.1
VERARBEITUNGSSYSTEM
.
34
3.2.2
ERFASSUNG
DER
SPRACHPROBEN
.
36
4.
ZUR
UNTERSUCHUNG
DER
SPRACHVORVER
ARBEITUNG
39
4.1
MERKMALSEXTRAKTION
.
40
4.1.1
AUSWAHL
DER
SPRACHMERKMALE
.
40
4.1.2
IMPLEMENTATION
DES
MFCC-ALGORITHMUS
.
41
4.1.3
TRACE-SEGMENTIERUNG
.
44
4.1.4
DYNAMISCHE
MERKMALE
.
48
4.1.5
EXPERIMENTELLE
UNTERSUCHUNGEN
ZUR
MERKMALSEX
TRAKTION
.
49
4.2
VQ-BASIERTE
SPRACHVORVERARBEITUNG
.
55
4.2.1
DER
LBG-ALGORITHMUS
.
56
4.2.2
VQ
MIT
WORTBASIERTEN
CODEBUECHEM
.
56
4.3
SPRECHERCLUSTERUNG
.
67
4.3.1
VQ-BASIERTE
SPRECHERCLUSTERUNG
.
68
4.3.2
EXPERIMENTELLE
UNTERSUCHUNGEN
.
69
4.3.3
DISKUSSION
.
71
5.
ZUR
UNTERSUCHUNG
VON
NN-BASIERTEN
ERKENNUNGSVERFAHREN
74
5.1
DAS
MLP-NETZ
.
74
5.1.1
NETZSTRUKTUR
.
74
5.1.2
BACKPROPAGATION(BP)-LEMREGEL
.
77
5.1.3
EIGENSCHAFTEN
DES
MLP-NETZES
.
80
5.2
LERNEN
MIT
VEKTORQUANTISIERTEN
TRAININGSDATEN
.
83
5.2.1
SYSTEMBESCHREIBUNG
.
83
5.2.2
EXPERIMENTELLE
UNTERSUCHUNGEN
.
84
5.3
EXPANSION
DES
EINGANGSRAUMES
.
90
5.3.1
KOMBINATION
DER
MIT
MFCC
UND
DMFCC
TRAINIER
TEN
MLP-NETZE
.
90
5.3.2
KLASSIFIZIERENDE
NETZGRUPPE
.
93
5.3.3
BESCHLEUNIGUNG
DER
EIKENNUNGSPHASE
.
98
6.
ZUSAMMENFASSUNG
100
LITERATUR
.
102 |
any_adam_object | 1 |
author | Zhu, Ming |
author_facet | Zhu, Ming |
author_role | aut |
author_sort | Zhu, Ming |
author_variant | m z mz |
building | Verbundindex |
bvnumber | BV008166863 |
classification_tum | DAT 717d ELT 533d |
ctrlnum | (OCoLC)50178211 (DE-599)BVBBV008166863 |
discipline | Informatik Elektrotechnik |
format | Thesis Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>00000nam a2200000 c 4500</leader><controlfield tag="001">BV008166863</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20040219</controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">930811s1992 d||| m||| 00||| gerod</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">940159945</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)50178211</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV008166863</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-91</subfield><subfield code="a">DE-29T</subfield><subfield code="a">DE-355</subfield><subfield code="a">DE-634</subfield><subfield code="a">DE-83</subfield><subfield code="a">DE-11</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 717d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ELT 533d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Zhu, Ming</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen</subfield><subfield code="c">Ming Zhu</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="c">1992</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">105 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="502" ind1=" " ind2=" "><subfield code="a">Berlin, Techn. Univ., Diss., 1992</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Vektorquantisierung</subfield><subfield code="0">(DE-588)4297551-7</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Neuronales Netz</subfield><subfield code="0">(DE-588)4226127-2</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Sprecherunabhängige Worterkennung</subfield><subfield code="0">(DE-588)4271269-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Sprecherunabhängige Worterkennung</subfield><subfield code="0">(DE-588)4271269-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Vektorquantisierung</subfield><subfield code="0">(DE-588)4297551-7</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Neuronales Netz</subfield><subfield code="0">(DE-588)4226127-2</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">DNB Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=005388832&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="943" ind1="1" ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-005388832</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV008166863 |
illustrated | Illustrated |
indexdate | 2024-08-14T00:39:21Z |
institution | BVB |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-005388832 |
oclc_num | 50178211 |
open_access_boolean | |
owner | DE-91 DE-BY-TUM DE-29T DE-355 DE-BY-UBR DE-634 DE-83 DE-11 |
owner_facet | DE-91 DE-BY-TUM DE-29T DE-355 DE-BY-UBR DE-634 DE-83 DE-11 |
physical | 105 S. graph. Darst. |
publishDate | 1992 |
publishDateSearch | 1992 |
publishDateSort | 1992 |
record_format | marc |
spelling | Zhu, Ming Verfasser aut Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen Ming Zhu 1992 105 S. graph. Darst. txt rdacontent n rdamedia nc rdacarrier Berlin, Techn. Univ., Diss., 1992 Vektorquantisierung (DE-588)4297551-7 gnd rswk-swf Neuronales Netz (DE-588)4226127-2 gnd rswk-swf Sprecherunabhängige Worterkennung (DE-588)4271269-5 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Sprecherunabhängige Worterkennung (DE-588)4271269-5 s Vektorquantisierung (DE-588)4297551-7 s Neuronales Netz (DE-588)4226127-2 s DE-604 DNB Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=005388832&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Zhu, Ming Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen Vektorquantisierung (DE-588)4297551-7 gnd Neuronales Netz (DE-588)4226127-2 gnd Sprecherunabhängige Worterkennung (DE-588)4271269-5 gnd |
subject_GND | (DE-588)4297551-7 (DE-588)4226127-2 (DE-588)4271269-5 (DE-588)4113937-9 |
title | Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen |
title_auth | Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen |
title_exact_search | Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen |
title_full | Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen Ming Zhu |
title_fullStr | Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen Ming Zhu |
title_full_unstemmed | Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen Ming Zhu |
title_short | Sprecherunabhängige Erkennung von isoliert gesprochenen Einzelwörtern unter Verwendung der Vektorquantisierung und von Neuronalen Netzen |
title_sort | sprecherunabhangige erkennung von isoliert gesprochenen einzelwortern unter verwendung der vektorquantisierung und von neuronalen netzen |
topic | Vektorquantisierung (DE-588)4297551-7 gnd Neuronales Netz (DE-588)4226127-2 gnd Sprecherunabhängige Worterkennung (DE-588)4271269-5 gnd |
topic_facet | Vektorquantisierung Neuronales Netz Sprecherunabhängige Worterkennung Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=005388832&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT zhuming sprecherunabhangigeerkennungvonisoliertgesprocheneneinzelworternunterverwendungdervektorquantisierungundvonneuronalennetzen |