Reinforcement-Lernen in der Robotik:
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
Sankt Augustin
Infix
1996
|
Schriftenreihe: | Dissertationen zur künstlichen Intelligenz
119 |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | Zugl.: Bielefeld, Univ., Diss., 1995 |
Beschreibung: | VI, 143 S. graph. Darst. |
ISBN: | 3896011197 |
Internformat
MARC
LEADER | 00000nam a2200000 cb4500 | ||
---|---|---|---|
001 | BV010779841 | ||
003 | DE-604 | ||
005 | 20050530 | ||
007 | t | ||
008 | 960528s1996 gw d||| m||| 00||| ger d | ||
016 | 7 | |a 947638458 |2 DE-101 | |
020 | |a 3896011197 |c kart. : DM 48.00, sfr 44.50, S 350.00 |9 3-89601-119-7 | ||
035 | |a (OCoLC)722436046 | ||
035 | |a (DE-599)BVBBV010779841 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
044 | |a gw |c DE | ||
049 | |a DE-91G |a DE-29T |a DE-11 | ||
084 | |a ZQ 6250 |0 (DE-625)158184: |2 rvk | ||
084 | |a DAT 815d |2 stub | ||
084 | |a DAT 708d |2 stub | ||
100 | 1 | |a Wengerek, Thomas |e Verfasser |4 aut | |
245 | 1 | 0 | |a Reinforcement-Lernen in der Robotik |c Thomas Wengerek |
264 | 1 | |a Sankt Augustin |b Infix |c 1996 | |
300 | |a VI, 143 S. |b graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 1 | |a Dissertationen zur künstlichen Intelligenz |v 119 | |
500 | |a Zugl.: Bielefeld, Univ., Diss., 1995 | ||
650 | 0 | 7 | |a Operante Konditionierung |0 (DE-588)4172613-3 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Maschinelles Lernen |0 (DE-588)4193754-5 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Maschinelles Lernen |0 (DE-588)4193754-5 |D s |
689 | 0 | 1 | |a Operante Konditionierung |0 (DE-588)4172613-3 |D s |
689 | 0 | |5 DE-604 | |
830 | 0 | |a Dissertationen zur künstlichen Intelligenz |v 119 |w (DE-604)BV005345280 |9 119 | |
856 | 4 | 2 | |m DNB Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007200122&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
943 | 1 | |a oai:aleph.bib-bvb.de:BVB01-007200122 |
Datensatz im Suchindex
_version_ | 1807683868394782720 |
---|---|
adam_text |
INHALTSVERZEICHNIS
1
EINLEITUNG
1
2
REINFORCEMENT
LERNEN
-
GRUNDLAGEN
3
2.1
MARKOFFSCHE
ENTSCHEIDUNGSPROZESSE
.
6
2.2
DYNAMISCHE
PROGRAMMIERUNG
.
9
2.3
OPTIMALE
KONTROLLE
DURCH
REINFORCEMENT
LERNEN
.
11
2.3.1
STOCHASTISCHE
APPROXIMATION
.
12
2.3.2
Q-LEARNING
.
13
2.3.3
ECHTZEIT-LERNEN
.
16
2.3.4
BEWEGUNGSLERNEN
IM
LABYRINTH
-
EINE
TYPISCHE
AUFGABE
.
20
3
BESCHLEUNIGUNG
DES
LERNENS
21
3.1
EIN
UEBERBLICK
.
21
3.1.1
ERWEITERUNGEN
DES
BACKUP-OPERATORS
.
22
3.1.2
DIE
ANORDNUNG
DER
UPDATE-SCHRITTE
.
23
3.1.3
STRUKTURELLE
GENERALISIERUNG
.
26
3.1.4
MODULARISIERUNG
.
27
3.1.5
VERHALTENSBASIERTE
DESIGNS
.
28
3.2
TEACHING:
INTEGRATION
VON
RL
UND
EXPERTENHINWEISEN
.
30
3.2.1
DIE
POSITIONIERUNGSAUFGABE
.
31
3.2.2
EXPERIMENTE
.
32
3.3
EXPERIENCE
REPLAY:
SCHNELLE
AUSBREITUNG
VON
VORHERSAGEN
.
35
3.3.1
TD(A)
FUER
REINFORCEMENT
LERNEN
.
36
3.3.2
EXPERIMENTE
.
39
3.4
GENERALISIERUNG
DURCH
KOMBINATION
ELEMENTARER
STRATEGIEN
.
40
3.4.1
DIE
LABYRINTH-AUFGABE
.
42
3.4.2
DEKOMPOSITION
IN
TEILAUFGABEN
UND
ERZEUGUNG
VON
BASISFELDEM
.
.
44
3.4.3
SUPERPOSITION
VON
BASISFELDERN
UND
OPTIMIERUNG
.
46
3.4.4
EXPERIMENTE
.
47
3.5
ERSTE
SCHLUSSFOLGERUNGEN
UND
WEITERER
VERLAUF
.
49
4
DAS
PROBLEM
DER
UNVOLLSTAENDIGEN
ZUSTANDSINFORMATION
51
4.1
DIE
KLASSE
DER
BETRACHTETEN
LERNAUFGABEN
.
52
4.2
DAS
LERNVERHALTEN
BEI
FESTER
STARTPOSITION
.
56
4.2.1
DIE
WIRKUNG
DER
EXPLORATION
-
EIN
UEBERBLICK
.
57
4.2.2
ANALYSE
DES
LERNENS
BEI
FESTER
STARTPOSITION
.
63
4.2.3
EINFLUESSE
VON
ADAPTIVITAET
UND
VON
PLANUNG
DURCH
EXPERIENCE
REPLAY
75
4.3
DISKUSSION
.
81
5
LERNARCHITEKTUREN
FUER
ROBOTER
83
5.1
DAS
VERHALTENSBASIERTE
PARADIGMA
IN
DER
ROBOTIK
.
84
5.2
RL
MIT
EINEM
REPERTOIRE
VON
VERHALTENSWEISEN:
RICHTLINIEN
.
86
6
DAS
ERLERNEN
VON
GREIFBEWEGUNGEN
-
EINE
SIMULATION
89
6.1
DIE
ROBOTERSIMULATION
.
92
6.2
DER
EXPERIMENTELLE
ABLAUF
.
95
6.3
RESULTATE
AUS
DEN
EXPERIMENTEN
.
99
6.4
DISKUSSION
DER
GENERALISIERUNGSEIGENSCHAFTEN
.
101
7
VERHALTENSBASIERTES
LERNEN
-
EINE
BVDLSTUDIE
ZU
VISUELL
GEFUEHRTEN
GREIF
BEWEGUNGEN
103
7.1
DIE
LERNARCHITEKTUR
.
106
7.2
REALISIERUNG
DER
YYVIRTUELLEN
SENSOREN
"
.
107
7.3
ZUR
STRUKTUR
DER
VISUO-MOTORISCHEN
VERHALTENSWEISEN
.
111
7.4
DAS
ERLERNEN
DER
KOOPERATION
.
119
7.5
EXPERIMENTE
.
122
7.6
DISKUSSION
.
133
8
ZUSAMMENFASSUNG
135 |
any_adam_object | 1 |
author | Wengerek, Thomas |
author_facet | Wengerek, Thomas |
author_role | aut |
author_sort | Wengerek, Thomas |
author_variant | t w tw |
building | Verbundindex |
bvnumber | BV010779841 |
classification_rvk | ZQ 6250 |
classification_tum | DAT 815d DAT 708d |
ctrlnum | (OCoLC)722436046 (DE-599)BVBBV010779841 |
discipline | Informatik Mess-/Steuerungs-/Regelungs-/Automatisierungstechnik / Mechatronik |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>00000nam a2200000 cb4500</leader><controlfield tag="001">BV010779841</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20050530</controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">960528s1996 gw d||| m||| 00||| ger d</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">947638458</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3896011197</subfield><subfield code="c">kart. : DM 48.00, sfr 44.50, S 350.00</subfield><subfield code="9">3-89601-119-7</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)722436046</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV010779841</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">DE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-91G</subfield><subfield code="a">DE-29T</subfield><subfield code="a">DE-11</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ZQ 6250</subfield><subfield code="0">(DE-625)158184:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 815d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 708d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Wengerek, Thomas</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Reinforcement-Lernen in der Robotik</subfield><subfield code="c">Thomas Wengerek</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Sankt Augustin</subfield><subfield code="b">Infix</subfield><subfield code="c">1996</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">VI, 143 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Dissertationen zur künstlichen Intelligenz</subfield><subfield code="v">119</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Zugl.: Bielefeld, Univ., Diss., 1995</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Operante Konditionierung</subfield><subfield code="0">(DE-588)4172613-3</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Maschinelles Lernen</subfield><subfield code="0">(DE-588)4193754-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Maschinelles Lernen</subfield><subfield code="0">(DE-588)4193754-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Operante Konditionierung</subfield><subfield code="0">(DE-588)4172613-3</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="830" ind1=" " ind2="0"><subfield code="a">Dissertationen zur künstlichen Intelligenz</subfield><subfield code="v">119</subfield><subfield code="w">(DE-604)BV005345280</subfield><subfield code="9">119</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">DNB Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007200122&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="943" ind1="1" ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-007200122</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV010779841 |
illustrated | Illustrated |
indexdate | 2024-08-18T00:41:15Z |
institution | BVB |
isbn | 3896011197 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-007200122 |
oclc_num | 722436046 |
open_access_boolean | |
owner | DE-91G DE-BY-TUM DE-29T DE-11 |
owner_facet | DE-91G DE-BY-TUM DE-29T DE-11 |
physical | VI, 143 S. graph. Darst. |
publishDate | 1996 |
publishDateSearch | 1996 |
publishDateSort | 1996 |
publisher | Infix |
record_format | marc |
series | Dissertationen zur künstlichen Intelligenz |
series2 | Dissertationen zur künstlichen Intelligenz |
spelling | Wengerek, Thomas Verfasser aut Reinforcement-Lernen in der Robotik Thomas Wengerek Sankt Augustin Infix 1996 VI, 143 S. graph. Darst. txt rdacontent n rdamedia nc rdacarrier Dissertationen zur künstlichen Intelligenz 119 Zugl.: Bielefeld, Univ., Diss., 1995 Operante Konditionierung (DE-588)4172613-3 gnd rswk-swf Maschinelles Lernen (DE-588)4193754-5 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Maschinelles Lernen (DE-588)4193754-5 s Operante Konditionierung (DE-588)4172613-3 s DE-604 Dissertationen zur künstlichen Intelligenz 119 (DE-604)BV005345280 119 DNB Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007200122&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Wengerek, Thomas Reinforcement-Lernen in der Robotik Dissertationen zur künstlichen Intelligenz Operante Konditionierung (DE-588)4172613-3 gnd Maschinelles Lernen (DE-588)4193754-5 gnd |
subject_GND | (DE-588)4172613-3 (DE-588)4193754-5 (DE-588)4113937-9 |
title | Reinforcement-Lernen in der Robotik |
title_auth | Reinforcement-Lernen in der Robotik |
title_exact_search | Reinforcement-Lernen in der Robotik |
title_full | Reinforcement-Lernen in der Robotik Thomas Wengerek |
title_fullStr | Reinforcement-Lernen in der Robotik Thomas Wengerek |
title_full_unstemmed | Reinforcement-Lernen in der Robotik Thomas Wengerek |
title_short | Reinforcement-Lernen in der Robotik |
title_sort | reinforcement lernen in der robotik |
topic | Operante Konditionierung (DE-588)4172613-3 gnd Maschinelles Lernen (DE-588)4193754-5 gnd |
topic_facet | Operante Konditionierung Maschinelles Lernen Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007200122&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
volume_link | (DE-604)BV005345280 |
work_keys_str_mv | AT wengerekthomas reinforcementlerneninderrobotik |