Verfügbarkeit: Reinforcement-Lernen in der Robotik

Reinforcement-Lernen in der Robotik:

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	Wengerek, Thomas (VerfasserIn)
Format:	Buch
Sprache:	German
Veröffentlicht:	Sankt Augustin Infix 1996
Schriftenreihe:	Dissertationen zur künstlichen Intelligenz 119
Schlagworte:	Operante Konditionierung Maschinelles Lernen Hochschulschrift
Online-Zugang:	Inhaltsverzeichnis
Beschreibung:	Zugl.: Bielefeld, Univ., Diss., 1995
Beschreibung:	VI, 143 S. graph. Darst.
ISBN:	3896011197

Internformat

MARC


LEADER	00000nam a2200000 cb4500
001	BV010779841
003	DE-604
005	20050530
007	t
008	960528s1996 gw d\|\|\| m\|\|\| 00\|\|\| ger d
016	7		\|a 947638458 \|2 DE-101
020			\|a 3896011197 \|c kart. : DM 48.00, sfr 44.50, S 350.00 \|9 3-89601-119-7
035			\|a (OCoLC)722436046
035			\|a (DE-599)BVBBV010779841
040			\|a DE-604 \|b ger \|e rakddb
041	0		\|a ger
044			\|a gw \|c DE
049			\|a DE-91G \|a DE-29T \|a DE-11
084			\|a ZQ 6250 \|0 (DE-625)158184: \|2 rvk
084			\|a DAT 815d \|2 stub
084			\|a DAT 708d \|2 stub
100	1		\|a Wengerek, Thomas \|e Verfasser \|4 aut
245	1	0	\|a Reinforcement-Lernen in der Robotik \|c Thomas Wengerek
264		1	\|a Sankt Augustin \|b Infix \|c 1996
300			\|a VI, 143 S. \|b graph. Darst.
336			\|b txt \|2 rdacontent
337			\|b n \|2 rdamedia
338			\|b nc \|2 rdacarrier
490	1		\|a Dissertationen zur künstlichen Intelligenz \|v 119
500			\|a Zugl.: Bielefeld, Univ., Diss., 1995
650	0	7	\|a Operante Konditionierung \|0 (DE-588)4172613-3 \|2 gnd \|9 rswk-swf
650	0	7	\|a Maschinelles Lernen \|0 (DE-588)4193754-5 \|2 gnd \|9 rswk-swf
655		7	\|0 (DE-588)4113937-9 \|a Hochschulschrift \|2 gnd-content
689	0	0	\|a Maschinelles Lernen \|0 (DE-588)4193754-5 \|D s
689	0	1	\|a Operante Konditionierung \|0 (DE-588)4172613-3 \|D s
689	0		\|5 DE-604
830		0	\|a Dissertationen zur künstlichen Intelligenz \|v 119 \|w (DE-604)BV005345280 \|9 119
856	4	2	\|m DNB Datenaustausch \|q application/pdf \|u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007200122&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA \|3 Inhaltsverzeichnis
943	1		\|a oai:aleph.bib-bvb.de:BVB01-007200122

Datensatz im Suchindex

_version_	1807683868394782720
adam_text	INHALTSVERZEICHNIS 1 EINLEITUNG 1 2 REINFORCEMENT LERNEN - GRUNDLAGEN 3 2.1 MARKOFFSCHE ENTSCHEIDUNGSPROZESSE . 6 2.2 DYNAMISCHE PROGRAMMIERUNG . 9 2.3 OPTIMALE KONTROLLE DURCH REINFORCEMENT LERNEN . 11 2.3.1 STOCHASTISCHE APPROXIMATION . 12 2.3.2 Q-LEARNING . 13 2.3.3 ECHTZEIT-LERNEN . 16 2.3.4 BEWEGUNGSLERNEN IM LABYRINTH - EINE TYPISCHE AUFGABE . 20 3 BESCHLEUNIGUNG DES LERNENS 21 3.1 EIN UEBERBLICK . 21 3.1.1 ERWEITERUNGEN DES BACKUP-OPERATORS . 22 3.1.2 DIE ANORDNUNG DER UPDATE-SCHRITTE . 23 3.1.3 STRUKTURELLE GENERALISIERUNG . 26 3.1.4 MODULARISIERUNG . 27 3.1.5 VERHALTENSBASIERTE DESIGNS . 28 3.2 TEACHING: INTEGRATION VON RL UND EXPERTENHINWEISEN . 30 3.2.1 DIE POSITIONIERUNGSAUFGABE . 31 3.2.2 EXPERIMENTE . 32 3.3 EXPERIENCE REPLAY: SCHNELLE AUSBREITUNG VON VORHERSAGEN . 35 3.3.1 TD(A) FUER REINFORCEMENT LERNEN . 36 3.3.2 EXPERIMENTE . 39 3.4 GENERALISIERUNG DURCH KOMBINATION ELEMENTARER STRATEGIEN . 40 3.4.1 DIE LABYRINTH-AUFGABE . 42 3.4.2 DEKOMPOSITION IN TEILAUFGABEN UND ERZEUGUNG VON BASISFELDEM . . 44 3.4.3 SUPERPOSITION VON BASISFELDERN UND OPTIMIERUNG . 46 3.4.4 EXPERIMENTE . 47 3.5 ERSTE SCHLUSSFOLGERUNGEN UND WEITERER VERLAUF . 49 4 DAS PROBLEM DER UNVOLLSTAENDIGEN ZUSTANDSINFORMATION 51 4.1 DIE KLASSE DER BETRACHTETEN LERNAUFGABEN . 52 4.2 DAS LERNVERHALTEN BEI FESTER STARTPOSITION . 56 4.2.1 DIE WIRKUNG DER EXPLORATION - EIN UEBERBLICK . 57 4.2.2 ANALYSE DES LERNENS BEI FESTER STARTPOSITION . 63 4.2.3 EINFLUESSE VON ADAPTIVITAET UND VON PLANUNG DURCH EXPERIENCE REPLAY 75 4.3 DISKUSSION . 81 5 LERNARCHITEKTUREN FUER ROBOTER 83 5.1 DAS VERHALTENSBASIERTE PARADIGMA IN DER ROBOTIK . 84 5.2 RL MIT EINEM REPERTOIRE VON VERHALTENSWEISEN: RICHTLINIEN . 86 6 DAS ERLERNEN VON GREIFBEWEGUNGEN - EINE SIMULATION 89 6.1 DIE ROBOTERSIMULATION . 92 6.2 DER EXPERIMENTELLE ABLAUF . 95 6.3 RESULTATE AUS DEN EXPERIMENTEN . 99 6.4 DISKUSSION DER GENERALISIERUNGSEIGENSCHAFTEN . 101 7 VERHALTENSBASIERTES LERNEN - EINE BVDLSTUDIE ZU VISUELL GEFUEHRTEN GREIF BEWEGUNGEN 103 7.1 DIE LERNARCHITEKTUR . 106 7.2 REALISIERUNG DER YYVIRTUELLEN SENSOREN " . 107 7.3 ZUR STRUKTUR DER VISUO-MOTORISCHEN VERHALTENSWEISEN . 111 7.4 DAS ERLERNEN DER KOOPERATION . 119 7.5 EXPERIMENTE . 122 7.6 DISKUSSION . 133 8 ZUSAMMENFASSUNG 135
any_adam_object	1
author	Wengerek, Thomas
author_facet	Wengerek, Thomas
author_role	aut
author_sort	Wengerek, Thomas
author_variant	t w tw
building	Verbundindex
bvnumber	BV010779841
classification_rvk	ZQ 6250
classification_tum	DAT 815d DAT 708d
ctrlnum	(OCoLC)722436046 (DE-599)BVBBV010779841
discipline	Informatik Mess-/Steuerungs-/Regelungs-/Automatisierungstechnik / Mechatronik
format	Book
fullrecord	<?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>00000nam a2200000 cb4500</leader><controlfield tag="001">BV010779841</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20050530</controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">960528s1996 gw d\|\|\| m\|\|\| 00\|\|\| ger d</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">947638458</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3896011197</subfield><subfield code="c">kart. : DM 48.00, sfr 44.50, S 350.00</subfield><subfield code="9">3-89601-119-7</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)722436046</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV010779841</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">DE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-91G</subfield><subfield code="a">DE-29T</subfield><subfield code="a">DE-11</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ZQ 6250</subfield><subfield code="0">(DE-625)158184:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 815d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 708d</subfield><subfield code="2">stub</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Wengerek, Thomas</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Reinforcement-Lernen in der Robotik</subfield><subfield code="c">Thomas Wengerek</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Sankt Augustin</subfield><subfield code="b">Infix</subfield><subfield code="c">1996</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">VI, 143 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Dissertationen zur künstlichen Intelligenz</subfield><subfield code="v">119</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Zugl.: Bielefeld, Univ., Diss., 1995</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Operante Konditionierung</subfield><subfield code="0">(DE-588)4172613-3</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Maschinelles Lernen</subfield><subfield code="0">(DE-588)4193754-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Maschinelles Lernen</subfield><subfield code="0">(DE-588)4193754-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Operante Konditionierung</subfield><subfield code="0">(DE-588)4172613-3</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="830" ind1=" " ind2="0"><subfield code="a">Dissertationen zur künstlichen Intelligenz</subfield><subfield code="v">119</subfield><subfield code="w">(DE-604)BV005345280</subfield><subfield code="9">119</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">DNB Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007200122&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="943" ind1="1" ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-007200122</subfield></datafield></record></collection>
genre	(DE-588)4113937-9 Hochschulschrift gnd-content
genre_facet	Hochschulschrift
id	DE-604.BV010779841
illustrated	Illustrated
indexdate	2024-08-18T00:41:15Z
institution	BVB
isbn	3896011197
language	German
oai_aleph_id	oai:aleph.bib-bvb.de:BVB01-007200122
oclc_num	722436046
open_access_boolean
owner	DE-91G DE-BY-TUM DE-29T DE-11
owner_facet	DE-91G DE-BY-TUM DE-29T DE-11
physical	VI, 143 S. graph. Darst.
publishDate	1996
publishDateSearch	1996
publishDateSort	1996
publisher	Infix
record_format	marc
series	Dissertationen zur künstlichen Intelligenz
series2	Dissertationen zur künstlichen Intelligenz
spelling	Wengerek, Thomas Verfasser aut Reinforcement-Lernen in der Robotik Thomas Wengerek Sankt Augustin Infix 1996 VI, 143 S. graph. Darst. txt rdacontent n rdamedia nc rdacarrier Dissertationen zur künstlichen Intelligenz 119 Zugl.: Bielefeld, Univ., Diss., 1995 Operante Konditionierung (DE-588)4172613-3 gnd rswk-swf Maschinelles Lernen (DE-588)4193754-5 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Maschinelles Lernen (DE-588)4193754-5 s Operante Konditionierung (DE-588)4172613-3 s DE-604 Dissertationen zur künstlichen Intelligenz 119 (DE-604)BV005345280 119 DNB Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007200122&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis
spellingShingle	Wengerek, Thomas Reinforcement-Lernen in der Robotik Dissertationen zur künstlichen Intelligenz Operante Konditionierung (DE-588)4172613-3 gnd Maschinelles Lernen (DE-588)4193754-5 gnd
subject_GND	(DE-588)4172613-3 (DE-588)4193754-5 (DE-588)4113937-9
title	Reinforcement-Lernen in der Robotik
title_auth	Reinforcement-Lernen in der Robotik
title_exact_search	Reinforcement-Lernen in der Robotik
title_full	Reinforcement-Lernen in der Robotik Thomas Wengerek
title_fullStr	Reinforcement-Lernen in der Robotik Thomas Wengerek
title_full_unstemmed	Reinforcement-Lernen in der Robotik Thomas Wengerek
title_short	Reinforcement-Lernen in der Robotik
title_sort	reinforcement lernen in der robotik
topic	Operante Konditionierung (DE-588)4172613-3 gnd Maschinelles Lernen (DE-588)4193754-5 gnd
topic_facet	Operante Konditionierung Maschinelles Lernen Hochschulschrift
url	http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=007200122&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA
volume_link	(DE-604)BV005345280
work_keys_str_mv	AT wengerekthomas reinforcementlerneninderrobotik

Verfügbarkeit

Es ist kein Print-Exemplar vorhanden.

Fernleihe Bestellen Achtung: Nicht im THWS-Bestand! Inhaltsverzeichnis

MARC

Datensatz im Suchindex

Es ist kein Print-Exemplar vorhanden.

Ähnliche Einträge