Verfügbarkeit: Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters

Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters: = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	Frietsch, Markus 1979- (VerfasserIn)
Format:	Abschlussarbeit Buch
Sprache:	German
Veröffentlicht:	Karlsruhe IPEK 2011
Schriftenreihe:	Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT Bd. 52
Schlagworte:	Bestärkendes Lernen > Künstliche Intelligenz Steuerungssystem Nichtlineares System Hochschulschrift
Online-Zugang:	Inhaltsverzeichnis
Beschreibung:	280, XXX S. Ill., graph. Darst. 21 cm

Internformat

MARC


LEADER	00000nam a2200000 cb4500
001	BV040404333
003	DE-604
005	20191108
007	t
008	120905s2011 gw ad\|\| m\|\|\| 00\|\|\| ger d
015			\|a 12,B18 \|2 dnb
016	7		\|a 102048148X \|2 DE-101
035			\|a (OCoLC)794526306
035			\|a (DE-599)DNB102048148X
040			\|a DE-604 \|b ger \|e rakddb
041	0		\|a ger
044			\|a gw \|c XA-DE
049			\|a DE-83 \|a DE-1046
082	0		\|a 629.892631 \|2 22/ger
084			\|a ST 302 \|0 (DE-625)143652: \|2 rvk
084			\|a ZQ 6250 \|0 (DE-625)158184: \|2 rvk
084			\|a ZQ 9930 \|0 (DE-625)158194: \|2 rvk
084			\|a 621.3 \|2 sdnb
100	1		\|a Frietsch, Markus \|d 1979- \|e Verfasser \|0 (DE-588)1020583592 \|4 aut
245	1	0	\|a Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters \|b = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator \|c Markus Frietsch
246	1	1	\|a Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator
264		1	\|a Karlsruhe \|b IPEK \|c 2011
300			\|a 280, XXX S. \|b Ill., graph. Darst. \|c 21 cm
336			\|b txt \|2 rdacontent
337			\|b n \|2 rdamedia
338			\|b nc \|2 rdacarrier
490	0		\|a Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT \|v Bd. 52
502			\|a Zugl.: Karlsruhe, Karlsruher Inst. für Technologie, Diss., 2011
650	0	7	\|a Bestärkendes Lernen \|g Künstliche Intelligenz \|0 (DE-588)4825546-4 \|2 gnd \|9 rswk-swf
650	0	7	\|a Steuerungssystem \|0 (DE-588)4340829-1 \|2 gnd \|9 rswk-swf
650	0	7	\|a Nichtlineares System \|0 (DE-588)4042110-7 \|2 gnd \|9 rswk-swf
655		7	\|0 (DE-588)4113937-9 \|a Hochschulschrift \|2 gnd-content
689	0	0	\|a Nichtlineares System \|0 (DE-588)4042110-7 \|D s
689	0	1	\|a Steuerungssystem \|0 (DE-588)4340829-1 \|D s
689	0	2	\|a Bestärkendes Lernen \|g Künstliche Intelligenz \|0 (DE-588)4825546-4 \|D s
689	0		\|5 DE-604
856	4	2	\|m DNB Datenaustausch \|q application/pdf \|u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=025257480&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA \|3 Inhaltsverzeichnis
999			\|a oai:aleph.bib-bvb.de:BVB01-025257480

Datensatz im Suchindex

_version_	1804149455304261632
adam_text	IMAGE 1 INHALT 1. EINLEITUNG 3 1.1. AUFBAU UND INHALT 10 2. GRUNDLAGEN UND STAND DER FORSCHUNG 11 2.1. GRUNDLAGEN 11 2.1.1. DEFINITION LERNEN 11 2.1.2. LERNEN IN DER NATUR 13 2.1.3. LERNEN IN DER TECHNIK 18 2.1.3.1. SUPETVISED LEARNING 2 0 2.1.3.2. UNSUPERVISED LEARNING 31 , 2.1.3.3. REINFORCEMENT LEARNING 37 2.2. STAND D E R FORSCHUNG 8 1 2.2.1. OPTIMIERUNG D E S LERNPROZESSES 8 3 2.2.1.1. HIERARCHISCHES LERNEN 85 2.2.1.2. INTEGRATION VON VORWISSEN 106 2.2.1.3. UEBERTRAGEN VON WISSEN 115 2.2.1.4. SONSTIGE ANSAETZE 124 2.2.2. GENERALISIERENDE ANSAETZE 130 3. ZIELE DER ARBEIT 139 3.1. VORGEHENSWEISE 139 3.2. ZIELSETZUNG D E R ARBEIT 139 4. OPTIMIERUNG DES LERNPROZESSES 142 4.1. MODELLAUSWAHL UND ENTWICKLUNGSUMGEBUNG 142 4.1.1. MODELLAUSWAHL 142 4.1.2. BEWEGUNGSGLEICHUNGEN D E S UNGESTOERTEN MANIPULATORS 146 4.1.3. ENTWICKLUNGSUMGEBUNG 1 5 0 4.2. REWARD SHAPING 150 4.2.1. ENTWURF DER SIMULATIONSUMGEBUNG 152 4.2.1.1. INITIALISIERUNG 153 4.2.1.2. PROGRAMMABLAUF INNERHALB EINER EPISODE 155 4.2.1.3. DISKRETISIERUNG DER ZUSTANDSVARIABLEN 156 4.2.1.4. AKTIONSAUSWAHL 156 4.2.1.5. AKTIONSAUSFUEHRUNG 157 4.2.1.6. ERMITTLUNG DER BELOHNUNG 157 4.2.1.7. UPDATE 158 4.2.2. REWARD SHAPING ANSATZ 158 4.2.2.1. ACTION STATE TUNCTION Q(S,A) 159 HTTP://D-NB.INFO/102048148X IMAGE 2 4.2.2.2. AKTIONEN 160 4.2.2.3. GESTALTUNG DER BELOHNUNGSFUNKTION 160 4.2.3. EXPERIMENTE MIT VERSCHIEDENEN BELOHNUNGSFUNKTIONEN 167 4.2.3.1. KOMBINATION VON ABSTAND UND GESCHWINDIGKEIT 169 4.2.3.2. KOMBINATION VON ABSTAND UND BEWEGUNGSRICHTUNG 171 4.2.3.3. KOMBINATION VON GESCHWINDIGKEIT UND BEWEGUNGSRICHTUNG 172 4.2.3.4. KOMBINATION VON ABSTAND, GESCHWINDIGKEIT UND BEWEGUNGSRICHTUNG 173 4.2.3.5. VALIDIERUNG DER BELOHNUNGSFUNKTION 176 4.2.4. ANWENDUNG AUF TD-VERFAHREN 177 4.2.4.1. Q-LEARNING-AGENT 179 4.2.4.2. SARSA AGENT 180 4.2.5. ZUSAMMENFASSUNG UND DISKUSSION 181 4.3. INTEGRATION VON UNSCHARFEM VORWISSEN 183 4.3.1. EINFUEHRUNG FUZZY-LOGIK 184 4.3.2. FUZZY-ANSATZ 186 4.3.3. EXPERIMENTE 190 4.3.4. ZUSAMMENFASSUNG UND DISKUSSION ~ . ! 194 4.4. T WO-LAYER ANSATZ 194 4.4.1. ANSATZ 196 4.4.2. BEWEGUNGSPRIMITIVE 198 4.4.2.1. IMPLEMENTIERUNG 199 4.4.2.2. WISSENSERWERT) 200 4.4.3. KOMBINATION VON BASISBEWEGUNGEN 2 0 2 4.4.4. EXPERIMENTE 2 0 6 4.4.5. ZUSAMMENFASSUNG UND DISKUSSION 2 0 9 4.5. MULTIPLE Q-UPDATE 2 1 0 4.5.1. ANSATZ 2 1 1 4.5.2. EXPERIMENTE 2 1 4 4.5.3. ZUSAMMENFASSUNG UND DISKUSSION 2 1 7 4.6. ZUSAMMENFASSUNG OPTIMIERUNG D E S LERNPROZESSES 2 1 9 5. GENERALISIERUNGSFAEHIGKEIT 221 5.1. ANSATZ 2 2 1 5.1.1. DISKRETISIERUNG D E S ZUSTANDSRAUMS 2 2 3 5.1.2. AUFBAU D E R Q-TABLES 2 2 4 5.1.3. BELOHNUNGSFUNKTION 2 2 4 5.1.4. VERSUCHSPLANUNG 2 2 5 5.2. EXPERIMENTE 2 2 6 5.2.1. VORUNTERSUCHUNGEN 2 2 6 IMAGE 3 5.2.1.1. STABILER FALL 227 5.2.1.2. INSTABILER FALL 228 5.2.1.3. FAZIT DER VORUNTERSUCHUNGEN 229 5.2.2. EXPERIMENTE 2 2 9 5.2.2.1. ERMITTLUNG GEEIGNETER LERNBEWEGUNGEN 232 5.2.2.2. VALIDIERUNG DES RELATIV-ANSATZES 234 5.2.2.3. FAZIT 236 5.3. VERGLEICH D E R LEISTUNGSFAEHIGKEIT 2 3 7 5.3.1. AUFBAU DER DATENBANK 2 3 8 5.3.2. VERGLEICH 2 4 0 5.4. STOERVERHALTEN D E S RELATIV-ANSATZES 2 4 4 5.4.1. ABLEITUNG D E R BEWEGUNGSGLEICHUNGEN 2 4 4 5.4.1.1. INTEGRATION EINER STOERKRAFT.... 244 5.4.1.2. INTEGRATION DES SCHWEREFELDS 246 5.4.2. STOERKRAFT ALS STOSS 2 4 8 5.4.3. STOERKRAFT ALS SPRUNG 2 4 9 5.4.4. EINFLUSS EINES SCHWEREFELDS 2 5 0 5.5. ZUSAMMENFASSUNG UND DISKUSSION 2 5 1 5.6. FINALES FRAMEWORK 2 5 3 6. ZUSAMMENFASSUNG UND AUSBLICK 255 6.1. ZUSAMMENFASSUNG 2 5 5 6.2. AUSBLICK 2 5 7 7. LITERATURVERZEICHNIS 262 8. ANHANG I ANHANG A SIMULATIONSPARAMETER I ANHANG B BERECHNUNG DER GEWICHTUNGSPARAMETER II ANHANG C PARAMETERUNTERSUCHUNG FUER ALPHA UND GAMMA IV ANHANG D SYSTEMPARAMETER UND GRENZWERTE DER WERTEFUNKTION VI ANHANG E VERGLEICH VON SARSA UND Q-LEARNING VII ANHANG F DETAILS ZUM RL-FUZZY-HYBRID-ANSATZ IX ANHANG G ERMITTLUNG DER BELOHNUNGSWERTE FUZZY-RL-HYBRID-ANSATZ XII ANHANG H BESTIMMUNG DER LERNPARAMETER FUER FUZZY-RL-HYBRID-ANSATZ XIV ANHANG I QUADRATISCHE ZUSTANDSRAUMVERTEILUNG XX ANHANG J BETRACHTUNG DER AKTIONSWERTEFUNKTIONEN XXI ANHANG K EXPERIMENTE ZUR GENERIERUNG GEEIGNETER BASISSTRATEGIEN XXIII ANHANG L ERWEITERUNG DES ZUSTANDSRAUMS XXIX
any_adam_object	1
author	Frietsch, Markus 1979-
author_GND	(DE-588)1020583592
author_facet	Frietsch, Markus 1979-
author_role	aut
author_sort	Frietsch, Markus 1979-
author_variant	m f mf
building	Verbundindex
bvnumber	BV040404333
classification_rvk	ST 302 ZQ 6250 ZQ 9930
ctrlnum	(OCoLC)794526306 (DE-599)DNB102048148X
dewey-full	629.892631
dewey-hundreds	600 - Technology (Applied sciences)
dewey-ones	629 - Other branches of engineering
dewey-raw	629.892631
dewey-search	629.892631
dewey-sort	3629.892631
dewey-tens	620 - Engineering and allied operations
discipline	Informatik Elektrotechnik / Elektronik / Nachrichtentechnik Mess-/Steuerungs-/Regelungs-/Automatisierungstechnik / Mechatronik
format	Thesis Book
fullrecord	<?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>02293nam a2200481 cb4500</leader><controlfield tag="001">BV040404333</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20191108 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">120905s2011 gw ad\|\| m\|\|\| 00\|\|\| ger d</controlfield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">12,B18</subfield><subfield code="2">dnb</subfield></datafield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">102048148X</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)794526306</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)DNB102048148X</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-83</subfield><subfield code="a">DE-1046</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">629.892631</subfield><subfield code="2">22/ger</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 302</subfield><subfield code="0">(DE-625)143652:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ZQ 6250</subfield><subfield code="0">(DE-625)158184:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ZQ 9930</subfield><subfield code="0">(DE-625)158194:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">621.3</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Frietsch, Markus</subfield><subfield code="d">1979-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)1020583592</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters</subfield><subfield code="b">= Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator</subfield><subfield code="c">Markus Frietsch</subfield></datafield><datafield tag="246" ind1="1" ind2="1"><subfield code="a">Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Karlsruhe</subfield><subfield code="b">IPEK</subfield><subfield code="c">2011</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">280, XXX S.</subfield><subfield code="b">Ill., graph. Darst.</subfield><subfield code="c">21 cm</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="0" ind2=" "><subfield code="a">Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT</subfield><subfield code="v">Bd. 52</subfield></datafield><datafield tag="502" ind1=" " ind2=" "><subfield code="a">Zugl.: Karlsruhe, Karlsruher Inst. für Technologie, Diss., 2011</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Bestärkendes Lernen</subfield><subfield code="g">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4825546-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Steuerungssystem</subfield><subfield code="0">(DE-588)4340829-1</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Nichtlineares System</subfield><subfield code="0">(DE-588)4042110-7</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Nichtlineares System</subfield><subfield code="0">(DE-588)4042110-7</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Steuerungssystem</subfield><subfield code="0">(DE-588)4340829-1</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Bestärkendes Lernen</subfield><subfield code="g">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4825546-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">DNB Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=025257480&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-025257480</subfield></datafield></record></collection>
genre	(DE-588)4113937-9 Hochschulschrift gnd-content
genre_facet	Hochschulschrift
id	DE-604.BV040404333
illustrated	Illustrated
indexdate	2024-07-10T00:23:18Z
institution	BVB
language	German
oai_aleph_id	oai:aleph.bib-bvb.de:BVB01-025257480
oclc_num	794526306
open_access_boolean
owner	DE-83 DE-1046
owner_facet	DE-83 DE-1046
physical	280, XXX S. Ill., graph. Darst. 21 cm
publishDate	2011
publishDateSearch	2011
publishDateSort	2011
publisher	IPEK
record_format	marc
series2	Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT
spelling	Frietsch, Markus 1979- Verfasser (DE-588)1020583592 aut Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Markus Frietsch Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Karlsruhe IPEK 2011 280, XXX S. Ill., graph. Darst. 21 cm txt rdacontent n rdamedia nc rdacarrier Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT Bd. 52 Zugl.: Karlsruhe, Karlsruher Inst. für Technologie, Diss., 2011 Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd rswk-swf Steuerungssystem (DE-588)4340829-1 gnd rswk-swf Nichtlineares System (DE-588)4042110-7 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Nichtlineares System (DE-588)4042110-7 s Steuerungssystem (DE-588)4340829-1 s Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 s DE-604 DNB Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=025257480&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis
spellingShingle	Frietsch, Markus 1979- Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd Steuerungssystem (DE-588)4340829-1 gnd Nichtlineares System (DE-588)4042110-7 gnd
subject_GND	(DE-588)4825546-4 (DE-588)4340829-1 (DE-588)4042110-7 (DE-588)4113937-9
title	Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator
title_alt	Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator
title_auth	Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator
title_exact_search	Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator
title_full	Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Markus Frietsch
title_fullStr	Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Markus Frietsch
title_full_unstemmed	Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Markus Frietsch
title_short	Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters
title_sort	ein beitrag zum effizienten einsatz von reinforcement learning zur steuerung nichtlinearer systeme am beispiel eines zweiachsroboters efficient reinforcement learning for the control of complex non linear systems using the example of a 2 dof manipulator
title_sub	= Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator
topic	Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd Steuerungssystem (DE-588)4340829-1 gnd Nichtlineares System (DE-588)4042110-7 gnd
topic_facet	Bestärkendes Lernen Künstliche Intelligenz Steuerungssystem Nichtlineares System Hochschulschrift
url	http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=025257480&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA
work_keys_str_mv	AT frietschmarkus einbeitragzumeffizienteneinsatzvonreinforcementlearningzursteuerungnichtlinearersystemeambeispieleineszweiachsrobotersefficientreinforcementlearningforthecontrolofcomplexnonlinearsystemsusingtheexampleofa2dofmanipulator AT frietschmarkus efficientreinforcementlearningforthecontrolofcomplexnonlinearsystemsusingtheexampleofa2dofmanipulator

Verfügbarkeit

Es ist kein Print-Exemplar vorhanden.

Fernleihe Bestellen Achtung: Nicht im THWS-Bestand! Inhaltsverzeichnis

MARC

Datensatz im Suchindex

Es ist kein Print-Exemplar vorhanden.

Ähnliche Einträge