Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters: = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Abschlussarbeit Buch |
Sprache: | German |
Veröffentlicht: |
Karlsruhe
IPEK
2011
|
Schriftenreihe: | Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT
Bd. 52 |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | 280, XXX S. Ill., graph. Darst. 21 cm |
Internformat
MARC
LEADER | 00000nam a2200000 cb4500 | ||
---|---|---|---|
001 | BV040404333 | ||
003 | DE-604 | ||
005 | 20191108 | ||
007 | t | ||
008 | 120905s2011 gw ad|| m||| 00||| ger d | ||
015 | |a 12,B18 |2 dnb | ||
016 | 7 | |a 102048148X |2 DE-101 | |
035 | |a (OCoLC)794526306 | ||
035 | |a (DE-599)DNB102048148X | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
044 | |a gw |c XA-DE | ||
049 | |a DE-83 |a DE-1046 | ||
082 | 0 | |a 629.892631 |2 22/ger | |
084 | |a ST 302 |0 (DE-625)143652: |2 rvk | ||
084 | |a ZQ 6250 |0 (DE-625)158184: |2 rvk | ||
084 | |a ZQ 9930 |0 (DE-625)158194: |2 rvk | ||
084 | |a 621.3 |2 sdnb | ||
100 | 1 | |a Frietsch, Markus |d 1979- |e Verfasser |0 (DE-588)1020583592 |4 aut | |
245 | 1 | 0 | |a Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters |b = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator |c Markus Frietsch |
246 | 1 | 1 | |a Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator |
264 | 1 | |a Karlsruhe |b IPEK |c 2011 | |
300 | |a 280, XXX S. |b Ill., graph. Darst. |c 21 cm | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 0 | |a Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT |v Bd. 52 | |
502 | |a Zugl.: Karlsruhe, Karlsruher Inst. für Technologie, Diss., 2011 | ||
650 | 0 | 7 | |a Bestärkendes Lernen |g Künstliche Intelligenz |0 (DE-588)4825546-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Steuerungssystem |0 (DE-588)4340829-1 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Nichtlineares System |0 (DE-588)4042110-7 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Nichtlineares System |0 (DE-588)4042110-7 |D s |
689 | 0 | 1 | |a Steuerungssystem |0 (DE-588)4340829-1 |D s |
689 | 0 | 2 | |a Bestärkendes Lernen |g Künstliche Intelligenz |0 (DE-588)4825546-4 |D s |
689 | 0 | |5 DE-604 | |
856 | 4 | 2 | |m DNB Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=025257480&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-025257480 |
Datensatz im Suchindex
_version_ | 1804149455304261632 |
---|---|
adam_text | IMAGE 1
INHALT
1. EINLEITUNG 3
1.1. AUFBAU UND INHALT 10
2. GRUNDLAGEN UND STAND DER FORSCHUNG 11
2.1. GRUNDLAGEN 11
2.1.1. DEFINITION LERNEN 11
2.1.2. LERNEN IN DER NATUR 13
2.1.3. LERNEN IN DER TECHNIK 18
2.1.3.1. SUPETVISED LEARNING 2 0
2.1.3.2. UNSUPERVISED LEARNING 31
, 2.1.3.3. REINFORCEMENT LEARNING 37
2.2. STAND D E R FORSCHUNG 8 1
2.2.1. OPTIMIERUNG D E S LERNPROZESSES 8 3
2.2.1.1. HIERARCHISCHES LERNEN 85
2.2.1.2. INTEGRATION VON VORWISSEN 106
2.2.1.3. UEBERTRAGEN VON WISSEN 115
2.2.1.4. SONSTIGE ANSAETZE 124
2.2.2. GENERALISIERENDE ANSAETZE 130
3. ZIELE DER ARBEIT 139
3.1. VORGEHENSWEISE 139
3.2. ZIELSETZUNG D E R ARBEIT 139
4. OPTIMIERUNG DES LERNPROZESSES 142
4.1. MODELLAUSWAHL UND ENTWICKLUNGSUMGEBUNG 142
4.1.1. MODELLAUSWAHL 142
4.1.2. BEWEGUNGSGLEICHUNGEN D E S UNGESTOERTEN MANIPULATORS 146
4.1.3. ENTWICKLUNGSUMGEBUNG 1 5 0
4.2. REWARD SHAPING 150
4.2.1. ENTWURF DER SIMULATIONSUMGEBUNG 152
4.2.1.1. INITIALISIERUNG 153
4.2.1.2. PROGRAMMABLAUF INNERHALB EINER EPISODE 155
4.2.1.3. DISKRETISIERUNG DER ZUSTANDSVARIABLEN 156
4.2.1.4. AKTIONSAUSWAHL 156
4.2.1.5. AKTIONSAUSFUEHRUNG 157
4.2.1.6. ERMITTLUNG DER BELOHNUNG 157
4.2.1.7. UPDATE 158
4.2.2. REWARD SHAPING ANSATZ 158
4.2.2.1. ACTION STATE TUNCTION Q(S,A) 159
HTTP://D-NB.INFO/102048148X
IMAGE 2
4.2.2.2. AKTIONEN 160
4.2.2.3. GESTALTUNG DER BELOHNUNGSFUNKTION 160
4.2.3. EXPERIMENTE MIT VERSCHIEDENEN BELOHNUNGSFUNKTIONEN 167
4.2.3.1. KOMBINATION VON ABSTAND UND GESCHWINDIGKEIT 169
4.2.3.2. KOMBINATION VON ABSTAND UND BEWEGUNGSRICHTUNG 171
4.2.3.3. KOMBINATION VON GESCHWINDIGKEIT UND BEWEGUNGSRICHTUNG 172
4.2.3.4. KOMBINATION VON ABSTAND, GESCHWINDIGKEIT UND BEWEGUNGSRICHTUNG
173
4.2.3.5. VALIDIERUNG DER BELOHNUNGSFUNKTION 176
4.2.4. ANWENDUNG AUF TD-VERFAHREN 177
4.2.4.1. Q-LEARNING-AGENT 179
4.2.4.2. SARSA AGENT 180
4.2.5. ZUSAMMENFASSUNG UND DISKUSSION 181
4.3. INTEGRATION VON UNSCHARFEM VORWISSEN 183
4.3.1. EINFUEHRUNG FUZZY-LOGIK 184
4.3.2. FUZZY-ANSATZ 186
4.3.3. EXPERIMENTE 190
4.3.4. ZUSAMMENFASSUNG UND DISKUSSION ~ . ! 194
4.4. T WO-LAYER ANSATZ 194
4.4.1. ANSATZ 196
4.4.2. BEWEGUNGSPRIMITIVE 198
4.4.2.1. IMPLEMENTIERUNG 199
4.4.2.2. WISSENSERWERT) 200
4.4.3. KOMBINATION VON BASISBEWEGUNGEN 2 0 2
4.4.4. EXPERIMENTE 2 0 6
4.4.5. ZUSAMMENFASSUNG UND DISKUSSION 2 0 9
4.5. MULTIPLE Q-UPDATE 2 1 0
4.5.1. ANSATZ 2 1 1
4.5.2. EXPERIMENTE 2 1 4
4.5.3. ZUSAMMENFASSUNG UND DISKUSSION 2 1 7
4.6. ZUSAMMENFASSUNG OPTIMIERUNG D E S LERNPROZESSES 2 1 9
5. GENERALISIERUNGSFAEHIGKEIT 221
5.1. ANSATZ 2 2 1
5.1.1. DISKRETISIERUNG D E S ZUSTANDSRAUMS 2 2 3
5.1.2. AUFBAU D E R Q-TABLES 2 2 4
5.1.3. BELOHNUNGSFUNKTION 2 2 4
5.1.4. VERSUCHSPLANUNG 2 2 5
5.2. EXPERIMENTE 2 2 6
5.2.1. VORUNTERSUCHUNGEN 2 2 6
IMAGE 3
5.2.1.1. STABILER FALL 227
5.2.1.2. INSTABILER FALL 228
5.2.1.3. FAZIT DER VORUNTERSUCHUNGEN 229
5.2.2. EXPERIMENTE 2 2 9
5.2.2.1. ERMITTLUNG GEEIGNETER LERNBEWEGUNGEN 232
5.2.2.2. VALIDIERUNG DES RELATIV-ANSATZES 234
5.2.2.3. FAZIT 236
5.3. VERGLEICH D E R LEISTUNGSFAEHIGKEIT 2 3 7
5.3.1. AUFBAU DER DATENBANK 2 3 8
5.3.2. VERGLEICH 2 4 0
5.4. STOERVERHALTEN D E S RELATIV-ANSATZES 2 4 4
5.4.1. ABLEITUNG D E R BEWEGUNGSGLEICHUNGEN 2 4 4
5.4.1.1. INTEGRATION EINER STOERKRAFT.... 244
5.4.1.2. INTEGRATION DES SCHWEREFELDS 246
5.4.2. STOERKRAFT ALS STOSS 2 4 8
5.4.3. STOERKRAFT ALS SPRUNG 2 4 9
5.4.4. EINFLUSS EINES SCHWEREFELDS 2 5 0
5.5. ZUSAMMENFASSUNG UND DISKUSSION 2 5 1
5.6. FINALES FRAMEWORK 2 5 3
6. ZUSAMMENFASSUNG UND AUSBLICK 255
6.1. ZUSAMMENFASSUNG 2 5 5
6.2. AUSBLICK 2 5 7
7. LITERATURVERZEICHNIS 262
8. ANHANG I
ANHANG A SIMULATIONSPARAMETER I
ANHANG B BERECHNUNG DER GEWICHTUNGSPARAMETER II
ANHANG C PARAMETERUNTERSUCHUNG FUER ALPHA UND GAMMA IV
ANHANG D SYSTEMPARAMETER UND GRENZWERTE DER WERTEFUNKTION VI
ANHANG E VERGLEICH VON SARSA UND Q-LEARNING VII
ANHANG F DETAILS ZUM RL-FUZZY-HYBRID-ANSATZ IX
ANHANG G ERMITTLUNG DER BELOHNUNGSWERTE FUZZY-RL-HYBRID-ANSATZ XII
ANHANG H BESTIMMUNG DER LERNPARAMETER FUER FUZZY-RL-HYBRID-ANSATZ XIV
ANHANG I QUADRATISCHE ZUSTANDSRAUMVERTEILUNG XX
ANHANG J BETRACHTUNG DER AKTIONSWERTEFUNKTIONEN XXI
ANHANG K EXPERIMENTE ZUR GENERIERUNG GEEIGNETER BASISSTRATEGIEN XXIII
ANHANG L ERWEITERUNG DES ZUSTANDSRAUMS XXIX
|
any_adam_object | 1 |
author | Frietsch, Markus 1979- |
author_GND | (DE-588)1020583592 |
author_facet | Frietsch, Markus 1979- |
author_role | aut |
author_sort | Frietsch, Markus 1979- |
author_variant | m f mf |
building | Verbundindex |
bvnumber | BV040404333 |
classification_rvk | ST 302 ZQ 6250 ZQ 9930 |
ctrlnum | (OCoLC)794526306 (DE-599)DNB102048148X |
dewey-full | 629.892631 |
dewey-hundreds | 600 - Technology (Applied sciences) |
dewey-ones | 629 - Other branches of engineering |
dewey-raw | 629.892631 |
dewey-search | 629.892631 |
dewey-sort | 3629.892631 |
dewey-tens | 620 - Engineering and allied operations |
discipline | Informatik Elektrotechnik / Elektronik / Nachrichtentechnik Mess-/Steuerungs-/Regelungs-/Automatisierungstechnik / Mechatronik |
format | Thesis Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>02293nam a2200481 cb4500</leader><controlfield tag="001">BV040404333</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20191108 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">120905s2011 gw ad|| m||| 00||| ger d</controlfield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">12,B18</subfield><subfield code="2">dnb</subfield></datafield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">102048148X</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)794526306</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)DNB102048148X</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-83</subfield><subfield code="a">DE-1046</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">629.892631</subfield><subfield code="2">22/ger</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 302</subfield><subfield code="0">(DE-625)143652:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ZQ 6250</subfield><subfield code="0">(DE-625)158184:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ZQ 9930</subfield><subfield code="0">(DE-625)158194:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">621.3</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Frietsch, Markus</subfield><subfield code="d">1979-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)1020583592</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters</subfield><subfield code="b">= Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator</subfield><subfield code="c">Markus Frietsch</subfield></datafield><datafield tag="246" ind1="1" ind2="1"><subfield code="a">Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Karlsruhe</subfield><subfield code="b">IPEK</subfield><subfield code="c">2011</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">280, XXX S.</subfield><subfield code="b">Ill., graph. Darst.</subfield><subfield code="c">21 cm</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="0" ind2=" "><subfield code="a">Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT</subfield><subfield code="v">Bd. 52</subfield></datafield><datafield tag="502" ind1=" " ind2=" "><subfield code="a">Zugl.: Karlsruhe, Karlsruher Inst. für Technologie, Diss., 2011</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Bestärkendes Lernen</subfield><subfield code="g">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4825546-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Steuerungssystem</subfield><subfield code="0">(DE-588)4340829-1</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Nichtlineares System</subfield><subfield code="0">(DE-588)4042110-7</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Nichtlineares System</subfield><subfield code="0">(DE-588)4042110-7</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Steuerungssystem</subfield><subfield code="0">(DE-588)4340829-1</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Bestärkendes Lernen</subfield><subfield code="g">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4825546-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">DNB Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=025257480&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-025257480</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV040404333 |
illustrated | Illustrated |
indexdate | 2024-07-10T00:23:18Z |
institution | BVB |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-025257480 |
oclc_num | 794526306 |
open_access_boolean | |
owner | DE-83 DE-1046 |
owner_facet | DE-83 DE-1046 |
physical | 280, XXX S. Ill., graph. Darst. 21 cm |
publishDate | 2011 |
publishDateSearch | 2011 |
publishDateSort | 2011 |
publisher | IPEK |
record_format | marc |
series2 | Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT |
spelling | Frietsch, Markus 1979- Verfasser (DE-588)1020583592 aut Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Markus Frietsch Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Karlsruhe IPEK 2011 280, XXX S. Ill., graph. Darst. 21 cm txt rdacontent n rdamedia nc rdacarrier Forschungsberichte / IPEK, Institut für Produktentwicklung am KIT Bd. 52 Zugl.: Karlsruhe, Karlsruher Inst. für Technologie, Diss., 2011 Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd rswk-swf Steuerungssystem (DE-588)4340829-1 gnd rswk-swf Nichtlineares System (DE-588)4042110-7 gnd rswk-swf (DE-588)4113937-9 Hochschulschrift gnd-content Nichtlineares System (DE-588)4042110-7 s Steuerungssystem (DE-588)4340829-1 s Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 s DE-604 DNB Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=025257480&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Frietsch, Markus 1979- Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd Steuerungssystem (DE-588)4340829-1 gnd Nichtlineares System (DE-588)4042110-7 gnd |
subject_GND | (DE-588)4825546-4 (DE-588)4340829-1 (DE-588)4042110-7 (DE-588)4113937-9 |
title | Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator |
title_alt | Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator |
title_auth | Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator |
title_exact_search | Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator |
title_full | Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Markus Frietsch |
title_fullStr | Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Markus Frietsch |
title_full_unstemmed | Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator Markus Frietsch |
title_short | Ein Beitrag zum effizienten Einsatz von Reinforcement Learning zur Steuerung nichtlinearer Systeme am Beispiel eines Zweiachsroboters |
title_sort | ein beitrag zum effizienten einsatz von reinforcement learning zur steuerung nichtlinearer systeme am beispiel eines zweiachsroboters efficient reinforcement learning for the control of complex non linear systems using the example of a 2 dof manipulator |
title_sub | = Efficient reinforcement learning for the control of complex non-linear systems using the example of a 2-DOF manipulator |
topic | Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd Steuerungssystem (DE-588)4340829-1 gnd Nichtlineares System (DE-588)4042110-7 gnd |
topic_facet | Bestärkendes Lernen Künstliche Intelligenz Steuerungssystem Nichtlineares System Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=025257480&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT frietschmarkus einbeitragzumeffizienteneinsatzvonreinforcementlearningzursteuerungnichtlinearersystemeambeispieleineszweiachsrobotersefficientreinforcementlearningforthecontrolofcomplexnonlinearsystemsusingtheexampleofa2dofmanipulator AT frietschmarkus efficientreinforcementlearningforthecontrolofcomplexnonlinearsystemsusingtheexampleofa2dofmanipulator |