Reinforcement learning: aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
Berlin
Springer Berlin
2024
Neckargemünd Springer Vieweg [2024] |
Ausgabe: | 2. Auflage |
Schlagworte: | |
Online-Zugang: | Inhaltstext Auszug Inhaltsverzeichnis |
Beschreibung: | XVI, 204 Seiten 24 cm x 16.8 cm |
ISBN: | 9783662683101 3662683105 |
Internformat
MARC
LEADER | 00000nam a22000008c 4500 | ||
---|---|---|---|
001 | BV049699235 | ||
003 | DE-604 | ||
005 | 20240613 | ||
007 | t| | ||
008 | 240528s2024 gw |||| |||| 00||| ger d | ||
015 | |a 23,N39 |2 dnb | ||
016 | 7 | |a 1303544717 |2 DE-101 | |
020 | |a 9783662683101 |c : circa EUR 32.99 (DE), circa EUR 33.92 (AT), circa CHF 36.50 (freier Preis), circa EUR 30.83 |9 978-3-662-68310-1 | ||
020 | |a 3662683105 |9 3-662-68310-5 | ||
024 | 3 | |a 9783662683101 | |
028 | 5 | 2 | |a Bestellnummer: 978-3-662-68310-1 |
028 | 5 | 2 | |a Bestellnummer: 89235149 |
035 | |a (OCoLC)1399581563 | ||
035 | |a (DE-599)DNB1303544717 | ||
040 | |a DE-604 |b ger |e rda | ||
041 | 0 | |a ger | |
044 | |a gw |c XA-DE-BE | ||
049 | |a DE-739 | ||
084 | |a ST 302 |0 (DE-625)143652: |2 rvk | ||
084 | |8 1\p |a 004 |2 23sdnb | ||
100 | 1 | |a Lorenz, Uwe |e Verfasser |4 aut | |
245 | 1 | 0 | |a Reinforcement learning |b aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot |c Uwe Lorenz |
250 | |a 2. Auflage | ||
264 | 1 | |a Berlin |b Springer Berlin |c 2024 | |
264 | 1 | |a Neckargemünd |b Springer Vieweg |c [2024] | |
264 | 4 | |c © 2024 | |
300 | |b XVI, 204 Seiten |c 24 cm x 16.8 cm | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
650 | 0 | 7 | |a Java |g Programmiersprache |0 (DE-588)4401313-9 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Bestärkendes Lernen |g Künstliche Intelligenz |0 (DE-588)4825546-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Greenfoot |g Programmierumgebung |0 (DE-588)7713261-0 |2 gnd |9 rswk-swf |
651 | 7 | |a Java |0 (DE-588)4028527-3 |2 gnd |9 rswk-swf | |
653 | |a Maschinelles Lernen | ||
653 | |a Künstliche Intelligenz | ||
653 | |a Reinforcement Learning | ||
653 | |a Bestärkendes Lernen | ||
653 | |a Verstärkendes Lernen | ||
653 | |a SARSA | ||
653 | |a Q-Learning | ||
653 | |a Policy Gadient | ||
653 | |a Actor-Critic | ||
653 | |a Java-Hamster | ||
653 | |a Greenfoot | ||
653 | |a Deep Reinforcement Learning | ||
689 | 0 | 0 | |a Bestärkendes Lernen |g Künstliche Intelligenz |0 (DE-588)4825546-4 |D s |
689 | 0 | 1 | |a Java |0 (DE-588)4028527-3 |D g |
689 | 0 | 2 | |a Greenfoot |g Programmierumgebung |0 (DE-588)7713261-0 |D s |
689 | 0 | |5 DE-604 | |
689 | 1 | 0 | |a Bestärkendes Lernen |g Künstliche Intelligenz |0 (DE-588)4825546-4 |D s |
689 | 1 | 1 | |a Java |g Programmiersprache |0 (DE-588)4401313-9 |D s |
689 | 1 | 2 | |a Greenfoot |g Programmierumgebung |0 (DE-588)7713261-0 |D s |
689 | 1 | |5 DE-604 | |
710 | 2 | |a Springer-Verlag GmbH |0 (DE-588)1065168780 |4 pbl | |
776 | 0 | 8 | |i Erscheint auch als |n Online-Ausgabe |z 9783662683118 |
780 | 0 | 0 | |i Vorangegangen ist |z 9783662616505 |
856 | 4 | 2 | |m X:MVB |q text/html |u http://deposit.dnb.de/cgi-bin/dokserv?id=f7355fa234364733a3e4c4108630856a&prov=M&dok_var=1&dok_ext=htm |3 Inhaltstext |
856 | 4 | 2 | |m X:MVB |u https://link.springer.com/978-3-662-68310-1 |3 Auszug |
856 | 4 | 2 | |m Digitalisierung UB Passau - ADAM Catalogue Enrichment |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=035041676&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
883 | 1 | |8 1\p |a vlb |d 20230922 |q DE-101 |u https://d-nb.info/provenance/plan#vlb | |
943 | 1 | |a oai:aleph.bib-bvb.de:BVB01-035041676 |
Datensatz im Suchindex
_version_ | 1817968340657766400 |
---|---|
adam_text |
Inhaltsverzeichnis 1 Verstärkendes Lernen als Teilgebiet des Maschinellen Lernens. 1 Maschinelles Lernen als automatische Verarbeitung von Feedback aus der Umwelt. 2 1.2 Verfahren des maschinellen Lernens. 1.3 Reinforcement Learning mit Java. Literatur. 3 8 12 1.1 2 Grundbegriffe des Bestärkenden Lernens. Agenten. Die Steuerung des Agentensystems („Policy“). Die Bewertung von Zuständen und Aktionen (Q-Funktion, Bellman-Gleichung).,(. Literatur. 2.1 2.2 2.3 3 Optimal entscheiden in einer bekannten Umwelt. 3.1 Zustandsbewertung . 3.1.1 Zielorientierte Zustandsbewertung (Rückwärtsinduktion). 3.1.2 Taktikbasierte Zustandsbewertung(Belohnungsvorhersage). 3.2
Taktiksuche. 3.2.1 Taktikoptimierung. 3.2.2 Policy-Iteration. 3.3 Optimale Taktik in einem Brettspiel-Szenario. 3.4 Zusammenfassung. Literatur. 4 Entscheiden und Lernen in einer unbekannten Umwelt. 4.1 4.2 Exploration vs. Exploitation. Rückwirkende Verarbeitung vonErfahrungen („Modellfreies Reinforcement Learning“). 4.2.1 Zielorientiertes Lernen („value-based“). 4.2.2 Taktiksuche. 13 14 16 18 20 21 23 23 32 35 36 38 42 46 48 49 50 53 54 73 XV
XVI Inhaltsverzeichnis 4.2.3 Kombinierte Methoden (Actor-Critic). Erkunden mit vorausschauenden Simulationen („Modellbasiertes Reinforcement Learning“). 108 4.3.1 Dyna-Q. 4.3.2 Monte-Carlo Rollout. 4.3.3 Künstliche Neugier. 4.3.4 Monte-Carlo-Baumsuche (MCTS). 4.3.5 Bemerkungen zum Intelligenzbegriff. 4.4 Systematik der Lernverfahren. Literatur. 109 115 121 125 131 134 135 5 Schätzer für Zustandsbewertung und Aktionsauswahl. 5.1 Künstliche neuronale Netze. 5.1.1 Mustererkennung mit dem Perzeptron. 5.1.2 Die Anpassungsfähigkeit von künstlichen Neuronalen Netzen. 5.1.3 Backpropagation-Lernen. 5.1.4 Regression mit Multilayer Perzeptrons. 5.2 Generalisierende
Zustandsbewertung. 5.3 Neuronale Schätzer für die Aktionsauswahl. 5.3.1 Policy Gradient mit neuronalen Netzen. 5.3.2 Proximal Policy Optimization. 5.3.3 Evolutionäre Strategie mit einer neuronalen Policy. Literatur. 137 139 143 146 162 165 169 182 182 185 188 192 6 Leitbilder in der Künstlichen Intelligenz. 6.1 Grundvorstellungen im Wandel. 6.2 Über das Verhältnis von Mensch undKünstlicher Intelligenz. Literatur. 195 196 201 204 94 4.3 |
any_adam_object | 1 |
author | Lorenz, Uwe |
author_facet | Lorenz, Uwe |
author_role | aut |
author_sort | Lorenz, Uwe |
author_variant | u l ul |
building | Verbundindex |
bvnumber | BV049699235 |
classification_rvk | ST 302 |
ctrlnum | (OCoLC)1399581563 (DE-599)DNB1303544717 |
discipline | Informatik |
edition | 2. Auflage |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>00000nam a22000008c 4500</leader><controlfield tag="001">BV049699235</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20240613</controlfield><controlfield tag="007">t|</controlfield><controlfield tag="008">240528s2024 gw |||| |||| 00||| ger d</controlfield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">23,N39</subfield><subfield code="2">dnb</subfield></datafield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">1303544717</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9783662683101</subfield><subfield code="c">: circa EUR 32.99 (DE), circa EUR 33.92 (AT), circa CHF 36.50 (freier Preis), circa EUR 30.83</subfield><subfield code="9">978-3-662-68310-1</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3662683105</subfield><subfield code="9">3-662-68310-5</subfield></datafield><datafield tag="024" ind1="3" ind2=" "><subfield code="a">9783662683101</subfield></datafield><datafield tag="028" ind1="5" ind2="2"><subfield code="a">Bestellnummer: 978-3-662-68310-1</subfield></datafield><datafield tag="028" ind1="5" ind2="2"><subfield code="a">Bestellnummer: 89235149</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)1399581563</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)DNB1303544717</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE-BE</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-739</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 302</subfield><subfield code="0">(DE-625)143652:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="8">1\p</subfield><subfield code="a">004</subfield><subfield code="2">23sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Lorenz, Uwe</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Reinforcement learning</subfield><subfield code="b">aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot</subfield><subfield code="c">Uwe Lorenz</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">2. Auflage</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Berlin</subfield><subfield code="b">Springer Berlin</subfield><subfield code="c">2024</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Neckargemünd</subfield><subfield code="b">Springer Vieweg</subfield><subfield code="c">[2024]</subfield></datafield><datafield tag="264" ind1=" " ind2="4"><subfield code="c">© 2024</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="b">XVI, 204 Seiten</subfield><subfield code="c">24 cm x 16.8 cm</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Java</subfield><subfield code="g">Programmiersprache</subfield><subfield code="0">(DE-588)4401313-9</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Bestärkendes Lernen</subfield><subfield code="g">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4825546-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Greenfoot</subfield><subfield code="g">Programmierumgebung</subfield><subfield code="0">(DE-588)7713261-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="651" ind1=" " ind2="7"><subfield code="a">Java</subfield><subfield code="0">(DE-588)4028527-3</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Maschinelles Lernen</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Künstliche Intelligenz</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Reinforcement Learning</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Bestärkendes Lernen</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Verstärkendes Lernen</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">SARSA</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Q-Learning</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Policy Gadient</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Actor-Critic</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Java-Hamster</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Greenfoot</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Deep Reinforcement Learning</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Bestärkendes Lernen</subfield><subfield code="g">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4825546-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Java</subfield><subfield code="0">(DE-588)4028527-3</subfield><subfield code="D">g</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Greenfoot</subfield><subfield code="g">Programmierumgebung</subfield><subfield code="0">(DE-588)7713261-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="689" ind1="1" ind2="0"><subfield code="a">Bestärkendes Lernen</subfield><subfield code="g">Künstliche Intelligenz</subfield><subfield code="0">(DE-588)4825546-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="1"><subfield code="a">Java</subfield><subfield code="g">Programmiersprache</subfield><subfield code="0">(DE-588)4401313-9</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="2"><subfield code="a">Greenfoot</subfield><subfield code="g">Programmierumgebung</subfield><subfield code="0">(DE-588)7713261-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="710" ind1="2" ind2=" "><subfield code="a">Springer-Verlag GmbH</subfield><subfield code="0">(DE-588)1065168780</subfield><subfield code="4">pbl</subfield></datafield><datafield tag="776" ind1="0" ind2="8"><subfield code="i">Erscheint auch als</subfield><subfield code="n">Online-Ausgabe</subfield><subfield code="z">9783662683118</subfield></datafield><datafield tag="780" ind1="0" ind2="0"><subfield code="i">Vorangegangen ist</subfield><subfield code="z">9783662616505</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">X:MVB</subfield><subfield code="q">text/html</subfield><subfield code="u">http://deposit.dnb.de/cgi-bin/dokserv?id=f7355fa234364733a3e4c4108630856a&prov=M&dok_var=1&dok_ext=htm</subfield><subfield code="3">Inhaltstext</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">X:MVB</subfield><subfield code="u">https://link.springer.com/978-3-662-68310-1</subfield><subfield code="3">Auszug</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UB Passau - ADAM Catalogue Enrichment</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=035041676&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="883" ind1="1" ind2=" "><subfield code="8">1\p</subfield><subfield code="a">vlb</subfield><subfield code="d">20230922</subfield><subfield code="q">DE-101</subfield><subfield code="u">https://d-nb.info/provenance/plan#vlb</subfield></datafield><datafield tag="943" ind1="1" ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-035041676</subfield></datafield></record></collection> |
geographic | Java (DE-588)4028527-3 gnd |
geographic_facet | Java |
id | DE-604.BV049699235 |
illustrated | Not Illustrated |
indexdate | 2024-12-09T13:08:34Z |
institution | BVB |
institution_GND | (DE-588)1065168780 |
isbn | 9783662683101 3662683105 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-035041676 |
oclc_num | 1399581563 |
open_access_boolean | |
owner | DE-739 |
owner_facet | DE-739 |
physical | XVI, 204 Seiten 24 cm x 16.8 cm |
publishDate | 2024 |
publishDateSearch | 2024 |
publishDateSort | 2024 |
publisher | Springer Berlin Springer Vieweg |
record_format | marc |
spelling | Lorenz, Uwe Verfasser aut Reinforcement learning aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot Uwe Lorenz 2. Auflage Berlin Springer Berlin 2024 Neckargemünd Springer Vieweg [2024] © 2024 XVI, 204 Seiten 24 cm x 16.8 cm txt rdacontent n rdamedia nc rdacarrier Java Programmiersprache (DE-588)4401313-9 gnd rswk-swf Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd rswk-swf Greenfoot Programmierumgebung (DE-588)7713261-0 gnd rswk-swf Java (DE-588)4028527-3 gnd rswk-swf Maschinelles Lernen Künstliche Intelligenz Reinforcement Learning Bestärkendes Lernen Verstärkendes Lernen SARSA Q-Learning Policy Gadient Actor-Critic Java-Hamster Greenfoot Deep Reinforcement Learning Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 s Java (DE-588)4028527-3 g Greenfoot Programmierumgebung (DE-588)7713261-0 s DE-604 Java Programmiersprache (DE-588)4401313-9 s Springer-Verlag GmbH (DE-588)1065168780 pbl Erscheint auch als Online-Ausgabe 9783662683118 Vorangegangen ist 9783662616505 X:MVB text/html http://deposit.dnb.de/cgi-bin/dokserv?id=f7355fa234364733a3e4c4108630856a&prov=M&dok_var=1&dok_ext=htm Inhaltstext X:MVB https://link.springer.com/978-3-662-68310-1 Auszug Digitalisierung UB Passau - ADAM Catalogue Enrichment application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=035041676&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis 1\p vlb 20230922 DE-101 https://d-nb.info/provenance/plan#vlb |
spellingShingle | Lorenz, Uwe Reinforcement learning aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot Java Programmiersprache (DE-588)4401313-9 gnd Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd Greenfoot Programmierumgebung (DE-588)7713261-0 gnd |
subject_GND | (DE-588)4401313-9 (DE-588)4825546-4 (DE-588)7713261-0 (DE-588)4028527-3 |
title | Reinforcement learning aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot |
title_auth | Reinforcement learning aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot |
title_exact_search | Reinforcement learning aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot |
title_full | Reinforcement learning aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot Uwe Lorenz |
title_fullStr | Reinforcement learning aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot Uwe Lorenz |
title_full_unstemmed | Reinforcement learning aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot Uwe Lorenz |
title_short | Reinforcement learning |
title_sort | reinforcement learning aktuelle ansatze verstehen mit beispielen in java und greenfoot |
title_sub | aktuelle Ansätze verstehen - mit Beispielen in Java und Greenfoot |
topic | Java Programmiersprache (DE-588)4401313-9 gnd Bestärkendes Lernen Künstliche Intelligenz (DE-588)4825546-4 gnd Greenfoot Programmierumgebung (DE-588)7713261-0 gnd |
topic_facet | Java Programmiersprache Bestärkendes Lernen Künstliche Intelligenz Greenfoot Programmierumgebung Java |
url | http://deposit.dnb.de/cgi-bin/dokserv?id=f7355fa234364733a3e4c4108630856a&prov=M&dok_var=1&dok_ext=htm https://link.springer.com/978-3-662-68310-1 http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=035041676&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT lorenzuwe reinforcementlearningaktuelleansatzeverstehenmitbeispieleninjavaundgreenfoot AT springerverlaggmbh reinforcementlearningaktuelleansatzeverstehenmitbeispieleninjavaundgreenfoot |