Holdings: Deep learning :: THWS Bibkatalog

Deep learning: a practitioner's approach

Saved in:

Bibliographic Details
Main Authors:	Patterson, Josh (Author), Gibson, Adam (Author)
Format:	Book
Language:	English
Published:	Beijing ; Boston ; Farnham ; Sebastopol ; Tokyo O'Reilly August 2017
Edition:	First edition
Subjects:	Maschinelles Lernen
Online Access:	Inhaltsverzeichnis
Physical Description:	xxi, 507 Seiten Illustrationen, Diagramme
ISBN:	9781491914250

Staff View

MARC


LEADER	00000nam a2200000 c 4500
001	BV043292275
003	DE-604
005	20180221
007	t
008	160119s2017 a\|\|\| \|\|\|\| 00\|\|\| eng d
020			\|a 9781491914250 \|c Pb.: £ 39.99 \|9 978-1-491-91425-0
035			\|a (OCoLC)1004328064
035			\|a (DE-599)BSZ452265150
040			\|a DE-604 \|b ger \|e rda
041	0		\|a eng
049			\|a DE-739 \|a DE-91 \|a DE-706 \|a DE-M347 \|a DE-1050 \|a DE-1051 \|a DE-573 \|a DE-523 \|a DE-11 \|a DE-91G \|a DE-20 \|a DE-Aug4 \|a DE-522 \|a DE-898 \|a DE-83
084			\|a ST 300 \|0 (DE-625)143650: \|2 rvk
084			\|a ST 302 \|0 (DE-625)143652: \|2 rvk
084			\|a 68T05 \|2 msc
084			\|a ELT 515f \|2 stub
084			\|a DAT 708f \|2 stub
100	1		\|a Patterson, Josh \|0 (DE-588)1139859978 \|4 aut
245	1	0	\|a Deep learning \|b a practitioner's approach \|c Josh Patterson and Adam Gibson
250			\|a First edition
264		1	\|a Beijing ; Boston ; Farnham ; Sebastopol ; Tokyo \|b O'Reilly \|c August 2017
300			\|a xxi, 507 Seiten \|b Illustrationen, Diagramme
336			\|b txt \|2 rdacontent
337			\|b n \|2 rdamedia
338			\|b nc \|2 rdacarrier
650	0	7	\|a Maschinelles Lernen \|0 (DE-588)4193754-5 \|2 gnd \|9 rswk-swf
689	0	0	\|a Maschinelles Lernen \|0 (DE-588)4193754-5 \|D s
689	0		\|5 DE-604
700	1		\|a Gibson, Adam \|4 aut
776	0	8	\|i Erscheint auch als \|n Online-Ausgabe, e-Book \|z 978-1-491-91423-6
856	4	2	\|m Digitalisierung UB Passau - ADAM Catalogue Enrichment \|q application/pdf \|u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=028713376&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA \|3 Inhaltsverzeichnis
999			\|a oai:aleph.bib-bvb.de:BVB01-028713376

Record in the Search Index

_version_	1804175823057453056
adam_text	Table of Contents Preface...................................................................... xiii 1. A Review of Machine Learning.................................................1 The Learning Machines 1 How Can Machines Learn? 2 Biological Inspiration 4 What Is Deep Learning? 6 Going Down the Rabbit Hole 7 Framing the Questions 8 The Math Behind Machine Learning: Linear Algebra 8 Scalars 9 Vectors 9 Matrices 10 Tensors 10 Hyperplanes 10 Relevant Mathematical Operations 11 Converting Data Into Vectors 11 Solving Systems of Equations 13 The Math Behind Machine Learning: Statistics 15 Probability 16 Conditional Probabilities 18 Posterior Probability 19 Distributions 19 ‘ Samples Versus Population 22 Resampling Methods 22 Selection Bias 22 Likelihood 23 How Does Machine Learning Work? 23 Regression 23 Classification 25 Clustering 26 Underfitting and Overfitting 26 Optimization 27 Convex Optimization 29 Gradient Descent 30 Stochastic Gradient Descent 32 Quasi-Newton Optimization Methods 33 Generative Versus Discriminative Models 33 Logistic Regression 34 The Logistic Function 35 Understanding Logistic Regression Output 35 Evaluating Models 36 The Confusion Matrix 36 Building an Understanding of Machine Learning 40 Foundations of Neural Networks and Deep Learning............... ..............41 Neural Networks 41 The Biological Neuron 43 The Perceptron 45 Multilayer Feed-Forward Networks 50 Training Neural Networks 56 Backpropagation Learning 57 Activation Functions 65 Linear 66 Sigmoid 66 Tanh 67 Hard Tanh 68 Softmax 68 Rectified Linear 69 Loss Functions 71 Loss Function Notation 71 Loss Functions for Regression 72 Loss Functions for Classification 75 Loss Functions for Reconstruction 77 Hyperparameters 78 Learning Rate 78 Regularization 79 Momentum 79 Sparsity 80 vi \| Table of Contents 3. Fundamentals of Deep Networks.......................................... 81 Defining Deep Learning 81 What Is Deep Learning? 81 Organization of This Chapter 91 Common Architectural Principles of Deep Networks 92 Parameters 92 Layers 93 Activation Functions 93 Loss Functions 95 Optimization Algorithms 96 Hyperparameters 100 Summary 105 Building Blocks of Deep Networks 105 RBMs 106 Autoencoders 112 Variational Autoencoders 114 4. Major Architectures of Deep Networks...................................117 Unsupervised Pretrained Networks 118 Deep Belief Networks 118 Generative Adversarial Networks 121 Convolutional Neural Networks (CNNs) 125 Biological Inspiration 126 Intuition 126 CNN Architecture Overview 128 Input Layers 130 Convolutional Layers 130 Pooling Layers 140 Fully Connected Layers 140 Other Applications of CNNs 141 CNNs of Note 141 Summary 142 Recurrent Neural Networks 143 Modeling the Time Dimension 143 3D Volumetric Input 146 Why Not Markov Models? 148 General Recurrent Neural Network Architecture 149 ■LSTM Networks 150 Domain-Specific Applications and Blended Networks 159 Recursive Neural Networks 160 Network Architecture 160 Varieties of Recursive Neural Networks 161 Table of Contents \| vii Applications of Recursive Neural Networks 161 Summary and Discussion 162 Will Deep Learning Make Other Algorithms Obsolete? 162 Different Problems Have Different Best Methods 162 When Do I Need Deep Learning? 163 5. Building Deep Networks..................................................165 Matching Deep Networks to the Right Problem 165 Columnar Data and Multilayer Perceptrons 166 Images and Convolutional Neural Networks 166 Time-series Sequences and Recurrent Neural Networks 167 Using Hybrid Networks 169 The DL4J Suite of Tools 169 Vectorization and DataVec 170 Runtimes and ND4J 170 Basic Concepts of the DL4J API 172 Loading and Saving Models 172 Getting Input for the Model 173 Setting Up Model Architecture 173 Training and Evaluation 174 Modeling CSV Data with Multilayer Perceptron Networks 175 Setting Up Input Data 178 Determining Network Architecture 178 Training the Model 181 Evaluating the Model 181 Modeling Handwritten Images Using CNNs 182 Java Code Listing for the LeNet CNN 183 Loading and Vectorizing the Input Images 185 Network Architecture for LeNet in DL4J 186 Training the CNN 190 Modeling Sequence Data by Using Recurrent Neural Networks 191 Generating Shakespeare via LSTMs 191 Classifying Sensor Time-series Sequences Using LSTMs 200 Using Autoencoders for Anomaly Detection 207 Java Code Listing for Autoencoder Example 207 Setting Up Input Data 211 Autoencoder Network Architecture and Training 211 Evaluating the Model 213 Using Variational Autoencoders to Reconstruct MNIST Digits 214 Code Listing to Reconstruct MNIST Digits 214 Examining the VAE Model 217 Applications of Deep Learning in Natural Language Processing 221 viii I Table of Contents Learning Word Embedding Using Word2Vec 221 Distributed Representations of Sentences with Paragraph Vectors 227 Using Paragraph Vectors for Document Classification 231 6. Tuning Deep Networks.....................................................237 Basic Concepts in Tuning Deep Networks 237 An Intuition for Building Deep Networks 238 Building the Intuition as a Step-by-Step Process 239 Matching Input Data and Network Architectures 240 Summary 241 Relating Model Goal and Output Layers 242 Regression Model Output Layer 242 Classification Model Output Layer 243 Working with Layer Count, Parameter Count, and Memory 246 Feed-Forward Multilayer Neural Networks 246 Controlling Layer and Parameter Counts 247 Estimating Network Memory Requirements 250 Weight Initialization Strategies 251 Using Activation Functions 253 Summary Table for Activation Functions 255 Applying Loss Functions 256 Understanding Learning Rates 258 Using the Ratio of Updates-to-Parameters 259 Specific Recommendations for Learning Rates 260 How Sparsity Affects Learning 263 Applying Methods of Optimization 263 SGD Best Practices 265 Using Parallelization and GPUs for Faster Training 265 Online Learning and Parallel Iterative Algorithms 266 Parallelizing SGD in DL4J 269 GPUs 272 Controlling Epochs and Mini-Batch Size 273 Understanding Mini-Batch Size Trade-Offs 274 How to Use Regularization 275 Priors as Regularizers 275 Max-Norm Regularization 276 Dropout 277 ՝ Other Regularization Topics 279 Working with Class Imbalance 280 Methods for Sampling Classes 282 Weighted Loss Functions 282 Dealing with Overfitting 283 Table of Contents \| ix Using Network Statistics from the Tuning UI 284 Detecting Poor Weight Initialization 287 Detecting Nonshuffled Data 288 Detecting Issues with Regularization 290 7. Tuning Specific Deep Network Architectures...............................293 Convolutional Neural Networks (CNNs) 293 Common Convolutional Architectural Patterns 294 Configuring Convolutional Layers 297 Configuring Pooling Layers 303 Transfer Learning 304 Recurrent Neural Networks 306 Network Input Data and Input Layers 307 Output Layers and RnnOutputLayer 308 Training the Network 309 Debugging Common Issues with LSTMs 311 Padding and Masking 312 Evaluation and Scoring With Masking 313 Variants of Recurrent Network Architectures 314 Restricted Boltzmann Machines 314 Hidden Units and Modeling Available Information 315 Using Different Units 316 Using Regularization with RBMs 317 DBNs 317 Using Momentum 318 Using Regularization 319 Determining Hidden Unit Count 320 8. Vectorization........................................................... 321 Introduction to Vectorization in Machine Learning 321 Why Do We Need to Vectorize Data? 322 Strategies for Dealing with Columnar Raw Data Attributes 325 Feature Engineering and Normalization Techniques 327 Using DataVec for ETL and Vectorization 334 Vectorizing Image Data 336 Image Data Representation in DL4J 337 Image Data and Vector Normalization with DataVec 339 Working with Sequential Data in Vectorization 340 Major Variations of Sequential Data Sources 340 Vectorizing Sequential Data with DataVec 341 Working with Text in Vectorization 347 Bag of Words 348 X I Table of Contents TF-IDF 349 Comparing Word2Vec and VSM Comparison 353 Working with Graphs 354 9. Using Deep Learning and DL4J on Spark.................................. 357 Introduction to Using DL4J with Spark and Hadoop 357 Operating Spark from the Command Line 360 Configuring and Tuning Spark Execution 362 Running Spark on Mesos 363 Running Spark on YARN 364 General Spark Tuning Guide 367 Tuning DL4J Jobs on Spark 371 Setting Up a Maven Project Object Model for Spark and DL4J 372 A pom.xml File Dependency Template 374 Setting Up a POM File for CDH 5.X 378 Setting Up a POM File for HDP 2.4 378 Troubleshooting Spark and Hadoop 379 Common Issues with ND4J 380 DL4J Parallel Execution on Spark 381 A Minimal Spark Training Example 383 DL4J API Best Practices for Spark 385 Multilayer Perceptron Spark Example 387 Setting Up MLP Network Architecture for Spark 390 Distributed Training and Model Evaluation 390 Building and Executing a DL4J Spark Job 392 Generating Shakespeare Text with Spark and Long Short-Term Memory 392 Setting Up the LSTM Network Architecture 395 Training, Tracking Progress, and Understanding Results 396 Modeling MNIST with a Convolutional Neural Network on Spark 397 Configuring the Spark Job and Loading MNIST Data 400 Setting Up the LeNet CNN Architecture and Training 401 A. What Is Artificial Intelligence?.......................................405 B. RL4J and Reinforcement Learning........................................417 C. Numbers Everyone Should Know...........................................441 D. Neural Networks and Backpropagation: A Mathematical Approach.......... 443 E. Using the ND4J API.....................................................449 Table of Contents \| xi F. Using DataVec.................................................................463 G. Working with DL4J from Source...............................................475 H. Setting Up DL4J Projects.....................................................477 I. Setting Up GPUs for DL4J Projects............................................483 J. Troubleshooting DL4J Installations.......................................... 487 Index........................................................................... 495 xii [ Table of Contents
any_adam_object	1
author	Patterson, Josh Gibson, Adam
author_GND	(DE-588)1139859978
author_facet	Patterson, Josh Gibson, Adam
author_role	aut aut
author_sort	Patterson, Josh
author_variant	j p jp a g ag
building	Verbundindex
bvnumber	BV043292275
classification_rvk	ST 300 ST 302
classification_tum	ELT 515f DAT 708f
ctrlnum	(OCoLC)1004328064 (DE-599)BSZ452265150
discipline	Informatik Elektrotechnik
edition	First edition
format	Book
fullrecord	<?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01676nam a2200397 c 4500</leader><controlfield tag="001">BV043292275</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20180221 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">160119s2017 a\|\|\| \|\|\|\| 00\|\|\| eng d</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9781491914250</subfield><subfield code="c">Pb.: £ 39.99</subfield><subfield code="9">978-1-491-91425-0</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)1004328064</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BSZ452265150</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">eng</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-739</subfield><subfield code="a">DE-91</subfield><subfield code="a">DE-706</subfield><subfield code="a">DE-M347</subfield><subfield code="a">DE-1050</subfield><subfield code="a">DE-1051</subfield><subfield code="a">DE-573</subfield><subfield code="a">DE-523</subfield><subfield code="a">DE-11</subfield><subfield code="a">DE-91G</subfield><subfield code="a">DE-20</subfield><subfield code="a">DE-Aug4</subfield><subfield code="a">DE-522</subfield><subfield code="a">DE-898</subfield><subfield code="a">DE-83</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 300</subfield><subfield code="0">(DE-625)143650:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 302</subfield><subfield code="0">(DE-625)143652:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">68T05</subfield><subfield code="2">msc</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ELT 515f</subfield><subfield code="2">stub</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 708f</subfield><subfield code="2">stub</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Patterson, Josh</subfield><subfield code="0">(DE-588)1139859978</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Deep learning</subfield><subfield code="b">a practitioner's approach</subfield><subfield code="c">Josh Patterson and Adam Gibson</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">First edition</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Beijing ; Boston ; Farnham ; Sebastopol ; Tokyo</subfield><subfield code="b">O'Reilly</subfield><subfield code="c">August 2017</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">xxi, 507 Seiten</subfield><subfield code="b">Illustrationen, Diagramme</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Maschinelles Lernen</subfield><subfield code="0">(DE-588)4193754-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Maschinelles Lernen</subfield><subfield code="0">(DE-588)4193754-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Gibson, Adam</subfield><subfield code="4">aut</subfield></datafield><datafield tag="776" ind1="0" ind2="8"><subfield code="i">Erscheint auch als</subfield><subfield code="n">Online-Ausgabe, e-Book</subfield><subfield code="z">978-1-491-91423-6</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UB Passau - ADAM Catalogue Enrichment</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=028713376&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-028713376</subfield></datafield></record></collection>
id	DE-604.BV043292275
illustrated	Illustrated
indexdate	2024-07-10T07:22:24Z
institution	BVB
isbn	9781491914250
language	English
oai_aleph_id	oai:aleph.bib-bvb.de:BVB01-028713376
oclc_num	1004328064
open_access_boolean
owner	DE-739 DE-91 DE-BY-TUM DE-706 DE-M347 DE-1050 DE-1051 DE-573 DE-523 DE-11 DE-91G DE-BY-TUM DE-20 DE-Aug4 DE-522 DE-898 DE-BY-UBR DE-83
owner_facet	DE-739 DE-91 DE-BY-TUM DE-706 DE-M347 DE-1050 DE-1051 DE-573 DE-523 DE-11 DE-91G DE-BY-TUM DE-20 DE-Aug4 DE-522 DE-898 DE-BY-UBR DE-83
physical	xxi, 507 Seiten Illustrationen, Diagramme
publishDate	2017
publishDateSearch	2017
publishDateSort	2017
publisher	O'Reilly
record_format	marc
spelling	Patterson, Josh (DE-588)1139859978 aut Deep learning a practitioner's approach Josh Patterson and Adam Gibson First edition Beijing ; Boston ; Farnham ; Sebastopol ; Tokyo O'Reilly August 2017 xxi, 507 Seiten Illustrationen, Diagramme txt rdacontent n rdamedia nc rdacarrier Maschinelles Lernen (DE-588)4193754-5 gnd rswk-swf Maschinelles Lernen (DE-588)4193754-5 s DE-604 Gibson, Adam aut Erscheint auch als Online-Ausgabe, e-Book 978-1-491-91423-6 Digitalisierung UB Passau - ADAM Catalogue Enrichment application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=028713376&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis
spellingShingle	Patterson, Josh Gibson, Adam Deep learning a practitioner's approach Maschinelles Lernen (DE-588)4193754-5 gnd
subject_GND	(DE-588)4193754-5
title	Deep learning a practitioner's approach
title_auth	Deep learning a practitioner's approach
title_exact_search	Deep learning a practitioner's approach
title_full	Deep learning a practitioner's approach Josh Patterson and Adam Gibson
title_fullStr	Deep learning a practitioner's approach Josh Patterson and Adam Gibson
title_full_unstemmed	Deep learning a practitioner's approach Josh Patterson and Adam Gibson
title_short	Deep learning
title_sort	deep learning a practitioner s approach
title_sub	a practitioner's approach
topic	Maschinelles Lernen (DE-588)4193754-5 gnd
topic_facet	Maschinelles Lernen
url	http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=028713376&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA
work_keys_str_mv	AT pattersonjosh deeplearningapractitionersapproach AT gibsonadam deeplearningapractitionersapproach

Holdings

There is no print copy available.

Interlibrary loan Place Request Caution: Not in THWS collection! Indexes

MARC

Record in the Search Index

There is no print copy available.

Similar Items