Praktische Statistik für Data scientists: 50+ essenzielle Konzepte mit R und Python
Statistische Methoden sind ein zentraler Bestandteil der Arbeit mit Daten, doch nur wenige Data Scientists haben eine formale statistische Ausbildung. In Kursen und Büchern werden die Grundlagen der Statistik allerdings selten aus der Sicht von Data Scientists behandelt. Dieses praxisorientierte Han...
Gespeichert in:
Hauptverfasser: | , , |
---|---|
Weitere Verfasser: | |
Format: | Buch |
Sprache: | German English |
Veröffentlicht: |
Heidelberg
O'Reilly
[2021]
|
Ausgabe: | 1. Auflage |
Schlagworte: | |
Online-Zugang: | Inhaltstext Inhaltsverzeichnis |
Zusammenfassung: | Statistische Methoden sind ein zentraler Bestandteil der Arbeit mit Daten, doch nur wenige Data Scientists haben eine formale statistische Ausbildung. In Kursen und Büchern werden die Grundlagen der Statistik allerdings selten aus der Sicht von Data Scientists behandelt. Dieses praxisorientierte Handbuch erklärt Ihnen anhand zahlreicher Beispiele in Python und R, wie Sie verschiedene statistische Methoden speziell in den Datenwissenschaften anwenden. Das Buch erläutert, welche statistischen Konzepte für die Datenwissenschaften besonders relevant sind, und zeigt Ihnen auch, wie Sie den falschen Gebrauch von statistischen Verfahren vermeiden. Wenn Sie mit R oder Python vertraut sind, ermöglicht Ihnen diese gut lesbare Referenz ein tieferes Verständnis Ihrer Daten und Sie werden Ihr Statistikwissen für die Praxis deutlich ausbauen. |
Beschreibung: | Auf dem Umschlag: "Übersetzung der 2. Auflage" |
Beschreibung: | XV, 356 Seiten Illustrationen, Diagramme 24 cm x 16.5 cm |
ISBN: | 9783960091530 3960091532 |
Internformat
MARC
LEADER | 00000nam a22000008c 4500 | ||
---|---|---|---|
001 | BV047207924 | ||
003 | DE-604 | ||
005 | 20240626 | ||
007 | t| | ||
008 | 210322s2021 gw a||| |||| 00||| ger d | ||
015 | |a 20,N45 |2 dnb | ||
016 | 7 | |a 1220521876 |2 DE-101 | |
020 | |a 9783960091530 |c kart. : circa EUR 39.90 (DE), circa EUR 41.10 (AT) |9 978-3-96009-153-0 | ||
020 | |a 3960091532 |9 3-96009-153-2 | ||
024 | 3 | |a 9783960091530 | |
035 | |a (OCoLC)1249658986 | ||
035 | |a (DE-599)DNB1220521876 | ||
040 | |a DE-604 |b ger |e rda | ||
041 | 1 | |a ger |h eng | |
044 | |a gw |c XA-DE-BW | ||
049 | |a DE-706 |a DE-860 |a DE-92 |a DE-20 |a DE-29T |a DE-1049 |a DE-523 |a DE-1046 |a DE-1043 |a DE-11 |a DE-861 |a DE-859 |a DE-83 |a DE-1102 |a DE-703 |a DE-573 |a DE-188 |a DE-M49 |a DE-384 | ||
084 | |a SK 850 |0 (DE-625)143263: |2 rvk | ||
084 | |a ST 300 |0 (DE-625)143650: |2 rvk | ||
084 | |a XF 3400 |0 (DE-625)152765: |2 rvk | ||
084 | |a ST 530 |0 (DE-625)143679: |2 rvk | ||
084 | |a ST 601 |0 (DE-625)143682: |2 rvk | ||
084 | |a ST 250 |0 (DE-625)143626: |2 rvk | ||
084 | |a XC 4011 |0 (DE-625)152514:12917 |2 rvk | ||
084 | |a DAT 307 |2 stub | ||
084 | |a MAT 620 |2 stub | ||
084 | |a DAT 620 |2 stub | ||
084 | |8 1\p |a 004 |2 sdnb | ||
100 | 1 | |a Bruce, Peter C. |d 1953- |e Verfasser |0 (DE-588)1104275260 |4 aut | |
240 | 1 | 0 | |a Practical statistics for data scientists |
245 | 1 | 0 | |a Praktische Statistik für Data scientists |b 50+ essenzielle Konzepte mit R und Python |c Peter Bruce, Andrew Bruce & Peter Gedeck ; deutsche Übersetzung von Marcus Fraaß |
250 | |a 1. Auflage | ||
264 | 1 | |a Heidelberg |b O'Reilly |c [2021] | |
264 | 4 | |c © 2021 | |
300 | |a XV, 356 Seiten |b Illustrationen, Diagramme |c 24 cm x 16.5 cm | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
500 | |a Auf dem Umschlag: "Übersetzung der 2. Auflage" | ||
520 | 3 | |a Statistische Methoden sind ein zentraler Bestandteil der Arbeit mit Daten, doch nur wenige Data Scientists haben eine formale statistische Ausbildung. In Kursen und Büchern werden die Grundlagen der Statistik allerdings selten aus der Sicht von Data Scientists behandelt. Dieses praxisorientierte Handbuch erklärt Ihnen anhand zahlreicher Beispiele in Python und R, wie Sie verschiedene statistische Methoden speziell in den Datenwissenschaften anwenden. Das Buch erläutert, welche statistischen Konzepte für die Datenwissenschaften besonders relevant sind, und zeigt Ihnen auch, wie Sie den falschen Gebrauch von statistischen Verfahren vermeiden. Wenn Sie mit R oder Python vertraut sind, ermöglicht Ihnen diese gut lesbare Referenz ein tieferes Verständnis Ihrer Daten und Sie werden Ihr Statistikwissen für die Praxis deutlich ausbauen. | |
650 | 0 | 7 | |a Big Data |0 (DE-588)4802620-7 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Python |g Programmiersprache |0 (DE-588)4434275-5 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a R |g Programm |0 (DE-588)4705956-4 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Data Mining |0 (DE-588)4428654-5 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Datenanalyse |0 (DE-588)4123037-1 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Data Science |0 (DE-588)1140936166 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Statistik |0 (DE-588)4056995-0 |2 gnd |9 rswk-swf |
653 | |a Statistik | ||
653 | |a R | ||
653 | |a Python | ||
653 | |a Data Science | ||
653 | |a Algorithmen | ||
653 | |a Big Data | ||
653 | |a Data Mining | ||
653 | |a Datenanalyse | ||
653 | |a Wahrscheinlichkeit | ||
653 | |a Machine Learning | ||
653 | |a Unsupervised Learning | ||
653 | |a Regression | ||
653 | |a Datenklassifikation | ||
653 | |a Random Forest | ||
689 | 0 | 0 | |a Data Science |0 (DE-588)1140936166 |D s |
689 | 0 | 1 | |a Big Data |0 (DE-588)4802620-7 |D s |
689 | 0 | 2 | |a Statistik |0 (DE-588)4056995-0 |D s |
689 | 0 | 3 | |a Datenanalyse |0 (DE-588)4123037-1 |D s |
689 | 0 | |5 DE-604 | |
689 | 1 | 0 | |a Data Mining |0 (DE-588)4428654-5 |D s |
689 | 1 | 1 | |a Datenanalyse |0 (DE-588)4123037-1 |D s |
689 | 1 | 2 | |a R |g Programm |0 (DE-588)4705956-4 |D s |
689 | 1 | 3 | |a Python |g Programmiersprache |0 (DE-588)4434275-5 |D s |
689 | 1 | |5 DE-604 | |
700 | 1 | |a Bruce, Andrew |e Verfasser |0 (DE-588)170744183 |4 aut | |
700 | 1 | |a Gedeck, Peter |e Verfasser |0 (DE-588)1231483199 |4 aut | |
700 | 1 | |a Fraaß, Marcus |0 (DE-588)1181254078 |4 trl | |
775 | 0 | 8 | |i Parallele Sprachausgabe |a Bruce, Peter |t Practical statistics for data scientists |d O'Reilly Media Inc. : 2020 |n englisch |z 978-1492072942 |w (DE-604)BV046884098 |
776 | 0 | 8 | |i Erscheint auch als |n Online-Ausgabe, PDF |z 978-3-96010-467-4 |
776 | 0 | 8 | |i Erscheint auch als |n Online-Ausgabe, EPUB |z 978-3-96010-468-1 |
776 | 0 | 8 | |i Erscheint auch als |n Online-Ausgabe, MOBI |z 978-3-96010-469-8 |
856 | 4 | 2 | |m X:MVB |q text/html |u http://deposit.dnb.de/cgi-bin/dokserv?id=c18172d5062946f795b0fd43024dc0ae&prov=M&dok_var=1&dok_ext=htm |3 Inhaltstext |
856 | 4 | 2 | |m DNB Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=032612785&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
883 | 1 | |8 1\p |a vlb |d 20201030 |q DE-101 |u https://d-nb.info/provenance/plan#vlb | |
943 | 1 | |a oai:aleph.bib-bvb.de:BVB01-032612785 |
Datensatz im Suchindex
_version_ | 1822694167301586944 |
---|---|
adam_text |
INHALT
VORWORT
.
XIII
1
EXPLORATIVE
DATENANALYSE
.
1
STRUKTURIERTE
DATENTYPEN
.
2
WEITERFUEHRENDE
LITERATUR
.
4
TABELLARISCHE
DATEN
.
5
DATA
FRAMES
UND
TABELLEN
.
6
NICHT
TABELLARISCHE
DATENSTRUKTUREN
.
7
WEITERFUEHRENDE
LITERATUR
.
8
LAGEMASSE
.
8
MITTELWERT
.
9
MEDIAN
UND
ANDERE
ROBUSTE
LAGEMASSE
.
11
BEISPIEL:
LAGEMASSE
FUER
EINWOHNERZAHLEN
UND
MORDRATEN
.
12
WEITERFUEHRENDE
LITERATUR
.
14
STREUUNGSMASSE
.
14
STANDARDABWEICHUNG
UND
AEHNLICHE
MASSE
.
15
STREUUNGSMASSE
AUF
BASIS
VON
PERZENTILEN
.
17
BEISPIEL:
STREUUNGSMASSE
FUER
DIE
EINWOHNERZAHLEN
DER
BUNDESSTAATEN
IN
DEN
USA
.
19
WEITERFUEHRENDE
LITERATUR
.
20
EXPLORATION
DER
DATENVERTEILUNG
.
20
PERZENTILE
UND
BOX-PLOTS
.
21
HAEUFIGKEITSTABELLEN
UND
HISTOGRAMME
.
23
DICHTEDIAGRAMME
UND
-SCHAETZER
.
25
WEITERFUEHRENDE
LITERATUR
.
TI
BINAERE
UND
KATEGORIALE
DATEN
UNTERSUCHEN
.
28
MODUS
.
30
ERWARTUNGSWERT
.
30
W
AHRSCHEINLICHKEITEN
.
31
WEITERFUEHRENDE
LITERATUR
.
32
I
V
KORRELATION
.
32
STREUDIAGRAMME
.
35
WEITERFUEHRENDE
LITERATUR
.
37
ZWEI
ODER
MEHR
VARIABLEN
UNTERSUCHEN
.
37
HEXAGONAL-BINNING
UND
KONTURDIAGRAMME
(DIAGRAMME
FUER
MEHRERE
NUMERISCHE
VARIABLEN)
.
38
ZWEI
KATEGORIALE
VARIABLEN
.
41
KATEGORIALE
UND
NUMERISCHE
VARIABLEN
.
42
MEHRERE
VARIABLEN
VISUALISIEREN
.
44
WEITERFUEHRENDE
LITERATUR
.
47
ZUSAMMENFASSUNG
.
47
2
DATEN
UND
STICHPROBENVERTEILUNGEN
.
49
ZUFALLSSTICHPROBENZIEHUNG
UND
STICHPROBENVERZERRUNG
.
50
VERZERRUNG
.
52
ZUFALLSAUSWAHL
.
53
GROESSE
VERSUS
QUALITAET:
WANN
SPIELT
DIE
STICHPROBEN
GROESSE
EINE
ROLLE?
.
54
UNTERSCHIED
ZWISCHEN
DEM
STICHPROBEN
UND
DEM
POPULATIONS
MITTELWERT
.
56
WEITERFUEHRENDE
LITERATUR
.
56
AUSWAHLVERZERRUNG
.
57
REGRESSION
ZUR
MITTE
.
58
WEITERFUEHRENDE
LITERATUR
.
60
STICHPROBENVERTEILUNG
EINER
STATISTISCHEN
GROESSE
.
60
ZENTRALER
GRENZWERTSATZ
.
63
STANDARDFEHLER
.
64
WEITERFUEHRENDE
LITERATUR
.
65
BOOTSTRAP-VERFAHREN
.
65
UNTERSCHIEDE
ZWISCHEN
RESAMPLING
UND
DEM
BOOTSTRAP
VERFAHREN
.
69
WEITERFUEHRENDE
LITERATUR
.
69
KONFIDENZINTERVALLE
.
70
WEITERFUEHRENDE
LITERATUR
.
72
NORMALVERTEILUNG
.
73
STANDARDNORMALVERTEILUNG
UND
Q-Q-DIAGRAMME
.
75
VERTEILUNGEN
MIT
LANGEN
VERTEILUNGSENDEN
.
76
WEITERFUEHRENDE
LITERATUR
.
79
STUDENTSCHE
T-VERTEILUNG
.
79
WEITERFUEHRENDE
LITERATUR
.
81
BINOMIALVERTEILUNG
.
81
WEITERFUEHRENDE
LITERATUR
.
84
VI
|
INHALT
CHI-QUADRAT-VERTEILUNG
.
84
WEITERFUEHRENDE
LITERATUR
.
85
F-VERTEILUNG
.
86
WEITERFUEHRENDE
LITERATUR
.
86
POISSON
UND
VERWANDTE
VERTEILUNGEN
.
87
POISSON-VERTEILUNG
.
87
EXPONENTIALVERTEILUNG
.
88
DIE
HAZARDRATE
SCHAETZEN
.
89
WEIBULL-VERTEILUNG
.
89
WEITERFUEHRENDE
LITERATUR
.
90
ZUSAMMENFASSUNG
.
90
3
STATISTISCHE
VERSUCHE
UND
SIGNIFIKANZTESTS
.
91
A/B-TEST
.
92
WARUM
EINE
KONTROLLGRUPPE
NUTZEN?
.
94
WARUM
LEDIGLICH
A/B?
WARUM
NICHT
AUCH
C,
D
USW.?
.
95
WEITERFUEHRENDE
LITERATUR
.
97
HYPOTHESENTESTS
.
97
DIE
NULLHYPOTHESE
.
99
DIE
ALTERNATIVHYPOTHESE
.
99
EINSEITIGE
UND
ZWEISEITIGE
HYPOTHESENTESTS
.
99
WEITERFUEHRENDE
LITERATUR
.
100
RESAMPLING
.
101
PERMUTATIONSTEST
.
101
BEISPIEL:
DIE
AFFINITAET
VON
NUTZERN
ZU
EINEM
WEBINHALT
MESSEN
(WEB-STICKINESS)
.
102
EXAKTE
UND
BOOTSTRAP-PERMUTATIONSTESTS
.
106
PERMUTATIONSTESTS:
EIN
GEEIGNETER
AUSGANGSPUNKT
IN
DER
DATA
SCIENCE
.
107
WEITERFUEHRENDE
LITERATUR
.
108
STATISTISCHE
SIGNIFIKANZ
UND
P-WERTE
.
108
P-WERT
.
111
SIGNIFIKANZNIVEAU
.
112
FEHLER
1.
UND
2.
ART
.
113
DATA
SCIENCE
UND
P-WERTE
.
114
WEITERFUEHRENDE
LITERATUR
.
114
T-TESTS
.
115
WEITERFUEHRENDE
LITERATUR
.
117
TESTEN
MEHRERER
HYPOTHESEN
.
117
WEITERFUEHRENDE
LITERATUR
.
120
DIE
ANZAHL
DER
FREIHEITSGRADE
.
121
WEITERFUEHRENDE
LITERATUR
.
122
INHALT
|
VII
VARIANZANALYSE
(ANOVA)
.
122
F-STATISTIK
.
126
ZWEIFAKTORIELLE
VARIANZANALYSE
.
128
WEITERFUEHRENDE
LITERATUR
.
128
CHI-QUADRAT-TEST
.
128
CHI-QUADRAT-TEST:
EIN
RESAMPLING-ANSATZ
.
129
CHI-QUADRAT-TEST:
DIE
STATISTISCHE
THEORIE
.
131
EXAKTER
TEST
NACH
FISHER
.
133
RELEVANZ
IN
DER
DATA
SCIENCE
.
135
WEITERFUEHRENDE
LITERATUR
.
136
MEHRARMIGE
BANDITEN
.
136
WEITERFUEHRENDE
LITERATUR
.
139
TRENNSCHAERFE
UND
STICHPROBENGROESSE
.
140
STICHPROBENGROESSE
.
142
WEITERFUEHRENDE
LITERATUR
.
144
ZUSAMMENFASSUNG
.
144
4
REGRESSION
UND
VORHERSAGE
.
145
LINEARE
EINFACHREGRESSION
.
145
DIE
REGRESSIONSGLEICHUNG
.
147
ANGEPASSTE
WERTE
UND
RESIDUEN
.
149
DIE
METHODE
DER
KLEINSTEN
QUADRATE
.
151
UNTERSCHIED
ZWISCHEN
VORHERSAGE
UND
ERKLAERENDEN
MODELLEN.
.
.
.
152
WEITERFUEHRENDE
LITERATUR
.
153
MULTIPLE
LINEARE
REGRESSION
.
153
BEISPIEL:
DIE
KING-COUNTY-IMMOBILIENDATEN
.
154
DAS
MODELL
BEWERTEN
.
155
KREUZVALIDIERUNG
.
158
MODELLAUSWAHL
UND
SCHRITTWEISE
REGRESSION
.
159
GEWICHTETE
REGRESSION
.
163
WEITERFUEHRENDE
LITERATUR
.
164
VORHERSAGE
MITTELS
REGRESSION
.
164
RISIKEN
BEI
DER
EXTRAPOLATION
.
165
KONFIDENZ
UND
PROGNOSEINTERVALLE
.
165
REGRESSION
MIT
FAKTORVARIABLEN
.
167
DARSTELLUNG
DURCH
DUMMY-VARIABLEN
.
168
FAKTORVARIABLEN
MIT
VIELEN
STUFEN
.
171
GEORDNETE
FAKTORVARIABLEN
.
173
INTERPRETIEREN
DER
REGRESSIONSGLEICHUNG
.
174
KORRELIERTE
PRAEDIKTORVARIABLEN
.
175
MULTIKOLLINEARITAET
.
176
VIII
|
INHALT
KONFUNDIERENDE
VARIABLEN
.
177
INTERAKTIONS
UND
HAUPTEFFEKTE
.
178
REGRESSIONSDIAGNOSTIK
.
180
AUSREISSER
.
181
EINFLUSSREICHE
BEOBACHTUNGEN
.
183
HETEROSKEDASTISCHE,
NICHT
NORMALVERTEILTE
UND
KORRELIERTE
FEHLER
.
.
186
PARTIELLE
RESIDUENDIAGRAMME
UND
NICHTLINEARITAET
.
190
POLYNOMIALE
UND
SPLINE-REGRESSION
.
192
POLYNOME
.
193
SPLINES
.
195
VERALLGEMEINERTE
ADDITIVE
MODELLE
.
197
WEITERFUEHRENDE
LITERATUR
.
199
ZUSAMMENFASSUNG
.
199
5
KLASSIFIKATION
.
201
NAIVER
BAYES-KLASSIFIKATOR
.
203
WARUM
EINE
EXAKTE
BAYESSCHE
KLASSIFIKATION
NICHT
PRAKTIKABEL
IST
.
204
DIE
NAIVE
LOESUNG
.
204
NUMERISCHE
PRAEDIKTORVARIABLEN
.
207
WEITERFUEHRENDE
LITERATUR
.
207
DISKRIMINANZANALYSE
.
208
KOVARIANZMATRIX
.
209
LINEARE
DISKRIMINANZANALYSE
NACH
FISHER
.
209
EIN
EINFACHES
BEISPIEL
.
210
WEITERFUEHRENDE
LITERATUR
.
213
LOGISTISCHE
REGRESSION
.
214
LOGISTISCHE
ANTWORTFUNKTION
UND
LOGIT-FUNKTION
.
215
LOGISTISCHE
REGRESSION
UND
VERALLGEMEINERTE
LINEARE
MODELLE
. 217
VERALLGEMEINERTE
LINEARE
MODELLE
.
218
VORHERGESAGTE
WERTE
AUS
DER
LOGISTISCHEN
REGRESSION
.
219
INTERPRETATION
DER
KOEFFIZIENTEN
UND
ODDS-RATIOS
.
220
LINEARE
UND
LOGISTISCHE
REGRESSION:
GEMEINSAMKEITEN
UND
UNTERSCHIEDE
.
221
DAS
MODELL
PRUEFEN
UND
BEWERTEN
.
223
WEITERFUEHRENDE
LITERATUR
.
226
KLASSIFIKATIONSMODELLE
BEWERTEN
.
TU
KONFUSIONSMATRIX
.
228
DIE
PROBLEMATIK
SELTENER
KATEGORIEN
.
230
RELEVANZ,
SENSITIVITAET
UND
SPEZIFITAET
.
231
ROC-KURVE
.
232
INHALT
|
IX
FLAECHE
UNTER
DER
ROC-KURVE
(AUC)
.
234
LIFT
.
236
WEITERFUEHRENDE
LITERATUR
.
238
STRATEGIEN
BEI
UNAUSGEWOGENEN
DATEN
.
238
UNDERSAMPLING
.
239
OVERSAMPLING
UND
UP/DOWN
WEIGHTING
.
240
GENERIERUNG
VON
DATEN
.
241
KOSTENBASIERTE
KLASSIFIKATION
.
242
DIE
VORHERSAGEN
UNTERSUCHEN
.
243
WEITERFUEHRENDE
LITERATUR
.
244
ZUSAMMENFASSUNG
.
244
6
STATISTISCHES
MASCHINELLES
LERNEN
.
247
K-NAECHSTE-NACHBARN
.
248
EIN
KLEINES
BEISPIEL:
VORHERSAGE
VON
KREDITAUSFAELLEN
.
249
DISTANZMASSE
.
252
1-AUS-N-CODIERUNG
.
253
STANDARDISIERUNG
(NORMIERUNG,
Z-WERTE)
.
254
K
FESTLEGEN
.
257
KNN
ZUR
MERKMALSKONSTRUKTION
.
258
BAUMMODELLE
.
260
EIN
EINFACHES
BEISPIEL
.
262
DER
RECURSIVE-PARTITIONING-ALGORITHMUS
.
264
HOMOGENITAET
UND
UNREINHEIT
MESSEN
.
266
DEN
BAUM
DARAN
HINDERN,
WEITERZUWACHSEN
.
267
VORHERSAGE
EINES
KONTINUIERLICHEN
WERTS
.
270
WIE
BAEUME
VERWENDET
WERDEN
.
270
WEITERFUEHRENDE
LITERATUR
.
271
BAGGING
UND
RANDOM
FORESTS
.
271
BAGGING
.
273
RANDOM
FOREST
.
273
VARIABIENWICHTIGKEIT
.
278
HYPERPARAMETER
.
281
BOOSTING
.
282
DER
BOOSTING-ALGORITHMUS
.
283
XGBOOST
.
284
REGULARISIERUNG:
UEBERANPASSUNG
VERMEIDEN
.
287
HYPERPARAMETER
UND
KREUZVALIDIERUNG
.
292
ZUSAMMENFASSUNG
.
295
X
|
INHALT
7
UNUEBERWACHTES
LERNEN
.
297
HAUPTKOMPONENTENANALYSE
.
298
EIN
EINFACHES
BEISPIEL
.
299
DIE
HAUPTKOMPONENTEN
BERECHNEN
.
302
DIE
HAUPTKOMPONENTEN
INTERPRETIEREN
.
302
KORRESPONDENZANALYSE
.
305
WEITERFUEHRENDE
LITERATUR
.
307
K-MEANS-CLUSTERING
.
307
EIN
EINFACHES
BEISPIEL
.
308
DER
K-MEANS-ALGORITHMUS
.
311
DIE
CLUSTER
INTERPRETIEREN
.
312
DIE
ANZAHL
VON
CLUSTERN
BESTIMMEN
.
314
HIERARCHISCHE
CLUSTERANALYSE
.
317
EIN
EINFACHES
BEISPIEL
.
317
DAS
DENDROGRAMM
.
318
DER
AGGLOMERATIVE
ALGORITHMUS
.
320
AEHNLICHKEITSMASSE
.
321
MODELLBASIERTE
CLUSTERANALYSE
.
322
MULTIVARIATE
NORMALVERTEILUNG
.
323
ZUSAMMENGESETZTE
NORMALVERTEILUNGEN
(GAUSSSCHE
MISCHVERTEILUNGEN)
.
324
DIE
ANZAHL
DER
CLUSTER
BESTIMMEN
.
327
WEITERFUEHRENDE
LITERATUR
.
329
SKALIERUNG
UND
KATEGORIALE
VARIABLEN
.
329
VARIABLEN
SKALIEREN
.
330
DOMINIERENDE
VARIABLEN
.
332
KATEGORIALE
DATEN
UND
DIE
GOWER-DISTANZ
.
334
PROBLEME
BEI
DER
CLUSTERANALYSE
MIT
VERSCHIEDENEN
DATENTYPEN
.
.
.
336
ZUSAMMENFASSUNG
.
338
QUELLENANGABEN
.
339
INDEX
.
341
INHALT
|
XI |
adam_txt |
INHALT
VORWORT
.
XIII
1
EXPLORATIVE
DATENANALYSE
.
1
STRUKTURIERTE
DATENTYPEN
.
2
WEITERFUEHRENDE
LITERATUR
.
4
TABELLARISCHE
DATEN
.
5
DATA
FRAMES
UND
TABELLEN
.
6
NICHT
TABELLARISCHE
DATENSTRUKTUREN
.
7
WEITERFUEHRENDE
LITERATUR
.
8
LAGEMASSE
.
8
MITTELWERT
.
9
MEDIAN
UND
ANDERE
ROBUSTE
LAGEMASSE
.
11
BEISPIEL:
LAGEMASSE
FUER
EINWOHNERZAHLEN
UND
MORDRATEN
.
12
WEITERFUEHRENDE
LITERATUR
.
14
STREUUNGSMASSE
.
14
STANDARDABWEICHUNG
UND
AEHNLICHE
MASSE
.
15
STREUUNGSMASSE
AUF
BASIS
VON
PERZENTILEN
.
17
BEISPIEL:
STREUUNGSMASSE
FUER
DIE
EINWOHNERZAHLEN
DER
BUNDESSTAATEN
IN
DEN
USA
.
19
WEITERFUEHRENDE
LITERATUR
.
20
EXPLORATION
DER
DATENVERTEILUNG
.
20
PERZENTILE
UND
BOX-PLOTS
.
21
HAEUFIGKEITSTABELLEN
UND
HISTOGRAMME
.
23
DICHTEDIAGRAMME
UND
-SCHAETZER
.
25
WEITERFUEHRENDE
LITERATUR
.
TI
BINAERE
UND
KATEGORIALE
DATEN
UNTERSUCHEN
.
28
MODUS
.
30
ERWARTUNGSWERT
.
30
W
AHRSCHEINLICHKEITEN
.
31
WEITERFUEHRENDE
LITERATUR
.
32
I
V
KORRELATION
.
32
STREUDIAGRAMME
.
35
WEITERFUEHRENDE
LITERATUR
.
37
ZWEI
ODER
MEHR
VARIABLEN
UNTERSUCHEN
.
37
HEXAGONAL-BINNING
UND
KONTURDIAGRAMME
(DIAGRAMME
FUER
MEHRERE
NUMERISCHE
VARIABLEN)
.
38
ZWEI
KATEGORIALE
VARIABLEN
.
41
KATEGORIALE
UND
NUMERISCHE
VARIABLEN
.
42
MEHRERE
VARIABLEN
VISUALISIEREN
.
44
WEITERFUEHRENDE
LITERATUR
.
47
ZUSAMMENFASSUNG
.
47
2
DATEN
UND
STICHPROBENVERTEILUNGEN
.
49
ZUFALLSSTICHPROBENZIEHUNG
UND
STICHPROBENVERZERRUNG
.
50
VERZERRUNG
.
52
ZUFALLSAUSWAHL
.
53
GROESSE
VERSUS
QUALITAET:
WANN
SPIELT
DIE
STICHPROBEN
GROESSE
EINE
ROLLE?
.
54
UNTERSCHIED
ZWISCHEN
DEM
STICHPROBEN
UND
DEM
POPULATIONS
MITTELWERT
.
56
WEITERFUEHRENDE
LITERATUR
.
56
AUSWAHLVERZERRUNG
.
57
REGRESSION
ZUR
MITTE
.
58
WEITERFUEHRENDE
LITERATUR
.
60
STICHPROBENVERTEILUNG
EINER
STATISTISCHEN
GROESSE
.
60
ZENTRALER
GRENZWERTSATZ
.
63
STANDARDFEHLER
.
64
WEITERFUEHRENDE
LITERATUR
.
65
BOOTSTRAP-VERFAHREN
.
65
UNTERSCHIEDE
ZWISCHEN
RESAMPLING
UND
DEM
BOOTSTRAP
VERFAHREN
.
69
WEITERFUEHRENDE
LITERATUR
.
69
KONFIDENZINTERVALLE
.
70
WEITERFUEHRENDE
LITERATUR
.
72
NORMALVERTEILUNG
.
73
STANDARDNORMALVERTEILUNG
UND
Q-Q-DIAGRAMME
.
75
VERTEILUNGEN
MIT
LANGEN
VERTEILUNGSENDEN
.
76
WEITERFUEHRENDE
LITERATUR
.
79
STUDENTSCHE
T-VERTEILUNG
.
79
WEITERFUEHRENDE
LITERATUR
.
81
BINOMIALVERTEILUNG
.
81
WEITERFUEHRENDE
LITERATUR
.
84
VI
|
INHALT
CHI-QUADRAT-VERTEILUNG
.
84
WEITERFUEHRENDE
LITERATUR
.
85
F-VERTEILUNG
.
86
WEITERFUEHRENDE
LITERATUR
.
86
POISSON
UND
VERWANDTE
VERTEILUNGEN
.
87
POISSON-VERTEILUNG
.
87
EXPONENTIALVERTEILUNG
.
88
DIE
HAZARDRATE
SCHAETZEN
.
89
WEIBULL-VERTEILUNG
.
89
WEITERFUEHRENDE
LITERATUR
.
90
ZUSAMMENFASSUNG
.
90
3
STATISTISCHE
VERSUCHE
UND
SIGNIFIKANZTESTS
.
91
A/B-TEST
.
92
WARUM
EINE
KONTROLLGRUPPE
NUTZEN?
.
94
WARUM
LEDIGLICH
A/B?
WARUM
NICHT
AUCH
C,
D
USW.?
.
95
WEITERFUEHRENDE
LITERATUR
.
97
HYPOTHESENTESTS
.
97
DIE
NULLHYPOTHESE
.
99
DIE
ALTERNATIVHYPOTHESE
.
99
EINSEITIGE
UND
ZWEISEITIGE
HYPOTHESENTESTS
.
99
WEITERFUEHRENDE
LITERATUR
.
100
RESAMPLING
.
101
PERMUTATIONSTEST
.
101
BEISPIEL:
DIE
AFFINITAET
VON
NUTZERN
ZU
EINEM
WEBINHALT
MESSEN
(WEB-STICKINESS)
.
102
EXAKTE
UND
BOOTSTRAP-PERMUTATIONSTESTS
.
106
PERMUTATIONSTESTS:
EIN
GEEIGNETER
AUSGANGSPUNKT
IN
DER
DATA
SCIENCE
.
107
WEITERFUEHRENDE
LITERATUR
.
108
STATISTISCHE
SIGNIFIKANZ
UND
P-WERTE
.
108
P-WERT
.
111
SIGNIFIKANZNIVEAU
.
112
FEHLER
1.
UND
2.
ART
.
113
DATA
SCIENCE
UND
P-WERTE
.
114
WEITERFUEHRENDE
LITERATUR
.
114
T-TESTS
.
115
WEITERFUEHRENDE
LITERATUR
.
117
TESTEN
MEHRERER
HYPOTHESEN
.
117
WEITERFUEHRENDE
LITERATUR
.
120
DIE
ANZAHL
DER
FREIHEITSGRADE
.
121
WEITERFUEHRENDE
LITERATUR
.
122
INHALT
|
VII
VARIANZANALYSE
(ANOVA)
.
122
F-STATISTIK
.
126
ZWEIFAKTORIELLE
VARIANZANALYSE
.
128
WEITERFUEHRENDE
LITERATUR
.
128
CHI-QUADRAT-TEST
.
128
CHI-QUADRAT-TEST:
EIN
RESAMPLING-ANSATZ
.
129
CHI-QUADRAT-TEST:
DIE
STATISTISCHE
THEORIE
.
131
EXAKTER
TEST
NACH
FISHER
.
133
RELEVANZ
IN
DER
DATA
SCIENCE
.
135
WEITERFUEHRENDE
LITERATUR
.
136
MEHRARMIGE
BANDITEN
.
136
WEITERFUEHRENDE
LITERATUR
.
139
TRENNSCHAERFE
UND
STICHPROBENGROESSE
.
140
STICHPROBENGROESSE
.
142
WEITERFUEHRENDE
LITERATUR
.
144
ZUSAMMENFASSUNG
.
144
4
REGRESSION
UND
VORHERSAGE
.
145
LINEARE
EINFACHREGRESSION
.
145
DIE
REGRESSIONSGLEICHUNG
.
147
ANGEPASSTE
WERTE
UND
RESIDUEN
.
149
DIE
METHODE
DER
KLEINSTEN
QUADRATE
.
151
UNTERSCHIED
ZWISCHEN
VORHERSAGE
UND
ERKLAERENDEN
MODELLEN.
.
.
.
152
WEITERFUEHRENDE
LITERATUR
.
153
MULTIPLE
LINEARE
REGRESSION
.
153
BEISPIEL:
DIE
KING-COUNTY-IMMOBILIENDATEN
.
154
DAS
MODELL
BEWERTEN
.
155
KREUZVALIDIERUNG
.
158
MODELLAUSWAHL
UND
SCHRITTWEISE
REGRESSION
.
159
GEWICHTETE
REGRESSION
.
163
WEITERFUEHRENDE
LITERATUR
.
164
VORHERSAGE
MITTELS
REGRESSION
.
164
RISIKEN
BEI
DER
EXTRAPOLATION
.
165
KONFIDENZ
UND
PROGNOSEINTERVALLE
.
165
REGRESSION
MIT
FAKTORVARIABLEN
.
167
DARSTELLUNG
DURCH
DUMMY-VARIABLEN
.
168
FAKTORVARIABLEN
MIT
VIELEN
STUFEN
.
171
GEORDNETE
FAKTORVARIABLEN
.
173
INTERPRETIEREN
DER
REGRESSIONSGLEICHUNG
.
174
KORRELIERTE
PRAEDIKTORVARIABLEN
.
175
MULTIKOLLINEARITAET
.
176
VIII
|
INHALT
KONFUNDIERENDE
VARIABLEN
.
177
INTERAKTIONS
UND
HAUPTEFFEKTE
.
178
REGRESSIONSDIAGNOSTIK
.
180
AUSREISSER
.
181
EINFLUSSREICHE
BEOBACHTUNGEN
.
183
HETEROSKEDASTISCHE,
NICHT
NORMALVERTEILTE
UND
KORRELIERTE
FEHLER
.
.
186
PARTIELLE
RESIDUENDIAGRAMME
UND
NICHTLINEARITAET
.
190
POLYNOMIALE
UND
SPLINE-REGRESSION
.
192
POLYNOME
.
193
SPLINES
.
195
VERALLGEMEINERTE
ADDITIVE
MODELLE
.
197
WEITERFUEHRENDE
LITERATUR
.
199
ZUSAMMENFASSUNG
.
199
5
KLASSIFIKATION
.
201
NAIVER
BAYES-KLASSIFIKATOR
.
203
WARUM
EINE
EXAKTE
BAYESSCHE
KLASSIFIKATION
NICHT
PRAKTIKABEL
IST
.
204
DIE
NAIVE
LOESUNG
.
204
NUMERISCHE
PRAEDIKTORVARIABLEN
.
207
WEITERFUEHRENDE
LITERATUR
.
207
DISKRIMINANZANALYSE
.
208
KOVARIANZMATRIX
.
209
LINEARE
DISKRIMINANZANALYSE
NACH
FISHER
.
209
EIN
EINFACHES
BEISPIEL
.
210
WEITERFUEHRENDE
LITERATUR
.
213
LOGISTISCHE
REGRESSION
.
214
LOGISTISCHE
ANTWORTFUNKTION
UND
LOGIT-FUNKTION
.
215
LOGISTISCHE
REGRESSION
UND
VERALLGEMEINERTE
LINEARE
MODELLE
. 217
VERALLGEMEINERTE
LINEARE
MODELLE
.
218
VORHERGESAGTE
WERTE
AUS
DER
LOGISTISCHEN
REGRESSION
.
219
INTERPRETATION
DER
KOEFFIZIENTEN
UND
ODDS-RATIOS
.
220
LINEARE
UND
LOGISTISCHE
REGRESSION:
GEMEINSAMKEITEN
UND
UNTERSCHIEDE
.
221
DAS
MODELL
PRUEFEN
UND
BEWERTEN
.
223
WEITERFUEHRENDE
LITERATUR
.
226
KLASSIFIKATIONSMODELLE
BEWERTEN
.
TU
KONFUSIONSMATRIX
.
228
DIE
PROBLEMATIK
SELTENER
KATEGORIEN
.
230
RELEVANZ,
SENSITIVITAET
UND
SPEZIFITAET
.
231
ROC-KURVE
.
232
INHALT
|
IX
FLAECHE
UNTER
DER
ROC-KURVE
(AUC)
.
234
LIFT
.
236
WEITERFUEHRENDE
LITERATUR
.
238
STRATEGIEN
BEI
UNAUSGEWOGENEN
DATEN
.
238
UNDERSAMPLING
.
239
OVERSAMPLING
UND
UP/DOWN
WEIGHTING
.
240
GENERIERUNG
VON
DATEN
.
241
KOSTENBASIERTE
KLASSIFIKATION
.
242
DIE
VORHERSAGEN
UNTERSUCHEN
.
243
WEITERFUEHRENDE
LITERATUR
.
244
ZUSAMMENFASSUNG
.
244
6
STATISTISCHES
MASCHINELLES
LERNEN
.
247
K-NAECHSTE-NACHBARN
.
248
EIN
KLEINES
BEISPIEL:
VORHERSAGE
VON
KREDITAUSFAELLEN
.
249
DISTANZMASSE
.
252
1-AUS-N-CODIERUNG
.
253
STANDARDISIERUNG
(NORMIERUNG,
Z-WERTE)
.
254
K
FESTLEGEN
.
257
KNN
ZUR
MERKMALSKONSTRUKTION
.
258
BAUMMODELLE
.
260
EIN
EINFACHES
BEISPIEL
.
262
DER
RECURSIVE-PARTITIONING-ALGORITHMUS
.
264
HOMOGENITAET
UND
UNREINHEIT
MESSEN
.
266
DEN
BAUM
DARAN
HINDERN,
WEITERZUWACHSEN
.
267
VORHERSAGE
EINES
KONTINUIERLICHEN
WERTS
.
270
WIE
BAEUME
VERWENDET
WERDEN
.
270
WEITERFUEHRENDE
LITERATUR
.
271
BAGGING
UND
RANDOM
FORESTS
.
271
BAGGING
.
273
RANDOM
FOREST
.
273
VARIABIENWICHTIGKEIT
.
278
HYPERPARAMETER
.
281
BOOSTING
.
282
DER
BOOSTING-ALGORITHMUS
.
283
XGBOOST
.
284
REGULARISIERUNG:
UEBERANPASSUNG
VERMEIDEN
.
287
HYPERPARAMETER
UND
KREUZVALIDIERUNG
.
292
ZUSAMMENFASSUNG
.
295
X
|
INHALT
7
UNUEBERWACHTES
LERNEN
.
297
HAUPTKOMPONENTENANALYSE
.
298
EIN
EINFACHES
BEISPIEL
.
299
DIE
HAUPTKOMPONENTEN
BERECHNEN
.
302
DIE
HAUPTKOMPONENTEN
INTERPRETIEREN
.
302
KORRESPONDENZANALYSE
.
305
WEITERFUEHRENDE
LITERATUR
.
307
K-MEANS-CLUSTERING
.
307
EIN
EINFACHES
BEISPIEL
.
308
DER
K-MEANS-ALGORITHMUS
.
311
DIE
CLUSTER
INTERPRETIEREN
.
312
DIE
ANZAHL
VON
CLUSTERN
BESTIMMEN
.
314
HIERARCHISCHE
CLUSTERANALYSE
.
317
EIN
EINFACHES
BEISPIEL
.
317
DAS
DENDROGRAMM
.
318
DER
AGGLOMERATIVE
ALGORITHMUS
.
320
AEHNLICHKEITSMASSE
.
321
MODELLBASIERTE
CLUSTERANALYSE
.
322
MULTIVARIATE
NORMALVERTEILUNG
.
323
ZUSAMMENGESETZTE
NORMALVERTEILUNGEN
(GAUSSSCHE
MISCHVERTEILUNGEN)
.
324
DIE
ANZAHL
DER
CLUSTER
BESTIMMEN
.
327
WEITERFUEHRENDE
LITERATUR
.
329
SKALIERUNG
UND
KATEGORIALE
VARIABLEN
.
329
VARIABLEN
SKALIEREN
.
330
DOMINIERENDE
VARIABLEN
.
332
KATEGORIALE
DATEN
UND
DIE
GOWER-DISTANZ
.
334
PROBLEME
BEI
DER
CLUSTERANALYSE
MIT
VERSCHIEDENEN
DATENTYPEN
.
.
.
336
ZUSAMMENFASSUNG
.
338
QUELLENANGABEN
.
339
INDEX
.
341
INHALT
|
XI |
any_adam_object | 1 |
any_adam_object_boolean | 1 |
author | Bruce, Peter C. 1953- Bruce, Andrew Gedeck, Peter |
author2 | Fraaß, Marcus |
author2_role | trl |
author2_variant | m f mf |
author_GND | (DE-588)1104275260 (DE-588)170744183 (DE-588)1231483199 (DE-588)1181254078 |
author_facet | Bruce, Peter C. 1953- Bruce, Andrew Gedeck, Peter Fraaß, Marcus |
author_role | aut aut aut |
author_sort | Bruce, Peter C. 1953- |
author_variant | p c b pc pcb a b ab p g pg |
building | Verbundindex |
bvnumber | BV047207924 |
classification_rvk | SK 850 ST 300 XF 3400 ST 530 ST 601 ST 250 XC 4011 |
classification_tum | DAT 307 MAT 620 DAT 620 |
ctrlnum | (OCoLC)1249658986 (DE-599)DNB1220521876 |
discipline | Informatik Mathematik Medizin |
discipline_str_mv | Informatik Mathematik Medizin |
edition | 1. Auflage |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>00000nam a22000008c 4500</leader><controlfield tag="001">BV047207924</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20240626</controlfield><controlfield tag="007">t|</controlfield><controlfield tag="008">210322s2021 gw a||| |||| 00||| ger d</controlfield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">20,N45</subfield><subfield code="2">dnb</subfield></datafield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">1220521876</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9783960091530</subfield><subfield code="c">kart. : circa EUR 39.90 (DE), circa EUR 41.10 (AT)</subfield><subfield code="9">978-3-96009-153-0</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">3960091532</subfield><subfield code="9">3-96009-153-2</subfield></datafield><datafield tag="024" ind1="3" ind2=" "><subfield code="a">9783960091530</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)1249658986</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)DNB1220521876</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="1" ind2=" "><subfield code="a">ger</subfield><subfield code="h">eng</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE-BW</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-706</subfield><subfield code="a">DE-860</subfield><subfield code="a">DE-92</subfield><subfield code="a">DE-20</subfield><subfield code="a">DE-29T</subfield><subfield code="a">DE-1049</subfield><subfield code="a">DE-523</subfield><subfield code="a">DE-1046</subfield><subfield code="a">DE-1043</subfield><subfield code="a">DE-11</subfield><subfield code="a">DE-861</subfield><subfield code="a">DE-859</subfield><subfield code="a">DE-83</subfield><subfield code="a">DE-1102</subfield><subfield code="a">DE-703</subfield><subfield code="a">DE-573</subfield><subfield code="a">DE-188</subfield><subfield code="a">DE-M49</subfield><subfield code="a">DE-384</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">SK 850</subfield><subfield code="0">(DE-625)143263:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 300</subfield><subfield code="0">(DE-625)143650:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">XF 3400</subfield><subfield code="0">(DE-625)152765:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 530</subfield><subfield code="0">(DE-625)143679:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 601</subfield><subfield code="0">(DE-625)143682:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ST 250</subfield><subfield code="0">(DE-625)143626:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">XC 4011</subfield><subfield code="0">(DE-625)152514:12917</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 307</subfield><subfield code="2">stub</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">MAT 620</subfield><subfield code="2">stub</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">DAT 620</subfield><subfield code="2">stub</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="8">1\p</subfield><subfield code="a">004</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Bruce, Peter C.</subfield><subfield code="d">1953-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)1104275260</subfield><subfield code="4">aut</subfield></datafield><datafield tag="240" ind1="1" ind2="0"><subfield code="a">Practical statistics for data scientists</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Praktische Statistik für Data scientists</subfield><subfield code="b">50+ essenzielle Konzepte mit R und Python</subfield><subfield code="c">Peter Bruce, Andrew Bruce & Peter Gedeck ; deutsche Übersetzung von Marcus Fraaß</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">1. Auflage</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Heidelberg</subfield><subfield code="b">O'Reilly</subfield><subfield code="c">[2021]</subfield></datafield><datafield tag="264" ind1=" " ind2="4"><subfield code="c">© 2021</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">XV, 356 Seiten</subfield><subfield code="b">Illustrationen, Diagramme</subfield><subfield code="c">24 cm x 16.5 cm</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Auf dem Umschlag: "Übersetzung der 2. Auflage"</subfield></datafield><datafield tag="520" ind1="3" ind2=" "><subfield code="a">Statistische Methoden sind ein zentraler Bestandteil der Arbeit mit Daten, doch nur wenige Data Scientists haben eine formale statistische Ausbildung. In Kursen und Büchern werden die Grundlagen der Statistik allerdings selten aus der Sicht von Data Scientists behandelt. Dieses praxisorientierte Handbuch erklärt Ihnen anhand zahlreicher Beispiele in Python und R, wie Sie verschiedene statistische Methoden speziell in den Datenwissenschaften anwenden. Das Buch erläutert, welche statistischen Konzepte für die Datenwissenschaften besonders relevant sind, und zeigt Ihnen auch, wie Sie den falschen Gebrauch von statistischen Verfahren vermeiden. Wenn Sie mit R oder Python vertraut sind, ermöglicht Ihnen diese gut lesbare Referenz ein tieferes Verständnis Ihrer Daten und Sie werden Ihr Statistikwissen für die Praxis deutlich ausbauen.</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Big Data</subfield><subfield code="0">(DE-588)4802620-7</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Python</subfield><subfield code="g">Programmiersprache</subfield><subfield code="0">(DE-588)4434275-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">R</subfield><subfield code="g">Programm</subfield><subfield code="0">(DE-588)4705956-4</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Data Mining</subfield><subfield code="0">(DE-588)4428654-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Datenanalyse</subfield><subfield code="0">(DE-588)4123037-1</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Data Science</subfield><subfield code="0">(DE-588)1140936166</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Statistik</subfield><subfield code="0">(DE-588)4056995-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Statistik</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">R</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Python</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Data Science</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Algorithmen</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Big Data</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Data Mining</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Datenanalyse</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Wahrscheinlichkeit</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Machine Learning</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Unsupervised Learning</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Regression</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Datenklassifikation</subfield></datafield><datafield tag="653" ind1=" " ind2=" "><subfield code="a">Random Forest</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Data Science</subfield><subfield code="0">(DE-588)1140936166</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Big Data</subfield><subfield code="0">(DE-588)4802620-7</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="2"><subfield code="a">Statistik</subfield><subfield code="0">(DE-588)4056995-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="3"><subfield code="a">Datenanalyse</subfield><subfield code="0">(DE-588)4123037-1</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="689" ind1="1" ind2="0"><subfield code="a">Data Mining</subfield><subfield code="0">(DE-588)4428654-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="1"><subfield code="a">Datenanalyse</subfield><subfield code="0">(DE-588)4123037-1</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="2"><subfield code="a">R</subfield><subfield code="g">Programm</subfield><subfield code="0">(DE-588)4705956-4</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2="3"><subfield code="a">Python</subfield><subfield code="g">Programmiersprache</subfield><subfield code="0">(DE-588)4434275-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="1" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Bruce, Andrew</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)170744183</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Gedeck, Peter</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)1231483199</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Fraaß, Marcus</subfield><subfield code="0">(DE-588)1181254078</subfield><subfield code="4">trl</subfield></datafield><datafield tag="775" ind1="0" ind2="8"><subfield code="i">Parallele Sprachausgabe</subfield><subfield code="a">Bruce, Peter</subfield><subfield code="t">Practical statistics for data scientists</subfield><subfield code="d">O'Reilly Media Inc. : 2020</subfield><subfield code="n">englisch</subfield><subfield code="z">978-1492072942</subfield><subfield code="w">(DE-604)BV046884098</subfield></datafield><datafield tag="776" ind1="0" ind2="8"><subfield code="i">Erscheint auch als</subfield><subfield code="n">Online-Ausgabe, PDF</subfield><subfield code="z">978-3-96010-467-4</subfield></datafield><datafield tag="776" ind1="0" ind2="8"><subfield code="i">Erscheint auch als</subfield><subfield code="n">Online-Ausgabe, EPUB</subfield><subfield code="z">978-3-96010-468-1</subfield></datafield><datafield tag="776" ind1="0" ind2="8"><subfield code="i">Erscheint auch als</subfield><subfield code="n">Online-Ausgabe, MOBI</subfield><subfield code="z">978-3-96010-469-8</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">X:MVB</subfield><subfield code="q">text/html</subfield><subfield code="u">http://deposit.dnb.de/cgi-bin/dokserv?id=c18172d5062946f795b0fd43024dc0ae&prov=M&dok_var=1&dok_ext=htm</subfield><subfield code="3">Inhaltstext</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">DNB Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=032612785&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="883" ind1="1" ind2=" "><subfield code="8">1\p</subfield><subfield code="a">vlb</subfield><subfield code="d">20201030</subfield><subfield code="q">DE-101</subfield><subfield code="u">https://d-nb.info/provenance/plan#vlb</subfield></datafield><datafield tag="943" ind1="1" ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-032612785</subfield></datafield></record></collection> |
id | DE-604.BV047207924 |
illustrated | Illustrated |
index_date | 2024-07-03T16:53:13Z |
indexdate | 2025-01-30T17:03:33Z |
institution | BVB |
isbn | 9783960091530 3960091532 |
language | German English |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-032612785 |
oclc_num | 1249658986 |
open_access_boolean | |
owner | DE-706 DE-860 DE-92 DE-20 DE-29T DE-1049 DE-523 DE-1046 DE-1043 DE-11 DE-861 DE-859 DE-83 DE-1102 DE-703 DE-573 DE-188 DE-M49 DE-BY-TUM DE-384 |
owner_facet | DE-706 DE-860 DE-92 DE-20 DE-29T DE-1049 DE-523 DE-1046 DE-1043 DE-11 DE-861 DE-859 DE-83 DE-1102 DE-703 DE-573 DE-188 DE-M49 DE-BY-TUM DE-384 |
physical | XV, 356 Seiten Illustrationen, Diagramme 24 cm x 16.5 cm |
publishDate | 2021 |
publishDateSearch | 2021 |
publishDateSort | 2021 |
publisher | O'Reilly |
record_format | marc |
spelling | Bruce, Peter C. 1953- Verfasser (DE-588)1104275260 aut Practical statistics for data scientists Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python Peter Bruce, Andrew Bruce & Peter Gedeck ; deutsche Übersetzung von Marcus Fraaß 1. Auflage Heidelberg O'Reilly [2021] © 2021 XV, 356 Seiten Illustrationen, Diagramme 24 cm x 16.5 cm txt rdacontent n rdamedia nc rdacarrier Auf dem Umschlag: "Übersetzung der 2. Auflage" Statistische Methoden sind ein zentraler Bestandteil der Arbeit mit Daten, doch nur wenige Data Scientists haben eine formale statistische Ausbildung. In Kursen und Büchern werden die Grundlagen der Statistik allerdings selten aus der Sicht von Data Scientists behandelt. Dieses praxisorientierte Handbuch erklärt Ihnen anhand zahlreicher Beispiele in Python und R, wie Sie verschiedene statistische Methoden speziell in den Datenwissenschaften anwenden. Das Buch erläutert, welche statistischen Konzepte für die Datenwissenschaften besonders relevant sind, und zeigt Ihnen auch, wie Sie den falschen Gebrauch von statistischen Verfahren vermeiden. Wenn Sie mit R oder Python vertraut sind, ermöglicht Ihnen diese gut lesbare Referenz ein tieferes Verständnis Ihrer Daten und Sie werden Ihr Statistikwissen für die Praxis deutlich ausbauen. Big Data (DE-588)4802620-7 gnd rswk-swf Python Programmiersprache (DE-588)4434275-5 gnd rswk-swf R Programm (DE-588)4705956-4 gnd rswk-swf Data Mining (DE-588)4428654-5 gnd rswk-swf Datenanalyse (DE-588)4123037-1 gnd rswk-swf Data Science (DE-588)1140936166 gnd rswk-swf Statistik (DE-588)4056995-0 gnd rswk-swf Statistik R Python Data Science Algorithmen Big Data Data Mining Datenanalyse Wahrscheinlichkeit Machine Learning Unsupervised Learning Regression Datenklassifikation Random Forest Data Science (DE-588)1140936166 s Big Data (DE-588)4802620-7 s Statistik (DE-588)4056995-0 s Datenanalyse (DE-588)4123037-1 s DE-604 Data Mining (DE-588)4428654-5 s R Programm (DE-588)4705956-4 s Python Programmiersprache (DE-588)4434275-5 s Bruce, Andrew Verfasser (DE-588)170744183 aut Gedeck, Peter Verfasser (DE-588)1231483199 aut Fraaß, Marcus (DE-588)1181254078 trl Parallele Sprachausgabe Bruce, Peter Practical statistics for data scientists O'Reilly Media Inc. : 2020 englisch 978-1492072942 (DE-604)BV046884098 Erscheint auch als Online-Ausgabe, PDF 978-3-96010-467-4 Erscheint auch als Online-Ausgabe, EPUB 978-3-96010-468-1 Erscheint auch als Online-Ausgabe, MOBI 978-3-96010-469-8 X:MVB text/html http://deposit.dnb.de/cgi-bin/dokserv?id=c18172d5062946f795b0fd43024dc0ae&prov=M&dok_var=1&dok_ext=htm Inhaltstext DNB Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=032612785&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis 1\p vlb 20201030 DE-101 https://d-nb.info/provenance/plan#vlb |
spellingShingle | Bruce, Peter C. 1953- Bruce, Andrew Gedeck, Peter Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python Big Data (DE-588)4802620-7 gnd Python Programmiersprache (DE-588)4434275-5 gnd R Programm (DE-588)4705956-4 gnd Data Mining (DE-588)4428654-5 gnd Datenanalyse (DE-588)4123037-1 gnd Data Science (DE-588)1140936166 gnd Statistik (DE-588)4056995-0 gnd |
subject_GND | (DE-588)4802620-7 (DE-588)4434275-5 (DE-588)4705956-4 (DE-588)4428654-5 (DE-588)4123037-1 (DE-588)1140936166 (DE-588)4056995-0 |
title | Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python |
title_alt | Practical statistics for data scientists |
title_auth | Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python |
title_exact_search | Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python |
title_exact_search_txtP | Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python |
title_full | Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python Peter Bruce, Andrew Bruce & Peter Gedeck ; deutsche Übersetzung von Marcus Fraaß |
title_fullStr | Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python Peter Bruce, Andrew Bruce & Peter Gedeck ; deutsche Übersetzung von Marcus Fraaß |
title_full_unstemmed | Praktische Statistik für Data scientists 50+ essenzielle Konzepte mit R und Python Peter Bruce, Andrew Bruce & Peter Gedeck ; deutsche Übersetzung von Marcus Fraaß |
title_short | Praktische Statistik für Data scientists |
title_sort | praktische statistik fur data scientists 50 essenzielle konzepte mit r und python |
title_sub | 50+ essenzielle Konzepte mit R und Python |
topic | Big Data (DE-588)4802620-7 gnd Python Programmiersprache (DE-588)4434275-5 gnd R Programm (DE-588)4705956-4 gnd Data Mining (DE-588)4428654-5 gnd Datenanalyse (DE-588)4123037-1 gnd Data Science (DE-588)1140936166 gnd Statistik (DE-588)4056995-0 gnd |
topic_facet | Big Data Python Programmiersprache R Programm Data Mining Datenanalyse Data Science Statistik |
url | http://deposit.dnb.de/cgi-bin/dokserv?id=c18172d5062946f795b0fd43024dc0ae&prov=M&dok_var=1&dok_ext=htm http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=032612785&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT brucepeterc practicalstatisticsfordatascientists AT bruceandrew practicalstatisticsfordatascientists AT gedeckpeter practicalstatisticsfordatascientists AT fraaßmarcus practicalstatisticsfordatascientists AT brucepeterc praktischestatistikfurdatascientists50essenziellekonzeptemitrundpython AT bruceandrew praktischestatistikfurdatascientists50essenziellekonzeptemitrundpython AT gedeckpeter praktischestatistikfurdatascientists50essenziellekonzeptemitrundpython AT fraaßmarcus praktischestatistikfurdatascientists50essenziellekonzeptemitrundpython |