"Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup":
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Buch |
Sprache: | German |
Veröffentlicht: |
Stralsund
Fachhochsch.
2007
|
Schriftenreihe: | Diskussionsbeiträge / Fachhochschule Stralsund, Fachbereich Wirtschaft
24 |
Schlagworte: | |
Online-Zugang: | Inhaltsverzeichnis |
Beschreibung: | 50, 5 S. |
Internformat
MARC
LEADER | 00000nam a2200000zcb4500 | ||
---|---|---|---|
001 | BV022355997 | ||
003 | DE-604 | ||
005 | 20070410 | ||
007 | t | ||
008 | 070319s2007 |||| 00||| ger d | ||
016 | 7 | |a 98330520X |2 DE-101 | |
035 | |a (OCoLC)162422482 | ||
035 | |a (DE-599)DNB98330520X | ||
040 | |a DE-604 |b ger | ||
041 | 0 | |a ger | |
049 | |a DE-12 | ||
082 | 0 | |a 005.74 |2 22/ger | |
084 | |a 004 |2 sdnb | ||
100 | 1 | |a Deutschmann, Christel |e Verfasser |4 aut | |
245 | 1 | 0 | |a "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" |c von Christel Deutschmann |
264 | 1 | |a Stralsund |b Fachhochsch. |c 2007 | |
300 | |a 50, 5 S. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 1 | |a Diskussionsbeiträge / Fachhochschule Stralsund, Fachbereich Wirtschaft |v 24 | |
650 | 0 | 7 | |a Data Mining |0 (DE-588)4428654-5 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Vorverarbeitung |0 (DE-588)4403014-9 |2 gnd |9 rswk-swf |
689 | 0 | 0 | |a Data Mining |0 (DE-588)4428654-5 |D s |
689 | 0 | 1 | |a Vorverarbeitung |0 (DE-588)4403014-9 |D s |
689 | 0 | |5 DE-604 | |
810 | 2 | |a Fachhochschule Stralsund, Fachbereich Wirtschaft |t Diskussionsbeiträge |v 24 |w (DE-604)BV011738375 |9 24 | |
856 | 4 | 2 | |m HBZ Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=015565408&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
999 | |a oai:aleph.bib-bvb.de:BVB01-015565408 |
Datensatz im Suchindex
_version_ | 1804136402424692736 |
---|---|
adam_text | Inhaltsverzeichnis
1 Einleitung 3
2 Methoden zur Datenvorverarbeitung 4
2.1 Methoden zur Behandlung fehlender Werte 4
2.1.1 Streichung der Datensätze mit fehlenden Werten 4
2.1.2 Ersetzen durch mittlere Werte 4
2.1.3 Ersetzung von Fehlwerten durch Werte aus individuellen Schätzgleichungen. 5
2.1.4 Erfassung der Fehlwerte als zusätzliche Merkmalsausprägung 5
2.2 Datentransformationen 5
2.2.1 Umkodierung 6
2.2.2 Binärkodierung 6
2.2.3 Allgemeine Kategorisierung 6
2.2.4 Binning 7
2.3 Einfluss von „Data Preparation auf die Auswahl wesentlicher Einflussgrößen 7
3 Kennziffern zur Beurteilung der Klassifikationsgüte 8
4 Anwendung der Methoden auf einen Datensatz aus dem Data Mining Cup 2000 9
4.1 Beschreibung der Aufgabenstellung und der vorhandenen Daten 9
4.2 Erforderliche Datenvorverarbeitung 10
4.2.1 Streichung der fehlenden Werte im Datensatz 11
4.2.2 Ersetzung fehlender Werte im Datensatz 12
4.2.3 Datentransformationen im Datensatz 13
4.3 Modellierung unter den verschiedenen Prämissen 14
4.3.1 Ergebnisse generierter Modelle bei verschiedenen Methoden der Behandlung
von Fehlwerten 14
4.3.2 Ergebnisse nach Datentransformationen 16
4.3.3 Einfluss der Platzierung des Merkmalsauswahlknotens 19
4.4 Diskussion der Ergebnisse betreffend das Datenbeispiel Data Mining Cup 2000... 23
5 Anwendung der Methoden auf einen Datensatz aus dem Data Mining Cup 2004 28
5.1 Beschreibung der Aufgabenstellung und der vorhandenen Daten 28
5.2 Erforderliche Datenvorverarbeitung 28
5.2.1 Behandlung der fehlenden Werte im Datensatz 29
5.2.2 Datentransformationen im Datensatz 30
5.2.3 Einfluss der Platzierung des Merkmalsauswahlknotens 33
5.2.4 Diskussion der Ergebnisse für das Datenbeispiel Data Mining Cup 2004 38
6 Zusammenfassung und Schlussfolgerungen 41
Literatur und Datenquellenverzeichnis 44
Literatur . 44
Datenquellen 44
Tabellenverzeichnis 45
Anhang 1 47
Anhang 2 49
|
adam_txt |
Inhaltsverzeichnis
1 Einleitung 3
2 Methoden zur Datenvorverarbeitung 4
2.1 Methoden zur Behandlung fehlender Werte 4
2.1.1 Streichung der Datensätze mit fehlenden Werten 4
2.1.2 Ersetzen durch mittlere Werte 4
2.1.3 Ersetzung von Fehlwerten durch Werte aus individuellen Schätzgleichungen. 5
2.1.4 Erfassung der Fehlwerte als zusätzliche Merkmalsausprägung 5
2.2 Datentransformationen 5
2.2.1 Umkodierung 6
2.2.2 Binärkodierung 6
2.2.3 Allgemeine Kategorisierung 6
2.2.4 Binning 7
2.3 Einfluss von „Data Preparation" auf die Auswahl wesentlicher Einflussgrößen 7
3 Kennziffern zur Beurteilung der Klassifikationsgüte 8
4 Anwendung der Methoden auf einen Datensatz aus dem Data Mining Cup 2000 9
4.1 Beschreibung der Aufgabenstellung und der vorhandenen Daten 9
4.2 Erforderliche Datenvorverarbeitung 10
4.2.1 Streichung der fehlenden Werte im Datensatz 11
4.2.2 Ersetzung fehlender Werte im Datensatz 12
4.2.3 Datentransformationen im Datensatz 13
4.3 Modellierung unter den verschiedenen Prämissen 14
4.3.1 Ergebnisse generierter Modelle bei verschiedenen Methoden der Behandlung
von Fehlwerten 14
4.3.2 Ergebnisse nach Datentransformationen 16
4.3.3 Einfluss der Platzierung des Merkmalsauswahlknotens 19
4.4 Diskussion der Ergebnisse betreffend das Datenbeispiel Data Mining Cup 2000. 23
5 Anwendung der Methoden auf einen Datensatz aus dem Data Mining Cup 2004 28
5.1 Beschreibung der Aufgabenstellung und der vorhandenen Daten 28
5.2 Erforderliche Datenvorverarbeitung 28
5.2.1 Behandlung der fehlenden Werte im Datensatz 29
5.2.2 Datentransformationen im Datensatz 30
5.2.3 Einfluss der Platzierung des Merkmalsauswahlknotens 33
5.2.4 Diskussion der Ergebnisse für das Datenbeispiel Data Mining Cup 2004 38
6 Zusammenfassung und Schlussfolgerungen 41
Literatur und Datenquellenverzeichnis 44
Literatur . 44
Datenquellen 44
Tabellenverzeichnis 45
Anhang 1 47
Anhang 2 49 |
any_adam_object | 1 |
any_adam_object_boolean | 1 |
author | Deutschmann, Christel |
author_facet | Deutschmann, Christel |
author_role | aut |
author_sort | Deutschmann, Christel |
author_variant | c d cd |
building | Verbundindex |
bvnumber | BV022355997 |
ctrlnum | (OCoLC)162422482 (DE-599)DNB98330520X |
dewey-full | 005.74 |
dewey-hundreds | 000 - Computer science, information, general works |
dewey-ones | 005 - Computer programming, programs, data, security |
dewey-raw | 005.74 |
dewey-search | 005.74 |
dewey-sort | 15.74 |
dewey-tens | 000 - Computer science, information, general works |
discipline | Informatik |
discipline_str_mv | Informatik |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01545nam a2200373zcb4500</leader><controlfield tag="001">BV022355997</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20070410 </controlfield><controlfield tag="007">t</controlfield><controlfield tag="008">070319s2007 |||| 00||| ger d</controlfield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">98330520X</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)162422482</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)DNB98330520X</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-12</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">005.74</subfield><subfield code="2">22/ger</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">004</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Deutschmann, Christel</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">"Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup"</subfield><subfield code="c">von Christel Deutschmann</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Stralsund</subfield><subfield code="b">Fachhochsch.</subfield><subfield code="c">2007</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">50, 5 S.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Diskussionsbeiträge / Fachhochschule Stralsund, Fachbereich Wirtschaft</subfield><subfield code="v">24</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Data Mining</subfield><subfield code="0">(DE-588)4428654-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Vorverarbeitung</subfield><subfield code="0">(DE-588)4403014-9</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Data Mining</subfield><subfield code="0">(DE-588)4428654-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Vorverarbeitung</subfield><subfield code="0">(DE-588)4403014-9</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="810" ind1="2" ind2=" "><subfield code="a">Fachhochschule Stralsund, Fachbereich Wirtschaft</subfield><subfield code="t">Diskussionsbeiträge</subfield><subfield code="v">24</subfield><subfield code="w">(DE-604)BV011738375</subfield><subfield code="9">24</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">HBZ Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=015565408&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-015565408</subfield></datafield></record></collection> |
id | DE-604.BV022355997 |
illustrated | Not Illustrated |
index_date | 2024-07-02T17:01:30Z |
indexdate | 2024-07-09T20:55:50Z |
institution | BVB |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-015565408 |
oclc_num | 162422482 |
open_access_boolean | |
owner | DE-12 |
owner_facet | DE-12 |
physical | 50, 5 S. |
publishDate | 2007 |
publishDateSearch | 2007 |
publishDateSort | 2007 |
publisher | Fachhochsch. |
record_format | marc |
series2 | Diskussionsbeiträge / Fachhochschule Stralsund, Fachbereich Wirtschaft |
spelling | Deutschmann, Christel Verfasser aut "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" von Christel Deutschmann Stralsund Fachhochsch. 2007 50, 5 S. txt rdacontent n rdamedia nc rdacarrier Diskussionsbeiträge / Fachhochschule Stralsund, Fachbereich Wirtschaft 24 Data Mining (DE-588)4428654-5 gnd rswk-swf Vorverarbeitung (DE-588)4403014-9 gnd rswk-swf Data Mining (DE-588)4428654-5 s Vorverarbeitung (DE-588)4403014-9 s DE-604 Fachhochschule Stralsund, Fachbereich Wirtschaft Diskussionsbeiträge 24 (DE-604)BV011738375 24 HBZ Datenaustausch application/pdf http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=015565408&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA Inhaltsverzeichnis |
spellingShingle | Deutschmann, Christel "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" Data Mining (DE-588)4428654-5 gnd Vorverarbeitung (DE-588)4403014-9 gnd |
subject_GND | (DE-588)4428654-5 (DE-588)4403014-9 |
title | "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" |
title_auth | "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" |
title_exact_search | "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" |
title_exact_search_txtP | "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" |
title_full | "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" von Christel Deutschmann |
title_fullStr | "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" von Christel Deutschmann |
title_full_unstemmed | "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" von Christel Deutschmann |
title_short | "Einfluss von 'Data Preparation' auf Klassifikationsmodelle, dargestellt anhand von Beispieldatensätzen aus dem Data Mining Cup" |
title_sort | einfluss von data preparation auf klassifikationsmodelle dargestellt anhand von beispieldatensatzen aus dem data mining cup |
topic | Data Mining (DE-588)4428654-5 gnd Vorverarbeitung (DE-588)4403014-9 gnd |
topic_facet | Data Mining Vorverarbeitung |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=015565408&sequence=000002&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
volume_link | (DE-604)BV011738375 |
work_keys_str_mv | AT deutschmannchristel einflussvondatapreparationaufklassifikationsmodelledargestelltanhandvonbeispieldatensatzenausdemdataminingcup |