Gruppierung von Daten: topologische Verfahren vs. Clusteranalyse
Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierz...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Elektronisch E-Book |
Sprache: | German |
Veröffentlicht: |
Potsdam
Universität Potsdam
2022
|
Schriftenreihe: | Statistische Diskussionsbeiträge
Nr. 55 |
Schlagworte: | |
Online-Zugang: | Volltext Volltext kostenfrei kostenfrei kostenfrei kostenfrei |
Zusammenfassung: | Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierzu werden zwei empirische Datensätze aus der Biologie und Medizin herangezogen. Zusammengefasst haben sich die Verfahren der TDA als ein praktikables Werkzeug bei der Gruppierung von Objekten erwiesen. Vor allem mit dem Mapper-Algorithmus konnten adäquate Cluster erkannt werden. Beim Iris Flower-Datensatz hat die TDA ähnliche Ergebnisse wie die Clusteranalyse erzielt. Der Heart Disease-Datensatz war schwieriger zu behandeln. Die genutzten clusteranalytischen Verfahren waren nicht geeignet, die beiden Gruppen von Patienten korrekt zu identifizieren. Im Vergleich zu den Standardverfahren der Clusteranalyse zeigte sich eine leichte Überlegenheit der topologischen Verfahren. This paper includes a comparison between Topological Data Analysis (TDA) methods and statistical clustering methods in grouping data. Similarities and differences in the formation of clusters and assignment of statistical units are identified. Two empirical data sets from biology and medicine are used for this purpose. In summary, the procedures of TDA have proven to be a viable tool in grouping objects. Especially with the mapper algorithm adequate clusters could be detected. For the Iris Flower-dataset, TDA produced similar results to cluster analysis. The Heart Disease-dataset was more difficult to deal with. The used cluster analytic techniques are not capable of correctly identifying the two groups of patients. Compared with the standard cluster analysis methods, the topological procedures showed a slight superiority. |
Beschreibung: | 1 Online-Ressource (26 Seiten, 1366 KB) Illustrationen |
DOI: | 10.25932/publishup-57272 |
Internformat
MARC
LEADER | 00000nmm a2200000 cb4500 | ||
---|---|---|---|
001 | BV049026614 | ||
003 | DE-604 | ||
005 | 00000000000000.0 | ||
007 | cr|uuu---uuuuu | ||
008 | 230629s2022 gw |||| o||u| ||||||ger d | ||
024 | 7 | |a 10.25932/publishup-57272 |2 doi | |
024 | 7 | |a urn:nbn:de:kobv:517-opus4-572722 |2 urn | |
035 | |a (DE-599)KXP1830417177 | ||
040 | |a DE-604 |b ger |e rda | ||
041 | 0 | |a ger | |
044 | |a gw |c XA-DE-BB | ||
049 | |a DE-M382 | ||
100 | 1 | |a Nastansky, Andreas |d 1979- |e Verfasser |0 (DE-588)129641472 |4 aut | |
245 | 1 | 0 | |a Gruppierung von Daten |b topologische Verfahren vs. Clusteranalyse |c Andreas Nastansky |
264 | 1 | |a Potsdam |b Universität Potsdam |c 2022 | |
300 | |a 1 Online-Ressource (26 Seiten, 1366 KB) |b Illustrationen | ||
336 | |b txt |2 rdacontent | ||
337 | |b c |2 rdamedia | ||
338 | |b cr |2 rdacarrier | ||
490 | 0 | |a Statistische Diskussionsbeiträge |v Nr. 55 | |
520 | 3 | |a Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierzu werden zwei empirische Datensätze aus der Biologie und Medizin herangezogen. Zusammengefasst haben sich die Verfahren der TDA als ein praktikables Werkzeug bei der Gruppierung von Objekten erwiesen. Vor allem mit dem Mapper-Algorithmus konnten adäquate Cluster erkannt werden. Beim Iris Flower-Datensatz hat die TDA ähnliche Ergebnisse wie die Clusteranalyse erzielt. Der Heart Disease-Datensatz war schwieriger zu behandeln. Die genutzten clusteranalytischen Verfahren waren nicht geeignet, die beiden Gruppen von Patienten korrekt zu identifizieren. Im Vergleich zu den Standardverfahren der Clusteranalyse zeigte sich eine leichte Überlegenheit der topologischen Verfahren. | |
520 | 3 | |a This paper includes a comparison between Topological Data Analysis (TDA) methods and statistical clustering methods in grouping data. Similarities and differences in the formation of clusters and assignment of statistical units are identified. Two empirical data sets from biology and medicine are used for this purpose. In summary, the procedures of TDA have proven to be a viable tool in grouping objects. Especially with the mapper algorithm adequate clusters could be detected. For the Iris Flower-dataset, TDA produced similar results to cluster analysis. The Heart Disease-dataset was more difficult to deal with. The used cluster analytic techniques are not capable of correctly identifying the two groups of patients. Compared with the standard cluster analysis methods, the topological procedures showed a slight superiority. | |
653 | 0 | |a Clusteranalyse | |
653 | 0 | |a Mapper | |
653 | 0 | |a Persistente Homologie | |
653 | 0 | |a Topologische Datenanalyse | |
653 | 6 | |a Graue Literatur | |
655 | 7 | |0 (DE-588)4155043-2 |a Forschungsbericht |2 gnd-content | |
710 | 2 | |a Universitätsverlag Potsdam |0 (DE-588)1068096934 |4 pbl | |
856 | 4 | 0 | |u https://nbn-resolving.org/urn:nbn:de:kobv:517-opus4-572722 |x Resolving-System |z kostenfrei |3 Volltext |
856 | 4 | 0 | |u https://doi.org/10.25932/publishup-57272 |x Resolving-System |z kostenfrei |3 Volltext |
856 | 4 | 0 | |u https://publishup.uni-potsdam.de/opus4-ubp/files/57272/statdisk55.pdf |x Verlag |z kostenfrei |
856 | 4 | 0 | |u https://nbn-resolving.org/urn:nbn:de:kobv:517-opus4-572722 |x Resolving-System |z kostenfrei |
856 | 4 | 0 | |u https://d-nb.info/1277142033/34 |x Langzeitarchivierung Nationalbibliothek |z kostenfrei |
856 | 4 | 0 | |q application/pdf |u https://publishup.uni-potsdam.de/frontdoor/index/index/docId/57272 |x Verlag |z kostenfrei |
999 | |a oai:aleph.bib-bvb.de:BVB01-034289407 |
Datensatz im Suchindex
_version_ | 1804185307780743168 |
---|---|
adam_txt | |
any_adam_object | |
any_adam_object_boolean | |
author | Nastansky, Andreas 1979- |
author_GND | (DE-588)129641472 |
author_facet | Nastansky, Andreas 1979- |
author_role | aut |
author_sort | Nastansky, Andreas 1979- |
author_variant | a n an |
building | Verbundindex |
bvnumber | BV049026614 |
ctrlnum | (DE-599)KXP1830417177 |
doi_str_mv | 10.25932/publishup-57272 |
format | Electronic eBook |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>03720nmm a2200457 cb4500</leader><controlfield tag="001">BV049026614</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">00000000000000.0</controlfield><controlfield tag="007">cr|uuu---uuuuu</controlfield><controlfield tag="008">230629s2022 gw |||| o||u| ||||||ger d</controlfield><datafield tag="024" ind1="7" ind2=" "><subfield code="a">10.25932/publishup-57272</subfield><subfield code="2">doi</subfield></datafield><datafield tag="024" ind1="7" ind2=" "><subfield code="a">urn:nbn:de:kobv:517-opus4-572722</subfield><subfield code="2">urn</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)KXP1830417177</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE-BB</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-M382</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Nastansky, Andreas</subfield><subfield code="d">1979-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)129641472</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Gruppierung von Daten</subfield><subfield code="b">topologische Verfahren vs. Clusteranalyse</subfield><subfield code="c">Andreas Nastansky</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Potsdam</subfield><subfield code="b">Universität Potsdam</subfield><subfield code="c">2022</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">1 Online-Ressource (26 Seiten, 1366 KB)</subfield><subfield code="b">Illustrationen</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">c</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">cr</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="0" ind2=" "><subfield code="a">Statistische Diskussionsbeiträge</subfield><subfield code="v">Nr. 55</subfield></datafield><datafield tag="520" ind1="3" ind2=" "><subfield code="a">Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierzu werden zwei empirische Datensätze aus der Biologie und Medizin herangezogen. Zusammengefasst haben sich die Verfahren der TDA als ein praktikables Werkzeug bei der Gruppierung von Objekten erwiesen. Vor allem mit dem Mapper-Algorithmus konnten adäquate Cluster erkannt werden. Beim Iris Flower-Datensatz hat die TDA ähnliche Ergebnisse wie die Clusteranalyse erzielt. Der Heart Disease-Datensatz war schwieriger zu behandeln. Die genutzten clusteranalytischen Verfahren waren nicht geeignet, die beiden Gruppen von Patienten korrekt zu identifizieren. Im Vergleich zu den Standardverfahren der Clusteranalyse zeigte sich eine leichte Überlegenheit der topologischen Verfahren.</subfield></datafield><datafield tag="520" ind1="3" ind2=" "><subfield code="a">This paper includes a comparison between Topological Data Analysis (TDA) methods and statistical clustering methods in grouping data. Similarities and differences in the formation of clusters and assignment of statistical units are identified. Two empirical data sets from biology and medicine are used for this purpose. In summary, the procedures of TDA have proven to be a viable tool in grouping objects. Especially with the mapper algorithm adequate clusters could be detected. For the Iris Flower-dataset, TDA produced similar results to cluster analysis. The Heart Disease-dataset was more difficult to deal with. The used cluster analytic techniques are not capable of correctly identifying the two groups of patients. Compared with the standard cluster analysis methods, the topological procedures showed a slight superiority.</subfield></datafield><datafield tag="653" ind1=" " ind2="0"><subfield code="a">Clusteranalyse</subfield></datafield><datafield tag="653" ind1=" " ind2="0"><subfield code="a">Mapper</subfield></datafield><datafield tag="653" ind1=" " ind2="0"><subfield code="a">Persistente Homologie</subfield></datafield><datafield tag="653" ind1=" " ind2="0"><subfield code="a">Topologische Datenanalyse</subfield></datafield><datafield tag="653" ind1=" " ind2="6"><subfield code="a">Graue Literatur</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4155043-2</subfield><subfield code="a">Forschungsbericht</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="710" ind1="2" ind2=" "><subfield code="a">Universitätsverlag Potsdam</subfield><subfield code="0">(DE-588)1068096934</subfield><subfield code="4">pbl</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://nbn-resolving.org/urn:nbn:de:kobv:517-opus4-572722</subfield><subfield code="x">Resolving-System</subfield><subfield code="z">kostenfrei</subfield><subfield code="3">Volltext</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://doi.org/10.25932/publishup-57272</subfield><subfield code="x">Resolving-System</subfield><subfield code="z">kostenfrei</subfield><subfield code="3">Volltext</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://publishup.uni-potsdam.de/opus4-ubp/files/57272/statdisk55.pdf</subfield><subfield code="x">Verlag</subfield><subfield code="z">kostenfrei</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://nbn-resolving.org/urn:nbn:de:kobv:517-opus4-572722</subfield><subfield code="x">Resolving-System</subfield><subfield code="z">kostenfrei</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="u">https://d-nb.info/1277142033/34</subfield><subfield code="x">Langzeitarchivierung Nationalbibliothek</subfield><subfield code="z">kostenfrei</subfield></datafield><datafield tag="856" ind1="4" ind2="0"><subfield code="q">application/pdf</subfield><subfield code="u">https://publishup.uni-potsdam.de/frontdoor/index/index/docId/57272</subfield><subfield code="x">Verlag</subfield><subfield code="z">kostenfrei</subfield></datafield><datafield tag="999" ind1=" " ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-034289407</subfield></datafield></record></collection> |
genre | (DE-588)4155043-2 Forschungsbericht gnd-content |
genre_facet | Forschungsbericht |
id | DE-604.BV049026614 |
illustrated | Not Illustrated |
index_date | 2024-07-03T22:15:16Z |
indexdate | 2024-07-10T09:53:10Z |
institution | BVB |
institution_GND | (DE-588)1068096934 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-034289407 |
open_access_boolean | 1 |
owner | DE-M382 |
owner_facet | DE-M382 |
physical | 1 Online-Ressource (26 Seiten, 1366 KB) Illustrationen |
publishDate | 2022 |
publishDateSearch | 2022 |
publishDateSort | 2022 |
publisher | Universität Potsdam |
record_format | marc |
series2 | Statistische Diskussionsbeiträge |
spelling | Nastansky, Andreas 1979- Verfasser (DE-588)129641472 aut Gruppierung von Daten topologische Verfahren vs. Clusteranalyse Andreas Nastansky Potsdam Universität Potsdam 2022 1 Online-Ressource (26 Seiten, 1366 KB) Illustrationen txt rdacontent c rdamedia cr rdacarrier Statistische Diskussionsbeiträge Nr. 55 Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierzu werden zwei empirische Datensätze aus der Biologie und Medizin herangezogen. Zusammengefasst haben sich die Verfahren der TDA als ein praktikables Werkzeug bei der Gruppierung von Objekten erwiesen. Vor allem mit dem Mapper-Algorithmus konnten adäquate Cluster erkannt werden. Beim Iris Flower-Datensatz hat die TDA ähnliche Ergebnisse wie die Clusteranalyse erzielt. Der Heart Disease-Datensatz war schwieriger zu behandeln. Die genutzten clusteranalytischen Verfahren waren nicht geeignet, die beiden Gruppen von Patienten korrekt zu identifizieren. Im Vergleich zu den Standardverfahren der Clusteranalyse zeigte sich eine leichte Überlegenheit der topologischen Verfahren. This paper includes a comparison between Topological Data Analysis (TDA) methods and statistical clustering methods in grouping data. Similarities and differences in the formation of clusters and assignment of statistical units are identified. Two empirical data sets from biology and medicine are used for this purpose. In summary, the procedures of TDA have proven to be a viable tool in grouping objects. Especially with the mapper algorithm adequate clusters could be detected. For the Iris Flower-dataset, TDA produced similar results to cluster analysis. The Heart Disease-dataset was more difficult to deal with. The used cluster analytic techniques are not capable of correctly identifying the two groups of patients. Compared with the standard cluster analysis methods, the topological procedures showed a slight superiority. Clusteranalyse Mapper Persistente Homologie Topologische Datenanalyse Graue Literatur (DE-588)4155043-2 Forschungsbericht gnd-content Universitätsverlag Potsdam (DE-588)1068096934 pbl https://nbn-resolving.org/urn:nbn:de:kobv:517-opus4-572722 Resolving-System kostenfrei Volltext https://doi.org/10.25932/publishup-57272 Resolving-System kostenfrei Volltext https://publishup.uni-potsdam.de/opus4-ubp/files/57272/statdisk55.pdf Verlag kostenfrei https://nbn-resolving.org/urn:nbn:de:kobv:517-opus4-572722 Resolving-System kostenfrei https://d-nb.info/1277142033/34 Langzeitarchivierung Nationalbibliothek kostenfrei application/pdf https://publishup.uni-potsdam.de/frontdoor/index/index/docId/57272 Verlag kostenfrei |
spellingShingle | Nastansky, Andreas 1979- Gruppierung von Daten topologische Verfahren vs. Clusteranalyse |
subject_GND | (DE-588)4155043-2 |
title | Gruppierung von Daten topologische Verfahren vs. Clusteranalyse |
title_auth | Gruppierung von Daten topologische Verfahren vs. Clusteranalyse |
title_exact_search | Gruppierung von Daten topologische Verfahren vs. Clusteranalyse |
title_exact_search_txtP | Gruppierung von Daten topologische Verfahren vs. Clusteranalyse |
title_full | Gruppierung von Daten topologische Verfahren vs. Clusteranalyse Andreas Nastansky |
title_fullStr | Gruppierung von Daten topologische Verfahren vs. Clusteranalyse Andreas Nastansky |
title_full_unstemmed | Gruppierung von Daten topologische Verfahren vs. Clusteranalyse Andreas Nastansky |
title_short | Gruppierung von Daten |
title_sort | gruppierung von daten topologische verfahren vs clusteranalyse |
title_sub | topologische Verfahren vs. Clusteranalyse |
topic_facet | Forschungsbericht |
url | https://nbn-resolving.org/urn:nbn:de:kobv:517-opus4-572722 https://doi.org/10.25932/publishup-57272 https://publishup.uni-potsdam.de/opus4-ubp/files/57272/statdisk55.pdf https://d-nb.info/1277142033/34 https://publishup.uni-potsdam.de/frontdoor/index/index/docId/57272 |
work_keys_str_mv | AT nastanskyandreas gruppierungvondatentopologischeverfahrenvsclusteranalyse AT universitatsverlagpotsdam gruppierungvondatentopologischeverfahrenvsclusteranalyse |