Hierarchisches Clustering
Merke
Das hierarchische Clustering gruppiert (gruppiert) Daten in verschieden viele Gruppen (Cluster), sodass man am Ende auswählen kann, welche Anzahl an Clustern sinnvoll sind.
Social Media und Fitness
Folgendes Video versucht Menschen anhand ihrer Nutzungszeiten von Social Media und wie oft sie ins Fitnessstudio gehen zu gruppieren:
Koalasichtungen in Großstädten
Du hast ein neues soziales Netzwerk für Koalasichtungen in Großstädten gegründet. Nutzende können Fotos posten und liken. Für deine ersten 5 Nutzer:innen hast du zusammengezählt, wie sie sich verhalten haben:
Posts | Likes | |
---|---|---|
Emma | 4 | 5 |
Milan | 1 | 1 |
Ida | 4 | 2 |
Liam | 1 | 4 |
Charlie | 3 | 1 |
Sofia | 1 | 3 |
und hier visualisiert:
Aufgabe
Führe das hierarchische Clustering dreimal mit dem euklidischen Abstand und dem Average Linkage durch. Du kannst gern ein Tabellenkalkulationsprogramm nehmen.
Aufgabe
Werte die Daten aus:
a) Wie würdest du die gefundenen Cluster beschriften?
b) Wie sicher sind die Cluster-Beschriftungen?
c) Welches drittes Merkmal würdest du für bessere Cluster gern hinzufügen?