Visualisierung von mehrdimensionalen Clustern

Autor
K. Helml
Masterarbeit
MT0409 (November, 2004)
Betreut von
o. Univ.-Prof. Dr. Michael Schrefl
Angeleitet von
Dipl.-Wirtsch.-Inf. Mathias Goller
Ausgeführt an
Universität Linz, Institut für Wirtschaftsinformatik - Data & Knowledge Engineering

Kurzfassung (Englisch)

Data-mining methods like clustering mainly create multidimensional data which is repre-sented as text. In most cases text-based representations lack a need of understandability. Thus it is recommended to use visual data preparation and information visualization techniques to overcome this circumstance. Whensoever there is too little information about data available and the processing goals are rather dim human interaction is needed.

Therefore visualization techniques are used for data preparation in order to make them more understandable. Human interaction during the visualization process leads to individual and better results.

This work’s objective is to evaluate existing visualization techniques concerning their ability to represent clustering results. Because of the multitude of visualization techniques an ade-quate method was chosen from each of the four big domains of data visualization.

Kurzfassung (Deutsch)

Durch Data Mining Verfahren, wie Clustering, werden vor allem multidimensionale Daten generiert, die hauptsächlich in textueller Form dargestellt werden. Für den Menschen ist diese textuelle Darstellung meist unverständlich, weshalb eine visuelle Datenaufbereitung sowie Informationsvisualisierungstechniken empfohlen werden. Immer dann, wenn man über zu wenig Wissen über die Daten verfügt und die Aufbereitungsziele zu vage sind, um sie von automatischen Verfahren zu generieren, ist die Interaktion des Menschen notwendig.

Daher existieren Visualisierungstechniken, um diese für die Menschen besser aufzubereiten. Der Mensch wird auch gleichzeitig in die Darstellung involviert, was individuelle und vor allem bessere Ergebnisse für den Einzelnen zur Folge hat.

Das Ziel dieser Arbeit ist nun, die vorhandenen Visualisierungstechniken im Hinblick auf deren Eignung zur Visualisierung von Clustern anhand eines Kriterienkatalogs zu bewerten. Aufgrund der Vielzahl der Visualisierungstechniken wurde aus jeder der vier großen Bereiche (Geometrische Transformationen, Iconbasierte Techniken, Pixelbasierte Techniken und Hierarchische Techniken) jeweils eine geeignete und repräsentative Visualisierungstechnik ausgewählt und evaluiert.