Visualisierung von mehrdimensionalen Clustern

Author
K. Helml
Master Thesis
MT0409 (November, 2004)
Supervised by
o. Univ.-Prof. Dr. Michael Schrefl
Instructed by
Dipl.-Wirtsch.-Inf. Mathias Goller
Accomplished at
University Linz, Institute of Business Informatics - Data & Knowledge Engineering

Abstract (English)

Data-mining methods like clustering mainly create multidimensional data which is repre-sented as text. In most cases text-based representations lack a need of understandability. Thus it is recommended to use visual data preparation and information visualization techniques to overcome this circumstance. Whensoever there is too little information about data available and the processing goals are rather dim human interaction is needed.

Therefore visualization techniques are used for data preparation in order to make them more understandable. Human interaction during the visualization process leads to individual and better results.

This work’s objective is to evaluate existing visualization techniques concerning their ability to represent clustering results. Because of the multitude of visualization techniques an ade-quate method was chosen from each of the four big domains of data visualization.

Abstract (German)

Durch Data Mining Verfahren, wie Clustering, werden vor allem multidimensionale Daten generiert, die hauptsächlich in textueller Form dargestellt werden. Für den Menschen ist diese textuelle Darstellung meist unverständlich, weshalb eine visuelle Datenaufbereitung sowie Informationsvisualisierungstechniken empfohlen werden. Immer dann, wenn man über zu wenig Wissen über die Daten verfügt und die Aufbereitungsziele zu vage sind, um sie von automatischen Verfahren zu generieren, ist die Interaktion des Menschen notwendig.

Daher existieren Visualisierungstechniken, um diese für die Menschen besser aufzubereiten. Der Mensch wird auch gleichzeitig in die Darstellung involviert, was individuelle und vor allem bessere Ergebnisse für den Einzelnen zur Folge hat.

Das Ziel dieser Arbeit ist nun, die vorhandenen Visualisierungstechniken im Hinblick auf deren Eignung zur Visualisierung von Clustern anhand eines Kriterienkatalogs zu bewerten. Aufgrund der Vielzahl der Visualisierungstechniken wurde aus jeder der vier großen Bereiche (Geometrische Transformationen, Iconbasierte Techniken, Pixelbasierte Techniken und Hierarchische Techniken) jeweils eine geeignete und repräsentative Visualisierungstechnik ausgewählt und evaluiert.