Grafisches Werkzeug zur Integration von Data Marts

Author
L. Maislinger
Master Thesis
MT0901 (April, 2009)
Supervised by
o. Univ.-Prof. Dr. Michael Schrefl
Instructed by
Mag. Stefan Berger
Accomplished at
University Linz, Institute of Business Informatics - Data & Knowledge Engineering
Resources
Copy

Abstract (English)

In times of globalization a constant increase in the number of mergers and acquisitions among companies can be observed. This leads to a growing demand on cross-Data Warehouse analy-sis. Due to the fact that there is no central authority for managing Data Warehouses, the appli-cation of federate Data Warehouses is suitable. A federate Data Warehouse uses a “virtual Cube” in form of a global schema to allow transparent access to the various Data Warehouses. A prerequisite for this cross-Data Warehouse access is the removal of existing heterogeneities. In order to achieve this, the query language SQL-MDi is used.

The goal of this thesis is implementing a tool for integrating data marts and designing a global schema. Thus the tool is a part of a federated Data Warehouse System. Its basic task is to pro-vide the data needed to execute the query process of the SQL-MDi Query Parser and the SQL-MDi Query Processor. Hence the heterogeneities among the various data marts have to be eliminated. The tool was implemented as an Eclipse Plug-in. Furthermore the standardized frameworks of eclipse, like EMF or GEF, were used for the implementation of the tool. The usage of EMF induces a model driven architecture approach. Special attention was given to usability of the graphical user interface.

Abstract (German)

In Zeiten der Globalisierung steigt die Zahl der Unternehmenszusammenschlüsse- und koope-rationen stetig an. Dies erfordert oftmals Data Warehouse übergreifende Analysen. Aufgrund einer fehlenden zentralen Instanz zur Verwaltung der Data Warehouses bietet sich die An-wendung eines föderierten Data Warehouses an. Ein föderiertes Data Warehouse stellt dem Anwender mithilfe eines „virtuellen Würfels“ in Form eines globalen Schemas einen transpa-renten Zugriff auf die verschiedenen Data Warehouses zur Verfügung. Um diesen Zugriff zu ermöglichen müssen die Heterogenitäten zwischen den verschiedenen Data Warehouses be-seitigt werden können, hierfür wird die Abfragesprache SQL-MDi eingesetzt.

Ziel dieser Diplomarbeit ist die Umsetzung eines Werkzeuges zur Integration von unter-schiedlichen Data Marts und zur Erstellung eines globalen Schemas. Demnach stellt das Werkzeug einen Teil eines föderierten Datawarehouse-Systems dar. Grundlegende Aufgabe des Werkzeuges ist es die Daten für den Abfrageprozess bereitzustellen. Hierzu müssen die Heterogenitäten zwischen den verschiedenen importierten Data Marts beseitigt werden. Für den Abfrageprozess werden der SQL-MDi Query Parser sowie der SQL-MDi Query Proces-sor eingesetzt. Die Umsetzung des Werkzeuges erfolgte als Plug-in für die Rich-Client-Plattform Eclipse. Darüberhinaus wurden von Eclipse bereitgestellte Frameworks, wie z.B. EMF und GEF, eingesetzt. Dies führt zu einem teilweise modellbasierten Ansatz bei der Ent-wicklung des Werkzeuges. Zusätzlich wurde ein spezielles Augenmerk auf eine benutzer-freundliche Gestaltung des Werkzeuges gelegt.