Entwicklung eines Query Prozessors in einem Föderierten Data Warehouse System

Autor
T. Rossgatterer
Masterarbeit
MT0809 (Dezember, 2008)
Betreut von
o. Univ.-Prof. Dr. Michael Schrefl
Angeleitet von
Mag. Stefan Berger
Ausgeführt an
Universität Linz, Institut für Wirtschaftsinformatik - Data & Knowledge Engineering

Kurzfassung (Englisch)

Mergers of companies may require sales analysis across several Data Warehouses, where there is no central authority, which manages the data. For solving this problem a federated Data Warehouse System will be an appropriate approach. Due to the fact that the system provides a global schema, a federated Data Warehouse System gives the user transparent access to the underlying schemas and data. Moreover it is necessary to hide the heterogeneities, which may occur during the integration of Data Warehouse Systems. Thus the multidimensional language SQL-MDi was developed to resolve the heterogeneities.

Goal of this thesis is the design and the prototypic development of a processing-component for SQL-MDi, which is part of a query tool in a federated Data Warehouse System. The principal task of the query tool is to generate a global, integrated cube. The main challenge of the Query Processor is to traverse and evaluate an operator-tree and to calculate a global result. The operator-tree is generated by the Query Parser from an SQL-MDi-Query. The tree-structure contains the operators of the Dimension- and Fact-Algebra on which SQL-MDi is based on. The operator-tree is used as an evaluation plan and can be traversed by the processing-component without any restructuring.

Kurzfassung (Deutsch)

Durch den Zusammenschluss von Unternehmen werden Analysen über mehrere Data Warehouses notwendig, wobei es keine zentrale Instanz gibt, die die Daten verwaltet.Um dieses Problem zu lösen, bietet sich der Einsatz eines föderierten Data Warehouse Systems an. Ein föderiertes Data Warehouse System bietet dem Benutzer transparenten Zugriff auf die darunterliegenden Schemata und Daten, indem ein globales Schema zur Verfügung gestellt wird. Weiters ist es notwendig den Benutzer von den Heterogenitäaten, welche bei der Integration von Data Warehouse Systemen auftreten können, abzuschirmen. Dazu wurde die multidimensionale Abfragesprache SQL-MDi entwickelt.

Ziel dieser Diplomarbeit ist es eine Prozessor-Komponente für SQL-MDi, welche einen Teil eines Abfrage-Werkzeugs in einem föderierten Data Warehouse System darstellt, zu konzipieren und prototypisch zu implementieren. Das Abfrage-Werkzeug dient dazu, einen globalen, integrierten Würfel zu erzeugen. Aufgabe der Prozessor-Komponente ist es, eine Operator-Baumstruktur, welche der Query Parser aus einer SQL-MDi-Abfrage generiert, zu verarbeiten und daraus das globale Ergebnis zu berechnen. Die Baumstruktur beinhaltet die den SQL-MDi-Anweisungen zugrundeliegenden Operatoren der Dimension- und Faktalgebra. Der Operatorbaum dient als Ausführungsplan und kann ohne Umstrukturierungen von der Prozessor-Komponente verarbeitet werden.