KMS > EOH® > Mehrdimensionale Auswertungsräume
Autor KMS

KMS

10. April 2018

Mehrdimensionale Auswertungsräume

Aufbau und Funktion eines Cubes

In eisTIK®.akut sammeln wir die von unseren Kunden zu Analysezwecken benötigten Daten zunächst aus den gewünschten Vorsystemen in einer relationalen Datenbank, dem Data-Warehouse (DWH). Die Daten werden dort qualitativ verifiziert, ggf. vervollständigt und anschließend zur Analyse in multidimensionale Cubes des Microsoft SQL-Server Analysis Services (SSAS) aufbereitet.

SSAS-Dienst

Der SSAS-Dienst wird zusätzlich zum üblichen Datenbank-Dienst installiert, hat eigene Datei-basierte Speicherstrukturen und läuft für sich genommen völlig autark. Die relationale DWH-Datenbank wird lediglich zum Laden der Daten benötigt, anschließend können die individuell aufbereiteten Analysen entweder über unseren eisTIK®.akut Berichtsdesigner, Excel, PowerPivot oder andere Drittanbieter-Software direkt aus dem SSAS-Cube geladen werden. Der Zugriff läuft ausschließlich über das Active Directory von Microsoft (Windows-Kennung) und wird über das DWH gesteuert und konfiguriert. Die Anwender erhalten also nur dann Zugriff auf einen Cube, wenn sie von einem eisTIK®.akut-Administrator die Berechtigung erhalten haben, und sie sehen auch nur die für sie freigegebenen Datenbereiche und Datensätze.

Weiterhin wird über das DWH gesteuert, welche Daten überhaupt aufbereitet werden sollen oder mit Blick auf die Lizenzierung dürfen. Module, die der Kunde nicht wünscht, werden im Cube nicht aufbereitet, also ist die Verarbeitung insgesamt schneller und der Cube benötigt weniger Speicherplatz.

Ein eisTIK®-Cube bietet eine in sich dokumentierte Draufsicht auf einen Auszug der Daten des DWH. Alle Auswertungsstrukturen des Cubes haben sprechende Namen sowie einen erklärenden Tooltip, der über den eisTIK®.akut-Berichtsdesigner dargestellt werden kann. Sie können entweder durch Navigation über klar strukturierte Menübäume oder über eine Textsuche durchsucht werden.

Der Cube ermöglicht die Auswertung der verfügbaren Kennzahlen (auch Measures genannt) nach Auswertungsmerkmalen (Dimensionsattributen). Mehrere Kennzahlen werden zusammengefasst in Kennzahlengruppen (auch Measuregroups), so sie denn nach denselben Auswertungsmerkmalen ausgewertet werden können. Ein Beispiel dafür wäre die “Falldaten“-Kennzahlengruppe mit den Kennzahlen „Anzahl Fälle“ und „Alter in Jahren“. Kennzahlenbeträge werden für gewöhnlich nicht einzeln, sondern gruppiert ausgewertet: Dafür bietet sich eine Reihe von Aggregatsfunktionen an (z. B. Summierung, Anzahl, Minimum, Maximum, …).

Cube-Dimensionen

Mit den Kennzahlengruppen verbunden sind die Cube-Dimensionen: Diese enthalten die Auswertungsmerkmale, die eine Gruppierung oder Einschränkung der Auswertung erlauben (vgl. Abb. 1). Die „Falldaten“- Kennzahlengruppe ist beispielsweise sowohl verbunden mit der „Aufnahmedatum“- als auch mit der „Einzugsgebiete“-Cube-Dimension. Darüber hinaus basieren mehrere Cube-Dimensionen auf derselben Dimension: So gibt es eine „Entlassungsdatum Gesamtfall“-Cube-Dimension, die genau dieselben Auswertungsmerkmale aufweist wie die „Aufnahmedatum“- Cube-Dimension. Es handelt sich in beiden Fällen um die Darstellung eines Datums, also ist es für die Handhabung des Cubes von Vorteil, dieselben Auswertungsmerkmale in allen Datums-Dimensionen vorzufinden.

In Dimensionen werden Dimensionsattribute aufbereitet. Im Fall der Datumsdimension sind das neben dem „Tagesdatum“, dem Element mit der kleinsten Granularität, Attribute, die direkt davon abgeleitet werden, etwa das „Jahr“, der „Monat“, die „Woche des Jahres“ oder der„Tag der Woche“ in verschiedenen Ausprägungen (numerisch oder textuell, jeweils in einer geeigneten Sortierung, die standardmäßig in Auswertungen angewendet wird). In den „Einzugsgebieten“ finden sich neben dem Attribut der „Postleitzahl“ dazu passend „Regierungsbezirk“, „Bundesland“, „Land“ und weitere ortsspezifische Eigenschaften.

Jede Dimension hat ein Attribut mit der kleinsten Granularität, das sogenannte Schlüssel-Attribut. Jeder Wert des Schlüssel-Attributs tritt innerhalb der Dimension nur genau einmal auf, und die Werte aller anderen Attribute werden durch den Wert des Schlüssel-Attributs eindeutig festgelegt (es besteht eine sogenannte funktionale Abhängigkeit). Im Fall der Datumsdimension ist das „Tagesdatum“ das Schlüssel-Attribut.

Die weiteren nicht-Schlüssel-Attribute sind jedoch zum Teil voneinander abhängig: Diese Abhängigkeiten können zum einen intern durch den SSAS genutzt werden, um Verarbeitung und Abfrage des Cubes zu beschleunigen. Zum anderen können sie in manuellen Hierarchien genutzt werden. In der „Jahreshierarchie“ der Datumsdimension lässt sich auf oberster Ebene der Cube zunächst nach dem Merkmal „Jahr“ auswerten oder filtern. Wenn diese Ebene für die Auswertung nicht detailliert genug ist, können die nächsten Ebenen der Hierarchie hinzugezogen (aufgeklappt) werden. Dem Anwender erschließen sich dabei direkt durch die Struktur der Hierarchie die Zusammenhänge der einzelnen Dimensionsattribute. Gerade für komplexere Strukturen als das Datum bietet dies einen Mehrwert.

In manchen Fällen ist eine solche Strukturierung jedoch eine Vereinfachung der Realität: So gibt es Beispiele von Postleitzahlen, die zwei deutschen Regierungsbezirken unterstellt sind. In der Krankenhausstruktur wird eine Kostenstelle durchaus von mehreren Kombinationen von Fachabteilungen und Stationen genutzt. Da jedoch eine entsprechende Hierarchie durchaus sinnvoll und erwünscht ist, bereiten wir die Daten entsprechend so auf, dass alle Daten valide und verlustfrei über eine solche Hierarchie untersucht werden können.

Darüber hinaus gibt es Hierarchien zu Varianten, sogenannte Parent-Child-Hierarchien. Im Gegensatz zu den manuellen Hierarchien wird die Struktur dieser Variantenhierarchien nicht durch KMS vorgegeben, sondern sie können frei durch den Kunden im Variantenmanager gepflegt werden. Dieses Werkzeug kam bereits früher in eisTIK® zum Einsatz: Es ermöglicht die Definition verschiedener beliebig verschachtelter hierarchischer Strukturierungen der Datensätze einer Dimension. Die Varianten aus eisTIK.®NET können nach eisTIK®.akut importiert oder dort direkt erstellt und gepflegt werden. Auf diese Weise können Dimensionsbereiche noch flexibler ausgewertet werden als über die üblichen statischen Hierarchien.

Die Kennzahlengruppen eines Cubes sind verknüpft mit den für sie relevanten Cube-Dimensionen. Technisch gesehen werden die Schlüssel-Attribute der verknüpften Dimension durch die Datenquelle der Kennzahlengruppe referenziert. Diese direkte Referenzierung kann nur dann angewendet werden, wenn die für die Dimension relevante Schlüssel-Information auch verfügbar ist. So ist etwa die „DRG-ICD-Katalog“-Cube-Dimension direkt verknüpft mit der Kennzahlengruppe „DRG-Diagnosen“. Ein direkter Zusammenhang zwischen einer DRG-Diagnose und der Kennzahlengruppe „Fallbezogene Leistungen“ existiert daher zunächst nicht.

Illustration der Abfrage auf Kennzahlen einer Kennzahlengruppe. Der Raum einer Kennzahlengruppe wird aufgespannt durch die damit verknüpften Cube-Dimensionen.

Die Anzeige der Kennzahlen wird eingeschränkt auf einen konkreten Dimensionsbereich D1. Man spricht von einem Slicing (Datenschnitt).
Der Datenbereich wird auf mehr als einer Cube-Dimension eingeschränkt (D1-D3), es fand ein Dicing statt (Würfeln).

Jede Kennzahlengruppe bildet für sich einen eigenen Raum, ein eigenes Koordinationssystem von Cube-Dimensionen. Sie sind somit mit den verfügbaren Auswertungsmerkmalen verknüpft.

Weiterführende Artikel

- Wissensmanager #8

Stöbern Sie durch die aktuelle Printausgabe unseres Magazins

Bleiben Sie up-to-date
Newsletter abonnieren
Wir sind immer für Sie da
Kontakt aufnehmen
KMS Vertrieb und Services AG
Inselkammerstraße 1
82008 Unterhaching
Telefon: +49 89 66 55 09-0
Telefax: +49 89 66 55 09-55

Support: +49 89 66 55 09-45