Skip to main content.

Einführung in die OLAP Welt

SQL Server Magazin 2000 S.33 ff
Titel: So entsteht ein Data Warehouse - Einführung in die OLAP-Welt
Autor: Frank Abendroth
Beschreibung: So entsteht ein Data Warehouse - Einführung in die OLAP-Welt (OLAP, Data Warehouse, Data Marts)



top


Historie

  • entstanden aus: OLTP
    Online Transaction Processing (viele Anwender geben gleichzeitig Daten ein)


    • 1960/1970
    • Funktioniert nicht Ressourcenkonflikte
      Komplexe Abfragen und Berichte nur abends oder nachts ausführbar.


      » Siehe auch: OLAP

top


OLAP

  • 1. Konsolidierung der Analysedaten
    • separate Hardware
      Daten werden in einer Datenbank (Data Staging Area) auf separater Hardware in Kopie gespeichert ! (Früher wegen zu hoher Hardwarekosten nicht möglich.)


    • OLAP-Quelldaten
      Die konsolidierten Daten in ihrer Reinform sind die OLAP-Quelldaten.


    • 70% der Kosten !
      Konsolidierung verursacht 70% der gesamten OLAP-Kosten !


    • Doppelte Datensätze
      aus den OLTP-Quellen bzw. "OLTP-Inseln"


      • unterschiedliche Schreibweisen
      • unterschiedliche Datentypen
  • 2. Optimieren der Datenstruktur
    • für Analyse optimieren

      • Fakttabellen
        • Hauptsächlich numerische Daten.
        • Transaktionen, die analysiert werden sollen (Lagerbestände, Rechnungspositionen)

      • Dimensionstabellen
        • Alphanumerische Daten.
        • Diese Daten beschreiben, kategorisieren oder gruppieren die Daten der Fakttabelle (Lagerbezeichnungen, Zeiträume, Warengruppen).

    • besonders gut geeignete Strukturen
      • Star-Schema



      • Snowflake Schema


        Größere Datenmengen können hiermit besser verarbeitet werden (ist aber auch etwas langsamer).


  • 3. Aggregationen ermitteln
    Ermittlung vorgefertigter Antworten auf häufig gestellte Fragen -> Minimierung der Antwortzeiten des Systems (auf unter 5 sec.).


    • Abarbeitung der Abfragen
      • vor der Analyse
        • Der "Kern" von OLAP: vorab generierte Aggregationen.
          Man speicherte z.B. (vorab generierte) Umsätze einer Produktgruppe pro Jahr, Quartal und Monat gemeinsam mit den OLAP-Quelldaten.
        • Kritisch: Phänomen der "Datenexplosion".
          Ermittlung aller möglichen Aggregationen für 10 MB OLAP-Quelldaten ergeben ein Datenvolumen von 2 GB.

        Finden der Balance zwischen der Größe der gespeicherten Aggregationen und der Geschwindigkeit des OLAP-Systems mittels:
        Datenanalyse und
        "Usage Based Analysis" .


      • während der Analyse
        » Siehe auch: für Analyse optimieren
      • nach der Analyse
    • Balance zw.Größe und Geschwindigkeit
      • Datenanalyse
        OLAP-Server ermittelt selbst - anhand vom Administrator vorgegebener Parameter - die Aggregationen für ein optimales Verhältnis von benötigtem Speicherplatz und OLAP-Systemgeschwindigkeit.

        OLAP-Server generiert die kleinste Menge an Antworten, die gebraucht werden um die größte Menge an Fragen zu beantworten (Bsp. Zeitdimension).


      • "Usage Based Analysis"
        Ermittlung der häufigsten Abfragen eines vergangenen Zeitraums über Logging-Dateien ("HOLAP-Logs"). Als Ergebnis werden für diese häufigen Abfragen die entsprechenden Aggregationen erstellt.


top


Data Warehouse

» Siehe auch: Data Mart

  • "optimierte Kopie der konsolidierten Unternehmensdaten auf einer separaten Hardware"

top


Data Mart

» Siehe auch: Data Warehouse

  • "kleines Data Warehouse"
  • maßgeschneidert für bestimmte Zielgruppe im Unternehmen
  • hardwaretechnisch getrennt

top


Realisierung

  • Dies beachten! DataWarehouse -> Data Marts
    • Das ist gut. nach einmaliger Konsolidierung, einfache Erstellung der Marts
    • Funktioniert nicht Konsolidierung ist Kraftakt !
  • Dies beachten! Data Marts -> DataWarehouse
    • Das ist gut. einfache, schnelle Erstellung eines Data Marts
    • Funktioniert nicht Überführung von Insel- lösungen in einheitliches Data Warehouse schwierig
    • Interessant Saubere Planung der Marts erforderlich

top


Vorteile OLAP

  • Datenauswertungen
    • intuitiv
    • ad hoc
  • schnelle Reaktionen auf Änderungen
    • im Unternehmen
    • auf den Märkten
  • "Unternehmerische Entscheidungen werden durch Datenanalysen effizient gestützt."

top


Ausführliche Beschreibung

» Siehe Dokument: http://www.mkonetzny.de/aufsatz/olap.htm

top


Buchtipps