WielowymiarowyModelDanychWyklad.pdf

(2896 KB) Pobierz
Plan wykładu
1.
2.
3.
4.
5.
Model danych
Analiza wielowymiarowa
Model wielowymiarowy: koncepcja wymiarów i faktów
Operacje modelu wielowymiarowego
Implementacje modelu wielowymiarowego: ROLAP, MOLAP i
HOLAP
Wielowymiarowy model danych
Hurtownie danych, wykład
Bartosz Bębel
E-mail: bartosz.bebel@cs.put.poznan.pl
Hurtownie danych - Wielowymiarowy model danych
2
Model danych
Określa sposób reprezentacji danych w bazie danych
Składniki modelu danych:
struktury przechowujące dane
dane
ograniczenia dla danych
operacje wykonywane na danych
model relacyjny
model obiektowy
model wielowymiarowy
Analiza wielowymiarowa
Analizowanie danych w różnych perspektywach (wymiarach)
Cel: wyszukanie interesujących tendencji, trendów w danych
Scenariusz przykładowej analizy:
1.
Analityk porównuje zagregowane dane o sprzedaży poszczególnych kategorii
produktów spożywczych (pieczywo, nabiał, itd.) w w sklepach sieci Tesco w
ostatnim kwartale 2008 r. i pierwszym kwartale 2009 r.
Analityk zauważa, że sprzedaż produktów z kategorii „słodycze” w ostatnim
kwartale 2008 r. znacznie przewyższa pod względem liczby sprzedanych sztuk
sprzedaż tej samej kategorii w pierwszym kwartale 2009 r.
Analityk odczytuje dane o sprzedaży słodyczy w poszczególnych miesiącach
ostatniego kwartału 2008 r.
Analityk zauważa gwałtowny wzrost sprzedaży słodyczy w grudniu 2008 r.
Przykłady:
2.
3.
4.
5.
Hurtownie danych - Wielowymiarowy model danych
3
Hurtownie danych - Wielowymiarowy model danych
4
Analiza jednowymiarowa
Relacyjne bazy danych – informacje analizowane w jednej
perspektywie, dane przechowywane w relacjach – strukturach
jednowymiarowych
przykład: relacja
Sklepy:
Nazwa sklepu
Aldi
Biedronka
Lidl
Real
Tesco
Miasto
Kalisz
Kalisz
Swarzędz
Poznań
Poznań
Sprzedaż
8015
7061
10107
16438
27109
Zwiększanie liczby wymiarów
(1)
Dwie perspektywy: wielkość sprzedaży produktów w
poszczególnych sklepach – struktura dwuwymiarowa
Produkty
Sprzedaż
Bułki
Aldi
Sklepy
Biedronka
Lidl
Real
Tesco
Kalisz
Kalisz
Swarzędz
Poznań
Poznań
5498
4511
7621
11032
15604
Chleb
980
876
874
1502
2032
Mleko
670
710
501
1780
3545
Ser
87
54
92
109
278
Sok
780
910
1019
2015
5650
Jak dodać dodatkowe perspektywy (wymiary) analiz?
Hurtownie danych - Wielowymiarowy model danych
5
Czy jest możliwe zapisanie struktury dwuwymiarowej w postaci
jednowymiarowej relacyjnej?
Hurtownie danych - Wielowymiarowy model danych
6
Zwiększanie liczby wymiarów
(2)
Nazwa sklepu
Aldi
Aldi
Aldi
Aldi
Aldi
Biedronka
Biedronka
Biedronka
Biedronka
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Miasto
Bułki
Chleb
Mleko
Ser
Sok
Bułki
Chleb
Mleko
Ser
Produkt
Sprzedaż
5498
980
670
87
780
876
710
54
Zwiększanie liczby wymiarów
(3)
Dodatkowa informacja: okres, w którym sprzedano produkty
w poszczególnych sklepach – struktura trójwymiarowa
Produkty
Sprzedaż w styczniu 2008 r.
Bułki
Sprzedaż w lutym 2008 r.
Aldi
Kalisz
Sklepy
5498
Chleb
980
Mleko Ser
Produkty
Sok
Bułki
Chleb
670
Produkty
780
Sok
Mleko
87
Ser
4511
Sprzedaż w marcu 2008 r.
4511 5498 876 980 710 670 54 87910 780
Biedronka
Konin
Aldi
Kalisz
Bułki
Chleb Mleko Ser
Sok
7621
874
501
92
1019
Lidl
Swarzędz
4511
876
710
54
910
Biedronka
Konin
5498 1780
980 109 6702015 87
780
Aldi
Kalisz
11032
1502
Real
Poznań
7621
874
501
92
1019
Lidl
Swarzędz
4511 3545
876 278 7105650 54
910
Biedronka
2032
Tesco
Poznań Kalisz
15604
11032
1502
1780
109
2015
Real
Poznań
7621
874
501
92
1019
Lidl
Swarzędz
15604
2032
3545
278
5650
Tesco
Poznań
11032
1502
1780
109
2015
Real
Poznań
Sklepy
Sklepy
Tesco
Poznań
15604
2032
3545
278
5650
8
Hurtownie danych - Wielowymiarowy model danych
7
Hurtownie danych - Wielowymiarowy model danych
Zwiększanie liczby wymiarów
(4)
Dodanie kolejnej perspektywy – struktura 4-wymiarowa
Ogólnie: n perspektyw analiz – struktura n-wymiarowa, tzw.
n-wymiarowa kostka danych
Wartości zagregowane
Problem: znajdź sumaryczną sprzedaż bułek we wszystkich
sklepach
Hurtownie danych - Wielowymiarowy model danych
9
Hurtownie danych - Wielowymiarowy model danych
10
Kategorie informacji
Fakt i miara
Fakt
Produkty
Sprzedaż
Bułki
Aldi
Sklepy
Biedronka
Lidl
Real
Tesco
Kalisz
Kalisz
Swarzędz
Poznań
Poznań
5498
4511
7621
11032
15604
zdarzenie, którego cechy podlegają analizie
przykład:
Ser
87
54
92
109
278
Chleb
980
876
874
1502
2032
Mleko
670
710
501
1780
3545
Sok
780
910
1019
2015
5650
transakcja sprzedaży produktu w sklepie
wykonanie rozmowy telefonicznej
Miara
analizowana cecha faktu
najczęściej numeryczna i addytywna
rzadko tekstowa (opisowa)
przykłady:
Wymiary
Fakty i miary
dla faktu „transakcja sprzedaży produktu w sklepie”: liczba sztuk
sprzedanego produktu w ramach transakcji, cena sprzedaży produktu w
ramach transakcji
dla faktu „wykonanie rozmowy telefonicznej”: czas trwania, koszt rozmowy
11
Hurtownie danych - Wielowymiarowy model danych
12
Hurtownie danych - Wielowymiarowy model danych
Wymiar
Informacja opisująca fakt
Przykłady:
produkt – opisuje cechy sprzedanego towaru
lokalizacja – opisuje miejsce sprzedaży produktu
czas – opisuje moment dokonania sprzedaży
Hierarchia wymiaru
Wymiar może mieć strukturę hierarchiczną, elementem tej
struktury jest poziom wymiaru
Wyróżnione poziomy w hierarchii wymiaru:
poziom bazowy – najniższy poziom hierarchii: artykuł, sklep, dzień
poziom szczytowy – najwyższy poziom hierarchii: kategoria,
województwo, rok
Hierarchia wymiaru definiuje ścieżki agregacji wymiaru
Hurtownie danych - Wielowymiarowy model danych
13
Hurtownie danych - Wielowymiarowy model danych
14
Instancja wymiaru
(1)
Zbiór wartości poziomów w hierarchii wymiaru
Przykłady:
Instancja wymiaru
(2)
Przykłady (cd):
Hurtownie danych - Wielowymiarowy model danych
15
Hurtownie danych - Wielowymiarowy model danych
16
Struktura w modelu wielowym. – podsumowanie
Struktura –
n-wymiarowa kostka danych
Operacje modelu wielowymiarowego
Wykonywane przez analityków w celu:
1.
2.
3.
4.
5.
ograniczenia rozmiaru danych
wydobycia z danych interesujących informacji
dostosowania sposobu prezentacji danych do własnych potrzeb
zwijanie (ang.
roll-up)
rozwijanie (drążenie) (ang.
drill-down)
filtrowanie (ang.
screening, filtering)
wycinanie (ang.
slice-and-dice)
obracanie (ang.
pivoting)
Operacje modelu wielowymiarowego:
Hurtownie danych - Wielowymiarowy model danych
17
Hurtownie danych - Wielowymiarowy model danych
18
Operacja 1. Zwijanie
Wykonuje nawigowanie w górę struktury hierarchii wymiarów
Umożliwia analizowanie danych o większym stopniu agregacji
(danych o mniejszej szczegółowości)
Przykład:
Operacja 2. Rozwijanie (drążenie)
Wykonuje nawigowanie w dół struktury hierarchii wymiarów
Umożliwia analizowanie danych o mniejszym stopniu agregacji
(danych o większej szczegółowości)
Jest operacją odwrotną w stosunku do zwijania
Przykład:
Hurtownie danych - Wielowymiarowy model danych
19
Hurtownie danych - Wielowymiarowy model danych
20
Zgłoś jeśli naruszono regulamin