WielowymiarowyModelDanychWyklad.pdf
(
2896 KB
)
Pobierz
Plan wykładu
1.
2.
3.
4.
5.
Model danych
Analiza wielowymiarowa
Model wielowymiarowy: koncepcja wymiarów i faktów
Operacje modelu wielowymiarowego
Implementacje modelu wielowymiarowego: ROLAP, MOLAP i
HOLAP
Wielowymiarowy model danych
Hurtownie danych, wykład
Bartosz Bębel
E-mail: bartosz.bebel@cs.put.poznan.pl
Hurtownie danych - Wielowymiarowy model danych
2
Model danych
•
Określa sposób reprezentacji danych w bazie danych
•
Składniki modelu danych:
–
–
–
–
–
–
–
–
struktury przechowujące dane
dane
ograniczenia dla danych
operacje wykonywane na danych
model relacyjny
model obiektowy
…
model wielowymiarowy
Analiza wielowymiarowa
•
Analizowanie danych w różnych perspektywach (wymiarach)
•
Cel: wyszukanie interesujących tendencji, trendów w danych
•
Scenariusz przykładowej analizy:
1.
Analityk porównuje zagregowane dane o sprzedaży poszczególnych kategorii
produktów spożywczych (pieczywo, nabiał, itd.) w w sklepach sieci Tesco w
ostatnim kwartale 2008 r. i pierwszym kwartale 2009 r.
Analityk zauważa, że sprzedaż produktów z kategorii „słodycze” w ostatnim
kwartale 2008 r. znacznie przewyższa pod względem liczby sprzedanych sztuk
sprzedaż tej samej kategorii w pierwszym kwartale 2009 r.
Analityk odczytuje dane o sprzedaży słodyczy w poszczególnych miesiącach
ostatniego kwartału 2008 r.
Analityk zauważa gwałtowny wzrost sprzedaży słodyczy w grudniu 2008 r.
…
•
Przykłady:
2.
3.
4.
5.
Hurtownie danych - Wielowymiarowy model danych
3
Hurtownie danych - Wielowymiarowy model danych
4
Analiza jednowymiarowa
•
Relacyjne bazy danych – informacje analizowane w jednej
perspektywie, dane przechowywane w relacjach – strukturach
jednowymiarowych
–
przykład: relacja
Sklepy:
Nazwa sklepu
Aldi
Biedronka
Lidl
Real
Tesco
Miasto
Kalisz
Kalisz
Swarzędz
Poznań
Poznań
Sprzedaż
8015
7061
10107
16438
27109
Zwiększanie liczby wymiarów
(1)
•
Dwie perspektywy: wielkość sprzedaży produktów w
poszczególnych sklepach – struktura dwuwymiarowa
Produkty
Sprzedaż
Bułki
Aldi
Sklepy
Biedronka
Lidl
Real
Tesco
Kalisz
Kalisz
Swarzędz
Poznań
Poznań
5498
4511
7621
11032
15604
Chleb
980
876
874
1502
2032
Mleko
670
710
501
1780
3545
Ser
87
54
92
109
278
Sok
780
910
1019
2015
5650
•
Jak dodać dodatkowe perspektywy (wymiary) analiz?
Hurtownie danych - Wielowymiarowy model danych
5
•
Czy jest możliwe zapisanie struktury dwuwymiarowej w postaci
jednowymiarowej relacyjnej?
Hurtownie danych - Wielowymiarowy model danych
6
Zwiększanie liczby wymiarów
(2)
Nazwa sklepu
Aldi
Aldi
Aldi
Aldi
Aldi
Biedronka
Biedronka
Biedronka
Biedronka
…
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
Kalisz
…
Miasto
Bułki
Chleb
Mleko
Ser
Sok
Bułki
Chleb
Mleko
Ser
…
Produkt
Sprzedaż
5498
980
670
87
780
876
710
54
…
Zwiększanie liczby wymiarów
(3)
•
Dodatkowa informacja: okres, w którym sprzedano produkty
w poszczególnych sklepach – struktura trójwymiarowa
Produkty
Sprzedaż w styczniu 2008 r.
Bułki
Sprzedaż w lutym 2008 r.
Aldi
Kalisz
Sklepy
5498
Chleb
980
Mleko Ser
Produkty
Sok
Bułki
Chleb
670
Produkty
780
Sok
Mleko
87
Ser
4511
Sprzedaż w marcu 2008 r.
4511 5498 876 980 710 670 54 87910 780
Biedronka
Konin
Aldi
Kalisz
Bułki
Chleb Mleko Ser
Sok
7621
874
501
92
1019
Lidl
Swarzędz
4511
876
710
54
910
Biedronka
Konin
5498 1780
980 109 6702015 87
780
Aldi
Kalisz
11032
1502
Real
Poznań
7621
874
501
92
1019
Lidl
Swarzędz
4511 3545
876 278 7105650 54
910
Biedronka
2032
Tesco
Poznań Kalisz
15604
11032
1502
1780
109
2015
Real
Poznań
7621
874
501
92
1019
Lidl
Swarzędz
15604
2032
3545
278
5650
Tesco
Poznań
11032
1502
1780
109
2015
Real
Poznań
Sklepy
Sklepy
Tesco
Poznań
15604
2032
3545
278
5650
8
Hurtownie danych - Wielowymiarowy model danych
7
Hurtownie danych - Wielowymiarowy model danych
Zwiększanie liczby wymiarów
(4)
•
Dodanie kolejnej perspektywy – struktura 4-wymiarowa
•
…
•
Ogólnie: n perspektyw analiz – struktura n-wymiarowa, tzw.
n-wymiarowa kostka danych
Wartości zagregowane
•
Problem: znajdź sumaryczną sprzedaż bułek we wszystkich
sklepach
Hurtownie danych - Wielowymiarowy model danych
9
Hurtownie danych - Wielowymiarowy model danych
10
Kategorie informacji
Fakt i miara
•
Fakt
Produkty
Sprzedaż
Bułki
Aldi
Sklepy
Biedronka
Lidl
Real
Tesco
Kalisz
Kalisz
Swarzędz
Poznań
Poznań
5498
4511
7621
11032
15604
–
zdarzenie, którego cechy podlegają analizie
–
przykład:
Ser
87
54
92
109
278
Chleb
980
876
874
1502
2032
Mleko
670
710
501
1780
3545
Sok
780
910
1019
2015
5650
•
transakcja sprzedaży produktu w sklepie
•
wykonanie rozmowy telefonicznej
•
Miara
–
analizowana cecha faktu
•
najczęściej numeryczna i addytywna
•
rzadko tekstowa (opisowa)
–
przykłady:
Wymiary
Fakty i miary
•
dla faktu „transakcja sprzedaży produktu w sklepie”: liczba sztuk
sprzedanego produktu w ramach transakcji, cena sprzedaży produktu w
ramach transakcji
•
dla faktu „wykonanie rozmowy telefonicznej”: czas trwania, koszt rozmowy
11
Hurtownie danych - Wielowymiarowy model danych
12
Hurtownie danych - Wielowymiarowy model danych
Wymiar
•
Informacja opisująca fakt
•
Przykłady:
–
produkt – opisuje cechy sprzedanego towaru
–
lokalizacja – opisuje miejsce sprzedaży produktu
–
czas – opisuje moment dokonania sprzedaży
Hierarchia wymiaru
•
Wymiar może mieć strukturę hierarchiczną, elementem tej
struktury jest poziom wymiaru
•
Wyróżnione poziomy w hierarchii wymiaru:
–
poziom bazowy – najniższy poziom hierarchii: artykuł, sklep, dzień
–
poziom szczytowy – najwyższy poziom hierarchii: kategoria,
województwo, rok
•
Hierarchia wymiaru definiuje ścieżki agregacji wymiaru
Hurtownie danych - Wielowymiarowy model danych
13
Hurtownie danych - Wielowymiarowy model danych
14
Instancja wymiaru
(1)
•
Zbiór wartości poziomów w hierarchii wymiaru
•
Przykłady:
Instancja wymiaru
(2)
•
Przykłady (cd):
Hurtownie danych - Wielowymiarowy model danych
15
Hurtownie danych - Wielowymiarowy model danych
16
Struktura w modelu wielowym. – podsumowanie
•
Struktura –
n-wymiarowa kostka danych
Operacje modelu wielowymiarowego
•
Wykonywane przez analityków w celu:
–
–
–
–
1.
2.
3.
4.
5.
ograniczenia rozmiaru danych
wydobycia z danych interesujących informacji
dostosowania sposobu prezentacji danych do własnych potrzeb
…
zwijanie (ang.
roll-up)
rozwijanie (drążenie) (ang.
drill-down)
filtrowanie (ang.
screening, filtering)
wycinanie (ang.
slice-and-dice)
obracanie (ang.
pivoting)
•
Operacje modelu wielowymiarowego:
Hurtownie danych - Wielowymiarowy model danych
17
Hurtownie danych - Wielowymiarowy model danych
18
Operacja 1. Zwijanie
•
Wykonuje nawigowanie w górę struktury hierarchii wymiarów
•
Umożliwia analizowanie danych o większym stopniu agregacji
(danych o mniejszej szczegółowości)
•
Przykład:
Operacja 2. Rozwijanie (drążenie)
•
Wykonuje nawigowanie w dół struktury hierarchii wymiarów
•
Umożliwia analizowanie danych o mniejszym stopniu agregacji
(danych o większej szczegółowości)
•
Jest operacją odwrotną w stosunku do zwijania
•
Przykład:
Hurtownie danych - Wielowymiarowy model danych
19
Hurtownie danych - Wielowymiarowy model danych
20
Plik z chomika:
Lexor2
Inne pliki z tego folderu:
HDA - całość.rar
(90240 KB)
HDA_skrot_z_teorii.pdf
(12050 KB)
WielowymiarowyModelDanychWyklad.pdf
(2896 KB)
HDA_przykladowy_test_z_teorii.doc
(40 KB)
HDA_przykladowy_test_z_teorii-rozw.doc
(40 KB)
Inne foldery tego chomika:
Bazy danych 1 (BD1)
eksprolacja danych
Zgłoś jeśli
naruszono regulamin