roczniki_kae_z30_04.pdf

(788 KB) Pobierz
Roczniki Kolegium Analiz Ekonomicznych
nr 30/2013
M
ichał
b
ErnarDElli
Kolegium Analiz Ekonomicznych
Szkoła Główna Handlowa w Warszawie
Nieklasyczne modele Markowa w analizie cykli
koniunktury gospodarczej w Polsce
Streszczenie
Badanie cykli koniunkturalnych stanowi jedno z  podstawowych źródeł oceny
aktualnej i przyszłej sytuacji gospodarczej. Do analizy zmian klimatu koniunktury
w Polsce z powodzeniem wykorzystuje się nieklasyczne modele Markowa. Przedmiotem
badania było wykorzystanie wielostanowych modeli Markowa do analizy wyników
testu koniunktury w przemyśle prowadzonym przez Instytut Rozwoju Gospodarczego
Szkoły Głównej Handlowej w Warszawie. W przeprowadzonych badaniach szczególny
nacisk został położony na modele rozszerzone o efekty przestrzenne, dzięki uwzględ-
nieniu jako danych wejściowych łańcucha Markowa kombinacji par szeregów sald
odpowiedzi na pytania testu koniunktury. Porównana została dokładność tych modeli
z ukrytymi modelami Markowa związanymi z szeregiem sald odpowiedzi na poje-
dyncze pytania testu. Zweryfikowana została także przydatność zaprojektowanych
modeli pod kątem identyfikacji punktów zwrotnych cyklu koniunkturalnego w Polsce.
Słowa kluczowe:
ukryte modele Markowa, algorytm Viterbiego, test koniunktury
w przemyśle, punkty zwrotne cyklu koniunkturalnego
1. Wprowadzenie
Badanie cykli koniunkturalnych stanowi jedno z podstawowych źródeł oceny
aktualnej i przyszłej sytuacji gospodarczej. Budowa deterministycznych modeli
prognostycznych jest utrudniona ze względu na stosunkowo niewielką długość
dostępnych koniunkturalnych szeregów czasowych, jak również ze względu
na potencjalną obecność zmiennych ukrytych w tworzonych modelach. Stąd
60
Michał Bernardelli
nawet jednoznaczna identyfikacja punktów zwrotnych w polskiej gospodarce
nie jest zadaniem łatwym. Alternatywne rozwiązanie stanowią, stosowane z po-
wodzeniem, modele Markowa, których podstawą jest ich niedeterministyczny
charakter
1
.
Celem badania było porównanie jakości dopasowania wielostanowych ukry-
tych modeli Markowa wyznaczonych na podstawie kombinacji par szeregów
sald odpowiedzi na pytania testu koniunktury w przemyśle z dopasowaniem
modeli, których parametry zostały obliczone na podstawie pojedynczych pytań
testu. Uwzględnienie panelowości danych wejściowych zwiększa złożoność ob-
liczeniową rozwiązania badanego zagadnienia, ale uzyskane wyniki stanowią
pozytywną odpowiedź na pytanie o zasadność takiego podejścia i pozwalają
optymistycznie patrzeć na przydatność zaprojektowanych modeli pod kątem
np. identyfikacji punktów zwrotnych cyklu koniunkturalnego w Polsce.
Opracowanie podzielone jest na sześć paragrafów. Po wprowadzeniu w tema-
tykę pracy krótko zostały scharakteryzowane ukryte modele Markowa. Paragraf
trzeci poświęcony jest opisowi danych z testu koniunktury w przemyśle. Została
tu przedstawiona procedura przetworzenia danych empirycznych użytych do
konstrukcji ukrytych modeli Markowa. W paragrafie czwartym została opisana
przeprowadzona symulacja komputerowa. Następnie zaprezentowano rezultaty
uzyskane w wyniku działania napisanego przez autora programu komputerowego,
stanowiącego dokładną implementację postępowania opisanego w paragrafie
czwartym. Praca zakończona jest wnioskami.
2. Ukryte modele Markowa
Modele Markowa można zdefiniować na gruncie procesów stochastycznych
2
.
Można również sformułować równoważną definicję wykorzystującą terminologię
z dziedziny automatów skończonych. Niech
S
X
będzie skończonym
k-elemento-
wym zbiorem, tzw. zbiorem stanów z wyróżnionym stanem
S
0
traktowanym
jako stan początkowy. Zakładamy tym samym, że zbiór stanów jest niepusty,
czyli
k >
0. Niech
M. Bernardelli, M. Dędys,
Ukryte modele Markowa w analizie wyników testu koniunktury
gospodarczej,
w: Badanie
koniunktury – zwierciadło gospodarki,
cz. 1, red. K. Walczyk, „Prace
i Materiały” Instytutu Rozwoju Gospodarczego SGH, nr 90, Warszawa 2012, s. 159–181.
2
Np. O. Cappé, E. Moulines, T. Rydén,
Inference in Hidden Markov Models,
Springer,
New York 2005.
1
Nieklasyczne modele Markowa w analizie cykli koniunktury gospodarczej w Polsce
61
P
= 
p
i
,
j
i
,
j
=
1
k
będzie macierzą prawdopodobieństw przejść, gdzie
p
i,j
oznacza prawdopodo-
bieństwo przejścia ze stanu
do stanu
j.
Zakładamy, że macierz przejść jest
stochastyczna, czyli dla każdego
p
j
=
1
k
i
,
j
=
1.
Łańcuchem Markowa nazywamy uporządkowaną trójkę (S
X
, S
0
, P).
Kluczową
cechą łańcucha Markowa jest tzw. brak pamięci. Oznacza to, iż następny stan
zależy tylko od stanu obecnego, a nie od historii dojścia do aktualnego stanu.
Ukryte modele Markowa, w  skrócie HMM (ang.
Hidden Markov Models),
w literaturze informatycznej znane są również pod nazwą probabilistycznych
automatów z wyjściem. Stanowią one rozszerzenie definicji łańcucha Markowa
o dodatkowy alfabet
∑,
którego litery emitowane są w konkretnym stanie z za-
danym prawdopodobieństwem. Jeżeli dany HMM jest w stanie
i
S
X
, to emituje
on symbol
i
∈ ∑
z prawdopodobieństwem
e
i
(x), a następnie przechodzi do stanu j
z prawdopodobieństwem
p
i,j
. Przyjmujemy, iż w każdym stanie emitowany jest
jakiś symbol, tj. dla każdego
i
S
X
e
(
x
)
=
1.
i
x
∈Σ
Obserwowalne zatem są  tylko symbole emitowane przez model, to  zaś,
w  jakim aktualnie stanie znajduje się ukryty łańcuch Markowa, pozostaje
nieobserwowalne. W pracy będzie rozważany nieskończony alfabet
złożony
z liczb rzeczywistych, przy czym prawdopodobieństwo emisji danego symbolu
–  liczby rzeczywistej –  dane jest rozkładem normalnym i  tożsame ze staty-
stycznego punktu widzenia z założeniem normalnego warunkowego rozkładu
prawdopodobieństwa.
Jeśli przestrzeń stanów ukrytego łańcucha Markowa jest
k-elementowa,
to bę-
dziemy mówić o k-stanowym modelu HMM. Ze względu na łatwość interpretacji
ekonomicznej oraz praktyczne zastosowanie badanie zostało ograniczone do
modeli dwu-, trój- i czterostanowych.
W ekonometrii modele HMM wykorzystuje się najczęściej do analizy szeregów
finansowych i makroekonomicznych
3
. Podstawowym zakresem zastosowań HMM
3
Np. M. Bernardelli, M. Dędys, op.cit.; ibidem.
62
Michał Bernardelli
jest jednak rozpoznawanie wzorców, jak np.: mowy, sygnałów czy odręcznego
pisma. Ukryte modele Markowa są również szeroko stosowane w bioinformatyce.
3. Charakterystyka danych empirycznych
W pracy zostały wykorzystane odpowiedzi na pytania pochodzące z testu
koniunktury w przemyśle przeprowadzonego przez Instytut Rozwoju Gospo-
darczego SGH w Warszawie od marca 1997 r. do sierpnia 2011 r. W skład testu
wchodzą następujące pytania:
Pytanie 1. Wielkość produkcji.
Pytanie 2. Portfel zamówień ogółem.
Pytanie 3. Portfel zamówień eksportowych.
Pytanie 4. Poziom zapasów produkowanych wyrobów.
Pytanie 5. Ceny produkowanych wyrobów.
Pytanie 6. Poziom zatrudnienia.
Pytanie 7. Sytuacja finansowa przedsiębiorstwa.
Pytanie 8. Ogólna sytuacja gospodarki polskiej.
Dane zawierają odpowiedzi na  pytania o  aktualną sytuację w  gospodar-
ce oraz o prognozę na najbliższy okres dokonywaną przez respondentów. Ze
względu na liczbę możliwych kombinacji danych wejściowych konieczne było
ograniczenie się do kilku klas o najlepszych właściwościach. Po dokładnej we-
ryfikacji
4
do dalszej analizy wykorzystano modele oparte na trendach szeregów
sald dotyczących oceny stanu aktualnego. Do dekompozycji szeregów została
wykorzystana procedura
stl
z pakietu komputerowego R. Procedura ta stanowi
implementację algorytmu opartego na lokalnie ważonej metodzie regresji znanego
pod nazwą „loess”
5
. Na rysunku 1 została przedstawiona dekompozycja szeregu
sald odpowiedzi na pytanie o ogólną sytuację gospodarki polskiej (pytanie 8).
Wyeksponowane zostały składowa sezonowa (ang.
seasonal),
trend (ang.
trend)
oraz składowa losowa (ang.
remainder),
przy czym:
data = seasonal + trend + remainder.
M. Bernardelli, M. Dędys, op.cit.
R. B.  Cleveland, W. S.  Cleveland, J. E.  McRae, I.  Terpenning,
STL: A  Seasonal-Trend
Decomposition Procedure Based on Loess,
„Journal of Official Statistics” 1990, vol. 6, s. 3–73.
4
5
Nieklasyczne modele Markowa w analizie cykli koniunktury gospodarczej w Polsce
63
Rysunek 1. Dekompozycja szeregu sald odpowiedzi na pytanie o ogólną sytuację
gospodarki polskiej (pytanie 8) z wykorzystaniem procedury STL
Źródło: opracowanie własne.
Tak oczyszczone z wahań sezonowych i losowych dane z zestawów odpowiedzi
na każde z ośmiu pytań potraktowano jako realizacje składowej obserwowal-
nej ukrytego modelu Markowa. Na ich podstawie zostały dobrane parametry
modeli HMM.
4. Opis badania
W celu sprawdzenia wpływu liczby uwzględnionych zestawów odpowiedzi
na dokładność dopasowania do szeregów referencyjnych przeanalizowano ukryte
modele Markowa o różnej liczbie stanów dla zmiennych danych wejściowych.
W pierwszej kolejności przebadano kolejno każde z ośmiu pytań, a następnie
porównano uzyskane wyniki z rezultatami obliczeń dla wszystkich możliwych
kombinacji par pytań (28 możliwości).
Zgłoś jeśli naruszono regulamin