chowov test stability

Report
Stabilita ekonometrického
modelu
Testovanie normality
Dôležitým predpokladom, ktorému sme v predchádzajúcich prednáškach nevenovali
pozornosť, aj keď sme automaticky predpokladali jeho dodržanie, je predpoklad stability
modelu – ktorý sa prejavuje v nemennosti použitých (vypočítaných) parametrov modelu.
Tento predpoklad je v aplikovanej praktickej ekonometrii neudržateľný, a je potrebné odlíšiť
údajové segmenty vyžadujúce rozdielnu modelovanú štruktúru v čase. V takomto prípade
dochádza k situácii, kedy sa vypočítané hodnoty parametrov v čase menia, čo sa prejavuje v
kolísaní ich hodnôt, ako aj v kolísaní náhodných porúch odhadnutých pomocou rezíduí.
y  Xβ  u
Porušenie stability modelu sa prejaví relatívne veľkými a časovo korelovanými
hodnotami rezíduí e t čo je možné zistiť najčastejšie dvomi spôsobmi:
• Grafickými metódami resp. testami typu CUSUM (cumulative sums – kumulatívne
súčty)
• Chowowe testy
CUSUM TESTY.
Predpokladajme lineárny klasický model
y  Xβ  u
Parametre β pri platnosti nulovej hypotézy o ich nemennosti v čase vedú k tzv. štatistikám
CUSUM (cumulative sums) v jednotlivých časoch t s normálnym rozdelením:
t
e
C U SU M t   i N  0, t  k 
t = k +1, ... , T
i  k 1 s
kde s je odhad reziduálnej štandardnej odchýlky σ. Zodpovedajúci CUSUM - test potom
zisťuje zmenu príslušného modelu spočívajúcu v zmene parametrov β v tom okamžiku t, v
ktorom prvý raz:
CU SU M t  2 t  k
V softvérových riešeniach má najčastejšie CUSUM test grafickú podobu:
Presné rozdelenie CUSUM – štatistiky pri platnosti nulovej hypotézy o nemennosti
parametrov je dané vzťahom:
tk
et
t  t  k  1
st
kde
et 
s 
2
t
1
t  k
1
t

ei
i  k 1
t
 e
t  k  1 i  k 1
i
 et 
2
Príklad
Uvažujme hypotetické údaje, na základe ktorých sme kvantifikovali lineárny
ekonometrický model
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Yi
11,9
22,8
18,7
20,1
12,9
21,7
27,1
25,4
21,3
19,3
25,4
27,2
11,7
17,8
12,8
23,9
22,6
25,4
14,8
21,1
Xi1
19,5
24,7
30,7
29,8
19,1
25,6
31,4
27,9
22,1
25,5
31,1
30,4
18,7
19,7
14,6
29,5
27,7
30,2
22,7
25,2
Xi2
43,1
49,8
51,9
54,3
42,2
53,9
58,5
52,1
49,9
53,5
56,6
56,7
46,5
44,2
42,7
54,4
55,3
58,6
48,2
51
Xi3
29,1
28,2
37
31,1
30,9
23,7
27,6
30,6
23,2
24,8
30
28,3
23
28,6
21,3
30,1
25,7
24,6
27,1
27,5
Podobným testom je možné testovať nemennosť parametra σ2 (tj. homoskedasticitu),
kedy používame štatistiku CUSUMQt:
t
C U SU M Q t 

2
ei
i  k 1
T

2
ei

2
t  k 
T k
,
t = k +1, ... , T
i  k 1
Štatistika CUSUMQ potom detekuje na hladine významnosti zmenu príslušného
modelu spočívajúcu v zmene parametra σ2 v tom okamžiku t v ktorom po prvý raz
prekročí:
C U SU M Q t 
tk
T k
 c,
Kde c je príslušná kritická hodnota  2 . V softvérových riešeniach má CUSUMQ test
najčastejšie grafickú podobu, pričom špeciálne CUSUMQk = 0, CUSUMQT= 1
Príklad.
CHOWOVE TESTY
Chowove testy sa používajú na posúdenie stability parametrov ekonometrického modelu v
celom obore hodnôt definovaných časovou premennou :
t  1, 2 , ..., T
Často však dochádza k zmenám parametrov v dvoch alebo viacerých segmentoch údajov,
ktoré je potom potrebné vyšetriť. Konkrétne sa odporúča:
• Grafické znázornenie časového priebehu vysvetľovanej a vysvetľujúcich premenných,
ktoré môže viesť k optickému vyznačeniu časového bodu zmeny v chovaní údajov,
• Segmentácia údajov na základe známych historických udalostí, kedy dochádza k
štrukturálnym zmenám (napr. začiatok účinnosti nového zákona, významný pokles na
burze, nástup novej vlády...),
• Aplikácia testov typu CUSUM, alebo priamo grafický priebeh rekurentných rezíduí.
V literatúre sa môžeme stretnúť s dvomi testami:
1. Chowov test stability
2. Chowov predpovedný test
Gregory C. Chow
CHOWOV TEST STABILITY
Prvý z týchto testov sa označuje ako test stability a odporúča sa v prípade, kedy počet
pozorovaní v prvom segmente, označíme ho T1, popisujúci situáciu pred zmenou a počet
pozorovaní T2 v druhom segmente po zmene situácie, by boli postačujúce pre konštrukciu
samostatných modelov T  T1  T 2 :
Nech model v prvom segmente má tvar:
y t   1   2 x t 2   3 x t 3  ...   k x kt  u t
t  1, ..., T1
(1.)
model v druhom segmente má tvar:
y t    1   k 1     2  
k 2
 x t 2    3   k  3  x t 3  ...    k   2 k  x kt  u t
Uvažovaný test stability potom testuje nulovú hypotézu:
H 0 :  k  1   k  2  ...   2 k  0
t.j.: že modely v oboch segmentoch sú z hľadiska parametrov zhodné (stabilné).
(3.)
(2.)
Pri použití klasického F – testu potom máme obmedzený model
y t   1   2 x t 2   3 x t 3  ...   k x kt  u t
t  1, ..., T
(4.)
a neobmedzené modely (1.) (2.),ktoré sa oplatí pre väčšiu názornosť preformulovať s
použitím umelej premennej do tvaru:
y t   1   2 x t 2  ...   k x kt   k  1 D t   k  2 D t x t 2  ...   2 k D t x kt  u t
(5.)
t  1, ..., T
kde
 0,
Dt  
 1,
t  1, ..., T1
t  T1  1, ..., T1  T 2  T
(6.)
Uvedený F – test má tvar:
T1
T
 T
2
2
2 
ˆ
ˆ
ˆ
y

y

y

y

y

y
  t
  t t    t t   / k R SS  R SS  R SS / k
t

t 1
t  T1  1
1
2
 t 1

F 

T
( R SS 1  R SS 2 ) / ( T  2 k )
 T1
2
2 
ˆ
ˆ
y

y

y

y
/
T

2
k

  t
  t t  
t
t

1
t

T

1
1


(7.)
s kritickým oborom:
T  2 k  R SS  R SS 1  R SS 2 
k
 R SS 1  R SS 2 
F k ,T  2k 
(8.)
Kde 2k je počet regresorov v neobmedzenom modeli, a k je počet obmedzení nulovej hypotézy
(3.), RSS je reziduálny súčet štvorcov v obmedzenom modeli (5.), ktorý je možné získať ako
súčet štvorcov v modeloch (1.) a (2.).
Chovov test stability teda v podstate vyžaduje odhad troch klasických lineárnych regresných
modelov, aj keď v praktických aplikáciách sa často odhaduje len model (5.) s umelou
premennou.
Chowov predpovedný (predikčný) test.
Druhý z Chowových testov sa označuje ako Chowov predikčný test a odporúča sa v
situáciách kedy počet T1 v prvom segment pred zmenou je výrazne vyšší ako počet
pozorovaní T 2 v druhom segmente po zmene parametrov. V teste sa overuje predikčná
schopnosť modelu z prvého segmentu pre druhý „predikčný“ segment.
Nech model v prvom segmente je opäť:
y t   1   2 x t 2   3 x t 3  ...   k x kt  u t
t  1, ..., T1
(9.)
model v druhom predikčnom segmente má teraz tvar:
y t   1   2 x t 2   3 x t 3  ...   k x kt   j  u t
t  T1  j , j  1, ..., T 2
(10.)
kde  j sú chyby predpovedí. Test stability potom testuje nulovú hypotézu:
H 0 :  1   2  , ...,   T 2  0
(11.)
t.j.: že pri predpovediach z prvého segmentu pre druhý segment majú chyby predpovedí
nulové stredné hodnoty a model z predikčného hľadiska vykazuje stabilitu.
Pri použití klasického F – testu znovu vychádzame z obmedzeného modelu
y t   1   2 x t 2   3 x t 3  ...   k x kt  u t
t  1, ..., T
(12.)
a neobmedzený model pre oba segmenty opäť preformulujeme pomocou umelej premennej
do tvaru:
y t   1   2 x t 2  ...   k x kt   1 D t 1   2 D t 2  ...   T2 D tT2  u t
(13.)
t  1, ..., T
kde

 1 , t= T1 + j, j= 1 ,...,T 2
Dt  
in a k

 0,
Chowov predikčný test má potom tvar:
F 
( R SS  U R SS ) / T 2
U R SS / ( T1  k )
(14.)
a na hladine významnosti α má kritický obor:
T1  k R SS  U R SS
T2
U R SS
F  T 2 , T1  k 
kde k + T2 je počet regresorov v neobmedzenom modeli (13.), T2 je počet obmedzení nulovej
hypotézy (11.) a URSS je reziduálny súčet štvorcov v neobmedzenom modeli (13.), ktorý je
možné získať opäť ako súčet reziduálnych súčtov štvorcov v modeloch (9.) a (10.).
Chowov predikčný test teda opäť vyžaduje odhad troch klasických modelov lineárnej regresie
(9.), (10.) a (12.)
Ak je počet pozorovaní T1 v prvom segmente pred zmenou výrazne nižší, ako počet pozorovaní
T2 v druhom segmente po zmene parametrov, je možné predikčný test stability založiť na
spätnej predpovedi z druhého segmentu pre prvý segment.
Chowove testy bývajú citlivé aj na iné typy nestability nielen na nestabilitu spôsobenú
zmenami parametrov.
Testovanie normality
Testovacie postupy využívané v aplikovanej ekonometrii sú založené obvykle na predpoklade
normality modelu, odporúča sa overiť pre OLS odhady (rezíduá), či je predpoklad normality
prijateľný alebo nie. V literatúre sa často stretávame pri väčšom rozsahu údajov, že tento
predpoklad sa považuje za automaticky splnený.
Aj keď je možné postupovať rôzne, pre kvalitnú konštrukciu modelov je predsa len obvyklé
využiť rôzne štatistické postupy overenia normality. Tieto postupy je možné rozdeliť na:
• grafické (napr. Q – Q graf, P – P graf a iné.)
• štatistické testy (test zhody, test Jarque - Bery, Shapiro-Wilkov W test, Doornik-Hansenov
test, Lillieforsov test a iné.
N(0,1)
N(0, σ2)
Zo štatistických testov sa často v aplikovanej ekonometrii používa test Jarque – Bery, ktorý
pre OLS odhady pracuje s W štatistikov:
2
2
 ˆ1
ˆ 2 
W T 


6
24


2


1
ktorá je založená na vlastnostiach koeficientov šikmosti
(skewness) a špicatosti 2
2
(kurtosis) normálneho rozdelenia. Pri výpočte štatistiky W sa využívajú výberové
2
2
charakteristiky šikmosti ˆ1 a špicatosti ˆ 2 :
 xt  x 
2
ˆ1   

T t 1  s 
1
T
3
4
 xt  x 
2
ˆ 2   
 3
T t 1  s 
1
T
Nulová hypotéza predpokladá normalitu regresného modelu, má štatistika W asyptoticky
rozdelenie  2  2  (chí – kvadrát rozdelenie s 2 stupňami voľnosti), takže kritický obor na
hladine významnosti α má tvar:
W   1   2  ,
2

similar documents