05.cviceni-predikce_multi_AKT

Report
ZÁKLADY EKONOMETRIE
4. cvičení
PREDIKCE
MULTIKOLINEARITA
1
Predikce
1.
2.
Predikce bodová a intervalová
Ex ante a ex post
2
Predikce
Cílem predikce (předpovědi) je kvantitativní
odhad endogenní proměnné mimo interval
pozorování s využitím minulé i současné
informace
Ex-ante - podmíněná
Ex-post - pseudopředpověď
3
Dělení predikce
období
extrapolaci do budoucna,
extrapolace do minulosti nazývanou jako retrospektiva,
znalosti endogenní proměnné v období prognózy na
ex-post predikci, kdy známe hodnotu endogenní proměnné
v období - pseudopředpověď,
ex-ante - klasické chápání předpovědi,
znalosti exogenních proměnných v období prognózy na
podmíněnou predikci – pro období předpovědi neznáme
hodnoty exogenních proměnných, tyto hodnoty musíme také
predikovat, předpověď Y je tedy podmíněná předpovědí
hodnot X,
nepodmíněnou predikci – pro období předpovědi známe
hodnoty exogenních proměnných.
4
Predikce Ex-Ante
Podmíněná volbou vysvětlující proměnné
vysvětlující proměnnou máme buď zadanou, nebo zadanou ve formě
procentuálního nárůstu
Predikce může být bodová
YˆT 1  xTT1b .
nebo intervalová – v GiveWinu 2 možnosti:
Yˆ  sigma
YˆT  t1* /2  s p ,
s p  s 1  xTT ( XT X) 1 xT
Intervalovou předpověď můžeme interpretovat tak, že pro
opakované výběry daný interval obsahuje se spolehlivostí (1 –
α)∙100 % skutečnou hodnotu proměnné Y v období předpovědi.
5
Predikce Ex-post
Vyřadím určitý počet pozorování z modelu, poté
odhadnu model, předpovím pozorování a
zkontroluji s jejich skutečnou hodnotou.
Chyba odhadu
H0: Chyba není statisticky významná(model je vhodný
k predikci)
H1: Chyba je statisticky významná
Testujeme pomocí t-statistiky
6
Příklad 1 – eko1.xls
Odhadněte závislost maloobchodního obratu na
disponibilním příjmu a cenovém indexu.
Y – maloobchodní obrat potřeb pro domácnost
v mld. CZK
X1 – disponibilní příjem v mld. CZK
X2 – cenový index
Proveďte predikci bodovou a intervalovou pro
disponibilní příjem 211 mld. CZK a cenový index
113.
Ověřte, zda je model vhodný k predikci pomocí expost predikce.
7
Ekonomická specifikace
= tj. zhodnocení odhadnutých koeficientů z hlediska
znaménka a intervalu
b0 – úrovňová konstanta může být libovolná, vzniká z
podmínky, aby součet čtverců reziduí byl minimální
b1 – v intervalu (0,1) pokud nepracujeme s
úsporami nebo >0 s úsporami
b2 – by mělo být < 0
Příklad – eko1.xls
Výstup z GiveWinu:
EQ( 1) Modelling y by OLS (using eko1.xls)
The estimation sample is: 1966 to 1973
Constant
x1
x2
Coefficient
3.01620
0.103550
-0.0979638
sigma
R^2
log-likelihood
no. of observations
mean(y)
0.120682
0.997094
7.44531
8
10.5
Std.Error
1.032
0.004550
0.01583
t-value
2.92
22.8
-6.19
t-prob Part.R^2
0.033
0.6308
0.000
0.9904
0.002
0.8845
RSS
0.0728202076
F(2,5) =
857.8 [0.000]**
DW
1.95
no. of parameters
3
var(y)
3.1325
9
Regresní nadrovina – zápis:
Napozorované hodnoty:
Y = 3,016 + 0,104X2 – 0,098X3 + e
Vyrovnané hodnoty:
Y^ = 3,016 + 0,104X2 – 0,098X3
Intervalový odhad
Provést intervalový odhad alespoň u
jednoho parametru, který je statisticky
významný
• pro β2:
0,104 – 0,0046*2,57<= β2<= 0,104 + 0,0046*2,57
0,092 <= β2<= 0,114
Absolutní pružnost
dle vzorců:
b1 = 0,104 – vzroste-li disponibilní příjem o 1 jednotku (tj. o 1 mld
CZK) a X2 se nezmění, vzroste maloobchodní obrat potřeb pro
domácnost v průměru o 0,104 mld CZK.
b2 = - 0,098 – vzroste-li cenový index X2 o jeden procentní bod a
X1 se nezmění, klesne maloobchodní obrat potřeb pro domácnost
v průměru o 98 miliónu CZK.
definovány v daných jednotkách
Relativní pružnost pro r. 2003
Y(73) = 13,6; X2(73) = 209, X3(73) = 113
zvýší-li se v roce 73 X2 o 1 % a X3 je pevné, vzroste Y v průměru o 1,59 %
zvýší-li se v roce 73 X3 o 1 % a X2 je pevné, klesne Y v průměru o 0,8 %
Predikce – EX ANTE
Bodová predikce
Dynamic (ex ante) forecasts for y (SE based on error
variance only)
Horizon
Forecast
(SE)
2004
13.7953
0.1207
Dynamic (ex ante) forecasts for y (SE with parameter
uncertainty)
Horizon
Forecast
(SE)
2004
13.7953
0.1584
Intervalová predikce
S parametrem sigma:
YˆT  s  13,7953  0,1207.
S parametrem chyby předpovědi:
YˆT  t1* /2  s p  13,7953  2,57  0,1207
14
Predikce – EX POST
Odhadnutý model na období 1996 – 2001
Provedena predikce 2002, 2003
Dynamic (ex ante) forecasts for y (SE based on error variance only)
Horizon
Forecast
SE
Actual
Error
t-value
2002
12.3717
0.1076
12.1000
-0.271654
-2.524
2003
13.7732
0.1076
13.6000
-0.173184
-1.609
Intuitivní vyhodnocení pomocí % chyby z
skutečné hodnoty:
X = 0,2716/12,1 = 0,022 = 2,2 % < 5 %
Pomocí t-testu: H0: Chyba není st. Významná
2,524 (z výstupu abs hodnota) < 2,57 (tabulková
hodnota) → Nezamítáme H0, chyba není statisticky
významná.
15
MULTIKOLINEARITA
1.
2.
3.
4.
Podstata
Příčiny
Důsledky
Měření
16
MULTIKOLINEARITA
Multikolinearita = existence více než jednoho
vztahu lineární závislost mezi pozorováními
vysvětlujících proměnných
Kolinearita = existence pouze jednoho
lineárního vztahu
Pozn. Většinou se v obou případech používá pojem multikolinearita
17
Multikolinearita
18
MULTIKOLINEARITA
Týká se pouze výběrového vzorku, nikoliv
abstraktního modelu !!!
multikolinearita se NETESTUJE, jen měří v jednom
konkrétním výběru
Podstata zkoumání: intenzita závislosti mezi
dvěma nebo více vysvětlujícími proměnnými
Zda je či není multikolinearita únosná
19
Příčiny
Tendence časových řad ekonomických ukazatelů
(makroúdajů) vyvíjet se stejným směrem (např.
HDP, C, I, S, Ex, Im)
Průřezová analýza (např. proměnná příjem a
bohatství)
Zahrnutí zpožděné endo nebo exo proměnné.
Špatně diskretizovaná proměnné pomocí 0, 1
20
Důsledky
Snížená přesnost odhadů regresních koeficientů
Velké standardní chyby odhadové funkce MNČ
Pochybnosti či nejistotu pokud jde o správnost
specifikace modelu
Odhady zůstávají nestranné, vydatné
Velká citlivost odhadové funkce MNČ na velmi
malé změny v matici X
Obtížné vyjádření odděleného působení silně
kolineárních proměnných.
21
Měření multikolinearity – Metoda I
Použití párových korelačních koeficientů
Pouze pro 2 vysvětlující proměnné:
rx1x2
cov( x1 x2 )

 1,1
sx1 sx2
multikolinearita je únosná, pokud:
rX X ≤ 0,9 a současně
1 2
rx x  R
2
koeficient vícenásobné
determinace modelu
1 2
22
Párové korelační koeficienty
modul PcGive
Package → Descriptive Statistics
Model → Formulate – Vložím proměnné
zvolit nabídku korelační matice
23
Měření multikolinearity – Metoda II
Využívá se pomocných regresí
Více vysvětlujících proměnných (tj. nelze dělat
párové korelační koeficienty)
Využívá se koeficientů pomocné regrese Ri2
Pokud máme model Y = f(X1, X2, X3) … z modelu
… R2
X1= f (X2,X3) … R12
X2= f (X1,X3) … R22
X3= f (X1,X2) … R32
jsou-li všechna Ri2 < R2,
pak je multikolinearita
únosná
24
Příklad 2 – eko1.xls
Odhadněte závislost maloobchodního obratu na
disponibilním příjmu a cenovém indexu.
Y – maloobchodní obrat potřeb pro domácnost
v mld. CZK
X1 – disponibilní příjem v mld. CZK
X2 – cenový index
Je v modelu multikolinearita?
25
Příklad KUŘE
Určete, jak závisí počet prodaných kuřat na níže
uvedených proměnných. K dispozici máme
roční pozorování od roku 1960 do roku 1982.
Y – počet prodaných kuřat (v desítkách milionů kusů)
X2 – výše dotace do zemědělství (v miliardách Kč)
X3 – cena za kuře (Kč/kilo)
X4 – cena vepřového (Kč/kilo)
Je v modelu multikolinearita?
26
Možná otázka do závěrečného testu
Predikce
Multikolinearita
Podstata
Příčiny
Důsledky
Měření
27

similar documents