EKO_KLRM1_2013_1D

Report
Ekonometrija 1D
Ekonometrija, Doktorske studije
Predavač: Aleksandra Nojković
Beograd, školska 2012/13
Struktura predavanja
• Uvodna razmatranja
• Jednostavna regresiona analiza i metod običnih
najmanjih kvadrata (metod ONK)
• Klasični jednostavni linearni regresioni
model(KLRM)
• Svojstva ocena dobijenih primenom metoda
ONK u KLRM
• Statisticko zaključivanje u KLRM
• Klasični višestruki linearni regresioni model
• Pokazatelji kvaliteta ocenjenog modela
• Testovi linearnih ograničenja na parametre
• Testovi stabilnosti
Neke definicije termina ekonometrija




Naucna disciplina koja se bavi merenjima u
ekonomiji.
Nastanak se vezuje osnivanje Ekonometrijskog
društva 1930 godine (1933. god. pokreće se
časopis “Econometrica”).
Nauka koja primenjuje metode matematičke
statistike na ekonomske podatke u cilju analize
valjanosti postavki ekonomske teorije
(Samuelson, Koopmans,Stone, 1954).
Osnovni zadatak ekonometrije jeste
oživljavanje (engl. “to put empirical flesh and
blood”) teorijskih struktura (Kennedy, 1998).
Još neke definicije

Ekonometrija označava primenu statistickih
metoda na probleme koji interesuju
ekonomiste (Ashenfelter, Levine and
Zimmerman, 2003)
Problemi se javljaju:
- makroekonomiji
- mikroekonomiji i
- finansijskoj ekonomiji.

Osnovni ciljevi ekonometrije



Utvrdivanje kvantitativne zavisnosti veličina
u ekonomskoj relaciji
- Modeliranje ekonomskih velicina: koliko
se promeni jedna veličina sa promenom
druge.
Ispitivanje valjanosti postavki ekonomske
teorije
- Testiranje konkurentnih hipoteza.
Predvidanje buduceg kretanja ekonomskih
veličina na osnovu utvrđene kvantitativne
veze.
Ekonometrijska istraživanja se zasnivaju
na rezultatima sledećih naučnih
disciplina:



Ekonomska teorija (matematicka ekonomija):
teorije i ideje su formulisane u formi
matematičkih jednacina (bez brojeva).
Ekonomska statistika: prikupljanje i obrada
podataka.
Matematička (teorijska) statistika: izvodenje
zaključaka o ekonomskim odnosima primenom
statistickih metoda (merenje i testiranje
hipoteza) na konkretne podatke.
Veza ekonometrije sa drugim
naučnim disciplinama


Ekonomija vs. Ekonometrija: Prilagođavanje
problemima ekonomskog života se se sastoji u
specifikovanju stohastičkih elemenata u
ekonomskom ponašanju.
Statistika vs. Ekonometrija: Korišćeni podaci se
mogu interpretirati kao slučajan uzorak, na koji se
primenjuju statistički metodi prilagođeni radu sa
ekonomskim podacima (korigovani metodi
statističke nalaize).
Metodologija ekonometrjskog istraživanja
Metodologija (faze) ekonometrijskog
istraživanja
1.
2.
3.
4.
5.
6.
Izbor teorijskog modela
Postavka ekonometrijskog modela
Prikupljanje podataka
Ocena parametara modela
Ispitivanje valjanosti ocenjenog modela
Predviđanje
Vrste podataka
Podaci vremenskih serija
- Godišnji, kvartalni mesecni, dnevni, kako se
obavi transakcija.
 Podaci preseka (strukture, uporedni)
- Vrednosti različitih promenljivih koje
definišu strukturu u datom trenutku
vremena.
 Podaci panela
- Kombinacija podataka vremenskih serija i
podataka preseka.

Jednostavna regresiona analiza



Regresiona analiza predstavlja osnovni
metodološki okvir ekonometrijskog
modeliranja.
Pretpostavimo da raspolažemo podacima o
potrošnji i dohotku za odredeni broj slučajnih
ispitanika period i da želimo da otkrijemo
prirodu njihove međusobne povezanosti
(primer: Asteriou and Hall (2007), str.47,
tabela 4.2).
Cilj regresione analize jeste utvrđivanje
prirode i forme povezanosti između
promenljivih.
Primena jednostavne regresije

Pretpostavljamo da je veza između potrošnje i
dohotka pozitivna. Hoćemo da opišemo potrošnju kao
funkciju dohotka.
- Potrošnja: zavisna promenljiva/varijabla (Y)
- Dohodak: nezavisna promenljiva/varijabla (X)


U regresionoj analizi zavisna (Y) i nezavisna (X)
promenljiva imaju potpuno razlicitu poziciju (razlika sa
korelacionom analizom).
– Promenljiva Y je stohastickog tipa, što znaci da je slucajna
promenljiva koju karakteriše odredena raspodela.
– Promenljiva X uzima fiksirane vrednosti iz ponovljenih
uzoraka. Ona nije stohasticke prirode.
– Postoji jednosmeran pravac uzrocnosti: samo X utice naY,
dok Y ne utice na X.
Dijagram rasturanja tačaka sa
paravom linijom
180
160
potrosnja
140
120
100
80
60
80
100 120 140 160 180 200 220 240 260
dohodak
Populaciona i uzoracka
regresiona prava (jednačina)

Populaciona regresiona prava označava stvarnu stohastičku
vezu izmedu datih promenljivih (sadrži stvarno b0 i b):
Yi  b 0  bX i 



sistematski deo

i
stohastiički deo
za i=1,2,..., n.
Uzoračka regresiona prava opisuje vezu prema datom
uzorku:



Y i  b 0  b X i  b0  bXi

Stvarni nivo zavisne promenljive je zbir ocenjenog nivoa i
onoga što model nije ocenio (reziduala, obeležavaju kao ei).

Yi  Yi  ei

Uzoracka regresiona prava (jednacina) se koristi za
donošenje zakljucaka o parametrima populacione
regresione jednacine.
Metod običnih najmanjih kvadrata
(metod ONK)


Najcešce korišcen metod postavljanja prave i izbora
regresionih koeficijenata jeste metod obicnih najmanjih
kvadrata (ONK).
Ideja metoda: minimizirati zbir kvadrata odstupanja
podataka od prave.
Ocene metodom ONK

Izvođenje ocena...

Ocene ONK:
n

b b
n
n
n X iYi   X i Yi
i 1
i 1
i 1


n X    X i 
i 1
 i 1 
n
n
2
i

b 0  b0  Y  b X
2
n

x y
i 1
n
i
x
i 1
2
i
i
Ocena potrošne funkcije iz Eviews-a
(Primer 1)
Dependent Variable: Y
Method: Least Squares
Date: 06/08/11 Time: 14:32
Sample: 1 20
Included observations: 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
X
15.11641
0.610889
6.565638
0.038837
2.302352
15.72951
0.0335
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.932182
0.928415
6.879603
851.9210
-65.89639
247.4176
0.000000
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
115.5160
25.71292
6.789639
6.889212
6.809076
2.283770
Interpretacija ocena bo i b?




b oznacava prirast zavisne promenljive po
jedinici prirasta nezavisne.
bo oznacava nivo zavisne promenljive kada
je nivo objašnjavajuće promenljive nula
(dohodak je nula).
Sa rastom dohotka za jednu jedinicu
potrošnja raste za 0.61 jedinica.
Ukoliko je nivo dohotka nula, potrošnja
iznosi 15.12 jedinica.
Pretpostavke klasicnog linearnog
regresionog modela (KLRM)

1.
2.
3.
4.
5.
Pretpostavke KNLRM/KLRM o εi :
E(εi)=0, za svako i.
Var(εi )=E(εi2)=σ2, za svako i.
Cov(εi,εj)=E(εiεj)=0, za svako i,j, tako da i≠j.
E(εiXi)=0, za svako i.
εi ~ N(0, σ2).
Implikacije navedenih pretpostavki


Ocena b je linearna funkcija slucajne
promenljive Yi.
Posledice:
– Ocena b je slucajna promenljiva
– Ocena b ima normalnu raspodelu.
Svojstva ocena koje su dobijene
primenom metoda ONK


•
•
•
•
Ako su zadovoljene pretpostavke KLRM od 1. do 4. tada se
primenom metoda ONK dobijaju najbolje linearne
nepristrasne ocene (NLNO).
Šta to znaci?
Ocena: b je ocena stvarne vrednosti parametra β.
Linearna: b je linearna funkcija raspoloživih podataka.
Nepristrasna: u proseku ocena b je jednaka parametru β.
Najbolja: ocena je efikasna (nepristrasna ocena sa
najmanjom varijansom).
Nepristrasnost/Efikasnost/Konzistentnost

Nepristrasnost
Ocene metoda ONK su nepristasne. To znaci da su ocene
u proseku jednake parametrima koji se ocenjuju:
E(b0)=β0 i E(b)= β.

Efikasnost
Ocene metoda ONK su efikasne ocene. Ocena je efikasna
ako je nepristrasna i ako ne postoji druga nepristrasna
ocena koja poseduje manju varijansu. To je nepristrasna
ocena sa najmanjom mogućom varijansom.

Konzistentnost
Ocene metoda ONK su konzistentne. To znaci da sa porastom
obima uzorka ocena konvergira u verovatnoci ka stvarnoj
vrednosti parametra. Nepristrasna ocena je konzistentna ako
njena varijansa teži nuli sa porastom obima uzorka.
Asimptotska svojstva ocena

-

Asimptotska nepristrasnost: Eb  b, za n  .
Ocena je asim. Nepristrasna ako postaje nepristrasna
sa rastom uzorka.
Konzistentana - ako konvergira u verovatnoći ka
pravoj vrednosti parametra, kada n teži ka nuli:
p limb  b.
-

Konzistentna: varijansa i pristrasnost (SKG) teže ka
nuli kada obim uzorka teži ka beskonačnosti.
Asimptotska efikasnost: konzistentna ocena sa
najmanjom asimptotskom varijansom (najbrže
konvergira u verovatnoći ka β).
Osobine ocena dobijenih metodom NK
i metodom MV



Ocene dobijene metodom NK imaju sve poželjne
osobine u malim uzorcima.
Metod maksimalne verodostojnosti (MV) daje
ocene parametara koje imaju poželjne
asimptotske osobine: konzistentost i asim.
efikasnost.
Metod MV se koristi kada su na raspolaganju
veliki uzorci i kada se pretposavka o normalnoj
distribuciji grešaka može smatrati opravdanom
(u opštem slučaju pristrasne u malim uzorcima).
Kako merimo preciznost ocena?





Svaki drugi uzorak daje nove ocene parametara bo i
b. Ako se sa promenom uzorka ocene malo
razlikuju, onda one imaju malu varijansu i obratno.
Preciznost ocene se meri na osnovu ocene varijanse
ocena.
Kvadratni koren iz ocene varijanse je standardna
greška ocene.
Da bi se izračunale standardne greške ocena
potrebno je prethodno oceniti varijabilitet slučajne
greške modela.
ˆ 2 (s2).
U pitanju je ocena parametra 
Ocena varijanse slučajne greške
modela (σ2) i ocene varijansi ocena
parametara bo i b

Nepristrasna ocena σ2 je:
n
ˆ 2  s 2 

 ei
2
i 1
n2
Sada možemo da analiziramo ocene varijansi ocena
parametara bo i b:
1
X 
varb0   sb20  s 2  
 n  x2 
i 



s2
varb  s 
2
x
i
2
b
Standardne greške ocena parametara biće
manje ukoliko je:




Manji stepen stohastičnosti između Xi i Yi,
odnosno manja ocena varijanse s2 (manji
varijabilitet modela).
Veći varijabilitet objašnjavajuće promenljive Xi
(suma kvadrata odstupanja X od aritmetilčke
sredine).
Veći uzorak (n).
Standardna greška ocene slobodnog člana zavisi
i od aritimeticke sredine podataka za X.
(Podaci su udaljeniji od y-ose što je vrednost ove
aritmetičke sredine veća. Rezultat: nepreciznija ocena
slobodnog člana).
Statističko zakljucivanje u KLRM


Izvođenje zaključaka o svojstvima parametara
osnovnog skupa na osnovu ocenjenih regresionih
parametara.
Primer: Ocenjen je model oblika:

Y i  15.12  0.61X i
(6.57) (0.04)


Ocena 0.35 je (tackasta) nepoznatog parametra
nagiba. Koliko je ta ocena pouzdana?
Odgovor na to pitanje daje standardna greška ocene.
Testiranje hipoteze: osnovni elementi





Interesuje nas da li parametar nagiba uzima tacno
odredenu vrednost.
Postavljamo dve hipoteze: nultu (oznaka H0) i
alternativnu hipotezu (oznaka H1).
Nulta hipoteza je iskaz ciju valjanost ispitujemo,
odnosno testiramo. Alternativna hipoteza obuhvata
sva alternativna tvrđenja.
Na primer, interesuje nas da li se zavisna
promenljiva menja u istom obimu kao i
objašnjavajuca, odnosno da li je β jednako 1.
Koristimo sledeću notaciju:
H0 : β =1
H1 : β ≠1
Raspodela verovatnoće ocena
dobijenih metodom ONK

Standardizovanjem slučajnih promenljivih b i b0
dobijamo:
b b
b b
: N(0,1), 0 0 : N(0,1)
varb
varb0 

Medutim, varijanse ocena su su nepoznate velicine.
Ako ih zamenimo odgovorajućim ocenama, tada
dobijamo slučajne promenljive sa t-raspodelom
(proveriti!)
b  b0
bb
: t (n  2), 0
: t (n  2).
sb
sb0
Testiranje hipoteza: algoritam

Posmatramo model oblika:
Yi  b0  b Xi   i , za i  1,2,...,n.

Testiramo vaidnost hipoteze:
H0: β = β*, H1:β ≠ β*

Koraci u postupku testiranja:
1. Ocenjujemo: b, b0, sb, sbo na poznati nacin.
2. Racunamo test-statistiku koristeci sledeću formulu:
test  statistika 
bb *
: t (n  2),
sb
gde je β * vrednost β u uslovima važenja nulte hipoteze.
Testiranje hipoteza: algoritam
(nastavak)
3. Sastavni deo testiranja hipoteze je izbor nivoa značajnosti,
koji se cesto oznacava sa . To je verovatnoća odbacivanja nulte
hipoteze u situaciji kada je ona tačna. Uobičajeno se koristi nivo
značajnosti 5%.
4. Definišemo pravilo odlučivanja, kriterijum po kojem
odbacujemo nultu hipotezu. Ako je:
bb *
 t( n  2 ) 0.025 ,
sb
Odbacujemo H0 kao netačnu uz nivo značajnosti 5%.
5. Konačno sprovodimo testiranja. Ako izračunata test statistika
leži u oblasti prihvatanja nulte hipoteze, tada se nulta hipoteza ne
odbacuje. Obratno, ako izračunata teststatistika pripada kritičnoj
oblasti testa, tada nultu hipotezu odbacujemo za dati nivo
značajnosti.
Specijalni tip hipoteze: t-odnos

Pretpostavimo da nas interesuje:
H0: β = 0, H1:β ≠ 0.
Ako je tačna nulta hipoteza, tada objašnjavajuća promenljiva ne
utiče na kretanje zavisne promenljive. Na ovaj način proveravamo
opravdanost postavke modela.

U tom slučaju opšti oblik test statistike postaje t-odnos, zapravo
odnos ocene i odgovarajuce standardne greške ocene:
test  statistika  t  odnos
b
: t (n  2).
sb
Klasicni višestruki linearni
regresioni model

Analiticki oblik višestrukog linearnog regresionog
modela:
Yi  b0  b1 X1i  b 2 X 2i  ...  bk X ki   i ,

za i  1,2,...,n.
Parametri β1, β2,..., βk su parcijalni koeficijenti
nagiba.
Na primer: ako se X1i poveća za jednu jedinicu, očekivana
promena Yi je β1 jedinica, pod pretpostavkom da se ne
menja uticaj ostalih objašnjavajućih promenljivih X2,X3,...,Xk.
Pretpostavke KLRM (višestrukog)
1.
2.
3.
4.
5.
6.
E(εi)=0, za svako i.
Var (εi)=E(εi2)=σ2, za svako i.
Cov(εi,εj)=E(εiεj)=0, za svako i,j, tako da i≠j.
E(εiXi)=0, za svako i.
εi ~ N(0, σ2).
Ne postoji tačna linearna zavisnost izmedu
objašnjavajucih promenljivih (ni jedna od
objašnjavajucih promenljivih se ne može
predstaviti kao linearna kombinacija ostalih).
Klasicni višestruki linearni
regresioni model (matrična notacija)

U matričnoj notaciji:
y=Xβ + ε,
gde su: y (nx1) vektor kolona; X (nxk) matrica; β
(kx1) vektor kolona; ε (nx1) vektor kolona.

Matrica X: svaki red predstavlja vrednost svih
eksplanatornih prom. koje odgovaraju jednoj
opservaciji, a svaka kolona predstavlja sve
vrednosti jedne eksplanatorne prom. u uzorku.
Pretpostavke KLRM u matričnoj notaciji
1)
2)
3)
ε ~ N (0,Σ), gde je nula vektor kolona sa
elementima jednakim nuli, a Σ je matrica
(nxn).
E(εε’)=σ2In, gde je In jedinična matrica tipa
(nxn), sa jedinicama na glavnoj dijagonali, sve
ostalo su nule.
Elementi matrice X su nestohastički, sa
vrednostima fiksiranim u ponovljenim
uzorcima, a matrica (1/n)(X’X) je nesingularna
i njeni elementi su konačni za bilo koju veličinu
uzorka.
Pretpostavke KLRM u matričnoj notaciji
(nastavak)


Po prvoj pretpostavci, greška je N distribuirana, a očekivana
vrednost je nula za sve opservacije.
Po drugoj pretpostavci, matrica varijansi i kovarijansi
grešaka različitih opservacija definisana je kao:
 
 E 12
E1 2   E1 n   2

 
2




E


E


E


0
2
2 n 
  E  '   1 2

 

  

 
2




E


E



E

 1 n
  0
2 n
n
 
 
 
0
2

0
0

 0
  2 I.
 

  2 

-Pretpostavka sadrži dve ranije pretpostavke:
odsustvo autokorelacije i homoskedstičnost.
 Po trećoj pretpostavci, vrednosti regresora su fiksne za date
opservacije, broj opservacija je veći od broja parametara za
ocenjivanje i nema perfektne linearne zavisnosti između
regresora.
Primena metoda ONK


Primenom metoda ONK dobijaju se najbolje linearne
nepristrasne ocene.
Vektor originalnih vrednosti y se može zapisati kao zbir
objašnjenih i neobjašnjenih vrednosti modelom:
y  Xbˆ  e ,

Da bismo dobili ocene parametara β1, β2,..., βk potrebno je
da odredimo minimum rezidualne sume kvadrata:



'
ˆ
ˆ  yý  2 bˆ ' X ' y  bˆ ' X' Xbˆ ,
e

e
'
e

y

X
b
y

X
b
i1
n
2
i
u odnosu na ocene parametara β1, β2,..., βk.
Primena metoda ONK (nastavak)

Izvođenje ocena....

Vektor ocena je:
 b1 
b 
b   2   ( x' x) 1 ( x' y ).

 
bk 
Određivanje standardnih grešaka
ocena u višestrukom modelu

U višestrukom modelu ocene varijanse σ2 je:
ˆ 2  s 2 

e' e
nk
U višestrukom modelu ocene varijansi
vektora ocena je:

var(b)  sb2  s 2 x' x 
1
Specifičan tip t-testa: t-odnos

Kao i u slucaju jednostavnog modela, i u višestrukoj
regresiji se koristi test-statistika oblika:
test  statistika 


bi  bi *
: t (n  k ).
sbi
Pretpostavimo da je hipoteza od interesa:
H0: βi = 0, H1:βi ≠ 0 i=1,2,...,k.
U uslovima validnosti nulte hipoteze test-statistika je:
test  statistika 

bi
: t (n  k ).
sbi
Buduci da je u pitanju kolicnik ocene i odgovarajuce
standardne greške te ocene, ova statistika se naziva todnos. Na ovaj način se proverava značajnost pojedinačnog
uticaja svake od objašnjavajucih promenljivih na zavisnu
promenljivu.
Korelacija u jednostavnom i višestrukom
modelu

Za jednostavni model važi:
sx
sx
ˆ
rxy  b  b .
sy
sy

U višestrukom modelu sa npr. dve objašnjavajuće
promeljive X1 i X2, važi da koeficijent parcijalne
korelacije između Y i X1 (koeficijent prvog reda ili
koef. korelacija po odbitku uticaja X2) odgovara
znaku ocenjenog regresionog koeficijenta bˆ 1 b1  :
r

YX 1 X 2

r
YX 1
 r YX
1  r YX
2
2
r
X1X 2
1  rX X
.
2
2
1
2
Videti Primer 2, zavinost Y od X1 i X2.
Pokazatelj kvaliteta regresije:
koeficijent determinacije
•
•
•
Koji deo varijacija zavisne promenljive je objašnjen modelom,
odnosno varijacijama nezavisne promenljive?
Odgovor na to pitanje daje koeficijent determinacije R2.
Ukupni varijabilitet zavisne promenljive definiše se na sledeći
način:
USK    yi  y 
2
i
•
Ukupni varijabilitet zavisne promenljive može se predstaviti kao
zbir dve komponente:
1. Varijabilitet zavisne promenljive koji je objašnjen
modelom:
2
OSK    yˆi  y 
i
2. Varijabilitet zavisne promenljive koji nije objašnjen
modelom, rezidualna suma kvadrata).
2
RSK    yi  yˆi    ei2
i
i
Koeficijent determinacije R2 (II)
yi  y  yˆ i  y  
yi  yˆ i 

ei
  yi  y    yˆ i  y    ei2  2 yˆ i  y ei
i
i
i
t


2
2
0
 USK  OSK  RSK
Koeficijent determinacije R2 (III)

Dakle, USK = OSK + RSK
2
2
ˆ




y

y

y

y
  ei2
 i
 i
i

i
Koeficijent determinacije predstavlja udeo objašnjenog u
ukupnom varijabilitetu:
OSK
R2 

USK

i
 yˆ
y
2
i
2
i
.
Kako je: OSK = USK - RSK, imamo:
R2 
OSK USK  RSK
RSK

 1
USK
USK
USK
R 2  1
e
i
2


y

y
 i
i

2
i
R2 se uvek nalazi u intervalu od 0 do 1.
Ekstremni slučajevi: R2 = 0 i R2 = 1
yt
yt
y
xt
xt
Ograničenja u primeni R2 kao pokazatelja
kvaliteta regresije
1.
R2
se uvek povećava sa dodavanjem
objašnjavajućih promenljivih:
Regresija 1: yi = β0 + β1x1i + β2x2i + εi
Regresija 2: yi = b0 + β1x1i + β2x2i + β3x3i + εi
novih
R2 će uvek biti veći u regresiji 2, bez obzira na to kakva je
eksplanatorna snaga nove objašnjavajuće promenljive.
To je sasvim jasno iz sledećih izraza:
R2 
r
2
YX 1
 r YX  2 r YX
2
2
1  rX X
2
1
2
1
r r
YX 2
X1X 2
.
Ograničenja u primeni R2 kao pokazatelja
kvaliteta regresije (nastavak)
-
Odnosno, izraženo preko parcijalnih koeficijenata
korelacije:

R  r YX  1  r YX
2
2
1
2
1
r
2
YX 2 X1
,
2. R2 je krajnje nepouzdan pokazatelj u regresionoj
analizi vremenskih serija kada vrednost, na
primer 0.999, ne mora nužno pokazivati ništa.
Korigovani koeficijent determinacije R2


Koriguje se koeficijent determinacije sa ciljem dobijanja
pokazatelja koji se neće neopravdano povećavati sa
rastom broja objašnjavajućih promenljivih.
Novi pokazatelj: korigovani koeficijent determinacije R 2
R 2  1
e
i
 y
i
R 2  1
i  y
2
e
i
 y
2
i
2
i
/(n  k )
 y  /(n  1)
2
i
 1
n 1
1 R 2
nk


i

Korigovani koeficijent determinacije je uvek manji od
običnog koeficijenta determinacije. Koeficijenti su
jednaki samo za jednostavni model bez slobodnog
člana.
Ispitivanje kvaliteta regresije na
osnovu koeficijenta determinacije:

Hipoteze od interesa:
H 0 : b1  b 2  ...  b k  0  H 0 : R 2  0
H 1 : hipoteza H 0 nije tacna  H 1 : R 2  0


Nulta hipoteza: regresija nije statistički
značajna (zajednički uticaj objašnjavajućih
promenljivih nije statistički značajan).
Alternativna hipoteza: objašnjavajuće
promenljive ostvaruju statistički značajan
uticaj na kretanje zavisne promenljive (bar
jedan od parametara je značajno različit od
nule).
Ispitivanje kvaliteta regresije na
osnovu koeficijenta determinacije
(II)

Relevantna statistika
Objasnjeni varijabilitet /(k - 1)
Neobjasnjeni varijabilitet/(n  k )
OSK /(k  1)
Fnkk1 
RSK /(n  k )
Fnkk1 
k 1
nk
F

R 2 /(k  1)

(1  R 2 ) /(n  k )
Pravilo odlučivanja:
 Ako je izračunata vrednost date statistike
veća od kritične vrednosti F-raspodele sa k-1 i
n-k stepeni slobode, tada se nulta hipoteza
odbacuje uz izabrani nivo značajnosti.
Testovi linearnih ograničenja na parametre


1)
2)
Ekonomski kriterijumi često zahtevaju da koeficijenti u
ocenjenom modelu zadovoljavaju izvesna ograničenja
(npr. konstantni prinosi u Cobb-Douglasovoj funkciji;
odsustvo iluzije novca (zbir elastičnosti tražnje s
obzirom na nominalni dohodak i cene je jednak nuli i
sl.)).
Dva alternativna postupka:
Oceniti f-ju ne vodeći računa o ograničenjima, a
zatim testirati da li ocenjeni koeficijenti
zadovoljavaju zahtevane resrikcije.
Oceniti model sa inkorporiranim ograničenjima, a
zatim testirati značajnost razlike između ocena
takvog modela (pod ograničenjem) i modelom bez
ograničanje.
Testovi linearnih ograničenja na
parametre (nastavak)


Pri testiranju jednog ograničenja
(jednostavna nulta hipoteza) koristi
se t-test.
U slučaju testa više ograničenja
(kad je nulta hipoteza složena) Fstatistika.
Prvi postupak testiranja
Jedno postavljeno ograničenje:
H0: c’β=r ; H1: c’β≠r,
gde je c’ vektor konstanti specifikovanih da
odgovaraju ograničenju, a r poznata konstanta.


Npr. Hipoteza o konstantnim prinosima
(β1+β2=1) u Cobb-Douglasovoj f-ji Q=β0Kβ1Lβ2
se definiše:
c’=[1 1], β’=[β1 β2], r =1.
Prvi postupak testiranja: t-test

Nulta hipoteza se testira ispitujući da li se
ocenjene vrednosti parametara statistički
značajno razlikuju od pretpostavljenih, sledećom
statistikom testa:
t* 
c' bˆ  r
1
ˆ c' ( x ' x ) c
~ t (n  k ),
ˆ)
gde se podrazumeva da je linearna kombinacija (c' b
jednaka pretpostavljenoj vrednosti u nultoj hipotezi
(r),a u imeniocu je standardna devijacija te linearne
kombinacije regresionih parametara.
Primer 3. Cobb-Douglas-ova funkcija

Ako je Cobb-Douglasova proizvodna funkcija oblika Y=β0Kβ1Lβ2
eu, gde je Y proizvodnja, K kapital i L rad, ocenjena na bazi
podataka za SAD za period 1Q1960-1Q1991 (primer: Asteriou
and Hall (2007), str.81, vezba 5.5):
ˆ  4.514 0.383log K  0.624log L
log Y
(0.008)


R 2  0.968
(0.088)
U pitanju je dvojno-logaritamski model u kome
parametri modela β1 i β2 predstavljaju koeficijente
elastičnosti proizvodnje u odnosu na kapital i rad.
Sa povečanjem kaptala za 1% proizvodnja se poveća
za 0,38%, odnosno da povećanjem rada za 1%
proizvodnja se poveća za 0,62%.
Primer CD funkcije (nastavak)
a)
b)
c)
d)
Testirati statističku značajnost pojedinačnog uticaja
rada i kapitala na proizvodnju, na nivou značajnosti
α = 0,05.
Testirati statističku značajnost istovremenog uticaja
objašnjavajućih promenljivih na zavisnu, na nivou
značajnosti α = 0,05.
Testirati hipotezu da rad ostvaruje dvostruko manji
efekat na kretanje proizvodnje u odnosu na kapital.
Testirati hipotezu da su u datoj grani industrije
prinosi konstantni (β1+β2=1). Predložiti
pojednostavljenje funkcije ako se ocenjuje pod datim
ograničenjem.
Drugi postupak testiranja
Za testiranje više ograničenja primenjuje se princip
ocenjivanja modela sa i bez ograničenja.
 Nulta i alternativna hipoteza se definišu na sledeći
način:
H0: Rβ=r ; H1: Rβ≠r,
gde je R poznata matrica tipa (g x k) i ranga g (g je
broj ograničenja), a r je vektor kolona poznatih g < k
elemenata.
 Npr. ukoliko u je modelu sa tri objašnjavajuće
promenljive g=2, odnosno testiramo dva
ograničenja(β1=β2 i β3=0), tada su u nultoj hipotezi:

1  1 0
R
;

0 0 1
b'  b1 b2 b3  ;
r '  0 0 0.
Drugi postupak testiranja: F-test

Distinkcija između nulte i alternativne hipoteze
H0: Rβ=r ; H1: Rβ≠r,
vrši se pomoću sledeće F statistike:
F*

e   e / g



2
0
2
B
2
e
 B /n  k 
(R 2B  R O2 ) / g
g
~
F
n k ,
2
1  R B / n  k 


gde se oznaka (O) odnosi na model sa ograničenjem,
oznaka (B) na model bez ograničenja, a g je broj
ograničenja.
Primer CD funk. (nastavak)

Pri ocenjivanju funkcije uz
ograničenje da su prinosi konstantni
(β1+β2=1) dobijena je rezudualna
suma kvadrata 0.332. Testirati
značajnost razlike tako dobijenih
ocena i ocena NK bez ograničenja
na parametre (u kome je rezidualna
suma kvadrata iznosila 0.331).
Testiranje stabilnosti ocena


Za ispitivanje stabilnosti ocena pri povećanju
uzorka koristi se F-statistika testa (složena
hipoteza).
Dve verzije Chow testa.
Chow test (prva verzija: engl. Chow
forecast test)
Pretpostavimo da je prvobitni uzorak n1, a za period
predviđanja imamo još dodanih n2 opservacija (ukupno
n=n1+n2), videti Primer 4.
 Nulta hipoteza da su reg. parametri ostali nepromenjeni i u
proširenom modelu:
H0: β1=β,
testira se ispitujući značajnost rezidualne sume kvadrata iz
Proširenog (indeks 0) i prvobitnog uzorka (indeks 1):

*
F

e   e / n


2
0
 e /n
2
1
2
1
1
 g
2
~ Fn 2 , n1  g .
Chow test (druga verzija:
engl.Chow breakpoint test)


Testira se prisustvo strukturnog loma (preloma)
u tački X*, koja deli uzorak veličine n na dva
poduzorka, veličine n1 i n2.
Porede se sume kvadrata reziduala dobijene
ocenjivanjem dve odvojene regresije na bazi
skupa opservacija n1 i n2, sa onom dobijenom iz
polazne regresije na osnovu svih n opservacija:
F 
*
 e
2
0
2
1
 ( e12   e 22
 / g
( e   e / n1  n 2  2g 
2
2
~ Fk, n 2  n1  2g ,
gde je g broj parametara u polaznoj regresiji.
Osnovni princip rekurzivne regresije
(rekurzivnih NK)





Postavljena jednačina sa k-parametara se ocenjuje
počevši od prvih k opservacija.
Svaki put se dodaje po jedna opservacija i na taj način
koristi sve veći uzorak iz raspoloživog skupa od n (T)
podataka.
U svakom koraku se ocenjuje sledeća očekivana
vrednost zavisne promenljive.
Na taj način (prognoziranjem “jedan korak unapred”)
određuje se rekurzivni rezidual, kao razlika stvarne i
ocenjene vrednosti.
Ocenjeni regresioni koeficijenti, dobijeni pri tim
iteracijama, nazivaju se rekurzivni koeficijenti.
Rekurzivna reziduali

Analiza stabilnosti koja se zasniva na
primeni NK:
4)
Rekurzivni reziduali
Kusum (CUSUM) test
Kusum (CUSUM) na kvadrat
Rekurzivni koeficijenti

Videti Primere 4 i 5.
1)
2)
3)
Rekurzivni reziduali



Rekurzivni reziduali – ucrtavaju se oko
nulte linije (njihove srednje vrednosti) za
svaku iteraciju (na X osi je prestavljena je
veličina uzorka).
Ucrtavaju se zajedno sa granicom od plus i
minus dve standardne greške.
Reziduali izvan ovih granica sugerišu
nestabilnost ocenjenog modela u datoj
opservaciji.
Rekurzivna reziduali (nastavak)

Za ustanovljene tačke odstupanja izvan granica,
potrebno je značajnost preloma proveriti Chow-ovim
testom:
2
2
*
F

e   e / n


0
 e /n
2
1
1
1
 g
2
~ Fn 2 , n1  g .
gde je n1 broj opservacija, a suma rezidualnih
kvadarata u prvom periodu ima u indeksu 1, suma
rezidualnih kvadrata za sve opservacije (n1+n2) u indeksu
ima o, dok je g broj parametara koji se ocenjuje.

Viša vrednost F* statistike od tablične ukazuje na
slabu moć prognoze prethodno ocenjenog modela,
odnosno na značajnu nestabilnost parametara
(promenu strukture u datoj tački).
CUSUM test



Alternativno, može se koristiti i test koji se
zasniva na kumulativnoj sumi svih prethodnih
rekurzivnih reziduala, deljenih njihovom
dotadasnjom standardnom greškom.
Grafički prikaz ove sume, zajedno sa graničnim
linijama na nivou od 5% značajnosti, ukazuje da
li su parametri modela stabilni.
Ako vektor parametara ne ostaje konstantan u
celom uzorku, ucrtana linija će značajno odstupati
od srednje vrednosti (nulta linija) i istupati izvan
kritičnih vrednosti.
CUSUM na kvadrat



Kao statistika testa može se koristiti i suma
kvadrata rekurzivnih reziduala (kusum-skraćenica
od kumulativna suma) do svake opservacije (t) u
odnosu prema ukupnoj sumi kvadrata reziduala
za ceo uzorak (T).
Očekivana vrednost te statistike raste od nule za
t=k do jedinice za t=T.
Odstupanje izvan granica pri nivou značajnosti od
5% sugeriše nestabilnost, bilo regresionih
parametara bilo varijanse reziduala.
Rekurzivni koeficijenti




Predstavljaju ocene regresionih koeficijenata dobijene
počevši od najmanjeg mogućeg uzorka (n=k), sa sve više
opservacija uključenih u uzorak za ocejivanje.
Posebnim grafikonima su dati pojedinačni rekurzivni
koeficijenti u jednačini, uz granični pojas od plus i minus
dve standardne greške.
U slučaju strukturnog loma, ovi crteži pokazuju velika
odstupanja koeficijeta od prethodnog nivoa ( ili čak i
promenu smera njihovog kretanja pri dodavanju novih
opservacija).
Ukoliko je u posmatranom uzorku došlo do strukturne
promene, neophodno je korigovati početnu fomulaciju
modela (uvođenjem veštačkih ili drugih egzogenih
promenljivih, odnosno uvođenjemenovih jednačina u model).

similar documents