Diapozitiv 1

Report
Korelacijske metode
psihologija (1.st.) – 2. letnik
2011/12
5. predavanje:
logistična regresija
Kaj vpliva na multiplo korelacijo?
• korelacije prediktorjev s kriterijem ()
• korelacije med prediktorji (),
• vplivne točke (/),
• napaka merjenja (),
• variabilnost OV v vzorcu ().
Stabilnost (SE) modela odvisna od:
• korelacij med prediktorji (),
• velikosti vzorca (),
• vplivnih točk ().
REGRESIJSKE PREDPOSTAVKE:
1. Naključno vzorčenje
2. Linearnost
3. Homoscedastičnost
4. Normalnost rezidualov
5. (popolna zanesljivost)
Kaj navajamo pri poročanju?
•Regresijski koeficienti
•Standardne napake
•Intervali zaupanja
•Beta koeficienti
•(Popravljeni koeficient) multiple korelacije in determinacije
•F test za multiplo korelacijo
•(standardna napaka napovedi)
•Pri postopnem vključevanju še spremembo pojasnjene
variance.
Vsote kvadratov
Slide 5
Povzetek
• SST
– Skupna variabilnost (variabilnost med dejanskimi rezultati
in sredino).
• SSR
– Residualna variabilnost/variabilnost napake (Error)
(variabilnost med regresijskim modelom in dejanskimi
razultati).
• SSM
– variabilnost modela (razlika v variabilnosti med modelom
in sredino).
Slide 6
Testiranje modela: ANOVA
SST
Total Variance In The Data
SSM
Improvement Due to the Model
SSR
Error in Model
• Če model daje boljšo napoved kot uporaba sredine
(srednje vrednosti glede na Y), je pričakovati, da bo
SSM mnogo večji kot SSR
Slide 7
Testiranje modela: ANOVA
• Srednja kvadrirana napaka:
– Vsote kvadratov so skupne vrednosti
– Lahko jih izrazimo kot povprečja
– Imenujemo jih „srednji kvadrati“ – MS
Testiranje modela: R in R2
• R: korelacija med opazovanimi vrednostmi na
kriteriju in vrednostmi, napovedanimi z
modelom
• R2: Delež variance, pojasnjene s strani
postavljenega regresijskega modela (kvadriran
Pearsonov koeficient korelacije
• Adj. R2: ocena R2 v populaciji („shrinkage“).
Slide 8
F
MSM
MSR
2
SSM
SST
R 
Regresijske metode:
• Hierarhična:
– Znani napovedniki (glede na predhodne razskave ali teoretične
predpostavke) so najprej vključevani v regresijski model
– Zatem so v ločenem koraku/bloku vključeni novi (manj znani/neznani)
napovedniki
– Raziskovalec določa vrstni red, v katerem so spremenljivke vključevane v
model
– Je najboljša metoda:
• Temelji na preverjanju teorije
• Lahko vidiš edinstven napovedni vpliv nove spremenljivke na izid ker so
znani napovedniki v modelu konstantni/kontrolirani
• You can see the unique predictive influence of a new variable on the
outcome because known predictors are held constant in the model.
– A slabo:
• Zanaša se na to, da raziskovalec ve, kaj počne
Direktna („Forced“):
• Vsi napovedniki so vključeni simultano/naenkrat
• Dobljeni rezultat je odvisen od spremenljivk, ki jih vključimo v
model (lahko so razmeroma naključne)
– Zato je pomembno imeti dobre teoretske razloge za vključitev
posameznih spremenljivk kot napovednike
Stopenjska („Stepwise“):
• Napovedniki so vključeni v model po matematičnem kriteriju (glede na
njihove semi-parcialne korelacije z izidom/kriterijem)
• Računalnik izbere spremenljivke v različnih korakih (korak 1: SPSS pogleda
za napovednikom, ki zmore pojasniti največ variance v kriterijski
spremenljivki)
• Problem te metode: temelji le na matematičnem kriteriju (izbor
spremenljivk v posameznem koraku je odvisen tudi le od majhnih razlik v
semi-parcialnih korelacijah
• Bi morala biti uporabljana le v eksploratorne namene…
Semi-parcialna korelacija:
• Parcialna korelacija:
– Meri odnos med dvema spremenljivkama, pri čemer nadzira učinek
tretje spremenljivke na obe
• Semi-parcialna korelacija:
– Meri odnos med dvema spremenljivkama, pri čemer nadzira učinek
tretje spremenljivke zgolj na eno od obeh
– Meri edinstven prispevek prediktorja k pojasnitvi variance kriterija
Parcialna korelacija
Semi-parcialna korelacija
Generalizacija:
• Pri regresiji upamo, da bomo lahko posploševali z vzorčne ocene
napovedi na celotno populacijo
• Za to mora biti zadoščeno vrsti predpostavk
• Nespoštovanje teh predpostavk nam preprečuje posploševanje na
ciljno populacijo
Osnovne predpostavke:
• Tip spremenljivk: Kriterij (izid) mora biti kontinuiran, Napovedniki so
lahko kontinuirani ali dihotomni/kategorični
• Neničelna varianca: Napovedniki ne smejo imeti ničelne variance
• Linearnost: Odnos, ki ga modeliramo, je (naj bo) v realnosti linearen
• Neodvisnost: Vse vrednosti na kriteriju/izidu moramo dobiti na
različnih osebah
Zahtevnejše predpostavke:
• Čim manjše multikolinearnost: Napovedniki ne smejo biti visoko med
seboj korelirani
• Homoscedastičnost: Za vsako vrednost na napovedniku bi morala biti
varianca napake konstantna
• Neodvisne napake: Za vsak par izmerjenih vrednosti bi morale biti
napake nekorelirane
• Napake bi morale biti normalno porazdeljene
Kako napovedovati dihotomno spremenljivko?
(npr. uspešnost terapije, zaključek šolanja, pravilna rešitev naloge,
strinjanje z določeno trditvijo…)
Uporaba linearne regresije neustrezna:
• kršene predpostavke linearnosti, normalnosti in
homoscedastičnosti (Var odvisna od p)
• napovedane vrednosti izven možnega razpona
• neustrezne ocene parametrov in ocene učinkov
Diskriminantna analiza (DA): “poiščemo obteženo vsoto
napovednikov (enega: => ANOVA, več => MANOVA), ki
maksimizira razlike med skupinama”
-> EN DISKRIMINATOR: Skušajmo napovedati spol osebe na
podlagi merjene višine: = VERJETNOST (natančnost klasifikacije)
DA z dvema diskriminatorjema
DA:
• Diskriminantna funkcija z dvema ali več napovedniki je linearna enačba
teh faktorjev, ki je v vlogi separatorja (kriterija) med dvema skupinama
• Površina pod sečiščem distribucij je področje napačne klasifikacije
0,45
0,4
0,35
0,3
0,25
Skupina 0
0,2
Skupina 1
0,15
0,1
0,05
0
-3
-2
-1
0
1
2
3
Obtežena vsota napovednikov
• Povezana z multivariatno analizo variance (MANOVA).
• Odvisna spremenljivka ima lahko poljubno št. vrednosti.
• Zelo občutljiva na predpostavke!
4
• DA se trudi: maksimizirati SS med skupinami v razmerju
do SS znotraj skupin
• Cilj DA: ne izločiti ene same spremenljivke za ločevanje
med skupinami, ampak čim manjše število spremenljvk
(lahko tudi latentnih), ki bodo omogočale čimvečjo verjetnost
napovedovanja
• Postopno vključevanje: na vsakem koraku upošteva vse
spremenljivke in izbere tisto, ki najbolje ločuje osebke
glede na članstvo v skupini
•
(ta je vključena v model in program nadaljuje z naslednjim korakom).
Če imamo dihotomno ali kako drugače kategorično spremenljivko
(ordinalnega tipa) kot napovednik, lahko uporabimo klasično
regresijsko analizo („…there is nothing in the regression model that
requires regressor variables to be continuous – they can be discrete or
categorical…“)
Slika odnosa med porodno težo in
spola - ilustracija regresije na
binarno spremenljivko
Prilagojena premica gre skozi
povprečno porodno težo za 34
novorojenčic (0 – 3,24 kg) in
povprečno porodno težo 31
novorojenčkov (1 – 3,43 kg);
nagib premice (0,19 kg) je
razlika v povprečni teži.
Če imamo dihotomno kriterijsko spremenljivko, pa imamo
težavo…
- za par z $ 25.000 reg.linija da verjetnost 0,38;
- za par z $ 41.000 pa 1,13;
- zaslužek $ 14.000 da verjetnost obiska -0,13
(!?)
Nameni logistične regresije
– Binarna
– Multinomialna
• Teorija, ki stoji za LR
– Ocenjevanje modela
– Ocenjevanje napovednikov
Napovedovanje z niza spremenljivk na kategorično (nominalno)
spremenljivko.
Kdaj in zakaj
• Ko želim napovedati izid, ki je kategorična spremenljivka, na osnovi
ene ali več kategoričnih ali kontinuiranih napovednikov
• Uporabimo jo, ker kategorično izid (kriterij) ne zadovolji predpostavki
linearnosti v normalni regresiji
Primeri
• Napovedovanje izida terapije – uspešno oziroma neuspešno.
• Napovedovanje uspeha v šoli – izdela razred oziroma ne izdela razreda.
• Napovedovanje bolezni na delovnem mestu – zboli oziroma ne zboli.
• Napovedovanje študijske odločitve – humanistična, družboslovna, naravoslovna.
Prednosti pred DA: vrednosti izven obsega 0 do 1, manj zahtevni
pogoji uporabe
Prednosti pred MR: vrednosti izven dosega 0 do 1, kršitev
homoscedastičnosti
Prednosti sicer:
• ne domneva linearnega odnosa med neodvisnimi in
odvisno spremenljivko,
• ne predvideva homoscedastičnosti,
• napake niso nujno razporejene normalno,
• neodvisne spremenljivke niso nujno intervalne,
• neodvisne spremenljivke niso nujno neomejene.
Pogoji uporabe:
• smiselno kodiranje (vrednost odvisne spremenljivke, ki nas najbolj
zanima, kodiramo z najvišjo številko),
• vključitev relevantnih spremenljivk v model,
• izključitev nerelevantrnih spremenljivk,
• neodvisne meritve,
• majhna napaka merjenja na neodvisnih spremenljivkah,
• brez manjkajočih vrednosti,
• linearen odnos med logit transformacijo neodvisnih in odvisne
spremenljivke,
• odsotnost interakcij (lahko uvedemo novo spremenljivko),
• čim nižja multikolinearnost neodvisnih spremenljivk,
• odsotnost vplivnih točk,
• velik vzorec,
• v vsakem pogoju vsaj 2 posameznika, v vsaj 80% pogojev vsaj 5
posameznikov.
Z enim napovednikom:
P(Y )  1 e ( ab1X1i )
1
• Izid
– Napovedujemo verjetnost pojavitve določenega izida
• a in b
– Je mogoče gledati nanju na enak način kot pri multipli
regresiji
– Enačba normalne (enostavne) regresije je del enačbe
logistične regresije!
Z več napovedniki:
P(Y )  1 e ( ab1X1b2 X 2 ...bn X n i )
1
• Izid
– Še vedno napovedujemo verjetnost pojavitve določenega izida
• Razlike
– Enačba multiple regresije je del enačbe logistične regresije!
– Ta del enačbe se razširi tako, da vključi dodatne napovednike
Preverjanje verjetnosti določenega dogodka v dveh skupinah, ki ju določa dvojiška
spremenljivka X.
Na posamezni proučevani enoti se dogodek zgodi ali pa ne zgodi, možna izida sta torej
le dva. Preprost primer (2x2):
- ali je delež obolelih za določeno boleznijo med kadilci in nekadilci enak (izid: oseba
zboli/ne zboli, oseba pa je kadilec ali nekadilec.)
Verjetnostna porazdelitev za slučajno spremenljivko, ki opisuje tak izid, je binomska
porazdelitev.
Ničelna domneva pravi, da je verjetnost proučevanega dogodka v prvi in v drugi
skupini enaka. Verjetnosti označimo p1 in p2.
H0: p1 = p2 = p
Prvo skupino predstavlja vzorec velikosti n1 , drugo vzorec velikosti n2 . Podatke
zapišemo v obliki tabele, ki ima dve vrstici in dva stolpca.
Vrstica - izid: dogodek D se zgodi ali ne zgodi: D oz. neD . V stolpce pa skupino 1 in
skupino 2, označimo jo x=1 in x=2.
V celicah tabele je število enot, ki spadajo v posamično kategorijo.
Izid
D
Dne
Skupaj
x=1
a
b
a+b=n1
x=2
c
d
c+d=n2
Iz prvega vzorca dobimo oceno za verjetnost p1 , označimo jo 1 ;
iz drugega vzorca oceno za verjetnost p2, označimo jo 2 :

1 =
+

2 =
+
Oceno za skupno verjetnost p , označimo jo  , izračunamo
takole:

+
=
+++
 =1-
Pripadajoča testna statistika je zapisana v obliki:
=
1 − 2
 
1
1
+
1 2
Izid
Ozdravi
Ne ozdravi
Skupaj
Zdravilo A
53
40
93
Zdravilo B
30
32
62
53
 =
= 0,5699 . 56,9 %
93
30
B =
= 0,4839 . 48,4 %
62

=
83
=
= 0,5355 . 53,6 %
155
0,5699 − 0,4839
0,5355 × 0,4645
1
1
+
93 62
= 1,052
Kritične vrednosti pri 5 % stopnji gotovosto sta ± 1,96 → se ne zavrne H0
(p = 2P(Z>1,052)=0,293 (p=0,293))
Skupaj
83
72
155
Zanima nas, kako trajanje terapije z zdravilom A ali zdravilom B vpliva na
uspešnost zdravljenja. Trajanje terapije je številska spremenljivka z dovolj veliko
zalogo vrednosti (zvezna spremenljivka). Poleg tega nas lahko zanima, kako se na
zdravljenje z zdravilom A in B odzivajo moški in kako ženske.
(Y=uspešnost zdravljenja; X1=zdravilo, X2=spol, X3=trajanje terapije.
obeti (odds) in razmerje obetov (odds ratio); verjetnosti za posamezne dogodke:
Izid
D
Dne
Skupaj
x=1
p1
q1
1
x=2
P2
q2
1
Obeti za dogodek D v skupini x=1:
p1/q1=p1/(1-p1);
Obeti za dogodek D v skupini x=2:
p2/q2=p2/(1-p2);
Iz obetov izračunamo njihovo razmerje (referenčna skupina – vsebinsko vprašanje!):
x=1: Ψ2|1=(p2/q2)/p1/q1)=p2q1/p1q2
x=2: Ψ1|2=(p1/q1)/p2/q2)=p1q2/p2q1=1/Ψ2|1
Izid
D
Dne
Skupaj
x=1
a
b
a+b=n1
x=2
c
d
c+d=n2
Ocena za obete za dogodek D v x=1 je: a/b Ψ2|1=(c/d)/a/b)=cb/ad
Ocena za obete za dogodek D v x=2 je: c/d Ψ1|2=(a/b)/c/d)=ad/bc
Teorija pove, da je statistika lnψ asimptotično porazdeljena po
normalni porazdelitvi, vzorčna varianca za lnψ pa je:
var(lnψ) = 1/a +1/b +1/c +1/d
H0 pa postavimo takole: razmerje obetov je 1; Ψ = 1
H1 : Ψ ≠ 1
=
lnψ
var(lnψ)
Obeti in razmerje obetov:
Obet = p(1) : p(0)
Npr.: PISA – pričakovana
naravoslovna kariera pri 30. in
naravoslovna kariera staršev
Obeti za otroke
naravoslovcev:
443:896 = 0,49
Obeti za otroke ostalih:
1346:3725 = 0,36
Starši
naravoslovci
- ne
Starši
naravoslovci
– da
3725
896
4621
% znotraj vrstice
80,6%
19,4%
100,0%
% znotraj stolpca
73,5%
66,9%
72,1%
1346
443
1789
% znotraj vrstice
75,2%
24,8%
100,0%
% znotraj stolpca
26,5%
33,1%
27,9%
5071
1339
6410
% znotraj vrstice
79,1%
20,9%
100,0%
% znotraj stolpca
100,0%
100,0%
100,0%
Naravoslovec
pri 30.l. - ne
Naravoslovec
pri 30.l - da
Število
Število
Število
Razmerje obetov (odds ratio, OR): 0,49/0,36 = 1,37
OR enako v obe smeri.
OR  p(1|starši nar.) / p(1|starši nenar.) = 0,33/0,27 = 1,25 !
Število
Model logistične regresije:
linearni odnos preko pretvorbe odvisne spremenljivke (ta
transformacija se imenuje ‘logit’ in je opredeljena kot logaritem
obetov za dogodek, ki nas zanima):
p(Y) …zvezna spremenljivka med 0 in 1 (verjetnost)
obeti (odds): p/(1-p) …zvezna sprem. med 0 in 
logit(Y) = ln[p/(1-p)] …zvezna sprem. med - in 
1.2
Napovedujemo logit:
1
P
logit(Yi )  a   bP X Pi
0.6
j 1
0.4
a  bX
e 
1
p (Y  1) 

a   bX
 ( a  bX )
1 e
1 e 
0.2
0
-3
-2
-1
0
a+bX
1
2
3
p(Y=1)
0.8
Pomen parametrov pri LR:
• b ni niti Y niti p! (vendar lahko smiselna primerjava p za različne Xi)
• b je logit (pri nespremenjenih preostalih napovednikih)
• exp(b) = OR za Xi in Xi+1(pri konstantnih preostalih napoved.)
Zakaj? Obet =p/(1-p) = exp(a+bXi)=exp(a)×[exp(b)]Xi
Pri katerem X je p = 0,5?
Obet = 1  logit = ln(1) = 0 = a+bX  X = -a/b
Ocenjevanje parametrov: metoda največjega verjetja (maximum
likelihood)
Ocenjevanje modela
log  likelihood
N
 Y lnPY   1  Y ln1  PY 
i
i
i
i
i1
• Log-likelihood ocena
– Analogna vsoti kvadratov redzidualov v multipli
regresiji
– Je indikator, koliko je nepojasnjene informacije
potem, ko smo model prilagodili.
– Velike vrednosti kažejo na slabo prileganje
statističnih modelov
Ocena sprememb v modelu / modelih
• Možno je izračunati log-verjetje za različne modele in
jih med seboj primerjati tako, da gledamo razlike med
njihovimi log-verjetji.
 2  2LL(New)  LL(Baseline)
df  knew  kbaseline 
Ocenjevanje napovednikov: Waldov indeks
Wald 
•
•
•
•
Slide 36
b
SE b
Enak t-statistiki v regresiji
Preverja ničelno hipotezo, da b = 0
Je pristranski, kadar je b velik.
Raje pogledati statistike razmerja verjetij
Ocenjevanje napovednikov: razmerje obetov oz. Exp(b)
Izid
D
Dne
Skupaj
x=1
p1
q1
1
x=2
P2
q2
1
x=1: Ψ2|1=(p2/q2)/p1/q1)=p2q1/p1q2
Exp(b) 
Odds after a unit change in the predictor
Odds before a unit change in the predictor
• Oceni spremembo v obetih, ki je posledica
spremembe pri napovedniku za eno enoto
– OR > 1: Napovednik , Verjetnost pojave dogodka .
– OR < 1: Napovednik , Verjetnost pojave dogodka .
Slide 37
Prileganje modela in natančnost napovedovanja:
N
Funkcija verjetja
V   p( X i )
i 1
(višja vrednost  boljše prileganje, vendar zelo majhne vrednosti)
-2lnV (-2log-likelihood): odstopanje podatkov od modela
Razlika med dvema gnezdenima modeloma v -2lnV = devianca ~ 2 (df
= razlika v številu parametrov)
Uporaba deviance: vključevanje napovednikov.
Velikost učinka/ov:
Mere, analogne R2 (% zmanjšanja -2lnV)
Model Summary
Step
-2 Log
likelihood
1
7551,961a
Cox & Snell
R Square
Nagelkerke
R Square
,022
,032
Classification Tablea¸1
Primer:
Predicted
PISA –
naravoslovna
kariera in interes
za učenje
naravoslovja
Self science-relat. car. at
30
Observed
Step
1
No
Self science-related
career at 30
4690
17
99,6
Yes
1804
5
,3
72,1
a. The cut value is ,500
Variables in the Equation
95% C.I.for
EXP(B)
Step
1a
intscie
Constant
S.E.
Wald
df
Sig.
Exp(B)
Lower
Upper
1,364
1,547
,373
,032
135,01
1
,000
1,453
-,984
,028
1204,4
1
,000
,374
a. Variable(s) entered on step 1: intscie.
% Correct
No
Overall Percentage
B
Yes
Povzetek
• Skupno prileganje (overall fit) končnega modela je
prikazan z −2 log-likelihood statistiko
– Če je pomembnost hi-kvadrata manj kot .05, potem imam
model pomembno prileganje podatkom
• Preglej tabelo Variables in the equation, da vidiš, katere
spremenljivke pomembno napovedujejo izid
• Uporabi razmerje obetov, Exp(b), za interpretacijo
– OR > 1, potem se ob naraščanju napovednika obeti, da se
izid pojavi, povečujejo.
– OR < 1, potem se ob naraščanju napovednika obeti, da se
izid pojavi, zmanjšujejo.
– Interval zaupanja OR ne sme iti preko 1!
• Preglej tabelo labelled Variables not in the equation, da
vidiš, katere spremenljivke ne napovedujejo izida
pomembno
Pomembni predpostavki:
•Neodvisno vzorčenje.
•Linearnost odnosa med X in logit(Y).
Preverjanje: npr. z delitvijo v razrede.
Preveriti tudi, da -2lnV < št. parametrov, sicer lahko prenizke SE
Priporočena dodatna literatura:
Košmelj, K. (2001). Osnove logistične regresije.
Dostopno na:
http://stari.bf.uni-lj.si/statistika/logisticna_regresija_1.pdf
http://stari.bf.uni-lj.si/statistika/logisticna_regresija_2.pdf
Field, A. (2009). Discovering statistics using SPSS (3rd
ed.). London: Sage. Poglavje 8.
Logistična regresija
Primer:
Kakšna je verjetnost, da boste zaključili podiplomski študij? ]:-]
Spremenljivke:
• Aktivnost - aktivnost, v katero je (bil) vključen posameznik (šport, glasbilo,
jezik).
• Opravil – Posameznik je oziroma ni zaključil študija.
• Energija - dosežek na lestvici energija na BFO,
• Čustv_s - dosežek na lestvici čustvena stabilnost na BFO,
• Vestnost - dosežek na lestvici vestnost na BFO,
• Sprejemlj - dosežek na lestvici sprejemljivost na BFO,
• Odprtost - dosežek na lestvici odprtost na BFO,
• RPM - dosežek na testu inteligentnosti.
Logistična regresija
Analyze – Regression – Binary Logistic… ali Multinomial
Logistic…
Logistična regresija
Pogovorno okno binarne logistične regresije…
Logistična regresija
Pogovorno okno Categorical…
Logistična regresija
Pogovorno okno Save New Variables…
Logistična regresija
Pogovorno okno Options…
Logistična regresija
Izpis…
Case Processing Summary
a
Unweighted Cas es
Selected Cas es
Included in Analysis
Mis sing Cas es
Total
Unselected Cas es
Total
N
79
0
79
0
79
Percent
100,0
,0
100,0
,0
100,0
a. If weight is in effect, s ee class ification table for the total
number of cas es .
Categorical Variables Codings
Dependent Variable Encoding
Original Value
ni zaključil
je zaključil
Internal Value
0
1
Aktivnos t, v katero je
vključen posameznik
Šport
Učenje glasbila
Učenje jezika
Frequency
30
25
24
Parameter coding
(1)
(2)
1,000
,000
,000
1,000
,000
,000
Logistična regresija
Izpis…
Classification Tablea, b
Step 0
Obs erved
Posameznik je oziroma
ni zaključil š tudija
ni zaključil
je zaključil
Overall Percentage
a. Cons tant is included in the model.
b. The cut value is ,500
Predicted
Posameznik je oziroma
ni zaključil š tudija
ni zaključil je zaključil
0
28
0
51
Percentage
Correct
,0
100,0
64,6
Logistična regresija
Izpis…
Variables in the Equation
Step 0
Constant
B
,600
S.E.
,235
Wald
6,499
df
Sig.
,011
1
Exp(B)
1,821
Variables not in the Equation
Step
0
Variables
Overall Statistics
Aktivnos t
Aktivnost(1)
Aktivnost(2)
Energija
Čustv_s
Ves tnos t
Sprejemlj
Odprtos t
RPM
Score
1,359
1,316
,189
1,052
,725
1,305
,345
,394
14,831
21,489
df
2
1
1
1
1
1
1
1
1
8
Sig.
,507
,251
,663
,305
,395
,253
,557
,530
,000
,006
Logistična regresija
Izpis…
Omnibus Tests of Model Coefficients
Step 1
Step
Block
Model
Chi-square
28,303
28,303
28,303
df
8
8
8
Sig.
,000
,000
,000
Model Summary
Step
1
-2 Log
Cox & Snell
likelihood
R Square
a
74,420
,301
Nagelkerke
R Square
,414
a. Estimation terminated at iteration number 6 because
parameter estimates changed by les s than ,001.
Logistična regresija
Izpis…
Classification Tablea
Step 1
Obs erved
Posameznik je oziroma
ni zaključil š tudija
Overall Percentage
a. The cut value is ,500
ni zaključil
je zaključil
Predicted
Posameznik je oziroma
ni zaključil š tudija
ni zaključil je zaključil
16
12
6
45
Percentage
Correct
57,1
88,2
77,2
Logistična regresija
Izpis…
Variables in the Equation
B
Step
a
1
Aktivnos t
Aktivnos t(1)
Aktivnos t(2)
Energija
Čustv_s
Ves tnos t
Sprejemlj
Odprtos t
RPM
Constant
-,899
-,341
,068
,036
,034
,064
-,026
,200
-29,949
S.E.
,844
,945
,033
,032
,047
,053
,045
,061
8,913
Wald
1,141
1,135
,130
4,279
1,268
,510
1,461
,337
10,684
11,290
df
2
1
1
1
1
1
1
1
1
1
Sig.
,565
,287
,719
,039
,260
,475
,227
,562
,001
,001
Exp(B)
,407
,711
1,070
1,036
1,034
1,067
,974
1,221
,000
a. Variable(s ) entered on s tep 1: Aktivnost, Energija, Čustv_s , Vestnost, Sprejemlj, Odprtos t,
RPM.

similar documents