luento1

Report
Kvantitatiiviset tutkimusmenetelmät
Luento 1
Kaisu Puumalainen
Yleistä kurssista
Kurssin asema tutkinnossa
−
−
−
−
Uudessa kandissa kaikille pakollinen yleisopinto
Erillisvalinnoissa uusiin maisteriohjelmiin tuleville täydentävä vaihtoehtoinen
Korvaa vanhoissa tutkintorakenteissa kurssin Monimuuttujamenetelmät
Voi käyttää myös yhtenä vaihtoehtona korvaamaan vanhojen
tutkintorakenteiden kurssia Johdatus tutkimusmetodologiaan
− Esitietovaatimuksena Tilastollisen tutkimuksen perusteet tai vastaava
tilastotieteen peruskurssi, jossa on jo käytetty SAS EG-ohjelmistoa
− Jatkokursseina Ekonometrian perusteet ja Rahoituksen ekonometria, joissa
syvennetään analyysimenetelmien osaamista sekä Empirical strategy
research yms. maisteriohjelmien kurssit, joihin sisältyy kvantitatiivisten
tutkimusmenetelmien soveltamista
− Antaa valmiuksia soveltaa kvantitatiivisia menetelmiä opinnäytteessä
Footer
Tavoitteena oppia…
− Ymmärtämään ja arvioimaan kvantitatiivisten tutkimusten
toteutustapaa ja tuloksia
− Suunnittelemaan survey-tutkimuksen toteutusta
− Käyttämään tietokantoja otannassa ja kvantitatiivisen
tutkimusaineiston hankinnassa
− Kehittämään ja arvioimaan mittareita teoreettisille
käsitteille
− Testaamaan malleja tavallisimpia monimuuttujaanalyyseja hyödyntäen
− Käyttämään SAS-ohjelmistoa
− Raportoimaan kvantitatiivisen tutkimuksen menetelmät ja
tulokset sekä suullisesti että kirjallisesti
Suoritusvaatimukset
−
−
−
-
Ryhmätyön kirjallinen raportti
Ryhmätyön esittäminen seminaarissa
Muiden ryhmien seminaariesitysten arviointi
Huom! Aiempien vuosien itseopiskeluvaihtoehto on poistettu
− Luennoille ja mikroluokkaharjoituksiin osallistuminen on vapaaehtoista
− Ohjausta ryhmätöiden tekemiseen annetaan harjoituksissa
Footer
Käytännön asioita
Ilmoittautumiset
− harjoitusryhmiin ja kolmen hengen tiimeihin luennoilla ja harjoituksissa
kiertävään listaan 7.9. mennessä
Materiaalit
− Ota Tilastollisen tutkimuksen perusteiden prujut (myös SAS-opas) mukaan
harjoituksiin
− Printtaa luentojen slidet handoutina mukaan luennoille ja harjoituksiin
− Kurssikirja (e-kirja)
− Kaikki ohjeistukset, datat yms. Kurssimateriaali löytyy Nopasta (tarkista että
saat Nopasta kurssin uutiset sähköpostiisi)
Opettajat
− Kaisu Puumalainen, Maija Hujala, Juha Soininen, Sanna Sintonen
Footer
AIKATAULU
vko
LUENTO
HARJOITUS
35
Johdanto
36
Tiedonkeruu ja raportointi
Demo: Tietokannat
37
Mittaaminen ja arviointi
Demo: SAS peruskäytön kertaus
38
Faktorianalyysi ja reliabiliteetti
Ryhmätyön tekeminen
39
Lineaarinen regressio 1
Demo: faktorianalyysi ja
reliabiliteetti
40
Lineaarinen regressio 2
Ryhmätyön tekeminen
41
Logistinen regressio ja
lineaariset mallit (GLM)
Demo: lineaarinen regressio
43
Demo: logistinen regressio ja GLM
44
Ryhmätyön tekeminen
48
SEMINAARI: RYHMÄTÖIDEN ESITYKSET
8
Muita kvantitatiivisia menetelmiä
Klusterianalyysi, diskriminanttianalyysi
MANOVA, kanoninen korrelaatio
Konfirmatorinen faktorianalyysi, rakenneyhtälö- ja polkumallit
Data mining, neuroverkkopohjaiset ryhmittely- ja visualisointimenetelmät
DEA, AHP
Sumeat menetelmät
Aikasarja-analyysit (klassinen, eksp.tasoitus, ARIMA)
Aikasarjaekonometria (2SLS, VAR, ARCH, GARCH,…)
Sosiaalinen verkostoanalyysi
MDS
Survival / event history
Conjoint-analyysi
Simulointi (MonteCarlo, ABM)
Optimointi
Footer
Kirjallisuutta ja lisätietoa
kvantitatiivisen tutkimuksen tueksi
Kirjallisuutta, yleisiä
− Uusitalo, Hannu (1991) Tiede, tutkimus ja tutkielma: Johdatus
tutkielman maailmaan. WSOY. Juva
− Ghauri, P, Grönhaug, K. 2005. Research Methods in Business
Studies. A Practical Guide. 3rd ed. Prentice Hall.
− Cooper, Schindler (2001) Business Research methods.
− Laaksovirta, Tuula (1988) Tutkimuksen lukeminen ja tekeminen.
Kirjastopalvelu Oy. Helsinki
− Saunders, M, Lewis, P, Thronhill, A. 2007. Research Methods for
Business Students. 4th Ed. Prentice Hall.
− *Hirsjärvi, Remes, Sajavaara (2002) Tutki ja kirjoita. Vantaa:
Tummavuoren kirjapaino
− *Metsämuuronen (2002) Tutkimuksen tekemisen perusteet
ihmistieteissä. Sri Lanka: International Methelp Ky.
− http://www.fsd.uta.fi/menetelmaopetus/intro.html
Kirjallisuutta, kvantti
− Alkula, T., Pöntinen, S., Ylöstalo, P. (1994) Sosiaalitutkimuksen
kvantitatiiviset menetelmät. WSOY. Juva
− Eskola, Antti (1973) Sosiologian tutkimusmenetelmät. WSOY.
Porvoo
− Nummenmaa, L. 2004. Käyttäytymistieteiden tilastolliset
menetelmät. Helsinki: Tammi.
− *Heikkilä Tarja (1998) Tilastollinen tutkimus. Edita. Helsinki
− *Hair, Anderson, Tatham, Black (1998) Multivariate data analysis, 5th
ed. Upper Saddle River, NJ: Prentice Hall
− *Aaker, Kumar, Day (2002) Marketing research
− Diamantopoulos & Schlegelmilch (1997) Taking the fear out of Data
analysis
− *Lotti, Leila. Markkinointitutkimus, useita eri kirjoja
− Metsämuuroset
Nettisivustoja
KvantiMOTV
http://www.fsd.uta.fi/menetelmaopetus/intro.html
SAS support
http://support.sas.com/documentation/92/index.html
David Garsonin menetelmäsivusto
http://faculty.chass.ncsu.edu/garson/PA765/statnote.htm
Footer
Hyviä kvantitatiivisia graduja
− Riikka Ellonen 2005
− Kysely, organisaation kulttuuri, luottamus ja innovatiivisuus
− Mika Vanhala 2007
− Mittarin kehittäminen, institutionaalinen luottamus
− Milla Ratilainen 2006
− Tietokannat+nettisivut, energiayritysten strategiat
− Tanja Turunen 2007
− Tietokannat, metsäteollisuuden yritysostot
− Juha Soininen 2008
− Tietokannat, event study
− Maija Hujala 2007
− Tietokannat, paperin kysynnän ennustaminen
Hyviä kvantitatiivisia graduja
− Pirjo Jokio 2008
− Tietokannat, omistajuus ja kannattavuus
− Pasi Melarto 2008
− Yritysdata, markkina- ja myyntiennusteiden arviointi
− Marika Niskanen 2008
− Yritysdata, tuotantohävikki ja asiakaskannattavuus
− Juho Pakkanen 2007
− Yritysdata, logistiikkavalinnat ja asiakaskannattavuus
Kvantitatiivisen tutkimuksen
yleispiirteet ja rooli
Rooli käytännön tutkimuksen kentässä
Aina kun analysoidaan numeerista tietoa ja tavoitteena on
tehdä oikeita ja yleistettäviä johtopäätöksiä
− Mielipidekyselyt (kuluttajat, asiakkaat, päättäjät,
äänestäjät, työntekijät)
− Ennusteet (talouskasvu, sää, väestökehitys)
− Tuotanto- ym. Prosessien hallinta
− Kokeet (lääkkeiden vaikutus, testimarkkinointi)
− Kannattavan sijoituksen löytäminen (pörssi,
vedonlyönti)
Rooli tieteellisen tutkimuksen kentässä
− Teoria muodostuu käsitteistä ja niiden välisistä
yhteyksistä
− Empiirisen tutkimuksen tehtävänä on koetella
teorioiden paikkansapitävyyttä reaalimaailmassa
− Käsitteet on löydettävä, määriteltävä ja
operationalisoitava jotta analyysien avulla
päästään testaamaan teoriaa niiden yhteyksistä
− deduktio: teoreettisista hypoteeseista empiirisiin
− induktio: empiirisistä tuloksista käsitteiden
tasolle
Tutkimuksen tyypillinen kehitys
− Ilmiön X tunnistaminen ja käsitteen määrittely,
käsitteen dimensiot ja mittarin kehittäminen
− Ilmiön seuraukset, so what? X -> Y
− Ilmiön syyt A -> X
− Kontekstiriippuvuudet ja moderaattorit
− Esim. markkinaorientaatio
− Kirjallisuuskatsauksessa pyritään luomaan kuva
ilmiön tutkimuksen kehityksestä ja
tutkimusaukoista
ESIM: Innovaation diffuusio induktio - deduktio
1. empiirinen havainto monissa tilanteissa: innovaation
yleistyminen noudattaa S-muotoista käyrää
2. Teoreettinen selitys: se on kaksivaiheinen viestintäprosessi
sosiaalisessa systeemissä
3. Omaksujat luokitellaan omaksumisajan perusteella
enemmän ja vähemmän innovatiivisiin
4. Teoreettinen hypoteesi käsitteiden tasolla:
kosmopoliittisuudella on positiivinen yhteys
innovatiivisuuteen
5. Empiirinen hypoteesi mittareiden tasolla: mitä enemmän
matkustelee systeemin ulkopuolella sitä aiemmin
omaksuu
6. Teoreettista hypoteesia voidaan testata eri konteksteissa
(innovaatio, sosiaalinen systeemi) ja erilaisilla mittareilla > teoria vahvistuu ja/tai sen rajat saadaan selville ->
replikaatiotutkimukset
7. Teoriaa voidaan laajentaa eri tasoille (organisaatio, maa)
ja uusiin käsitteisiin (mikä muu vaikuttaa
innovatiivisuuteen)
Kvantitatiivisen tutkimuksen
tyyppejä
Tutkimustyyppejä
Tavoitteen mukaan:
− Käytännön vs. tieteellinen (Business vs. academic)
− Alustava, kuvaileva, selittävä (Exploratory, Descriptive, Explanatory)
Tutkimusasetelman mukaan:
− Korrelaatio vs. kausaalinen (correlational, causal)
− Poikkileikkaus, aikasarja, paneeli (Cross-sectional, longitudinal, panel)
Päätöksentekotilanteen mukaan:
− Ennakointi, optimointi (Predictive, Optimization)
Aineiston hankintatavan mukaan:
− Kokeellinen, ei-kokeellinen (Experimental, observational, ex post facto)
Aineistolähteen mukaan:
− Kirjoituspöytä, kenttä, laboratorio, simulaatio (Desk, field, laboratory,
simulation)
Tutkimustyypit ja tiedonkeruu
exploratory
descriptive
causal
Secondary sources
internal IS
good
ok
external
databanks
good
ok
services
good
ok
good
ok
ok
good
ok
ok
good
ok
Primary sources
qualitative
survey
experiment
Kvantitatiivisen tutkimuksen
peruskäsitteitä
Aineistotyypit
− Kaikissa peruselementteinä
− Muuttuja j (k kpl)
− Havaintoyksikkö i (n kpl)
− Muuttujan j saama arvo havainnolla i (k x n kpl)
− Arvot muodostavat k x n –datamatriisin
− Poikkileikkaus (havainnot eli rivit toisistaan riippumattomia)
− Aikasarja (havainnot eli rivit peräkkäisiä tasavälisiä ajanhetkiä)
− Paneeli (edellisten yhdistelmä, riippumattomista havainnoista on
samoja muuttujia mitattu useampana ajanhetkenä, voi olla
pitkässä tai leveässä muodossa)
Muuttuja
−
−
−
Datamatriisin sarake
Diskreetti (vain tiettyjä yleensä muutamia harvoja
arvoja) ja jatkuva (mitä tahansa numeroarvoja joltain
väliltä) muuttuja
Mittaustasot (ks. Tilastollisen analyysin perusteet),
vaikuttaa analyysimenetelmiin
−
−
−
−
Nominaali (diskreetti, epätarkin)
Ordinaali (diskreetti)
Intervalli (jatkuva)
Suhde (jatkuva, tarkin)
SAS: class, qualitative, categorical, quantitative,
continuous, scale, binary, count
Datamatriisi
5 muuttujaa (variables) 6 havaintoa (observations)
obs
name
sex
age
LikertA
1
Anne
F
22
3
2
Berit
F
15
4
3
Clas
M
30
1
4
Daniel
M
21
5
5
Emil
M
35
2
6
Frida
F
50
4
Poikkileikkausaineisto
obs
Industry Age
Empl
1
Firm
name
Nokia
Telec
50
60
2
Lukoil
Ener
25
90
3
Valio
Food
80
10
4
Shell
Ener
45
100
5
GM
Car
100
150
6
Motorola telec
30
20
Aikasarja-aineisto
obs
Day
Nokia
OMX
1
1.1.2010 10.11
7900
2
2.1.2010 10.25
8000
3
3.1.2010 9.96
7550
4
4.1.2010 10.00
8011
5
5.1.2010 11.00
8321
6
8.1.2010 10.74
8205
Paneeliaineisto leveässä muodossa
obs
1
Firm
name
Nokia
Emp
2008
60
Emp
2009
57
Emp
2010
55
2
Lukoil
90
95
95
3
Valio
10
9
10
4
Shell
100
99
98
5
GM
150
130
110
6
Motorola 20
22
23
Paneeliaineisto pitkässä muodossa
obs
Year
Emp
1
Firm
name
Nokia
2008
60
2
Nokia
2009
57
3
Nokia
2010
55
4
Lukoil
2008
90
5
Lukoil
2009
95
6
Lukoil
2010
95
Muuttujien rooliin mallissa liittyvät käsitteet
−
Riippumaton eli selittävä muuttuja (independent variable,
exogenous, explanatory, IV) X
−
−
−
−
−
−
Oletettu syy, cause
Aiheuttaa…
Edeltävä, antecedent
Manipuloitu
Stimulus /predictor, ärsyke
Riippuva eli selitettävä muuttuja (dependent variable,
endogenous, DV) Y
−
−
−
−
−
Oletettu seuraus, effect
Johtuu…
Seuraava, consequence
Mitattu lopputulema
Response / criterion, vaste
Muuttujien rooliin mallissa liittyvät käsitteet
−
Moderoiva muuttuja (moderating variable)
−
−
−
−
Mediating variable, välittäjämuuttuja
−
−
“Olosuhdemuuttuja”
MoV:n arvo vaikuttaa siihen, millainen IV:n ja DV:n suhde on
Sharma et al (1981) Journal of Marketing Research
18(3):291-300
Baron & Kenny (1986) Journal Of Personality and Social Psych.,
51, 1173-1182
Kontrollimuuttuja (control variable)
−
−
−
“olosuhdemuuttuja”, jonka vaikutus vakioidaan
Muuttuja jonka tiedetään vaikuttavan DV:hen
Mukaan malliin ilman hypoteesia
Muuttujien väliset suhteet graafisena mallina
IV
DV
IV
DV
MoV
IV
DV
CV
IV
MeV
DV
Esim. hypoteeseja muuttujien suhteista
− H1: karkinsyönti lihottaa (IV karkkia per viikko,
DV painoindeksi)
− H2: karkinsyönnin lihottava vaikutus on sitä
lievempi mitä enemmän harrastaa liikuntaa
(MoV liikuntatunnit per viikko)
− H3: karkinsyönti lisää saatua energiamäärää,
mikä taas lihottaa (MeV kilojoulet per viikko)
− Kontrollimuuttujaksi tarvitaan ikä, koska sillä on
varmasti vaikutusta painoindeksiin sekä ehkä
myös karkinsyöntiin
Hypoteesit
−
−
−
−
−
−
−
Oltava testattavissa!! (esim. TCE vaikea testata, max 2-3
muuttujaa samassa hypoteesissa)
Täsmällisiä ( x vaikuttaa y:hyn / vaikuttaa positiivisesti / Umuotoinen yhteys)
Propositio (alustava olettamus jota ei vielä testata samassa
tutkimuksessa) - Tutkimushypoteesi H1 - tilastollinen
nollahypoteesi H0
Jos pääset hylkäämään H0:n niin saat tukea H1:lle
Kuvaileva – käsitteiden välisiä yhteyksiä käsittelevä hypoteesi
Max 5-10 kpl, joista 1-2 uusia ja puolet saa tukea empiriassa
Analyyttinen päättely teorian pohjalta + aiemmat empiiriset
tutkimukset
Esimerkkejä hypoteeseista
− There is a positive relationship between a
firm’s export sales and the amount of R&D
expenditures
− Customer focus is a key driver of product
quality in born global firms
− In environments that are characterized by high
market turbulence, TMT risk taking behavior
does moderate the relationship between
market orientation and performance
Kausaalisuhde (syy-seuraus tai syyvaikutus)
−
−
John Stuart Mill:
Yhtäläisyyden periaate
−
−
−
Erilaisuuden periaate
−
−
Jos havaintoyksiköillä on tutkittavan ilmiön lisäksi
vain yksi yhteinen piirre, niin se on ilmiön syy
Auttaa poistamaan epärelevantteja muuttujia
Jos havaintoyksiköillä on muuten samat piirteet,
mutta tutkittavan ilmiön olemassaolo tai puuttuminen
liittyy yhden piirteen olemassaoloon tai
puuttumiseen, niin se on ilmiön syy
Käytännössä näitä periaatteita on vaikea
soveltaa esim. survey-tutkimuksessa
Kausaalisuhde (syy-seuraus tai syy-vaikutus)
Edellytyksiä kausaalisuhteelle x -> y:
− x:n ja y:n välillä on yhteisvaihtelua
− x on ajallisesti ennen y:tä
− y:n muut mahdolliset syyt on otettu huomioon
− x:n ja y:n yhteys empiirinen ts. x ja y voidaan
havaita toisistaan riippumatta (CMV)
− x:n ja y:n välinen yhteys voidaan johtaa
yleisestä teoriasta
− Kokeellinen asetelma paras tutkimiseen
(vakioidaan muut muuttujat paitsi x)
Kvantitatiivisen tutkimuksen kulku
Tutkimusprosessi
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Aiheen valinta
Kirjallisuuskatsaus
Teoreettinen viitekehys
Tutkimusongelmat (2-4 limittäin)
Teoriaosa ja hypoteesit
Tutkimusmenetelmä
Empiirisen tutkimuksen toteutus
Tulosten analyysi ja raportointi
Tulosten arviointi, diskussio
Yhteenveto (rajoitukset, jatkotutkimusaiheet)
Kvantitatiivisessa aina kannattaisi teoria ja hypoteesit kirjoittaa ennen
empiirisen aineiston hankintaa!
Footer
Kvantitatiivinen tutkimus
ilmiö
käsitteellistäminen
käsitteet
operationalisointi
kohderyhmän
määrittely
muuttujat
mittaaminen
kohderyhmä
otanta
otos
datamatriisi
tiedonkeruu
tulokset
analyysi
Kurssin menetelmien soveltuvuus
Tutkimuksen vaihe
Y
X:t
Cronbach Mittareiden arviointi
Alpha
Ei kausaliteettia
Jatkuvat muuttujat
FA
Mittareiden
muodostaminen
Ei kausaliteettia
Jatkuvat muuttujat
LinReg
Suhteiden
testaaminen
jatkuva
Jatkuva
(dummy)
GLM
Suhteiden
testaaminen
jatkuva
Luokiteltu
(jatkuva)
LogReg
Suhteiden
testaaminen
binäärinen
Jatkuva
Luokiteltu
43
Tutkimussuunnitelma
Research proposal
1.
2.
3.
6.
7.
8.
9.
10.
11.
12.
Title
Background
The research problem and research objective(s)/question(s) (which further can be divided into
sub objectives/questions)
Literature overview (What literature and studies are available of the subject? How this study is
positioned to these research streams, and whether a research gap exists?)
Preliminary theoretical framework (What area(s) of business theory does the research topic
belong to.)
Definitions (of special terminology used in the thesis)
Limitations and scope (what issues will be excluded and for what reason)
Method of research
Structure of the research
Tentative table of contents of the final report
Available source material
Tentative time table
−
−
http://www.des.emory.edu/mfp/proposal.html
http://www.statpac.com/research-papers/research-proposal.htm
4.
5.
Käsitemäärittely
−
−
−
−
−
Ennen kuin teoreettisia käsitteitä voidaan
empiirisesti tutkia ne on määriteltävä.
Tutkimuksessasi sovellettava määritelmä voi olla
jonkin aiemman tutkijan käyttämä tai aiemmista
tutkimuksista oman tutkimuksesi konteksiin
sovellettu määritelmä
Mitä käsite tarkoittaa? Mitä elementtejä
”dimensioita” siihen kuuluu?
Mitä yhteistä/eroa käsitteellä on muihin käsitteisiin?
Operationalisointi = mittarin laatiminen käsitteelle,
millä indikaattoreilla (muuttujilla, väittämillä,
kysymyksillä) käsitettä konkreettisesti mitataan
Suosi jo aiemmin käytettyjä ja validoituja mittareita
Esimerkki ja tehtävä
Esim. ilmiö on yrityksen innovatiivisuus,
dimensioita voisi olla
(1) uusien tuotteiden tuominen markkinoille ja
(2) uusien valmistusmenetelmien käyttöönotto.
Muuttujia voisi olla
(1) montako % liikevaihdosta tulee viimeisen 3 vuoden aikana
lanseeratuista tuotteista tai montako uutta tuotetta lanseerattiin
viimeisen vuoden aikana
(2) paljonko rahaa investoitiin viimeisen 3 vuoden aikana
tuotantoprosessien kehittämiseen tai otettiinko viimeisen vuoden
aikana käyttöön jokin sellainen valmistusmenetelmä jota kilpailijoilla
ei vielä ole
Tehtävä. Sinua kiinnostava ilmiö on yrityksen kasvustrategia
1. Mitä dimensioita siihen voisi liittyä?
2. Millä muuttujilla niitä voisi mitata?
Analysointi
− ohjelmistoja: Excel, SPSS, SAS, Statgraphics, DataFit, EViews, Stata, jne.
− alustava tarkastelu ja luokittelu, outlierit
− muunnokset
− avoimien kysymysten koodaaminen
− jatkuvien muuttujien luokittelu
− väittämien suunnan kääntäminen
− yhdistettyjen mittarien laskeminen
− viive- ym. uusien muuttujien laskeminen
− epäjohdonmukaiset vastaukset
− kuvailu, tiivistäminen
− hypoteesien testaus
− johtopäätökset ja suositukset
Kuvailu ja tiivistäminen
− grafiikka
−
−
−
−
pylväät, histogrammit
piirakat
viiva- ja aluekuviot
sirontakuviot
− frekvenssijakaumat
− tunnusluvut
−
−
−
−
jakauman sijainti (keskiluvut)
jakauman hajonta (hajontaluvut)
jakauman muoto (vinous ja huipukkuus)
korrelaatiomatriisi
Hypoteesien testaaminen
− yhden muuttujan testit (esim. event study-tutkimuksissa)
− riippumattomien otosten jakaumatestit
− riippuvien otosten jakaumatestit (esim.
paneeliaineistossa)
− korrelaatio, regressio (esim. CAPM-malli)
− monimuuttujamenetelmät
− aikasarja-analyysimenetelmät
Otanta
Otanta
− määritellään perusjoukko eli populaatio, jota
koskevaksi tulokset halutaan yleistää
− tutkitaan koko populaatio (census) tai tehdään
otanta
− otoskoon kasvattaminen lisää yleensä tulosten
luotettavuutta ja testien voimakkuutta
− ei alle 30, esim. perusjoukosta suomalaiset n=
1000-2500
− otoksen tulee olla perusjoukkoa edustava
− useita vaihtoehtoisia otantamenetelmiä
Otanta: vaiheet
−
−
−
−
−
−
−
määritellään perusjoukko
määritetään otantakehys
valitaan otantamenetelmä
valitaan otoskoko
tehdään otanta
kerätään tiedot
Edustavuuden ja vastaamattomuusongelmien
arviointi
− Uusi yhteyden otto, perusjakauma muista lähteistä tai
aikaiset vs. myöhäiset vastaajat
Otanta: perusjoukon määrittely
− havaintoyksiköiden tyyppi (unit of analysis) mitä on
datamatriisin riveinä?
− Esim. henkilö, kotitalous, yritys, verkosto
− Informantin /informanttien valinta, keneltä kysytään? (tietää
ja vastaa)
− Rajaukset, esim. mikä ikäisiä ihmisiä tai minkä toimialojen
yrityksiä? Perusjoukon on oltava teorian ja
tutkimusongelman kannalta järkevä konteksti
Otantakehys, sampling frame
− lista havaintoyksiköistä perusjoukossa, josta
otanta tehdään
− ajantasaisuus
− kattavuus (ei ylimääräisiä eikä puuttuvia)
− esim. Tilastokeskus, väestörekisterikeskus,
VoittoPlus, Dun&Bradstreet, Patentti- ja
rekisterihallitus, www, yrityksen omat rekisterit,
Amadeus, Thomson
Otantamenetelmät
− Satunnaisotanta (kaikilla perusjoukkoon
kuuluvilla yhtä suuri tn päästä mukaan
otokseen)
−
−
−
−
yksinkertainen
systemaattinen
Klusteri –eli ryväsotanta
ositettu
− ei- satunnaisotanta
−
−
−
−
mukavuus
lumipallo
harkinta
kiintiö
Otantamenetelmät
− systemaattinen satunnaisotanta
− aloitus satunnaisesti väliltä 1-k, ja valitaan joka k:s
− perusjoukon pitää olla satunnaisessa järjestyksessä
− ositettu satunnaisotanta
− Jaetaan ensin perusjoukko muutamaan suureen osajoukkoon
(strata) ja tehdään erikseen otanta kustakin osajoukosta
− osajoukkojen suuruuden varmistamiseksi
− eri menetelmät eri osajoukoille mahdollisia
− määritä ositteen osuudet perusjoukossa
− samassa suhteessa tai epäsuhtaisesti otanta
Otantamenetelmät
− Klusteriotanta (ryväsotanta)
− jaetaan perusjoukko hyvin useisiin pieniin alaryhmiin
ja valitaan niistä satunnaisesti jotkut kokonaan
tutkittaviksi
− klustereiden sisällä pitäisi olla hajontaa ja välillä ei
(käytännössä vaikea saavuttaa)
− taloudellinen tehokkuus hyvä, mutta tilastollinen
heikko
− monivaiheinen satunnaisotanta
− menetelmiä käytetään peräkkäin, erit. ositetut otannat
Ei- satunnaisotannat
− teoreettisesti huonompi, valitaan käytännön
syistä
− jos ei tavoitella tilastollista yleistettävyyttä
− alustavassa tutkimuksessa ok
− mukavuus tai harkinta
− kiintiöinti parantaa edustavuutta
− lumipallo, kun vastaajia on vaikea löytää
Otoskoko
− ei riipu suoraan perusjoukon koosta
− laskukaavat tarvittavalle otoskoolle
virhemarginaalin perusteella
− sitä suurempi otos, mitä
− enemmän hajontaa
− pienempi riskitaso halutaan
− enemmän alaryhmiä, joita halutaan vertailla
Otoskoko, muutama sääntö
− jokaisessa osaryhmässä vähintään 30
havaintoa
− monimuuttuja-analyyseissa havaintoja
vähintään 5-10 kertaa muuttujien määrä
− mitä isompi otos, sitä luotettavampi
yleistettävyys
− esim. suomalaisista yleensä noin 2000 kpl
− ei ole vakio %-osuus perusjoukon koosta
− ota huomioon että vastausprosentti voi jäädä
alhaiseksi, suuri kato
Otoskoko
− edelliset säännöt pätevät saatujen vastausten
määriin
− x= otantakehyksestä mukaan otettavien määrä
− .80*x tavoitetaan ja kuuluu kohderyhmään
− .80*(.80*x) suostuu osallistumaan
− .40*(.80*.80*x) vastaa kyselyyn
− jos tarvitset 100 vastausta, x=100/.256=390

similar documents