Mätvärden i förhållande till gränsvärden.

Report
Bedömning av uppfyllelse av
miljökvalitetsnormer
Claudia von Brömssen
Enheten för tillämpad statistik och matematik
Institutionen för Ekonomi, SLU
Miljökvalitetsnormer
Från NVs webbsida:
”Utgångspunkten för en norm är kunskaper om vad människan och naturen
tål. Normerna kan även ses som styrmedel för att på sikt nå
miljökvalitetsmålen. De flesta av miljökvalitetsnormerna baseras på krav i olika
direktiv inom EU. ”
”För att få reda på om vidtagna åtgärder räcker till för att en miljökvalitetsnorm
ska uppfyllas i tid behöver det ske en uppföljning, det vill säga de av
regeringen utpekade myndigheterna eller kommunerna behöver genom
mätningar och beräkningar övervaka den reglerade miljökvaliteten.”
Miljökvalitetsnormer
Miljömålen måste översättas till kvantitativa storheter:
”volymen död ved per hektar” som en indikator på miljömålet ”levande skogar”.
”dyngsmedelvärdet för PM10”
”fisk luft”.
Varje miljömål består av ett flertal indikatorer.
Frågor:
Hur kan beslut tas utifrån indikatorernas värden?
Vilka problem finns det när bedömningen görs?
Hur kan osäkerheterna bedömas?
Måluppfyllelse – en enkel formalisering
Ett mål är uppfylld om
Y≥ G
Alltså om det sanna värdet av indikatorn (Y) är större än gränsvärdet
(G)
(Alternativ: Y ≤ G)
Det sanna värdet Y kan dock inte observeras – vi måste skatta det.
Indikatorns skattning
För att kunna bedöma om målet är uppfyllt måste vi skatta värdet på Y.
Skattningen ska
- inte ha systematiska fel
- vara så noggrann som möjligt givet resurserna
Skattningens osäkerhet anges med skattningens medelfel.
Hur medelfelet beräknas beror på vilken typ at skattning som används,
t.ex. medelvärde, proportion, kvot,…
Hypotesprövning
Det finns olika sätt att bedöma om målet är uppfyllt. Ett av dessa är
klassisk statistisk hypotesprövning.
Vi vill visa att Y> G är uppfylld och sätter
Nollhypotesen: Y ≤ G
Alternativhypotes: Y >G
Vi utgår ifrån att nollhypotesen är sann och ta ställning till om
skattningens observerade värde är osannolikt. Om det är det så
förkastar vi nollhypotesen.
Hur osannolik ett värde måste vara för att nollhypotesen ska förkastas
bestäms av användaren genom signifikansnivån.
Hypotesprövning
Observerat
värde
’Fail-safe’ mot ’benefit of doubt’
I föregående exemplet användes metoden ’Fail-safe’:
Man kan inte anse att målet är uppfyllt innan man kan visa att
motsatsen är orimligt. Bevisbördan ligger hos oss.
Man kan också vända på hypoteserna genom metoden ’Benefit of
doubt’:
Nollhypotes: Y ≥ G (målet är uppfyllt)
Alternativhypotes: Y< G
Man anser att målet är uppfyllt tills vi kan bevisa motsatsen.
Bevisbördan ligger hos andra.
Benefit of doubt - hypotesprövning
’Fail-safe’ mot ’benefit of doubt’
Ett stort problemet med metoden benefit of doubt är att man genom
undermålig datainsamling skulle kunna se till att alla mål är uppfyllda.
Ett problem med metoden Fail-safe är att man måste överskrida
målgränsen med stort marignal för att hypotestestet blir signifikant.
Det observerade värdet måste ligger minst på
G+ 1.645*SE,
där SE är medelfelet av skattningen.
Benefit of doubt rekommenderas inte!
Konfidensintervall
På samma sätt kan vi använda konfidensintervall för att dra
slutsatserna. När vi har bestämt ett konfidensintervall för det sanna
värdet Y, så kan vi kontrollera om gränsvärdet G ligger inom eller
utanför detta interval. Samma funderingar som för fail-safe och benefit
of doubt gäller även här.
G
Yˆ
G
Yˆ
Face value – Direkt insättning
När man använder metoden Face value, så anser man att målet
är uppfylld när det observerade värdet ligger inom
bedömningsgrundens målområde, dvs om
Yˆ > G
I samband med denna metod är det vanligt att man beräknar hur
stor sannolikheten är att beslutet är felaktigt om det sanna värdet
är Y=y för olika möjliga värden på y.
Om y är nära gränsen G är sannolikheten för felaktiga beslut
givetvis större än om y är avsevärt större än G.
Face value – Direkt insättning
G=0.7
EK=Y
Hybridmetoden
Det kan tyckas att hypotesprövningen/konfidensintervallet kräver för
mycket eller är ”orättvist”, medan det är svårt att bedöma osäkerheten
för direkt insättning. En kompromiss skulle vara att det fanns en sorts
gråzon, där beslutet är osäkert.
Om vi sätter två referensgränser R och G, där R är mindre än G, så
kan vi istället använda oss av en hybrid mellan dessa metoder.
Hybridmetoden
Om U betecknar den undre gränsen för konfidensintervallet, R det
nedre gränsvärdet och G det ursprungliga gränsvärdet, så kan vi få 6
fall:
U ≥ G. Målet är uppfyllt (”grönt” fall).
Yˆ ≥ G och G ≥ U ≥ R. Målet är uppfyllt (”grönt” fall)
Yˆ ≥ G och R ≥ U. Här kan vi inte ta något beslut (”orange” fall)
G ≥ Yˆ ≥ R och G ≥ U ≥ R. Också tveksamt.
G ≥ Yˆ ≥ R och R ≥ U. Här anser vi målet inte vara uppfyllt (”rött” fall)
R ≥ Yˆ (och R ≥ U). Här anser vi målet inte vara uppfyllt (”rött” fall)
Hybridmetoden
Grönt:
R
Yˆ
G
Orange:
R
R
G
Yˆ
G
Yˆ
Hybridmetoden
Rött:
R
Yˆ
R
Yˆ
G
G
Hybridmetoden
Orange, fall 1, betyder alltså att vi behöver ytterligare information, då vi
har för lite eller för osäkra data.
Orange, fall 2, inträffar när vi har mycket eller säkra data (eller när
skillnaden mellan G och R har blivit för stor). Vi är ganska säkra på vi
ligger under G, men vi är också säkra på att Y är större än R.
En nackdel med varianten är att riskkontrollen sker gentemot gränsen
R och att sannolikhetsberäkningar gentemot gränsen G kompliceras.
Osäkerheten av statistiska mått
För att kunna genomföra hypotestest eller osäkerhetsbedömningar för
direkt insättning måste vi känna till osäkerheten av det observerade
värdet.
Osäkerheten består ofta ur många olika komponenter: spatial och
temporal osäkerhet, fel i samplingen eller i den kemiska analysen
Det kan också vara svårt att uppskatta osäkerheten/variationen ur
datamaterialet om datamaterialet är litet.
Hjälpinformation - normalisering
För att skatta den relevanta variationen kan det vara intressant att
försöka skala bort variation som kan beskrivas av yttre omständigheter.
För att kunna skatta säsongsvariationen måste det finnas observationer
under de relevanta säsongerna för ett antal år.
Om en del av variation beror på väderleken (nederbörd, temperatur,…)
så måste det finnas observationer för ett antal olika väderförhållandena.
Att reducera variationen med förklarande variabler sker oftast med
någon form av regressionsmodell. Viss del av variationen förklaras av
säsong eller väder. Enbart den variation som kvarstår används i
bedömningen av måluppfyllelse.
Stickprovsstorlekar
Man vill gärna redan i förväg veta hur många observationer som behövs
för att ganska säkert kunna påvisa att ett objekt håller god statusklass
om så är fallet.
Beräkningar av stickprovsstorleken för hypotesprovning är dock, som
alltid, svårt och kräver mycket information om de förväntade resultaten.
Den generella frågan är hur många observationer behövs för att kunna
uppnå en viss styrka för hypotestestet. Den information vi behöver är
alltså samma som vi behöver för en styrkeberäkning.
Information för Styrkeberäkningar
Vi behöver alltså
- testets signifikansnivå och den önskade styrka (väljs ofta till 0.05
och 0.8)
- osäkerheten av det statistiska måttet som används, dvs
medelfelet (standard error). Osäkerheten är vanligtvis inte känd
och kan skattas först när man har observerade värden. Ibland
kan den skattas ur tidigare liknande undersökningar, om sådana
finns.
- det sanna värdet för alternativhypotesen
Om H0: Y ≤ G och
H1: Y>G
så behöver vi alltså sätta ett värde för Y . Vi kan alltså bara
bestämma att testet ska ha en styrka av 0.8 om avståndet
mellan Y och G är av ett visst värde. Vi kan också beräkna
styrkefunktioner för olika värden för det sanna Y.
Att tänka på vid bedömning av mål
- Vad är en lämplig statistisk fråga?
- Hur skattar man osäkerheten? Vad gör jag om jag har få
observationer?
- Finns det hjälpinformation som man kan använda för att minska
osäkerheten?
- Kommer jag att lyckas att visa ’god status’ ens om det är verkligheten?

similar documents