03 casovne vrste

Report
6. ČASOVNI PODATKI
• Časovne podatke lahko glede na kvaliteto in
način zapisa obdelujemo z več tehnikami:
– Markove verige
– Zaporedja dogodkov
– Analiza trenda
– Analize časovnih zaporedij
6.1. MARKOVE VERIGE
6.1.1. Zamisel
• Najslabša kakovost časovno spremenljivih
podatkov je brez numeričnih vrednosti.
Podatke sestavlja serij opisov zaporednih stanj
sistema.
• Metoda Markovih verig testira vzorce v zapisu
prehodov enega stanja v drugega. Z njo
preiskujemo cikličnost ali ritmičnost.
• Pomanjkanje numerične informacije rešimo z
verjetnostno teorijo.
6.1.1. Zamisel
• Zaporedje 1:
ADCCBCADBBBABDDDCBAACDAA
• Zaporedje 2:
ABCDABCDABCDABCDABCDABCD
• Če obravnavamo dogodek B, lahko ugotovimo,
da se v vsakem od zaporedij 24 črk pojavi 6x.
• Verjetnost pojava dogodka B je 6/24 = 0,25.
6.1.1. Zamisel
• V obravnavanih zaporedjih pa je kljub enaki
verjetnosti pojava B razlika, kdaj se bo dogodek
pojavil – pred ali za katerim dogodkom:
• V prvem zaporedju se od šestih možnih pojavljanj Bja pred njim pojavi:
– 1 x A  1/6 = 0,167
– 2 x B  2/6 = 0,333
– 2 x C  2/6 = 0,333
– 1 x D  1/6 = 0,167
• V drugem zaporedju je pred B-jem vedno le A, kar je
očitno drugače kot v naključnem primeru.
6.1.1. Zamisel
• Kako si sledijo stanja,
izrazimo s tranzicijsko
frekvenčno matriko
(prehodov), ki zabeleži
število opazovanih
prehodov med vsakim
od možnih parov stanj.
Od\K
A
2
2
1
1
B
1
2
2
1
C
1
1
1
2
D
2
1
1
2
Od\K
A
B
C
D
A
B
C
D
0
0
0
6
6
0
0
0
0
6
0
0
0
0
6
0
A
B
C
D
6.1.2. Kodiranje geoloških zaporedij
• Problema sta:
– Kako razvrstiti litološke enote v profilu v ločena stanja?
– Kaj je kriterij za zapis prehoda med dvema stanjema?
• Število opazovanih prehodov naj bi 5x presegalo
kvadrat števila litoloških kategorij.
• Kriteriji prehoda:
– Menjava litologije.
• Ne zabeležimo prehoda kategorije v samo sebe.
– Ravnine plasti.
• Včasih jo je težko definirati.
– Stalni določeni interval skozi celotno zaporedje.
• Izpustimo tanke plasti, debele pa imajo mnogo prehodov same
vase.
6.1.3. Markove analize
6.1.3.1. Tranzicijska frekvenčna matrika
• Kadar obstaja m litologij
ima tranzicijska frekvenčna
matrika obliko m x m, z
vrstico in stolpcem za
vsako litologijo.
• Če sta prva in zadnja
litologija isti, bo vsota
vrstic enaka ustrezni vsoti
stolpcev.
6.1.3.2. Tranzicijska verjetnostna matrika
• Lastnosti tranzicijske verjetnostne matrike
izrazimo v bolj splošno primerljivi obliki tako,
da jo spremenimo v verjetnostno.
• Matriko verjetnosti prehodov izračunamo
tako, da delimo vsak element tranzicijske
frekvenčne matrike z ustrezno vsoto vrstice.
• Lastnosti nove matrike predstavimo z
diagramom, kjer izpostavimo litologije in s
puščicami nakažemo verjetni potek litološkega
nadaljevanja.
6.1.3.2. Tranzicijska verjetnostna matrika
• Lastnosti nove matrike predstavimo z
diagramom, kjer izpostavimo litologije in s
puščicami nakažemo verjetni potek litološkega
nadaljevanja.
• Verjetnost, da se neko zaporedje
prehodov ujema z nekim
določenim ciklom,
izračunamo z
množenjem verjetnosti.
6.1.3.3. Testiranje tranzicijske frekvenčne
matrike
• Testiranje izvedemo s testom hipoteze
naključnosti, kjer opazovano tranzicijsko
matriko primerjamo z matriko, ki bi jo
pričakovali, če ni nobenega vzorca.
• Izračunamo pričakovano verjetnostno
matriko. Pričakovano naključno verjetnostno
matriko obrnemo v pričakovano naključno
tranzicijsko frekvenčno matriko tako, da jo
ponovno izrazimo s preštetimi prehodi.
6.1.3.3. Testiranje tranzicijske frekvenčne
matrike
• Elemente pričakovane naključne tranzicijske
frekvenčne matrike poiščemo tako, da
množimo elemente pričakovane naključne
verjetnostne matrike z ustreznimi seštevki vrstic
iz opazovane tranzicijske frekvenčne matrike.
• Opazovana tranzicijska frekvenčna matrika je
sedaj neposredno primerljiva z matriko, ki
ustreza pričakovanemu naključnemu modelu.
• Med seboj ju primerjamo s X2 testom.
6.1.3.3. Testiranje tranzicijske
frekvenčne matrike
• H0: zaporedje stanj je naključno
H1: zaporedje stanj ni naključno
• Testna statistiko:
m 2 (O  E ) 2
j
j
2
X 
Ej
j 1
primerjamo s tabeliranim X2 z (m-1)2 stopnjami
prostosti.
• Zaporedje stanj ni naključno, če izračunana
vrednost presega kritično.
6.1.3.3. Testiranje tranzicijske frekvenčne
matrike
• Opozorila:
1. V večini razredov moramo pričakovati vsaj pet
prehodov, tako da je število prehodov najmanj 5 x m2.
2. Če je kriterij prehoda menjava litologije, morajo biti po
vodilni diagonali opazovane matrike ničle. V vodilni
diagonali pričakovane naključne matrika pa neizogibno
ne bo ničel, zato pričakovana matrika ni ustrezen
model.
3. Test vodi do zavrnitve H0, čim obstaja kakršnakoli oblika
nenaključnosti, ne le cikličnost ali ritmičnost. Kadar je
kriterij prehoda stalen interval ali plasti, je verjetna (in
precej nezanimiva) vrsta nenaključnosti velika debelina
iste litologije.
6.2. ZAPOREDJA DOGODKOV
6.2.1. Cilji in uporaba
• Seznam časov ali datumov: potresi,
vulkanski izbruhi, poplave, padci
meteoritov, obrati magnetnega pola,
masovna izumrtja.
• Podatke obravnavamo kot točke v času –
trajanje dogodka je izredno kratko.
• Metode uporabimo predvsem za
napovedovanje novih dogodkov.
6.2.1. Cilji in uporaba
• Dogodki so lahko v času razporejeni popolnoma
naključno; napovedovanje na osnovi vzorca v
preteklosti je nesmiselno.
• Oblike nenaključnosti so enakomernost, kopičenje,
trend in vzorec.
• Pomembna je
definicija
začetka in konca
časovnega intervala.
6.2.2. Testiranje naključnosti
• Naključnost pomeni, da pojav enega dogodka
ne vpliva na verjetnost, da se zgodi drugi.
• Frekvenčna porazdelitev takih podatkov se
ujema s Poissonovim modelom.
– Poissonova porazdelitev ima le en parameter (),
ki podaja povprečno gostoto točk.
– Glede na Poissonov model določimo število
intervalov z j dogodki (Oj) iz celotnega števila
dogodkov (n) in števila intervalov (T) ter ga
primerjamo s pričakovanim številom (Ej).
6.2.2. Testiranje naključnosti
• H0: dogodki so porazdeljeni naključno
H1: dogodki so nakopičeni ali enakomerni
• Pričakovanje Ej izračunamo iz Poissonovega modela:
n
T e  
T

Ej 
j!
n

T
j
m2
(O j  E j )
j 1
Ej
X 
2
• Uporabimo X2 test:
2
6.2.2. Testiranje naključnosti
• Število uporabljenih razredov je odvisno od
podatkov. V večini razredov bo običajno le ena
vrednost j. Na skrajnih koncih porazdelitve
zato združujemo razrede tako, da je
pričakovana pogostnost Ej v vsakem razredu ≥
5.
• Za j = 0 uporabimo j! = 1.
• Stopnje prostosti so (št. razredov) – 2.
6.2.2. Testiranje naključnosti
• Opozorilo:
• Test je občutljiv le na frekvenčne
porazdelitve števila intervalov; ko je število
intervalov doseženo, se intervali učinkovito
ločijo med seboj in od časovne lestvice.
• Zato test ni občutljiv za nenaključnost v
obliki trenda naraščajoče ali padajoče
gostote dogodkov v času.
6.2.3. Testiranje trenda (smeri)
• Spremembe pogostnosti dogodkov kvantificiramo s
spremembami dolžine intervala med njimi.
• Graf števila dogodkov proti intervalom med njimi
pokaže obstoječe
trende, ki jih
kvantificiramo
s korelacijo.
6.2.3. Testiranje trenda (smeri)
• H0: ni trenda spremembe dolžine intervala
H1: dolžine intervalov se krajšajo/daljšajo
• Testna statistika je Spermanov uvrstitveni
korelacijski koeficient:
n
r  1 
6 i  R(hi ) 
2
i 1
n(n  1)
• Kjer je hi dolžina i-tega intervala in n število
intervalov oz. število dogodkov – 1.
• Kadar izračunana vrednost presega tabelirano,
zavrnemo H0.
2
6.2.4. Testiranje enoličnosti
• Enakomerno porazdeljeni dogodki so lahko
posledica geoloških procesov, pri katerih pojav
dogodka zmanjša verjetnost naslednjega v
bližnji prihodnosti, vendar poveča njegovo
verjetnost kasneje.
• Enoličnost testiramo s Kolmogorov - Smirnov
(KS) testom.
• H0: dogodki so enakomerni ali naključni
H1: dogodki so nakopičeni ali imajo trend
spreminjajoče gostote
6.2.4. Testiranje enoličnosti
• Ničelni model izrazimo z ravno črto na
kumulativnem frekvenčnem grafu (s časom na x
osi). Kumulativni graf podatkov bo od te črte
odstopal. Največje odstopanje v navpični smeri je
osnova za KS statistiko.
6.2.4. Testiranje enoličnosti
• Kritične vrednosti KS temeljijo na velikosti
odstopanja, ki bi jo pričakovali pri naključnih
podatkih. Če je presežena, zavrnemo H0.
• Prednost testa je njegova občutljivost tako za
trende kot za nakopičenja.
• Za vsak dogodek vključuje izračun KS
primerjavo razmerja pretečenega dogodka z
razmerjem pretečenega časa.
6.2.4. Testiranje enoličnosti
• Za i-ti dogodek v zaporedju n dogodkov v
časovnem zapisu dolžine T, kjer je ti pretečeni
čas od začetka zapisa, primerjamo i/n s ti/T.
• Če bi bili dogodki popolnoma enakomerni, bi
bil ti/T za vsak dogodek enak (i-k)/n, kjer je k
katerakoli konstanta med 0 in 1.
• Za KS izračunamo razliki:
(i/n) – (ti/T)
in
((i-1)/n) - (ti/T)
za vsakega od dogodkov (stopnic na grafu).
6.2.4. Testiranje enoličnosti
• Manjša kot je neenakomernost, višje bodo
posamezne vrednosti. Najvišja absolutna vrednost
je KS statistika.
(i  1) ti i ti
KS  n  max
 , 
n
T n T
• Primerjamo jo s tabelirano kritično vrednostjo. H0
zavrnemo, kadar izračunana vrednost presega
kritično.
6.2.4. Testiranje enoličnosti
• Pravilnost, ki je skrajni primer enakomernosti, bo v
tem testu vodila do izredno nizkih vrednosti KS,
vendar jo je statistično izredno težko ločiti od
enakomernosti.
• Za podatke, ki jih želimo definirati kot pravilne,
moramo dopustiti nekaj naključne spremenljivosti
ali napake okrog popolnoma redno ponavljajočega
se vzorca.
• Večanje take spremenljivosti povzroči zveznost
možnosti od pravilne, preko enakomerne do
naključne porazdelitve.
6.2.5. Testiranje vzorcev
• Vrsta nenaključnosti so tudi kratki cikli
menjajoče se pogostnosti dogodkov in vzorci z
izmenjujočimi se dolgimi in kratkimi vmesnimi
intervali.
• Vzorec iščemo v zaporedju dolžine intervalov
h. Odnos med zaporednimi dolžinami
intervalov preiščemo s korelacijskim
koeficientom.
• Kadar med zaporednimi intervali ni vzorca, je
korelacija med hi in hi+1 nič.
6.2.5. Testiranje vzorcev
• Značilna negativna korelacija kaže menjajoče se
dolge in kratke intervale; pozitivna je znak, da so si
zaporedne dolžine
intervalov podobne.
• H0: ni povezave med
zaporednimi
dolžinami intervalov
H1: obstaja korelacija
med zaporednimi
dolžinami intervalov
6.2.5. Testiranje vzorcev
• Testna statistika je Spearmanov uvrstitveni
korelacijski koeficient:
n
r  1 
6 R(h)i  R(hi 1 ) 
2
i 1
n(n  1)
2
kjer je n število dogodkov - 2.
• Če izračunana vrednost presega kritično, zavrnemo
H0 in ugotovimo, da obstaja vzorec.
6.3. ANALIZE ČASOVNIH ZAPOREDIJ
• Čas je posebna spremenljivka, ker:
– ima časovna bližina dveh opazovanj poseben
pomen.
– so podatki že naravno razporejeni glede na čas
– je veliko naravnih procesov v času cikličnih.
6.3. ANALIZE ČASOVNIH ZAPOREDIJ
• V geologiji so absolutno časovno merljivi le nekateri
pojavi:
– Podatki na zelo dolgih časovnih lestvicah (106 – 109
let)  radiometrično datiranje  obrati magnetnega
polja, evstatična nihanja morske gladine, izumrtja
fosilnih zapisov, magmatizem.
– Geofizikalni podatki (potresni), kjer je čas z lahkoto
točno merljiv na kratkotrajni časovni lestvici.
– Podatki srednje časovne lestvice (1 – 106 let), kjer čas
z zadostno ločljivostjo poznamo za zgodovinske
dogodke  potresi, poplave, vulkanski izbruhi.
6.3. ANALIZE ČASOVNIH ZAPOREDIJ
• Časovna razlaga geoloških
sekvenc:
a. Varve
b. Prirastnice fosilov
c. Stratigrafska vrtina
d. Zaporedje plasti
6.3. ANALIZE ČASOVNIH ZAPOREDIJ
• Motnje v časovnem zapisu:
– Porušitev zapisa zaradi spreminjanja hitrosti
sedimentacije.
– Nezmožnost, da bi opazili nižje vrhove v ciklu.
6.3.1. Priprava podatkov
6.3.1.1. Interpolacija
• Časovno nihanje spremenljivk obravnavamo kot
zvezno, enakomerno razporejeno v času.
• Če sta t1 in t2 časa v sosednjih točkah in y1 in y2
izmerjeni vrednosti v njih, je vrednost v vmesni
točki ti:
ti  t1
yˆ i  y1 
  y2  y1 
t2  t1
6.3.1.2. Glajenje
• Surove podatke sestavljata dva dela:
– Signal, ki je posledica geološkega procesa
– Šum, ki je posledica naključnih motenj
• Šum se pojavlja v visokih frekvencah in ima
nestalen vpliv na sosednja opazovanja.
• Zmanjšamo ga s porazdelitvijo preko kratkega
niza opazovanj – z glajenjem.
6.3.1.2. Glajenje
6.3.1.2. Glajenje
• Povprečni niz glajenih podatkov ne sme biti
predolg, da ne zgladimo tudi signala.
• Vsako opazovano vrednost nadomestimo z
oceno vrednosti brez šuma.
• Oceno izračunamo z aritmetičnim
povprečenjem opazovane vrednosti v
obravnavani in v sosednjih točkah.
• Vpliv bližjih točk mora biti večji od vpliva bolj
oddaljenih  tehtanje vrednosti.
6.3.1.2. Glajenje
• Sprejeti moramo odločitvi:
1. Kolikšno število opazovanj bomo vključili v
tehtano povprečje
– Liho
– Kratki nizi (3 – 7) ohranjajo signal z relativno
visoko frekvenco
– Daljši nizi  glajenje je učinkovitejše
2. Kakšne bodo vrednosti uteži.
6.3.1.2. Glajenje
• Vrednosti uteži, ki jih predlagajo matematiki
glede na število členov kvadratnega
polinomnega glajenja:
Št. členov
5
7
9
ti
ti+1 ti+2 ti+3 ti+4
ti-1 ti-2 ti-3 ti-4
17 12 -3
7
6
3 -2
59 54 39 14 -21
6.3.1.2. Glajenje
• Če uporabimo pet členski polinom je ocena y1’
pri času ti:
 3 yi  2  12 yi 1  17 yi  12 yi 1  3 yi  2
yi 
35
• 35 je vsota uteži, s katero delimo zato, da
dobimo skupno utež 1 in s tem preprečimo
precenjevanje vrednosti.
6.3.1.2. Glajenje
• Pri glajenju nizov z 2n-1 členi, prve in zadnje
točke prvotnega časovnega zaporedja ne
moremo uporabiti na enak način.
• Zgladimo jih z manjšim številom členov ali jih
pustimo nespremenjene.
6.3.1.3. Okna in filtri
• Okno je razpon točk časovnega zaporedja,
preko katerega uporabimo algoritem pri vsaki
ponovitvi (= število členov pri glajenju).
• Filter sestavljata določen vzorec in algoritem.
• Postopke uporabimo za:
– Potresne podatke
– Poudarjanje gradientov v podatkih časovnih
zaporedij:
• Meritve stopnje (hitrosti) spremembe spremenljivke
• Delitev časovnega zaporedja v manjše pravilne cone,
ki jih razmejujejo hitre spremembe.
6.3.1.3. Okna in filtri
• Izračunamo niz razlik med zaporednimi
opazovanji:
yi’ = yi + yi-1
• Kjer yi’ predstavlja novo časovno zaporedje
razlik.
• Boljši rezultat dobimo, če uporabimo filter, ki
temelji na diferencialu polinomnih funkcij.
6.3.1.3. Okna in filtri
• Uteži filtra so enake členom polinoma:
Preprosti filter razlik Polinomni diferencialni filter
ti-1
-1
ti
1
ti-2
-2
ti-1
-1
ti
0
ti+1
1
ti+2
2
• Okno s petimi členi ima uteži filtra enake kot v
zgornji tabeli in enačbo zapišemo:
yi’ = 2yi+2 + yi+1 - yi-1 - 2yi-2
6.3.1.3. Okna
in filtri
6.3.1.3. Okna in filtri
• Strme lokalne gradiente, povezane s conarnostjo,
poudarimo z deljenim premikajočim se oknom:
– Okno, razdeljeno v enaki polovici pomikamo preko
nabora podatkov.
– V položajih,ki ustrezajo prehodu med conama, je razlika
med srednjima vrednostma velika glede na varianci, kar
kvantificiramo z:
y1  y2
yi  2 2
s1  s2
kjer sta y1 , s12in y2 , s 22 srednja vrednost in varianca
spremenljivke v dveh polovicah okna.
6.3.1.3. Okna in filtri
6.3.2. Časovni trendi
• Linearne trende odkrijemo s preprosto
bivariatno linearno regresijo, s časom kot
neodvisno spremenljivko, ter F testom
značilnosti analize variance.
• Linearni trend odstranimo tako, da namesto
surovih podatkov uporabimo preostanke
regresije.
6.3.2. Časovni trendi
• Če je regresijska enačba s časom t kot neodvisno
spremenljivko:
y = a + bt
• Izračunamo preostanle kot:
yi’ = y – bti – a
• Polinomna regresija običajno ni uporabna za
odkrivanje trendov v časovnih zaporedjih, ker
ukrivljene trende boljše opišejo cikli.
6.3.3. Odkrivanje ciklov
• Nekateri postopki analize cikličnost:
– Avtokorelacija
– Fourierjeva analiza
– ARIMA
• Obe zahtevata visoko kakovost podatkov, brez
popačenja časovne razsežnosti.
• Če je časovni zapis negotov, kot pri
stratigrafskih podatkih, je čas ordinalna
(vrstilna) meritev in dosežemo boljše rezultate
s tehnikami odkrivanja vzorca.
6.3.3.1. Avtokorelacija
• Avtokorelacija obravnava korelacijo niza podatkov s
samimi seboj.
• Korelacijski koeficient surovih podatkov je 1.
• Dva seta številk, ki jih koreliramo, dobimo tako, da
vsaki vrednosti yi poiščemo par yi+, kjer i podaja čas
ali položaj v časovni seriji,  pa je celoštevilčna
vrednost zamika, imenovana zaostanek.
• Korelacijski koeficient med časovno serijo in njeno
zamaknjeno dvojnico je avtokorelacijski koeficient
r. Izračunamo ga za zaporedne zaostanke – časovno
zaporedje drsi preko samega sebe.
6.3.3.1. Avtokorelacija
• Rezultirajoče zaporedje vrednosti r
nanesemo na graf r proti , ki se
imenuje avtokorelogram n.
1. Avtokorelacijski koeficient pri
zaostanku 0, je obvezno 1 in se
manjša z večanjem zamika. Hitrost
vpadanja r je odvisna od gladkosti
podatkov. Čim obstaja neka stopnja
gladkosti, vrednosti podatkovnih točk
niso popolnoma neodvisne od tistih,
tik pred njimi, kar se odraža v
pozitivnem r pri majhnem
zaostanku. Z naraščanjem zaostanka
se lahko zmanjšajo do zanemarljivo
majhne vrednosti, a lahko vse
podatke do te točke označimo kot
časovno avtokorelirane.
6.3.3.1. Avtokorelacija
2. Z naraščajočim zaostankom, ko
vpade začetna avtokorelacija, vsak
nadaljni vrh na avtokrelogramu z
dovolj visokim r lahko kaže
cikličnost podatkov. Po zamiku, ki je
enak zaostanku, podatki v takem
vrhu zdrsijo preko samih sebe čez
celotno valovno dolžino cikla, tako
da se viški in padci ponovno
ujamejo. Zaostanek je na položaju
vrha enak valovni dolžini obdobja ali
cikličnosti. Retultirajoči r bo manjši
od 1, razen v primeru nenaravno
pravilne cikličnosti. Resnično
cikličnost ločimo od naključnih
učinkov s testom značilnosti
avtokorelacije.
6.3.3.1. Avtokorelacija
• H0: r je posledica naključnosti
• Testna statistika:
Z  r n   3
• kjer je  zaostanek, r avtokorelacijski koeficient pri
zaostanku in n število opazovanj.
• Z je običajna Z statistika, ki je značilna na ravni 5%,
če presega vrednost 1,96.
6.3.3.1. Avtokorelacija
• Opozorila:
– Opazovanja morajo biti enakomerno
porazdeljena v času.
– Predhodno moramo odstraniti kakršenkoli
linearni trend. Ta bi povzročil postopno vpadanje
višine vrhov na avtokorelogramu, z naraščajočim
zaostankom.
– Zadostno število primerjav v izračunu koeficienta
zadostimo:
• S približno 50 opazovanji v časovnem zaporedju.
• Zaostanek ne presega n/4
6.3.3.1. Avtokorelacija
– Značilno visoke vrednosti r pri majhnih
zaostankih morda ne odražajo cikličnosti, temveč
le gladkost podatkov.
– Čeprav so možne značilne nizke vrednosti Z, te
niso pomembne, ker ustrezajo negativnim
avtokorelacijam, ki so posledica ujemanja vrhov
in padcev podatkov – pojavile se bodo skupaj z
visokimi pozitivnimi (vrh – vrh, padec – padec)
avtokorelacijami in ne dajejo nobene dodatne
informacije.
6.3.3.2. Fourierjeva analiza
• Fourierjeve metode skušajo razstaviti časovno
zaporedje v valovne nize.
• Zaporedje podatkov obravnavamo kot vsoto
zaporedij sinusoidnih funkcij z določeno amplitudo,
frekvenco in fazo.
• Fourierjeva analiza izračuna amplitudo in fazo za
vsako valovno frekvenco in podatke predstavimo
transformirane v frekvenčno področje.
• Perioda valov z značilno visoko amplitudo naj bi
ustrezala periodi cikličnosti podatkov.
6.3.3.2. Fourierjeva analiza
• Osnova Fourierjeve analize so cosinusni valovi:
y = A.cos(k - )
–  je čas, izražen v radianih (2 rad = 360o). Če je
dolžina časovnega zaporedja T in čas t, je
• u =2 (t/T)
– A je amplituda vala – polovica razdalje med
vrhom in dnom v smeri y.
– k je frekvenca – število ponovitev vala.
– je faza ali zamik vala v smeri , v enakih enotah
kot .
6.3.3.2. Fourierjeva analiza
• Časovno zaporedje lahko predstavimo z vsoto nizov
cosinusnih valov z različnimi frekvencami:

y   Ak cosk   k 
k 0
kjer so neznanke amplitude in faze valov pri vsaki od
frekvenc. Enačba je enaka:

y    k cos(k)   k sin(k) 
k 0
kjer je  k  Ak coskin
k  Ak sin k
6.3.3.2. Fourierjeva analiza
• Rešitev problema so vrednosti k in k za vsako
frekvenco.
• Geometrijsko lahko vsak par obravnavamo kot
koordinate točke na krogu z radijem A in kotnim
položajem, ki ustreza .
• Amplitudo in fazo izračunamo iz:
Ak   k2   k2
 k
 k  tan 
 k
1



6.3.3.2. Fourierjeva analiza
• Omejitve hitra Fourierjeve transformacije:
– Podatki morajo biti v času enakomerno
porazdeljeni in število opazovanj mora biti 2n, kjer
je n celo število.
– Podatki ne smejo vsebovati trenda.
– Izračun so samo celoštevilčne frekvence.
– Posledica tega je, da metoda predvideva, da je
kakršnakoli cikličnost podatkov prisotna v številih
celotnih ciklov; začetek in konec časovnega
zaporedja naj bi bila v isti točki cikla.
6.3.3.2. Fourierjeva analiza
• Dejansko je bolj od amplitude kot mera moči
frekvence uporabna vrednost, imenovana moč
(potenca), ki je enaka varianci pri tej frekvenci:
s 
2
k
 
2
2
2
• Rezultate prikažemo kot potenčni spekter.
• Cikličnost časovnega zaporedja se bo kazala kot
značilna konica na potenčnem spektru.
6.3.3.2. Fourierjeva analiza
• Če je T dolžina časovnega zaporedja v enotah
realnega časa in k frekvenca, pri kateri se
pojavi določena konica, je perioda cikličnosti
(oz. valovna dolžina) T/k.
• Najvišja rešljiva (Nyquistova) frekvenca je
polovica števila opazovanj v časovnem
zaporedju, tako da je najmanjša valovna
dolžina dvojni interval med opazovanji.
• Višje frekvence, vzorčene v pravilnih razmakih,
lahko nejasno oponašajo valovne oblike pri
nižjih frekvencah – privzemanje.
6.3.3.2. Fourierjeva analiza
• Poznavanje amplitude in faz značilnih frekvenc
uporabimo za rekonstrukcijo signala brez šuma Fourierjevo procesiranje je filter za odstranjevanje
šuma.
• Potenčni spekter resničnih podatkov bo vseboval
tipičen šum, z veliko nizkih konic, ki so posledica
naključnih učinkov.
• Signal od šuma ločimo z dvema testoma značilnosti:
– g statistika
– Test belega šuma
6.3.3.2.1. g statistika
• g statistika obravnava potenco kot varianco.
• Temelji na razmerju med največjo varianco pri
frekvenci s2max in celotno varianco zaporedja
s2, ki je enaka vsoti potenc vseh frekvenc.
• Problem je, da testiramo le eno frekvenco. Če
ima resnični signal dve ali več valovnih dolžin,
ki se prekrivajo, bo značilnost podrejenih
vrhov zmanjšana zaradi glavnega vrha. Signal
mora biti zelo močan, da ovrže H0.
6.3.3.2.1. g statistika
• H0: moč pri frekvenci je naključna
H1: pri frekvenci obstaja cikličnost
• Testno statistiko moči vrha izračunamo:
2
smax
gˆ  2
2s
• Kritično vrednost g ocenimo z:
g  1 e
ln p ln m
m 1
kjer je p raven zaupanja in m število opazovanj,
deljeno z 2.
6.3.3.2.2. Test belega šuma
• “Beli šum” pomeni podatke, pri katerih je moč
enakomerno porazdeljena preko spektra.
Uporabimo ga lahko kot H0 naključnosti.
• Test temelji na Kolmogorov Smirnov (KS)
statistiki, kjer ravna črta, na grafu kumulativne
moči proti frekvenci, nagnjena od 0 proti 1,
predstavlja ničelno situacijo – obstoj belega
šuma.
• H0 zavrnemo, kadar kumulativna krivulja
podatkov bistveno odstopa od ničelne črte.
6.3.3.2.2. Test belega šuma
• Kumulativna lastnost testa omogoča odkriti značilno
nakopičenje moči v delih spektra, namesto
testiranja le posameznega vrha.
• Kumulativno razmerje moč k pri k je:
k
ˆk 
2
s
i
i 1
n
2
2
s
i
i 1
• Pričakovana povprečna kumulativna moč podatkov,
ki izhajajo iz belega šuma pa:
2k
k 
n
6.3.3.2.2. Test belega šuma
• Pri =0,05 so meje zaupanja:
• Če katerikoli k pade
izven intervala
zaupanja, smo
95% prepričani,
da podatki niso
beli šum.
2k
1,36

n
n
1
2
6.3.3.2.2. Test belega šuma
• Čeprav test zazna nenaključnost, H1 ne
potrjuje cikličnosti.
• Pri večini geoloških podatkov obstoj belega
šuma zavrnemo zaradi težnje, da so moči višje
v nizkofrekvenčnem delu spektra.
• Kakršenkoli razprševalni proces (npr.
premikanje tekočine) bo zgladil
visokofrekvenčne podatke, tako da je
zavrnitev H0 precej verjetna.
6.3.3.3. Walshov spekter
• Cikličnost stratigrafskih sekvenc različnih litoloških
plasti analiziramo tako, da v enakomernih intervalih
litotipe kodiramo s celimi števili.
• Sekvenco predstavimo z menjajočimi se kodami kot
“kvadratni val”.
• Takim podatkom, razen če so izredno zglajeni, ne
smemo prilagajati Fourierjevih cosinusnih valov, ker
se na potenčnem spektru pojavijo umetni vrhovi, ki
so posledica prilagajanja cosinusnih valov vogalom
kvadratnih valovnih oblik.
• Namesto tega lahko uporabimo različico
Fourierjevega postopka – Walshev spekter.
6.3.3.4. Analize obrisov
• Obris podamo s polarnimi koordinatami in ga
obravnavamo kot časovno zaporedje.
• Začetek in konec se ovijata po obrisu in sta si
enakovredna.
6.3.4. ARIMA
• Avtoregresivno integrirano drseče povprečje
(autoregressive integrated moving average ARIMA) je metoda, ki se uporablja za boljše
razumevanje podatkov in/ali za napovedovanje
nadaljevanja zaporedja.
6.3.5. Odkrivanje splošnega vzorca: stratigrafski
položaj kot vrstilni (ordinalni) podatek
• Za stratigrafske sekvence ne razpolagamo s točnimi
meritvami časa, zato ne uspemo odkriti značilnih
cikolv.
• Pravilni časovni cikli so popačeni zaradi menjajoče
se hitrosti sedimentacije.
• Čas obravnavamo kot vrstilno spremenljivko.
• Tehnike, ki so na razpolago s takimi podatki, niso
sposobne ločiti pravilne cikličnosti od drugih
ponavljajočih se vzorcev ali ritmov.
6.3.5.1. Grafična obdelava
• Izdelamo serijski
korelacijski graf, kjer vsako
opazovanje y povežemo z
opazovanjem, ki mu
neposredno sledi.
• Na graf ju predstavimo kot
točko bivariatnega sipanja
yi proti yi+1.
6.3.5.2. Testi nizov
• Opazujemo zaporedje situacije dveh stanj, ki
ju opišemo z dvema alternativnima shemama:
– Stanje 1 – vrednost je višja od predhodne (+)
– Stanje 2 – vrednost je višja od predhodne (-)
Zaporednih enakih vrednosti ne upoštevamo.
ali:
– Stanje 1 – vrednost je višja od mediane (+)
– Stanje 2 – vrednost je višja od mediane (-)
6.3.5.2. Testi nizov
• Testi nizov temeljijo na številu nizov istega stanja v
zaporedju opazovanj.
• Test nizov išče značilna odstopanja od števila nizov,
ki bi jih pričakovali v naključnem zaporedju.
• H0: podatki so naključni
• testiramo s statistiko Z:
Z
U U
U
kjer je U opazovano število nizov, U pričakovano in
 U pričakovana standardna napak.
6.3.4.2. Testi nizov
• Če Z presega 1,96 ( = 0,05), je število nizov
značilno visoko, če je nižji od -1,96 pa je število
nizov značilno nizko.
• Pričakovano število nizov izračunamo:
2n1n2
U  1
n1  n2
• In pričakovano varianco:
2n1n2 (2n1n2  n1  n2 )
 
(n1  n2 ) 2 (n1  n2  1)
2
U
kjer sta n1 in n2 število opazovanj vsakega stanja.
6.3.5.3. Noetherjev test
• Zaporedja opazovanj razdelimo v trojke – po
tri opazovanja v skupini.
• Preštejemo število monotonih trojk.
• Monotonost pomeni, da je znotraj trojke
vrednosti zaporedno naraščajo ali vpadajo od
prve do zadnje. Enakih vrednosti ne
upoštevamo.
• V naključnih zaporedjih bo tretjina trojk
monotonih.
6.3.5.3. Noetherjev test
• Verjetnost opazovanja x’ monotonih trojk
izmed n trojk, s p 0 0,333, je podana s
kumulativnimi binomnostmi, ki so
tabelirane.
• Če je verjetnost, ugotovljena iz kumulativnih
binomnosti manjša od 0,05, zavrnemo H0, da
je sekvenca naključna in zaključimo, da
obstaja vzorec.
6.3.5.3. Noetherjev test
• Opozorili:
–Enake omejitve kot pri testu nizov naravno
gladkih podatkov.
–Rezultat je zelo občutljiv na nepopolnost
zaporedja:
• Popolna sekvenca monotonih trojk bi postala
neznačilna, če eno od vrednosti v sredini
odstranimo – polovica sekvence bi bila izven
faze in ne monotona.

similar documents