Valószín¶ségi el®rejelzések - ELTEweb.cs.elte.hu/blobs/diplomamunkak/mat/2009/s... · közé...

60

Transcript of Valószín¶ségi el®rejelzések - ELTEweb.cs.elte.hu/blobs/diplomamunkak/mat/2009/s... · közé...

  • Valószín¶ségi el®rejelzések

    Diplomamunka

    Írta: Szamoránsky János

    Matematikus szak

    Témavezet®:

    Arató Miklós, egyetemi docensValószín¶ségelméleti és Statisztika Tanszék

    Eötvös Loránd Tudományegyetem, Természettudományi Kar

    Eötvös Loránd TudományegyetemTermészettudományi Kar

    2009

  • Tartalomjegyzék

    1. Lényeges szkórok 41.1. Lényeges szkórok karakterizációja . . . . . . . . . . . . . . . . . . . . . . . . . 4

    1.1.1. Információmértékek és Bregman-divergenciák . . . . . . . . . . . . . . 61.2. Lényeges szkórok kategórikus változók esetén . . . . . . . . . . . . . . . . . . 6

    1.2.1. Savage reprezentáció . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.2. Schervish reprezentáció . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2.3. Példák . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    1.3. Lényeges szkórok s¶r¶ségfüggvény-el®rejelzések esetében . . . . . . . . . . . . 111.4. CRPS (Continuous Ranked Probability Score) . . . . . . . . . . . . . . . . . . 131.5. Az el®rejelz®i teljesítmény klasszikus mér®számai . . . . . . . . . . . . . . . . 15

    1.5.1. PMCC (Predictive Model Choice Criteria) . . . . . . . . . . . . . . . . 161.6. Energia szkór . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.7. Lényeges szkórok és negatív de�nit függvények kapcsolata . . . . . . . . . . . 171.8. Szkórok intervallum- és kvantilisel®rejelzések esetében . . . . . . . . . . . . . 19

    1.8.1. Lényeges szkórok kvantilis el®rejelzésekhez . . . . . . . . . . . . . . . . 191.8.2. Intervallumszkór . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    1.9. Optimális szkór becslés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    2. Kalibráció és élesség 242.1. Kalibráció . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    2.1.1. Valószín¶ségi kalibráció becslése . . . . . . . . . . . . . . . . . . . . . 272.1.2. Marginális kalibráció becslése . . . . . . . . . . . . . . . . . . . . . . . 33

    2.2. Élesség . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342.2.1. Az élesség becslése . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    3. Bayesi megközelítés 373.1. Konjugált priorok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383.2. Hipotézisvizsgálat és Bayes faktor . . . . . . . . . . . . . . . . . . . . . . . . . 41

    3.2.1. Lindley paradoxona [9] . . . . . . . . . . . . . . . . . . . . . . . . . . . 423.3. Bayes faktor az általános esetben . . . . . . . . . . . . . . . . . . . . . . . . . 43

    4. A logaritmikus szkór határeloszlása néhány esetben 454.1. Exponenciális modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.2. Normális modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.3. Lognormális modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494.4. Gamma modell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

    1

  • BevezetésA statisztikai analízis legfontosabb céljai közé tartozik, hogy megbízható el®rejelzéseket

    adjunk a jöv®re nézve. Persze a jöv® bizonytalansága miatt nem szorítkozhatunk csak deter-minisztikus el®rejelzésekre. Gondolhatunk a jöv®beli eseményekre, mint valamilyen háttérfo-lyamat véletlenül bekövetkez® kimeneteleire és vehetünk valószín¶ségi eloszlásokat egy ilyenjöv®beli esemény lehetéges kimenetelein, azaz külön-külön rendelhetünk valószín¶ségeketminden egyes lehet®séghez. Így az el®rejelzésünk egy eloszlás lesz, melyet prediktív elosz-lásnak nevezünk. A matematikai statisztika Bayes-becslésénél is tulajdonképpen az egésza posteriori eloszlást kaptuk becslésként, s ennek néztük különböz® funkcionáljait (várhatóérték, medián) pontbecslésként. Az elmúlt két évtizedben az efajta valószín¶ségi el®rejelzé-sek rengeteg alkalmazásra leltek meteorológia el®rejelzésekt®l (id®járás-1, klímael®rejelzések)kezdve különböz® makroökonómiai prognózisokig, köszönhet®en f®leg az MCMC (MarkovChain Monte Carlo) módszerek különböz® továbbfejlesztéseinek is, melyek a prediktív elosz-lásból való Monte Carlo-mintavételek formájában kerülnek alkalmazásra. El®ször csak adiszkrét eset került a kutatók elé, de aztán olyan folytonos és diszkrét-folytonos változók,mint például h®mérséklet, csapadék, szélsebesség, gdp, in�áció kerültek el®térbe, amelyeksegítették az általános elmélet kialakulását is. A valószín¶ségi el®rejelzések ekkor prediktívs¶r¶ség- ill. eloszlásfüggvények alakját öltik magukra. Továbbra is fennáll a kérdés: hogyanmérjük az ilyen valószín¶ségi el®rejelzésekben meglev® bizonytalanságot?

    A dolgozatom els® részében bevezetésre kerül® szkórok alapvet® szerepet játszanak avalószín¶ségi el®rejelzések kiértékelésénél. Egy ilyen szkór az el®rejelzéseken és meg�gyelé-seken értelmezett numerikus skála, melyekkel valószín¶ségi el®rejelzések min®ségét mérjük.Pontosabban egy szkór egy kétváltozós valós érték¶ leképezés, melynek egyik változója aprediktív eloszlás, a másik pedig a ω realizáció. Az így kapott értéket az el®rejelzés jutal-mának tekintjük. Gneiting és Raftery [2] cikke alapján megadom ezeknek egy igen fontostulajdonságát, mely óvatosságra inti az el®rejelz®t és ®szinte el®rejelzésekre biztatja. Mindenilyen szkór egy konvex függvényb®l ered, és mindegyiknek van egy információelméleti vonat-kozása: mindegyikhez tartozik egy entrópia függvény, ill. (Bregman) divergencia. Példákatmutatok a gyakorlatban legtöbbet használt szkórokra, mint például a kvadratikus szkór,vagy a sokkal robosztusabb CRPS. A legegyszer¶bb ilyen el®rejelzés persze p(ω) lenne, ezazt az el®rejelz®t helyezi el®bbre, mely nagyobb valószín¶séget csatolt a meg�gyeléshez,viszont majd látni fogjuk, hogy ez nem fog megfelelni a megkövetelt tulajdonságnak. Ezérthelyette a LS(p, ω) = log p(ω) képlettel de�niált ún. logaritmikus szkórt használjuk majd.Bemutatom a megismert CRPS egy messzemen® általánosítását, mely Székely J. Gábornevéhez f¶zödik, majd említést teszek a negatív de�nit függvények és a szkórok kapcso-latáról. E kapcsolat révén általános mintatér esetében tudunk értelmezni szkórokat. Ezutánintervallum- és kvantilisel®rejelzések esetében használt szkórok egy általános alakját muta-tom be. Mindezekmellett a becsléselméletben is fontos szerep juthat a szkóroknak, ugyanis azáltaluk nyert hasznossági függvények segítségével igen sok különféle becslést kaphatunk, me-lyek között található néhány már eddig is ismert becslésfajta, mint pl. maximum likelihoodvagy legkisebb négyzetes becslés. Az így kapott becslések a ML-becslés és az M-becslések

    1Valószín¶ségi id®járás-el®rejelzések tipikusan ensemble prediktív rendszereken alapszanak, melyek azatmoszféra aktuális állapotának legjobb becslésében perturbációkat generálnak, és numerikus id®járás-el®rejelzési modellek segítségével futtatják ®ket, s az így kapott eredményeket, mint a prediktív eloszlásbólszármazó mintát kezelik valamilyen jövöbeli id®járási mennyiség el®rejelzésére.

    2

  • közé tehet®k. Nagy el®nyük, hogy a feladat természetét®l függ®en mi választhatjuk megmelyik szkórhoz tartozó hasznossági függvénnyel2 dolgozunk.

    A dolgozatom második részében valószín¶ségi el®rejelzések kalibrációjával foglalkozom.Gneiting, Raftery és mások [3]-ban a valószín¶ségi el®rejelzések célját a következ®képpenfogalmazza meg: maximalizálni az eloszlás élességét rögzített kalibráció mellett. A kalibrációaz adatok konzisztenciáját jelenti, mennyire egyeztethet® össze statisztikailag a prediktíveloszlásunk a meg�gyelésekkel, így közös tulajdonsága az el®rejelzésnek és a meg�gyelé-seknek. Míg az élesség a prediktív eloszlás koncentráltságát fejezi ki, így csak magánakaz eloszlásnak a tulajdonsága. Minél koncentráltabb a prediktív eloszlás, annál élessebb azel®rejelzés; és az élesebb el®rejelzés a jobb, adott kalibráció mellett. A kalibráció különféle vál-tozatait de�niálom és különböz® eszközöket (például PIT, marginális kalibráció diagramm)ezek meglétének ellen®rzésére illetve becslésére. Mindezeket példákon keresztül és ábrákkaligyekszem ismertetni.

    Ezután megvizsgálom, hogyan kezelik a valószín¶ségi el®rejelzéseket bayesi környezet-ben. Ismertetem a konjugált priorokat, melyek adott likelihood mellett mindig ugyanabbaaz eloszláscsaládba tartozó posteriori eloszlásokat adnak, mint maguk. Egyszer¶en belátható,hogy minden exponenciális eloszláscsaládba tartozó likelihood esetén mindig található hozzászintén az exponenciális eloszláscsaládba tartozó konjugált prior. Bemutatom a Bayes fak-tort, el®ször mint a hipotézisvizsgálat bayesi megfelel®jét, majd de�niálom általános eset-ben is. Ismertetem ennek néhány hátrányát, mint például a priori hiperparaméterekre valóérzékenységét, egyúttal megemlítem Lindley paradoxonát is. Ebben a fejezetben leginkábbWalsh [10] cikkére támaszkodtam.

    Majd a dolgozat utolsó részében az egyik leggyakrabban használt szkór, a logaritmikusszkór határeloszlását vizsgálom néhány ismert modell esetén. Ezután egy példán keresztülbemutatom, miért hasznos a lényeges szkórokat kitüntet¶ tulajdonság, majd az általánosesetben is megmutatom, hogy ez teszi lehet®vé, hogy 1-hez tartó valószín¶séggel mindiga helyes modellt fogjuk kiválasztani, ha a lényeges szkórokat használjuk. Ezután egy sa-ját példán keresztül is bemutatom a Bayes faktor a priori hiperparaméterekre vonatkozóérzékenységét.

    2Vagy negatív orientációval veszteségfüggvénnyel.

    3

  • 1. fejezet

    Lényeges szkórok

    Az els® fejezetben el®ször bevezetem a jelöléseket, megadom a lényeges szkórok egy osz-tályának, a reguláris szkóroknak a karakterizációját, majd ismertetem a megfelel® infor-mációelméleti vonatkozásokat, illetve Bregman divergenciákat. Ezután a folytonos el®re-jelzések esetével foglalkozom, bemutatom a CRPS-t, majd ennek messzemenn® általánosítá-sait; megvizsgálom a lényeges szkórok és a negatív de�nit függvények kapcsolatát, végül azintervallum- és kvantilisel®rejelzések esetével foglalkozom, illetve említést teszek az optimálisszkór becslésr®l, mely magába foglal sok eddig megismert becsléstípust.

    1.1. Lényeges szkórok karakterizációjaValószín¶ségi el®rejelzések vizsgálatához el®ször is meg kell adni egy Ω mintateret, illetve

    az Ω részhalmazaiból álló A mérhet® halmazok σ-algebráját. Az így kapott (Ω,A) mérhet®téren legyen továbbá adott valószín¶ségi mértékek egy P konvex családja.Ekkor egy Ω-n értelmezett kiterjesztett valós érték¶ függvényt P-kváziintegrálhatónak ne-vezünk, ha mérhet® A-ra nézve és kváziintegrálható minden P ∈ P szerint. Kváziintegrál-hatóság alatt azt értve, hogy az integrál létezik, az értéke lehet véges vagy végtelen.Valószín¶ségi el®rejelzésnek nevezzük P egy P elemét.Egy S : P × Ω → R kiterjesztett valós érték¶ függvényt szkórnak vagy pontozó szabálynaknevezünk, ha S(P, · ) P-kváziintegrálható minden P ∈ P esetén. Egy ilyen szkór úgy inter-pretálható, hogy ha egy el®rejelz® a P ∈ P valószín¶ségi el®rejelzést adja és ω realizálódik,akkor az el®rejelz® jutalma S(P, ω).Bevezetem még a következ® jelölést a Q szerinti várható szkórra a P el®rejelzés mellett:

    S(P,Q) =∫S(P, ω)dQ(ω) (1.1)

    Ezt felfoghatjuk mint a P el®rejelzésünk várható jutalmát, ha a valódi háttéreloszlás Q.Fontos lenne olyan szkórokat készíteni melyek "®szinte" el®rejelzésekre bíztatnak. Minél"közelebb" van az el®rejelzésünk a valódi háttéreloszláshoz, annál jobb munkát végeztünkés nagyobb jutalmat érdemlünk. Tehát az eloszlások között kellene valamilyen távolság-fogalmat de�niálni.

    4

  • A következ®kben egy S szkór igen fontos tulajdonságát de�niálom, lényegében csak azilyen szkórokkal kell foglalkoznunk. Egy S szkórt lényegesnek1 nevezünk a P osztályon, ha

    S(Q,Q) ≥ S(P,Q) ∀P,Q ∈ P (1.2)

    Azaz bármely háttéreloszlás esetén a várható szkór maximális, hogyha ezt a valódi eloszlást(a lehet® legjobbat) adjuk el®rejelzésként. Ha a maximum csak ekkor éretik el, és mindenmás esetben szigorú egyenl®tlenség áll, akkor az S-t szigorúan lényegesnek nevezzük. Azt,hogy miért ez a megfelel® de�níció, majd a kés®bbiekben látni fogjuk. Világos, hogy (szi-gorúan) lényeges szkórok és P-integrálható függvények véges összege (szigorúan) lényeges.2

    De�níció: Egy G : P → R függvény konvex, ha ∀λ ∈ (0, 1),∀P0, P1 ∈ P esetén

    G((1− λ)P0 + λP1) ≤ (1− λ)G(P0) + λG(P1) (1.3)

    A G szigorúan konvex, ha egyenl®ség csak P0 = P1 esetben lehetséges.

    De�níció: Egy G?(P, · ) : Ω → R függvényt G szubtangensének nevezzük a P ∈ Ppontban, ha integrálható P szerint, kváziintegrálható a többi Q ∈ P szerint és

    G(Q) ≥ G(P ) +∫G?(P, ω)d(Q− P )(ω) ∀Q ∈ P (1.4)

    De�níció: Egy S : P × Ω → R szkór reguláris P-n, ha ∀P,Q ∈ P esetén teljesül:S(P, P ) ∈ R és S(P,Q)

  • 1.1.1. Információmértékek és Bregman-divergenciák

    Legyen S egy lényeges szkór P-n, ekkor a

    G(P ) = S(P, P ) = supQ∈P

    S(Q,P ) (1.6)

    várható szkór függvényt az S szkórhoz tartozó (általánosított) entrópiának nevezzük. Ez amaximális elérhet® hasznosság és a sima entrópia kifejezés is használatos. Ha az S szkórreguláris és lényeges, akkor

    d(P,Q) = S(P, P )− S(Q,P ) P,Q ∈ P (1.7)

    az S-hez tartozó divergencia függvény. Ez nemnegatív, és ha az S szkór szigorúan lényeges,akkor pontosan akkor 0, ha P = Q. Tehát a várható szkór maximalizálása egyenérték¶ adivergencia minimalizálásával.4 Bizonyos esetekben el®fordulhat, hogy valamilyen korláto-zások miatt csak adott típusú eloszlások jöhetnek szóba el®rejelzésként, így ezek közül kellkiválasztani a legjobbat, ekkor ezek között kell minimalizálni a divergenciát. Például ha egyparaméteres eloszláscsaládot akarunk illeszteni az adatsorra, akkor ezen a családon belülminimalizálhatjuk a divergenciát és így becslést kapunk a paraméterre. Ha a mintatér véges,és az entrópia függvény elegend®en sima, akkor a divergencia függvény a Bregman divergen-cia, melynek fontos szerep jut az optimalizációelméletben. A Bregman távolság kifejezést ishasználják habár d(P,Q) = d(Q,P ) nem feltétlen teljesül minden esetben.Érdekes probléma olyan feltételeket találni, mely mellett egy d divergenciához megadhatóegy S szkór úgy, hogy d a megfelel® szkór-divergencia. Ekkor persze egy új út nyílik el®ttünkkülönböz® szkórok de�niálásához. Szimmetrikus divergencia esetében Savage ([2], 1971) adszükséges feltételt: ha P és Q ugyanarra az eseményre koncentrált indikátorváltozók a meg-felel® p és q ∈ [0, 1] valószín¶ségekkel, akkor d(P,Q) (p−q)2 lineáris függvényévé redukálódik.Friedman és Nau ([2], 1985) egy lazább kapcsolatot vizsgált lényeges szkórok és valószín¶ségimértékek távolságai közt. Vizsgálataikat valódi metrikákra korlátozták, melyek szimmetri-kusak és kiegyenlítik a háromszög-egyenl®tlenséget is. Egy S szkórt e�ektívnek neveznek egyd metrikával, ha

    S(P1, Q) ≥ S(P2, Q) ⇐⇒ d(P1, Q) ≤ d(P2, Q) (1.8)Egy d metrikát pedig ko-e�ektívnek, ha létezik olyan S lényeges szkór, mely e�ektív d-vel.Bebizonyították, hogy az l1, l∞ és a Hellinger távolság5 az abszolút folytonos valószín¶ségimértékek terén nem ko-e�ektívek.

    1.2. Lényeges szkórok kategórikus változók eseténMost az el®z® két speciális esetét vizsgálom, és véges mintatér esetén Savage (1971, [2])

    és Schervish (1989, [2]) két reprezentációját mutatom be, melyek kategórikus és bináris vál-tozók esetén karakterizálja a (szigorúan) lényeges szkórokat, majd néhány példát láthatunklényeges szkórokra.

    4Ez felelhet meg a két eloszlás "távolságának", bár nyilvánvaló, hogy matemetikai értelemben nem me-trikáról van szó, például egyáltalán nem biztos, hogy szimmetrikus.5Hellinger távolság: d(P, Q) = ∫ (√p(x)−√q(x))2, ahol p és q a megfelel® s¶r¶ségfüggvények.

    6

  • 1.2.1. Savage reprezentáció

    El®ször tehát kategórikus vagy más néven kvalitatív változók el®rejelzéseivel foglalkozom.Ezek véges sok értéket felvev® diszkrét valószín¶ségi változók, melyeknél az értékek nemnagyságrendet tükröznek, hanem a változó olyan kategórikus értékeit hívatottak jelölni, mintpéldául szín vagy területi felosztás. A bináris változók ennek azt a speciális esetét adják,mikor két elemi eseményünk van, és dönteni szeretnénk, hogy melyik következik be közülük.Tehát akkor a mintatér Ω = {1, . . . ,m} véges sok, egymást kizáró eseményb®l áll, és egyvalószín¶ségi el®rejelzés egy (p1, . . . , pm) valószín¶ségi vektor. Az eddigi jelöléseket használvaaz el®rejelzések konvex osztálya

    P = Pm ={p = (p1, . . . , pm) : p1, . . . , pm ≥ 0, p1 + · · ·+ pm = 1

    }Ekkor egy S szkór megadása ekvivalens a következ® m függvény megadásával:

    S(·, i) : Pm → R i = 1, . . . ,m

    Vagyis, ha egy el®rejelz® a p valószín¶ségi vektort adja és az i esemény következik be, akkoraz ® jutalma S(p, i). A következ® tétel az el®z® pontban ismertett (1.5) speciális esete, ésSavage reprezentációját adja a lényeges szkóroknak véges mintatér esetén.El®bb de�niálom az el®z® pont fogalmait erre a speciális esetre:

    De�níció: Legyen G : Pm → R konvex függvény. Ekkor egy G′(p) = (G′1(p), . . . , G′m(p))vektort6 G szubgradiensének nevezünk p ∈ Pm-ben, ha

    G(q) ≥ G(p) + 〈G′(p), q − p〉 ∀q ∈ Pm (1.9)ahol 〈·, ·〉 jelöli a (standard) skaláris szorzatot.

    De�níció: Egy S szkór kategórikus változókra reguláris, ha S(·, i) valós érték¶, kivéveesetleg S(p, i) = −∞, ha pi = 0.

    Tétel (Savage reprezentáció)Egy S kategórikus változókra vonatkozó reguláris szkór akkor és csak akkor (szigorúan) lénye-

    ges, ha

    S(p, i) = G(p)− 〈G′(p), p〉+G′i(p) i = 1, . . . ,m (1.10)ahol G : Pm → R egy (szigorúan) konvex függvény és G′(p) G egy szubgradiense p-ben∀p ∈ Pm esetén.

    Azaz egy S reguláris szkór akkor és csak akkor (szigorúan) lényeges, ha a G(p) = S(p, p)várható szkór függvény (szigorúan) konvex Pm-n és az S(p, i) (i = 1, . . . ,m) komponensek-b®l alkotott vektor G egy szubgradiense p-ben.

    Tehát ez eddigiek szerint minden korlátos (szigorúan) konvex G függvény Pm-en generálegy reguláris, (szigorúan) lényeges szkórt. Ez a G függvény lesz a (1.6) várható szkór függ-vény, információmérték vagy entrópiafüggvény, a megfelel® divergencia pedig (1.7) Bregmantávolság.

    6Tegyük fel, hogy G′i(p) valós érték¶, kivéve a G′i(p) = −∞, ha pi = 0 esetet.

    7

  • 1.2.2. Schervish reprezentáció

    Mint már említettem a klasszikus eldöntend® kérdések témaköre külön tárgyalást érde-mel. Az eseménytér most két elemb®l áll, ahol az 1 felel meg az igennek: Ω = {0, 1}. Egyvalószín¶ségi el®rejelzés legyen p ∈ [0, 1] az igen valószín¶sége.7 Ebben az esetben egy Sszkór a következ® két függvénnyel adható meg:

    S(·, 1) : [0, 1] → R, S(·, 0) : [0, 1] → R

    Ezek azt adják meg, hogy mekkora a jutalmunk hogyha p valószín¶séggel jeleztük el®re azeseményt és az bekövetkezik (S(p, 1)), ill. nem következik be (S(p, 0)).

    De�níció:Az S szkór reguláris, ha S(·, 1) és S(·, 0) végesek, kivéve esetleg az S(0, 1) = −∞vagy S(1, 0) = −∞ eseteket.8

    A (1.5) tétel erre az esetre vonatkozó variánsa szerint minden reguláris, (szigorúan)lényeges szkór a következ® alakú:

    S(p, 1) = G(p) + (1− p)G′(p), S(p, 0) = G(p)− pG′(p) (1.11)

    ahol G : [0, 1] → R (szigorúan) konvex függvény és G′(p) G egy szubgradiense p-ben, akövetkez® értelemben:

    G(q) ≥ G(p) +G′(p)(q − p) ∀q ∈ [0, 1] (1.12)

    A G′(p) szubgradiens valós érték¶, kivéve a G′(0) = −∞ és a G′(1) = −∞ lehetséges ese-teket. Ha G di�erenciálható a p ∈ (0, 1) bels® pontban, akkor a G′(p) értéke egyértelm¶ ésmegegyezik a derivált értékével.9

    A Savage reprezentációból igen érdekes tulajdonságait nyerhetjük a reguláris, (szigorúan)lényeges szkóroknak. Például a következ®

    S(p, 1) = limq→1

    G(q)−∫ 1

    p

    (G′(q)−G′(p))dq p ∈ (0, 1) (1.13)

    el®állításból leolvasható (mivel G(p) (szigorú) konvexitása miatt G′(p) (szigorúan) monotonn®), hogy S(p, 1) szintén (szigorúan) monoton n®. Hasonlóan S(p, 0) (szigorúan) monotoncsökken, ahogy azt t®lük el®zetesen is elvárnánk. Ugyanis minél nagyobb valószín¶séggeljeleztünk el®re egy eseményt, ami aztán bekövetkezett, annál nagyobb jutalomra számítunk.Viszont ha nem következett be az esemény, akkor a jutalmunk egyre csökken, minél nagyobbvalószín¶séggel jeleztük el®re azt.

    Ennek felhasználásával bizonyítható a következ® tétel, mely a bináris el®rejelzésekre vo-natkozó reguláris lényeges szkórokat karakterizálja:

    7Különbség az el®z® részben tárgyaltakhoz képest, hogy most P = [0, 1], míg ott P2 = {(p1, p2) ∈ R2 :p1 ∈ [0, 1], p2 = 1− p1} volt.8Ezek azok az esetek, amikor az el®rejelzés szerint az esemény 1 valószín¶séggel be fog következni, ámnem következik be, illetve fordítva: az el®rejelzés szerint 1 valószín¶séggel nem fog bekövetkezni az esemény,mégis bekövetkezik.9Egy szubgradiens lényegében egy támaszhipersíknak felel meg.

    8

  • Tétel (Schervish reprezentáció)Legyen S egy reguláris szkór. Ez akkor és csak akkor lényeges, és

    S(0, 1) = limp→0 S(p, 1), S(0, 0) = limp→0 S(p, 0), illetve S(p, 0) és S(p, 1) balról folytonosak,

    ha létezik egy olyan ν mérték (0, 1)-en, melyre

    S(p, 1) = S(1, 1)−∫

    [p,1)

    (1− q)ν(dq) ∀p ∈ [0, 1] (1.14)

    S(p, 0) = S(0, 0)−∫

    [0,p)

    qν(dq) ∀p ∈ [0, 1] (1.15)

    Az S szkór akkor és csak akkor szigorúan lényeges, ha ν pozitív súlyt rendel minden nyílt

    intervallumhoz.

    Bizonyítás: (vázlat) Tegyük fel, hogy S kielégíti a tétel feltételeit. S(p, 1) (1.14)alakjához nézzük a (1.13) reprezentációt és mivel G′(p) monoton növekszik, ezért azonosítsukegy ν mérték (balról folytonos) eloszlásfüggvényével, és alkalmazzunk parciális integrálást.S(p, 0) el®állítása analóg módon történik. A másik irányhoz fordítsuk meg a gondolatmene-tet. A szigorú lényegességre vonatkozó állítás a szigorúan konvex függvények ismert tulaj-donságaiból következik.�

    Ha a G várható szkór függvény elegend®en sima, akkor ν(dq)-nak létezik Lebesgue-s¶r¶ségfüggvénye −G′′(q). Például a Brier szkór esetében G(p) = 2p(1− p), így a hozzátar-tozó ν mérték az egyenletes. Míg a logaritmikus szkór a Shannon entrópiából származik,és így G(p) = p log p + (1 − p) log(1 − p), a ν ekkor egy nem-véges mérték (q(1 − q))−1Lebesgue-s¶r¶ségfüggvénnyel.

    1.2.3. Példák

    Az eddigiek után lássuk néhány példát is lényeges szkórokra. Mindegyiknek létezik binárisváltozata is, de ezt nem részletezem mindenhol, ugyanis ezt megkaphatjuk, hogy ha a képletetkét eseményre írjuk fel.

    • Kvadratikus szkór (vagy Brier szkór)10Legyen G(p) a következ® konvex függvény Pm-en: G(p) =∑mj=1 p2j − 1Ekkor a (1.10) el®állítás a következ® ún. kvadratikus szkórt adja:

    S(p, i) = 2pi −m∑

    j=1

    p2j − 1 = −m∑

    j=1

    (δij − pj)2 (1.16)

    ahol δij a Kronecker-delta:δij =

    {1 ha i = j0 ha i 6= j

    A megfelel® Bregman divergencia a négyzetes euklideszi távolság lesz:

    d(p, q) =m∑

    j=1

    (pj − qj)2 (1.17)

    10Ezt az igen elterjedt szkórt Brier (1950) vezette be, innen is a Brier szkór elnevezés.

    9

  • • (Pszeudo)szférikus szkórLegyen α > 1 és nézzük a következ® általánosított entrópiafüggvényt:G(p) = (∑mj=1 pαj )1/α.Az ehhez tartozó pszeudoszférikus szkór:

    S(p, i) =pα−1i

    (∑m

    j=1 pαj )(α−1)/α

    (1.18)

    A tradicionális szférikus szkórt az α = 2 esetben kapjuk:

    S(p, i) =pi‖p‖2

    (1.19)

    A megfelel® Bregman divergencia:

    d(p, q) =( m∑

    j=1

    pαj)1/α − ∑mj=1 pjqα−1j

    (∑m

    j=1 qαj )(α−1)/α

    (1.20)

    • Logaritmikus szkórA negatív Shannon entrópia, G(p) = ∑mj=1 pj log pj szintén meghatároz egy lényegesszkórt, melyet logaritmikus szkórnak nevezünk:

    S(p, i) = log pi (1.21)

    A hozzátartozó Bregman divergencia a Kullback-Leibler divergencia:

    d(p‖q) =m∑

    j=1

    pj log(pj/qj) (1.22)

    Ez a klasszikus szkór egészen Good ([13]) munkásságáig vezethet® vissza, a gyakorlat-ban az egyik legtöbbet alkalmazott szkórról van szó.

    • 0-1 szkórA következ® szkór abban az esetben jutalmaz egy valószín¶ségi el®rejelzést, ha annaka módusza realizálódik. Ha több módusz is van, akkor a jutalom arányosan oszlik elezek között:

    S(p, i) =

    {1

    |M(p)| ha i ∈M(p)0 különben (1.23)

    ahol M(p) = {i : pi = maxj=1...m pj}A szkórnak megfelel® általánosított entrópia G(p) = maxj=1...m pj , a divergencia függ-vény pedig:

    d(p, q) = maxj=1...m

    pj −∑

    j∈M(q) pj

    |M(q)|(1.24)

    Ez nem lesz Bregman divergencia, mivel az entrópia függvény se nem di�erenciálható,se nem szigorúan konvex.

    A megismert szkórok mindegyike szimmetrikus a következ® értelemben:

    S((p1, . . . , pm), i) = S((pπ1 , . . . , pπm), πi) ∀p ∈ Pm,∀π ∈ Sm,∀i

    Winkler ([14], 1994) szerint a szimmetrikus szkórok nem mindig díjazzák megfelel®en azel®rejelz®i képességeket, és aszimmetrikus szkórok használatára bíztat. Aszimmetrikus (szi-gorúan) lényeges szkórokat olyan G (szigorúan) konvex entrópia függvényekb®l kaphatunk,melyek nem invariánsak a koordinátapermutációra.

    10

  • 1.3. Lényeges szkórok s¶r¶ségfüggvény-el®rejelzések eseté-ben

    Legyen µ egy σ-véges mérték a (Ω,A) mérhet® téren. Jelölje Lα (α > 1) valószín¶ségimértékek azon osztályát, melyek abszolút folytonosak µ-re és a s¶r¶ségfüggvényeikre az

    ‖p‖α =(∫

    p(ω)αµ(dω))1/α

    (1.25)

    integrál véges. Egy P ∈ Lα valószín¶ségi el®rejelzést a p s¶r¶ségfüggvényével adunk megés p-t prediktív s¶r¶ségfüggvénynek (s¶r¶ségfüggvény-el®rejelzés) nevezzük.11 Ebben az eset-ben is érvényes a reguláris, lényeges szkórokra az (1.5) el®állítás, azaz az S reguláris szkórpontosan akkor (szigorúan) lényeges P-n, ha a G(P ) = S(P, P ) várható szkór függvény (szi-gorúan) konvex P-n és S(P, ω) G egy szubtangense P -ben minden P ∈ P-re.Most néhány a diszkrét esetben látott szkór abszolút folytonos megfelel®jét tekintem át.

    Példák• Az els® szkór a kvadratikus (Brier) szkór volt, melynek folytonos alakja:

    QS(p, ω) = 2p(ω)− ‖p‖22 (1.26)

    Állítás: Ez szigorúan lényeges az L2 osztályon.

    Bizonyítás: Ehhez a d(p, q) = QS(p, p)−QS(q, p) ≥ 0 feltételt kell leellen®rizni tet-sz®leges p és g L2-beli s¶r¶ségfüggvényekre, egyenl®tlenséget csak p = g µ-m.m. eset-ben megengedve. Kiszámolva a divergenciát egyszer¶en adódik: d(p, q) = ‖p− q‖22 ≥ 0és egyenl®ség is csak a megengedett esetben lehetséges.�

    Láthatjuk, hogy a divergencia most is a négyzetes euklideszi távolság, míg az entrópiaebben az esetben G(p) = ‖p‖22, a p prediktív s¶r¶ségfüggény L2-normanégyzete.

    • Good ([13]) javasolta a folytonos pszeudoszférikus szkór használatát:

    PseudoSα(p, ω) =p(ω)α−1

    ‖p‖α−1α(1.27)

    Szintén szigorúan lényeges az Lα osztályon, ugyanis a G(p) = ‖p‖α entrópia szigorúkonvexitása egyszer¶ következménye a Minkowski-egyenl®tlenségnek, míg a

    d(p, q) = ‖p‖α −∫qα−1(ω)p(ω)µ(dω)

    ‖q‖α−1α(1.28)

    divergencia nemnegativitása a Hölder-egyenl®tlenségb®l adódik.

    Az α = 2 esetben a klasszikus szférikus szkórt kapjuk:

    PseudoS2(p, ω) =p(ω)‖p‖2

    (1.29)11Ezek csak µ-mm. vannak meghatározva.

    11

  • • A következ® a logaritmikus szkór folytonos esete:

    LogS(p, ω) = log p(ω) (1.30)

    mely megkapható megfelel®en paraméterezett pszeudoszférikus szkór α → 1 határ-eseteként is. Bevezetését szintén Good ([13]) javasolta, és azóta nagyon széles körbenelterjedt.12

    A hozzá tartozó várható szkór függvény a negatív Shannon entrópia,

    G(p) =∫p(x) log p(x)µ(dx) (1.31)

    míg a divergencia függvény a klasszikus Kullback-Leibler divergencia:

    d(p‖q) =∫p(x) log

    p(x)q(x)

    µ(dx) (1.32)

    Állítás: A logaritmikus szkór szigorúan lényeges az L1 osztályon.

    Bizonyítás: Ehhez a következ®nek kell teljesülnie tetsz®leges p és q s¶r¶ségfügg-vényekre: ∫

    p(x) log p(x)µ(dx) ≥∫p(x) log q(x)µ(dx)

    és egyenl®ség csak p = q µ-m.m. esetben lehetséges.∫p(x) log

    q(x)p(x)

    µ(dx) = Ep

    (log

    q(X)p(X)

    )≤

    ≤ logEp(q(X)p(X)

    )= log

    ∫q(x)p(x)

    p(x)µ(dx) = 0

    A Jensen-egyenl®tlenség alapján, és egyenl®ség csak q(x)p(x) = konstans esetben lehetsé-ges, de ekkor p(x) = q(x) µ-m.m.�

    Láthatjuk, hogy a logaritmikus szkór csak a meg�gyelt ω-n keresztül függ a prediktív s¶r¶ség-függvényt®l, míg az el®z® kett® emellett a prediktív s¶r¶ségfüggvény valamilyen Lα-normájátis tartalmazta. Az el®bbi tulajdonsággal rendelkez® szkóroknak külön elnevezése is van:

    De�níció: Egy olyan S szkórt, mely csak magán a meg�gyelt ω-n keresztül függ a pprediktív s¶r¶ségfüggvényt®l lokális szkórnak nevezünk.

    Bizonyos regularitási feltételek mellett megmutatható, hogy minden lényeges lokális szkór akövetkez® alakú:

    S(p, ω) = a log p(ω) + f(ω) (1.33)ahol a ≥ 0 és f : Ω → R tetsz®leges függvény. Azaz a lényeges lokális szkórok osztá-lya a logaritmikus szkór e�éle transzformáltjaiból áll. Így a bevezet®ben már említett aLinS(p, ω) = p(ω) formulával de�niált lineáris szkór sem lesz lényeges, akármilyen intuitívis lenne a használata. Err®l a következ® egyszer¶ példán is megbizonyosodhatunk.

    12Más néven is használatos, mint például predictive deviance vagy ignorance score.

    12

  • Jelölje ϕ a standard normális s¶r¶ségfüggvényt, míg u a (−�, �)-on egyenletes eloszlásét.Ekkor � < √log 2 esetén

    LinS(u, ϕ) =1√2π

    12�

    ∫ �−�e−x

    2/2dx >1

    2π1/2= LinS(ϕ,ϕ) (1.34)

    ellentmondásban a lényegesség (1.2) de�niciójával. Valójában a lineáris szkór hajlamos túl-becslésre a valódi s¶r¶ségfüggvény csúcsainál.

    Wilson, Burrows and Lanzinger ([2], 1999) valószín¶ségi szkór ja kiintegrálja a s¶r¶ség-függvényt a meg�gyelt ω egy kis környezetében:

    VSε(P, ω) =∫ ω+ε

    ω−εp(x)dx (1.35)

    de ez sem lesz lényeges.

    A logaritmikus szkór talán egyetlen problémája, hogy nem elég robosztus, a kis való-szín¶ség¶ meg�gyeléseket igen er®sen bünteti, és így igen érzékeny az extrém értékekre.Weigend és Shi ([2], 2000) ezért a logaritmikus szkór használatakor trimmelt átlagszkórszámítását javasolja. A következ® szkór sokkal robosztusabb lesz és nem is annyira érzékenyaz extrém értékek esetén.

    1.4. CRPS (Continuous Ranked Probability Score)Ezidáig csak diszkrét vagy abszolút folytonos, s¶r¶ségfüggvénnyel rendelkez® el®rejelzé-

    sekkel foglalkoztam. Utóbbi esetben maga a s¶r¶ségfüggvény volt az el®rejelzés. Ez egynem praktikus megszorítás, mivel nem minden esetben létezik s¶r¶ségfüggvény. Például, hacsapadékmennyiséget akarunk el®rejelezni, akkor szükségszer¶en pozitív súly kerül a 0-ba is.Persze le lehetne cserélni a Lebesgue-mértéket egy keverék domináló mértékre, de praktiku-sabb, ha eloszlásfüggvényeken értelmezett szkórokkal is dolgozunk. Továbbá az eddig tárgyaltszkórok nem nagyon érzékenyek a távolságra, abban az értelemben, hogy semmi se bizto-sítja, hogy a meg�gyelt érték környezetére (a meg�gyelt érték nélkül) is nagy súlyt helyez®el®rejelzéseknek kedveznek. Pedig ez igen kívánatos tulajdonság, ha a prediktív eloszlásainktöbbcsúcsúak. Ezért lépjünk egy lépcs®fokkal feljebb, hogy egy kalap alatt kezelhessük a kétesetet, és vizsgáljuk az eloszlásfüggvények el®rejelzésének esetét is. Ehhez jelölje P Borel-mértékek egy családját R-n. Egy valószín¶ségi el®rejelzést, azaz P egy elemét identi�káljukF eloszlásfüggvényével.Egy ilyen el®rejelzés kiértékelésére de�niálható a következ® szkór:

    CRPS(F, x) = −∫ ∞−∞

    (F (y)− 1{y ≥ x})2dy (1.36)

    Ez a prediktív eloszlásfüggvénynek és az x meg�gyelés empirikus eloszlásfüggvényének integ-rált négyzetes különbsége. Vegyük észre, hogy az integrál mögötti kifejezéshez hasonlóvalmár találkoztunk a Brier szkór de�niciójánál. Vegyünk egy F eloszlásfüggvény¶ X-t, ekkorvalójában az {X < y} eseményre felírt bináris Brier szkór van az integrál mögött. Tehát aCRPS felfogható úgy is, mint az y küszöbértékekhez tartozó Brier szkórok egy integrálja.

    13

  • A CRPS egy gra�kus illusztrációja látható a következ® ábrán normális prediktív eloszlásesetén. A bal oldalon látható a 0 várható érték¶ normális s¶r¶ségfüggvény 1 ill. 4 szórás-négyzettel, mellette pedig a megfelel® eloszlásfüggvény és az empirikus eloszlásfüggvénykülönbsége az y = 0 és az y = 2 meg�gyelések esetén. Ezek az ábrák mutatják, hogy aCRPS jutalmazza az éles el®rejelzéseket, de �gyelembe veszi azt is, hogy a meg�gyelés men-nyire esik az eloszlás farokrészébe.

    1.1. ábra. Normális és a tapasztalati eloszlásfüggvény különbsége [6]

    Eleinte elég nehézkesnek t¶nt ennek a szkórnak az alkalmazása analitikus kifejezés hiányá-ban, ám a következ® el®állítás sokat segített ezen (Székely, [12]):

    CRPS(F, x) =12EF |X −X ′| − EF |X − x| (1.37)

    ahol X és X ′ független változók F eloszlásfüggvénnyel és véges els® momentummal. Példáulha a prediktív eloszlásunk normális, akkor ez a következ® alakot ölti:

    CRPS(N(µ, σ2), x) = σ(

    1√π− 2ϕ

    (x− µσ

    )− x− µ

    σ

    (2Φ(x− µσ

    )− 1))

    (1.38)

    ahol ϕ és Φ a standard normális s¶r¶ség- ill. eloszlásfüggvényt jelöli. Hasonló analitikus ki-fejezéseket kaphatunk más eloszlások esetén is. Ha ilyen zárt alak nem áll rendelkezésünkre,de tudunk F eloszlású véletlen számokat generálni, akkor Monte Carlo módszerek alkalmaz-hatók a jobb oldal kiszámítására.

    A hozzátartozó várható szkór függvény (entrópia):

    G(F ) = −∫ ∞−∞

    F (y)(1− F (y))dy = −12EF |X −X ′| (1.39)

    míg a megfelel® divergencia Cramér-von Mises típusú:

    d(F,G) =∫ ∞−∞

    (F (y)−G(y))2dy (1.40)

    14

  • Állítás ([2]): A CRPS lényeges a P osztályon és szigorúan lényeges P véges els® mo-mentummal rendelkez® Borel-mértékekb®l álló P1 részosztályán.

    Gyakran negatív orientációval használják, azaz CRPS∗(F, x) = −CRPS(F, x)-vel szá-molnak és a kapott értékeket veszteségekként kezelik és minimalizálni szeretnék. Ekkor aCRPS∗ = EF |X−x|− 12EF |X−X

    ′| felírásból látszik, hogy az abszolút hiba általánosításávalvan dolgunk. Mikor F egy determinisztikus el®rejelzés (x∗), azaz a megfelel® P egy pont-mérték, akkor tényleg az abszolút hibát kapjuk vissza: |x∗ − x|. Így e szkór használatávalegy természetes módszer adódik determinisztikus és valószín¶ségi el®rejelzések összehason-lítására. Azért hasznos ez az általánosítás, mert lényeges szkórt kaptunk, az abszolút hibátátemelhetnénk máshogy is szkóros környezetbe, mint ahogy azt a következ® részben bemu-tatom, de egyáltalán nem biztos, hogy lényeges szkórt fogunk kapni.

    1.5. Az el®rejelz®i teljesítmény klasszikus mér®számaiA következ®kben az egyszer¶ség kedvéért tegyük fel, hogy az összes szóba kerül® momen-

    tum véges minden mérték esetében. El®ször legyen µ egy pontbecslés és legyen x a meg�gyeltérték. Ekkor a két legegyszer¶bb módszer a becslés hatékonyságának mérésére az abszolúthiba: AE(µ, x) = |µ− x| és a négyzetes hiba: SE(µ, x) = (µ− x)2. Ezek természetes módonáltalánosíthatók való-szín¶ségi el®rejelzések esetére is. De�niálhatjuk az abszolút hiba szkórtés a négyzetes hiba szkórt a következ®képpen:

    AES(P, x) = −|x− µP |, SES(P, x) = −(x− µP )2 (1.41)

    ahol µP a P prediktív eloszlás várható értéke.13 Az els® nem lesz lényeges míg a másodiklényeges, de nem szigorúan lényeges, ugyanis a EP |X − x| kifejezést a P prediktív eloszlásmediánja minimalizálja, ezért például µQ = medP esetben nem teljesül a lényegességet de-�níáló egyenl®tlenség:

    AES(P, P ) = −EP |X − µP | ≤ −EP |X − µQ| = AES(Q,P ) (1.42)

    Míg a EP (X − x)2 kifejezést µP minimalizálja, s így tetsz®lges µQ mellett

    SES(P, P ) = −EP (X − µP )2 ≥ −EP (X − µQ)2 = SES(Q,P ) (1.43)

    Itt egyenl®ség a µP = µQ esetben áll, ezért csak lényeges és nem szigorúan lényeges szkórtkapunk.14A SES azonos várható érték¶ prediktív eloszlásokat nem tud megkülönböztetni, így eléggéáltalános, az eloszlás laposságát, élességét, szórásnégyzetét ekkor még szabadon változtat-hatjuk. A következ® normalizált négyzetes hiba szkór ezt hívatott orvosolni:

    NSES(P, x) =(x− µPσP

    )2(1.44)

    ahol µP és σP a P prediktív eloszlás várható értéke és szórása.13Mivel ezek negatívan orientáltak, egy negatív el®jellel csinálunk bel®lük pozitívan orientált szkórokat.14Ennek alapján a S(P, x) = |x−medP | képlettel de�niált szkór lesz lényeges, de nem szigorúan lényeges.

    15

  • 1.5.1. PMCC (Predictive Model Choice Criteria)

    Képzeljük el, hogy a rendelkezésünkre álló x1, . . . , xn meg�gyelések alapján valamilyenmodellt illesztünk az adatokra és ennek a "min®ségére" vagyunk kiváncsiak. A PMCC azillesztés hibáját a következ®képp értelmezi:

    PMCC =n∑

    i=0

    (µi − xi)2 +n∑

    i=1

    σ2i (1.45)

    ahol µ és σ2 jelöli az illesztett modell várható értékét és szórásnégyzetét. Ezek általábannem függnek i-t®l, de el®fordulhat, hogy minden xi-hez tartozik egy meg�gyelési súly, ekkorpersze minden egyes mintaelemhez egy ezzel súlyozott prediktív eloszlás tartozik.Ez az eddigi környezetben az

    S(F, x) = −(EFX − x)2 −D2F (X) (1.46)

    szkórnak felel meg, és a véges második momentummal rendelkez® F eloszlásfüggvény¶ elosz-lásokon van értelmezve.Könnyen látható, hogy ez nem lesz lényeges, mivel a várható szkór nem akkor lesz maximális,ha a valódi F eloszlást adjuk el®rejelzésnek, hanem az EFX pontbecslés esetében, ugyanisS(EFX,x) = −(EFX − x)2 és így

    S(EFX,F ) = −EF (EFX −X)2 = −D2F (X) ≥ −2D2F (X) = S(F, F )) (1.47)

    Egyenl®ség pedig csak D2F (X) = 0, azaz az F = EFX esetben lehetséges. Tehát nem avalódi háttéreloszlás esetén lesz minimális a várható szkór, hanem a háttéreloszlás várhatóértékének megfelel® pontbecslés esetén.

    Az ebben a részben bemutatott szkórok a prediktív eloszlástól csak az els® két mo-mentumon keresztül függenek. Dawid és Sebastiani ([5], 1999) adott összefoglalást ezzel atulajdonsággal rendelkez® szkórokról. A következ® Dawid-Sebastiani szkór például a PMCCegy lényeges alternatívájának tekinthet®

    DSS(P, x) =(x− µPσP

    )2+ 2 logσP (1.48)

    Normális prediktív eloszlás esetében ez ekvivalens a logaritmikus szkórral, ugyanis csak egymultiplikatív konstanstól eltekintve különböznek.

    A CRPS alapján vizsgálhatjuk a

    S(F, x) = −∫ 1

    0

    (F−1(u)− x)2du = −EF (X − x)2 (1.49)

    képlettel de�niált szkórt is, viszont ez sem lesz lényeges.15Els® ránézésre úgy t¶nhet, hogy csak egy D2F (X)-es tagban különbözik a PMCC-t®l, ám itta várható értéket a zárójelen kívül kell képezni, míg ott belül, így nem ekvivalensek. Az ilyenintegrálalakban el®állítható szkórokról b®vebben majd a kvantilisel®rejelzésekkel foglalkozórészben teszek említést.

    15A neki megfelel® fogalmak a Mallows-távolság és a Wasserstein-metrika.

    16

  • 1.6. Energia szkórA következ®ben a CRPS egy igen széleskör¶ általánosítását fogom bemutatni, melyet az

    (1.38) analitikus el®állítás tesz lehet®vé. Jelölje Pβ , β ∈ (0, 2) azon P valószín¶ségi Borel-mértékek családját Rm-en, melyekre a EP ‖X‖β várható érték véges, ahol ‖ · ‖ jelöli azeuklideszi normát. Ekkor az energia szkórt a következ®képpen de�niáljuk:

    ES(P, x) =12EP ‖X −X ′‖β − EP ‖X − x‖β (1.50)

    aholX ésX ′ független vektorváltozók a P ∈ Pβ eloszlásból. Láthatóan a CRPS általánosítása,mely a β = 1 és m = 1 esetnek felel meg. Most megengedjük, hogy a változóink vektorér-ték¶ek legyenek és a β index is nagyobb tartományban mozoghat. A (1.51) kiszámításadiszkrét esetben egyszer¶, különben meg Monte Carlo módszerekkel történhet. Negatív ori-entációval a β-rend¶ abszolút hiba (|x∗ − x|β) általánosításának is tekinthet®.

    Állítás (Székely, [12], 2003): Az energia szkór szigorúan lényeges Pβ-n.

    Az energia szkór az β ∈ (0, 2) esetben az összes valószín¶ségi Borel-mértékre értelmezhet®Rm-en a következ®képpen:

    ES(P, x) = −β2β−2Γ(m+β2 )

    πm/2Γ(1− β2 )

    ∫Rm

    |ϕ(y)− ei〈x,y〉|2

    ‖y‖m+βdy (1.51)

    ahol ϕ jelöli a P mérték karakterisztikus függvényét. Így tehát a szkór a prediktív eloszlás és ameg�gyelés karakterisztikus függvényenek egy súlyozott távolságát számolja ki. Ha P ∈ Pβ ,akkor (1.51) és (1.51) megegyezik (Székely, [12]). A β = 2 határesetben (1.51) jobboldalaEPX és x négyzetes euklideszi távolságává redukálódik. Ekkor lényeges, de nem szigorúanlényeges szkórt kapunk a P2 eloszláscsaládon, melyekre EP ‖X‖2 véges.

    1.7. Lényeges szkórok és negatív de�nit függvények kap-csolata

    Ebben a fejezetben negatív de�nit függvények segítségével de�niálok lényeges szkórokat,megvizsgálom, hogy néhány eddig tárgyalt szkór, mely speciális esetnek felel meg, majd aCRPS egy igen messzemutató általánosítását mutatom be. Legyen Ω egy nemüres halmaz.Egy Ω×Ω-n értelmezett valós érték¶ g függvényt negatív de�nit magnak nevezünk, ha szim-metrikus és ∑ni=1∑nj=1 aiajg(xi, xj) ≤ 0 minden n pozitív egész, x1, . . . , xn ∈ Ω, és olyana1, . . . , an ∈ R esetén, melyre ∑ni=1 ai = 0.

    Tétel ([2]): Legyen Ω egy Hausdor� tér és g egy nemnegatív, folytonos negatív de�nitmag Ω×Ω-n. Legyen P egy valószín¶ségi Borel-mérték Ω-n és legyen X és X ′ két függetlenP eloszlású valószín¶ségi változó. Ekkor a

    S(P, x) =12EP g(X,X ′)− EP g(X,x) (1.52)

    képlettel de�niált szkór lényeges a valószín¶ségi Borel-mértékek azon osztályán, melyekre az

    EP g(X,X ′) várható érték véges.

    17

  • A jobb oldal kiszámítása ismét MCMC módszerrel történhet. Lássunk néhány példát, mind-egyikben a mintateret a standard topológiával látjuk el. Nézzük meg, hogy pár eddig látottszkór melyik speciális esetnek felel meg:

    • Legyen Ω = {0, 1} és g(0, 0) = g(1, 1) = 0, g(0, 1) = g(1, 0) = 2. Ekkor visszakapjuk aBrier szkórt.

    • Ha Ω = R és g(x, x′) = |x− x′|, akkor a CRPS-t kapjuk meg.

    • Hasonlóan az Ω = Rm, β ∈ (0, 2), g(x, x′) = ‖x− x′‖β esetben újra az energia szkórtkapjuk.

    • Lássunk a CRPS egy eddig nem látott megfelel®jét (cirkuláris változókra):Legyen Ω = S1 a körvonal és jelölje α(θ, θ′) két elem szögtávolságát. Legyen P egyvalószín¶ségi Borel-mérték S1-en és legyenek Θ és Θ′ független P eloszlású változók.Mivel Gneiting ([2], 1998) egy tétele szerint a szögtávolság egy negatív de�nit magS1×S1-en, ezért a

    S(P, θ) =12EP α(Θ,Θ′)− EP α(Θ, θ) (1.53)

    képlettel de�niált szkór lényeges lesz a körvonal valószín¶ségi Borel-mértékeinek hal-mazán.

    Most az energia szkór egy messzemutató általánosítását mutatom be, x = (x1, . . . , xn) ∈ Rmés α ∈ (0,∞] esetén de�niáljuk ‖x‖α-t a következ®képpen:

    ‖x‖α =

    (∑m

    i=1 |xi|α)1/α

    α ∈ (0,∞)

    max1≤i≤m |xi| α = ∞

    Schoenberg tétele ([2]) szerint ekkor α ∈ (0,∞] és β > 0 esetén a következ®g(x, x′) = ‖x− x′‖βα magfüggvény akkor és csak akkor negatív de�nit, ha

    (i)m = 1, α ∈ (0,∞] és β ∈ (0, 2] vagy

    (ii)m ≥ 2, α ∈ (0, 2], és β ∈ (0, α] vagy(iii)m = 2, α ∈ (2,∞], és β ∈ (0, 1]

    feltételek egyike teljesül.

    Ekkor tehát az el®z® tétel szerint a következ®

    S(P, x) =12EP ‖X −X ′‖βα − EP ‖X − x‖βα (1.54)

    képlettel de�niált szkór lényeges lesz Rm valószín¶ségi Borel-mértékeinek véges EP ‖X−X ′‖βαvárható értékkel rendelkez® részosztályán. Láthatóan az α = 2 esetben visszakapjuk az ener-gia szkórt, míg az m ≥ 2, α 6= 2 esetben nem-euklideszi analógokat kapunk.Mattner ([2], 1997) megmutatta, hogy α ≥ 1 esetén EP,Q‖X − Y ‖βα akkor és csak akkorvéges, ha EP ‖X‖βα és EQ‖Y ‖βα azok. Speciálisan α ≥ 1 esetén EP ‖X −X ′‖βα akkor és csakakkor véges, ha EP ‖X‖βα az.

    18

  • A következ® tétel euklideszi mintatér esetén szigorú lényegességet biztosít bizonyosszkórokra, ehhez azonban el®bb szükség van a teljesen monoton függvény fogalmára:

    De�níció: Egy η (0,∞)-n értelmezett függvény teljesen monoton, ha mindegyik deri-váltja létezik és ezekre (−1)kη(k)(t) ≥ 0 teljesül minden k nemnegatív egészre és t > 0-ra.

    Tétel ([2]): Legyen Ψ folytonos függvény [0,∞)-n, melyre −Ψ′ teljesen monoton és nemkonstans. Legyen P egy valószín¶ségi Borel-mérték Rm-en és legyen X és X ′ két függetlenP eloszlású vektorváltozó. Ekkor a

    S(P, x) =12EP Ψ(‖X −X ′‖22)− EP Ψ(‖X − x‖22) (1.55)

    képlettel de�niált szkór szigorúan lényeges lesz a valószín¶ségi Borel-mértékek azon rész-

    osztályán, melyre a EP Ψ(‖X −X ′‖22) várható érték véges.

    Speciálisan a Ψ(t) = tβ/2 (β ∈ (0, 2)) választással az energia szkór szigorú lényegességétkaphatjuk meg a véges EP ‖X‖β2 várható értékkel rendelkez® valószín¶ségi Borel-mértékekosztályán.

    1.8. Szkórok intervallum- és kvantilisel®rejelzések eseté-ben

    Nem minden esetben van szükségünk egy egész eloszlásra, lehet hogy elég elég lennenekünk csak egy 95 százalékos kvantilis, például hipotézisvizsgálathoz. S mivel néha igennehéz egy egész eloszlást meghatározni, egy el®rejelzés történhet prediktív intervallumokonilletve prediktív kvanitiliseken keresztül is.16 Most ezt a két esetet részletezem:

    1.8.1. Lényeges szkórok kvantilis el®rejelzésekhez

    Most egy egész eloszlás helyett csak néhány kvantilist adunk meg el®rejelzésként. Eze-ket prediktív kvantiliseknek nevezzük. Vegyünk α1, . . . , αk ∈ (0, 1) elemeket, az ilyen szint¶kvantilisek el®rejelzésére törekszünk. Most egy szkór a prediktív kvanitiliseken és a meg-�gyelésen van értelmezve, azaz ha egy el®rejelz® az r1, . . . , rk el®rejelzést bocsátja ki ésx a meg�gyelés, akkor az ® jutalma S(r1, . . . , rk;x) lesz. A várható szkórt a P valószín¶ségimérték és az r1 . . . , rk el®rejelzések mellett a

    S(r1, . . . , rk;P ) =∫S(r1, . . . , rk;x)dP (x) (1.56)

    képlettel de�niáljuk. A technikai nehézségek elkerülése végett tegyük fel, hogy P ∈ P, aholP olyan Borel-mértékek konvex osztálya R-en, melyeknek minden momentuma véges éseloszlásfüggvényük szigorúan monoton.Egy P ∈ P esetén jelölje q1, . . . , qk az α1, . . . , αk ∈ (0, 1) szinteknek megfelel® valódi P -kvantiliseket. Ekkor az S szkórt lényegesnek nevezzük, ha ∀ r1, . . . , rk ∈ R és ∀P ∈ P esetén

    S(q1, . . . , qk;P ) ≥ S(r1, . . . , rk;P ) (1.57)16Például Krzysztofowicz és Sigrest ([11], 1999) csapadékmennyiség kvantilisel®rejelzéseinek foglalkozott.

    19

  • A következ®kben megadom a lényeges szkórok egy igen széles osztályát, melyek kvanti-lisel®rejelzések kiértékelésére alkalmasak. El®ször egyetlen kvantilis el®rejelzése esetén majdtetsz®leges számúra általánosan. Tegyük fel, hogy fellép® s(x) és h(x) függvények P-mérhet®ekés legfeljebb polinomiálisan n®nek x-ben. Ekkor érvényes a következ®:

    Tétel ([2]): Ha s(x) monoton növekszik és h(x) tetsz®leges, akkor az

    S(r;x) = αs(r) + (s(x)− s(r))1{x ≤ r}+ h(x) (1.58)

    képlettel de�niált szkór lényeges az α-szint¶ kvantilis el®rejelzése esetében.

    Bizonyítás: Legyen q az (egyetlen) α-kvantilise a P ∈ P valószín¶ségi mértéknek, ekkora következ® jelölést használjuk: P (q) = α. Ha r < q, akkor

    S(q;P )− S(r;P ) =∫

    (r,q)

    s(x)dP (x) + s(r)P (r)− αs(r)

    ≥ s(r)(P (q)− P (r)) + s(r)P (r)− αs(r) = 0

    ahogy állítottuk. Az r > q eset hasonlóan intézhet® el. �

    A leggyakoribb eset, mikor s(x) = x-t és h(x) = −αx-t helyettesítenek a képletbe. Ekkora következ® lényeges szkórt kapjuk17:

    S(r;x) = (x− r)(1{x ≥ r} − α) ={

    (1− α)(x− r) ha x ≥ rα (r − x) ha x < r (1.59)

    Következmény Ha si (i = 1, . . . , k) monoton növekv® függvények, és h tetsz®leges,ekkor az

    S(r1, . . . , rk;x) =k∑

    i=1

    (αisi(ri) + (si(x)− si(ri))1{x ≤ ri}

    )+ h(x) (1.60)

    szkór lényeges az αi-szint¶ kvantilisek el®rejelzése esetén. (i = 1, . . . , k)

    Cervera és Muñoz ([8], 1996) még csak lineáris si-k esetében bizonyították ezt, és fel-vetették a kérdést, hogy vajon csak ezek-e lényegesek kvantilisel®rejelzések esetén. Gneitingés Raftery fenti következménye adta meg a negatív választ erre, de ®k sem adtak véglegesválaszt arra, hogy vajon a fenti képletek szolgáltatják-e a lényeges szkórok általános alakját.

    Mivel egy eloszlásfüggvény megadása ekvivalens az összes kvantilis megadásával, ígykönnyen kaphatunk különböz® szkórokat eloszlásfüggvény-el®rejelzések esetére a megfelel®kvantilis-szkórokból. Ehhez legyen ν tetsz®leges Borel-mérték a (0, 1) intervallumon, és Sαjelöljön egy az α szinthez tartozó lényeges kvantilis-szkórt, ekkor a következ®

    S(F, x) =∫ 1

    0

    Sα(F−1(α);x)ν(dα) (1.61)

    eloszlásfüggvények el®rejelzésének kiértékelésére használt szkór szintén lényeges megfelel®integrálhatósági feltételek mellett.

    17Ekkor tehát épp az α szintnek megfelel® felosztásnak megfelel®en büntetjük, hogyha alul- vagy felül-becsüljük a kvantilist.

    20

  • Hasonlóan építhetünk fel szkórokat prediktív eloszlásfüggvényekhez bináris el®rejelzésekheztartozó szkórokból. Legyen S egy bináris el®rejelzésekhez tartozó lényeges szkór, és ν tet-sz®leges Borel-mérték a számegyenesen. Ekkor az

    S?(F, x) =∫ ∞−∞

    S(F (y),1{y ≥ x})ν(dy) (1.62)

    formulával de�niált szkór is lényeges, ha az integrál létezik és véges. Emlékezzünk vissza,hogy a CRPS-t is így kaptuk a megfelel® bináris Brier szkórból, a megfelel® ν a Lebesgue-mérték volt. Ez a konstrukció m¶ködik a többdimenziós esetben is: legyen P Borel-mértékekegy osztálya Rm-en, és egy el®rejelzést adjunk meg az ® m-dimenziós eloszlásfüggvényével.Ekkor a CRPS többváltozós analógja a következ®képpen értelmezhet®:

    CRPS(F, x) = −∫

    Rm(F (y)− 1{y ≥ x})2ν(dy) (1.63)

    Ez a kvadratikus szkór egy súlyozott integrálja mind az m változóban, így a ν Borel-mértékválasztható olyan szorzatmértéknek, hogy az el®rejelz® a fontosabbakra koncentrálja a �gyel-mét. Ha ν véges, és a Lebesgue-mérték dominálja, akkor ez szigorúan lényeges a P osztályon.

    1.8.2. Intervallumszkór

    Az intervallumel®rejelzések egy igen fontos speciális esetét képezik a kvantilisel®rejelzé-seknek. A klasszikus centrális (1−α)× 100 % prediktív intervallumok esetével foglalkozom,melyek alsó határpontja az α2 szint¶ kvantilis egy el®rejelzése, míg a fels® az (1− α2 ) szint¶prediktív kvantilis. Ekkor jelöljünk egy S szkórt a következ®képpen: Sα(l, u;x), ahol l és ujelöli a megfelel® kvantilisel®rejelzéseket, x pedig a meg�gyelést. Vagyis ha egy el®rejelz®az [l, u] intervallumel®rejelzést adja, és x-et �gyeljük meg, akkor az ® jutalma Sα(l, u;x).Ekkor az el®z® tétel jelöléseit használva, az α1 = α2 , α2 = 1 − α2 és az s1(x) = s2(x) = 2 xαés a h(x) = − xα választás következ® intervallumszkórt eredményezi:

    Sintα (l, u;x) = −(

    (u− l) + 2α

    (l − x)1{x < l}+ 2α

    (x− u)1{x > u})

    (1.64)

    Ez az intervallumszkór sz¶k prediktív intervallumok el®rejelzésére bíztat, és elkerülünkegy az α-tól függ® büntetést, ha az intervallum lefedi a meg�gyelést. Hasonlóan kaphatunkmás lényeges szkórokat is az s1(x), s2(x) és h(x) különböz® megválasztásával.

    Az intervallumszkór a gyakorlatban [7]Vegyük a következ® Xt stacionárius bilineáris folyamatot, ahol �t független N (0, 1) zaj

    Xt+1 =12Xt +

    12Xt�t + �t (1.65)

    Kabaila és He [7] egylépéses centrális intervallumel®rejelzéseket vizsgált 95%-os szinten. Afolyamat Markov jelleg¶, így Xt+1 eloszlása adott Xt, Xt−1,. . . mellett normális 12Xt vár-ható értékkel és (1+ 12Xt)2 szórásnégyzettel, melyb®l a következ® intervallumbecslés kapható:

    I =[12Xt − c

    ∣∣∣∣1 + 12Xt∣∣∣∣ , 12Xt + c

    ∣∣∣∣1 + 12Xt∣∣∣∣] (1.66)

    ahol c = Φ−1(0.975). Ezt az I-t elnevezték standard prediktív intervallumnak, mert az alsóés fels® határpontja a feltételes eloszlás 2.5%-os ill. 97.5%-os kvantilise.

    21

  • Emellett még a következ® két másik alternativát vizsgálták:

    J = [F−1(0.025), F−1(0.975)] (1.67)

    ahol F jelöli a folyamat feltétel nélküli (stacionárius) eloszlásának eloszlásfüggvényét, és

    K =[12Xt − γ

    (∣∣∣∣1 + 12Xt∣∣∣∣) , 12Xt + γ

    (∣∣∣∣1 + 12Xt∣∣∣∣)] (1.68)

    aholγ(y) =

    (2 log

    (7.36

    y

    ))1/2y ha 0 < y ≤ 7.36

    0 ha y > 7.36Ez kicsit félrevezet®nek t¶nhet, mert a feltételes prediktív szórásnégyzet nagy értéke mel-lett egy pontbecsléssé redukálódik, ám γ ezen választása adott nominális fedettség mellettminimalizálja a prediktív intervallum várható szélességét. Egy 100.000 elemszámú mintátgenerálva a bilineáris folyamatból az intervallumel®rejelzésekre a következ® eredményt kap-ták:

    Intervallum- Tapasztalati Átlagos Intervallum-el®rejelzés lefedettség szélesség átlagszkór

    I 95.01% 4.00 -9.55J 95.08% 5.45 -16.09K 94.98% 3.79 -10.64

    Mindhárom esetben a tapasztalati lefedettség igen közel mutatkozik a nominálishoz, a má-sodik K intervallumbecslésnek legkisebb az átlagos szélessége, de végülis az I standard pre-diktív intervallum adja a legjobb eredményt az intervallumszkór használatakor.

    1.9. Optimális szkór becslésMint már említettem, a lényeges szkórok fontos szerephez jutnak a becsléselméletben is.

    Képzeljük el, hogy az X1, . . . , Xn független, azonos eloszlású meg�gyelések alapján akarunkegy Pϑ paraméteres modellt illeszteni az adatokra valamilyen {Pϑ : ϑ ∈ Θ} családból. Mikorϑ-t becsüljük, mérhetjük a becslés jóságát az átlagos szkórral:

    Sn(ϑ) =1n

    n∑i=1

    S(Pϑ, Xi) (1.69)

    ahol S egy (szigorúan) lényeges szkór valószín¶ségi mértékek egy konvex osztályán, melytartalmazza a paraméteres modellt. Ha ϑ0 jelöli a valódi paraméterértéket, akkor enyhefeltételek mellett bebizonyítható, hogy arg maxϑSn(ϑ) → ϑ0. Így egy természetes becslésieljárást kapunk: válasszunk ki egy a problémához ill® S szigorúan lényeges szkórt, majdmaximalizáljuk Sn(ϑ)-t a Θ paramétertéren. Az így kapott ϑ̂n =argmaxϑSn(ϑ) konzisztensbecslést az S-hez tartozó optimális szkór becslésnek nevezzük. Ez a becslésosztály nagyon sokidáig is ismert becsléseket foglal magába, mint például a maximum likelihood-becslés, legki-sebb négyzetes becslés vagy más regressziós becslések. Valahol a maximum likelihood-becslésés az M -becslések között helyezkednek el félúton: a ML-becslés a logaritmikus szkórnakfelel meg, míg az M -becslésnél optimalizálandó függvény esetünkben egy szigorúan lényegesszkórból ered. Így az M -becslésekre bizonyított tulajdonságok itt is érvényesek, például az

    22

  • aszimptotikus viselkedés is öröklödik. Például vegyük a normális eloszlás eltolásparaméteré-nek a CRPS-b®l ered® optimális szkór becslését ismert szórás esetén. Ekkor azM -becslésheztartozó ψ függvény a következ® alakú ψ(x) = 2Φ(xc )− 1 ahol c pozitív konstans.Nagy el®nyük, hogy a feladat természetét®l függ®en mi választhatjuk meg melyik szkórhoztartozó hasznossági függvénnyel dolgozunk. Pfanzagl, Birgé és Massart [2] optimális kontrasztbecslés néven foglalkozott velük. Bebizonyították a konzisztencia egy szigorúbb verzióját, ésmegmutatták, hogy a konvergencia sebessége a paramétertér entrópikus struktúrájával vankapcsolatban. Számos probléma esetében kiderült, hogy a ML-becslés nem elég jó, ezért ér-demes a logaritmikus szkór helyett valamilyen a problémához jobban ill® S szkórból ered®optimális szkór becsléssel próbálkozni.A pontbecslések mellett persze vizsgálhatunk intervallumbecsléseket is az intervallumszkór-ból kiindulva. A következ® paradoxonra J. O. Berger [2] hívta fel a �gyelmet. Egy normálispopuláció eltolásparaméterére keresünk intervallumbecsléseket, ismeretlen skálaparamétermellett. Legyen

    L(I, θ) = cλ(I)− 1{θ ∈ I} (1.70)a veszteségfüggvényünk, ahol c pozitív konstans és λ(I) jelöli az I intervallumbecslés Lebesgue-mértékét. Els® ránézésre nagyon intuitívnak t¶nhet L használata, hiszen minél keskenyebbintervallumbecslésekre biztat, de bünteti, hogyha az intervallum nem tartalmazza a pa-ramétert. A baj, hogy ezzel a klasszikus t-próbának megfelel® kon�denciaintervallumot do-minálja egy félrevezet® intervallumbecslés, mely nagyon rossz tulajdonságokkal rendelkezik,például nagyon gyorsan ráhúzodik a mintaátlagra a legbizonytalanabb helyzetekben is. Pedigaz L �gyelembe veszi az intervallumunk szélességét és lefedettséget is. Mégis azt a következ-tetést vonhatjuk le, hogy az egyetlen kiváltó oka ennek a nemkívánatos viselkedésnek csakaz lehet, hogy valami baj van a veszteségfüggvénnyel. Ezért nagyon ajánlott itt is a lényegesszkórokat el®venni és bel®lük származó veszteségfüggvényekkel dolgozni. El®ször is két inter-vallumbecslés összehasonlítása igazán akkor bír értékkel, ha legalább az egyik a szélesség ésa lefedettség közül le van rögzítve. Az L veszteségfüggvény minden halmazérték¶ becslésrealkalmazható függetlenül azok lefedettségét®l, ill. mértékükt®l, ami elég szükségtelennek, túláltalánosnak t¶nik. Ezért nézzünk olyan intervallumbecsléseket melyeknek a nominális le-fedettsége megegyezik, azaz nézzük a legalább (1 − α)-megbizhatósági szint¶ szimmetrikuskon�denciaintervallumokat és használjuk az intervallumszkórnak megfelel® veszteségfügg-vényt:

    Lα(I, θ) = λ(I) +2α

    infη∈I

    |θ − η| (1.71)

    Észrevehetjük hogy az Lα veszteségfüggvény mellett sokkal rugalmassabban büntetünk,ugyanis �gyelembe vesszük az intervallumbecslésünk és a becsülni kívánt paraméter távol-ságát.

    23

  • 2. fejezet

    Kalibráció és élesség

    2.1. KalibrációGneiting, Raftery és mások a valószín¶ségi el®rejelzések célját a következ®képpen fogal-

    mazzák meg: maximalizálni az eloszlás élességét rögzített kalibráció mellett. A kalibráció azadatok konzisztenciáját jelenti, mennyire egyeztethet® össze statisztikailag a prediktív elosz-lásunk a meg�gyelésekkel, így közös tulajdonsága az el®rejelzésnek és a meg�gyeléseknek.Míg az élesség a prediktív eloszlás koncentráltságát fejezi ki, így csak magának az eloszlás-nak a tulajdonsága. Minél koncentráltabb a prediktív eloszlás, annál élessebb az el®rejelzés;és minél élesebb egy el®rejelzés, annál jobb, adott kalibráció mellett. El®ször a valószín¶ségiel®rejelzések kalibrációjával foglalkozom. A kalibráció különféle változatait de�niálom, me-lyekr®l megmutatom, hogy logikailag függetlenek; majd különböz® eszközöket mutatok beezek meglétének ellen®rzésére illetve becslésére, mint például a marginális kalibráció dia-gramm, boxplot vagy a PIT (Probability Integral Transform), utóbbinak de�niálom két,diszkrét el®rejelzések esetére való általánosítását is (randomizált és nemrandomizált PIT).Végül szükséges és elégséges feltételt adok két megismert kalibráció meglétére egy Ft pre-diktív eloszlásfüggvény-sorozat esetén.Ezután rátérek a prediktív eloszlások koncentráltságának a vizsgálatára, két példát mutatokarra, hogy a gyenge kalibráció mellett egy el®rejelz® lehet élessebb, mint az ideális el®rejelz®.Klimatológiai el®rejelzés esetében azonban alsó korlátot biztosítható a prediktív eloszlás va-rianciájára.Mindezeket példákon keresztül mutatom be, különböz® ábrákkal illusztrálom a megismertfogalmakat, és a megismert lényeges szkórokat is felhasználom különböz® el®rejelz®k rang-sorolására.

    Legyenek (Ft)t=1,2,... és (Gt)t=1,2,... folytonos és szigorúan monoton eloszlásfüggvények so-rozatai, melyek függhetnek véletlen paraméterekt®l is. (Gt)t=1,2,...-re úgy gondolunk, minta valódi, természet által generált háttérfolyamatra, míg (Ft)t=1,2,...-re mint valószín¶ségiel®rejelzések sorozatára.A következ® de�níció a két sorozat közt esetlegesen meglév® aszimptotikus kompatibilitásrautal:1

    1Ha véletlen paramétereink is vannak, akkor mindenhol a konvergencia 1 valószín¶séggel értend®.

    24

  • De�níció (A kalibráció három f® fajtája)(i) Az (Ft)t=1,2,... sorozat valószín¶ségi kalibrált a (Gt)t=1,2,... sorozathoz, ha

    1T

    T∑t=1

    Gt ◦ F−1t (p) → p ∀ p ∈ (0, 1) (2.1)

    (ii) Az (Ft)t=1,2,... sorozat exceedance kalibrált2 a (Gt)t=1,2,... sorozathoz, ha

    1T

    T∑t=1

    G−1t ◦ Ft(x) → x ∀x ∈ R (2.2)

    (iii) Az (Ft)t=1,2,... sorozat marginálisan kalibrált a (Gt)t=1,2,... sorozathoz, ha a következ®két határérték

    G(x) = limT→∞

    (1T

    T∑t=1

    Gt(x)

    )és F (x) = lim

    T→∞

    (1T

    T∑t=1

    Ft(x)

    )(2.3)

    létezik és egyenl® ∀x ∈ R és eloszlást határoznak meg.3

    (iv) Az (Ft)t=1,2,... sorozat er®sen kalibrált a (Gt)t=1,2,... sorozathoz, ha mind valószín¶ségi,exceedance és marginálisan kalibrált hozzá.

    Ha az (Ft)t=1,2,... sorozat minden részsorozata valószín¶ségi kalibrált a (Gt)t=1,2,... meg-felel® részsorozatához, akkor azt mondjuk hogy (Ft)t=1,2,... teljesen valószín¶ségi kalibrált(Gt)t=1,2,...-hez. Hasonlóan beszélhetünk teljes exceedance, teljes marginális és teljes er®skalibráltságról is.

    A következ®kben bemutatok néhány tipikus el®rejelz®t és megvizsgálom ®ket kalibráltságszempontjából. Ehhez legyenek (µt)t=1,2,..., (σt)t=1,2,... és (τt)t=1,2,... egymástól is független,független, azonos eloszlású valószín¶ségi változók sorozatai.Mindegyik példában a Gt az N (µt, 1) eloszlásfüggvénye lesz, ahol µt ∼ N (0, 1). Azaz mindenpillanatban a természet kisorsol egy N (0, 1) eloszlású véletlen számot és a N(µt, 1) eloszlástveszi háttéreloszlásul.4

    Ideális el®rejelz®Az ideális el®rejelz® prediktív eloszlása minden egyes id®pontban megegyezik a természeteloszlásával, azaz Ft = Gt minden t-re. Az ideális el®rejelz® természetesen er®sen kalibrált.

    Klimatológiai el®rejelz®A klimatológiai el®rejelz® az Ft = N (0, 2) prediktív eloszlást bocsátja ki t-t®l függetlenül.Ez az el®rejelz® valószín¶ségi és marginálisan kalibrált, de nem exceedance, ugyanis

    1T

    T∑t=1

    G−1t ◦ Ft(x) =1T

    T∑t=1

    [Φ−1

    {Φ(x√2

    )}+ µt

    ]→ x√

    26= x (2.4)

    2Az angol elnevezést használom, mivel nem találtam neki igazán megfelel® magyar kifejezést. A másikkét kifejezés angol megfelel®je probabilistic calibration és marginal calibration.3A G létezése alapvet® feltétel meteorológiai problémákban és a stabil klíma létezéséhez kapcsolható.Lényegében a marginális kalibráció a meg�gyelt és az el®rejelzett klíma egyenl®ségét hivatott kifejezni.4Gt eloszlása kevert normális: Gt = G|µt ∼ N (µt, 1). Ekkor G feltétel nélküli eloszlása N (0, 2), ugyanisfG(x) =

    ∫fG|µt=y(x|y) · fµt (y)dy = fN (0,2)

    25

  • Vegyük észre, hogy az Ft prediktív eloszlás minden esetben megegyezik a G feltétel nél-küli eloszlással. Minden ezzel a tulajdonsággal rendelkez® el®rejelz®t klimatológiai el®re-jelz®nek nevezünk. Klimatológiai el®rejelzés esetében a valószín¶ségi kalibráltság ekviva-lens a marginális kalibráltsággal. Ugyanis, ha G folytonos és szigorúan monoton, akkorp = Ft(x) = G(x)-t helyettesítve (2.1)-be, a marginális kalibráltság de�nícióját kapjuk,ezt visszafele alkalmazva pedig a valószín¶ségi kalibráltságot. A gyakorlatban a klimatoló-giai el®rejelzések történelmi meg�gyelések alapján készülnek és gyakran mint referencia-el®rejelzések használatosak.

    Nem-fókuszált el®rejelz®A nem-fókuszált el®rejelz® prediktív eloszlása a következ® keverék eloszlás:

    Ft ∼12{N (µt, 1) +N (µt + τt, 1)} (2.5)

    ahol τt 12 − 12 valószín¶séggel a +1 és −1 értékeket veszi fel, µt-t®l függetlenül.Ekkor Ft(x) = 12{Φ+(x− µt) + Φ−(x− µt)}, ahol Φ±(x) = 12{Φ(x) + Φ(x∓ 1)}.Vizsgáljuk meg ezt az el®rejelz®t kalibráltság szempontjából, el®ször nézzük a valószín¶ségikalibráció (2.1) feltételét:

    1T

    T∑t=1

    Gt ◦ F−1t (p) →12{Φ ◦ Φ−1+ (p) + Φ ◦ Φ−1− (p)} = p (2.6)

    ahol az utolsó egyenl®ség p = Φ+(x) helyettesítéssel és egyszer¶sítéssel adódik.5Az exceedance kalibrációhoz (2.2) nem teljesül általában:

    1T

    T∑t=1

    G−1t ◦ Ft(x) →12{Φ−1 ◦ Φ+(x) + Φ−1 ◦ Φ−(x)} 6= x (2.7)

    A marginális kalibráció (2.3) feltétele sem teljesül, ugyanis

    G(x) ∼ N (0, 2) 6= F ∼ 12N (0, 2) + 1

    4N (−1, 2) + 1

    4N (1, 2)

    Tehát ez az el®rejelz® valószín¶ségi kalibrált, viszont se nem exceedance, se nem margináli-san kalibrált.

    Átlag-torzított el®rejelz®Ez az el®rejelz® a következ® torzított el®rejelzést bocsátja ki: Ft ∼ N (µt + τt, 1), aholτt ugyanaz mint az el®z® példában. Ez az el®rejelz® exceedance kalibrált, de se nemvalószín¶ségi, se nem marginális kalibrált.

    El®jel-torzított el®rejelz®Ennek az el®rejelz®nek a prediktív eloszlása: Ft ∼ N (−µt, 1). Ez az el®rejelz® exceedance ésmarginálisan kalibrált, viszont nem valószín¶ségi kalibrált.

    Kevert el®rejelz®A kevert el®rejelz® minden t id®pontban a klimatológiai és az el®jel-torzított el®rejelzés közülválaszt 12 − 12 valószín¶séggel, µt-t®l függetlenül. Ez az el®rejelz® valószín¶ségi és exceedance

    5Ugyanis Φ ◦ Φ−1− ◦ Φ+(x) = Φ(x − 1) és ezt átrendezve Φ+(x) = Φ−(x − 1), amib®l már következik azegyenl®tlenség.

    26

  • Kalibráció El®rejelz®V EM ideális el®rejelz®V EM Gt = Ft = N (t, 1)V EM klimatológiai el®rejelz®V EM átlag-torzított el®rejelz®V EM el®jel-torzított el®rejelz®V EM kevert el®rejelz®V EM nem-fókuszált el®rejelz®V EM Hamill-el®rejelz®

    2.1. táblázat. A 3 kalibrációfogalom logikailag független

    kalibrált, de nem marginálisan kalibrált.

    Hamill-el®rejelz®Ehhez az el®rejelz®höz a következ® kevert prediktív eloszlás tartozik: N (µt + δt, σ2t ),ahol (δt, σ2t ) =

    (12 , 1), (− 12 , 1) vagy (0, 169100) egyforma valószín¶séggel.6

    1T

    T∑t=1

    Gt ◦F−1t (p) →13

    [Φ{

    Φ−1(p)− 12

    }+ Φ

    {1310

    Φ−1(p)}

    + Φ{

    Φ−1(p) +12

    }]= p+ε(p)

    (2.8)ahol |ε(p)| ≤ 0.0032 minden p-re, de ε(p) 6= 0 általában. A valószín¶ségi kalibráció feltételetehát megsérült, emellett az exceedance kalibráció (2.2) feltétele sem teljesül:

    1T

    T∑t=1

    G−1t ◦ Ft(x) →13

    {(x+

    12

    )+

    1013x+

    (x− 1

    2

    )}=

    1213x (2.9)

    S®t ez az el®rejelz® marginálisan sem lesz kalibrált, ugyanis a két marginális eloszlás:

    G ∼ N (0, 2), míg F ∼ 13

    {N(−1

    2, 2)

    +N(

    12, 2)

    +N(

    0,269100

    )}

    A fenti példák mutatják, hogy a három bevezetett kalibrációfogalom logikailag függetlenegymástól, azaz bármilyen kombinációban felt¶nhetnek.

    2.1.1. Valószín¶ségi kalibráció becslése

    PIT (Probability Integral Transform)A következ® transzformáció azon alapszik, hogy egy x G folytonos eloszlású meg�gyelést

    visszahelyettesítünk az FG eloszlásfüggvényébe, akkor a (0, 1)-n egyenletes eloszlású vélet-len számot kapunk. Így ha képezzük a pt = Ft(xt) úgynevezett PIT-értékeket, akkor ezekegyenletesen oszlanak el az ideális el®rejelz® esetében. Tehát ezek egyenletessége szükségesfeltétele az ideális el®rejelzésnek. Ha ez fordítva is igaz lenne, akkor mérhetnénk egy el®re-jelzésünk jóságát a PIT-értékek egyenletességével, de sajnos ez nincs így, olyannyira, hogyHamill (2001) példát adott olyan el®rejelz®re, mely PIT-értékeinek hisztogrammja lényegé-ben egyenletes, habár minden egyes el®rejelzés torzított. Ebb®l kifolyólag a PIT-értékek

    6Itt a (δt, σ2t ) µt-t®l és egymástól is független sorozatot alkot.27

  • egyenletessége csak szükséges, de nem elégséges feltétele az ideális el®rejelz®nek.7A következ® ábrán egy 10.000 elemszámú mintából generált PIT-hisztogramm látható 4 meg-ismert el®rejelz® esetén, mindegyik esetben a [0, 1] intervallumot beosszuk 20 egyenl® részre,majd ábrázoljuk ezek relatív gyakoriságát. Láthatjuk, hogy nagyjából mindegyik egyenletes:

    2.1. ábra. (a) ideális, (b) klimatológiai, (c) nem-fókuszált, (d) Hamill el®rejelz®

    A PIT-hisztogramm vizuális vizsgálata magyarázatot adhat az el®rejelzés hiányosságaira.Domború hisztogramm túlságosan "széles" prediktív eloszlásra utal, túl széles prediktív in-tervallumokkal. Homorú hisztogramm esetében viszont túlságosan is "sz¶k" prediktív elosz-lásra kell gyanakodnunk. Háromszög-alakú hisztogrammot pedig akkor láthatunk, ha a pre-diktív eloszlásunk túl ferde.

    El®rejelz® Nominális lefedettség50% 90%

    Ideális 51.2 90.1Klimatológiai 51.3 90.7Nem-fókuszált 50.4 90.3Hamill 50.8 89.7

    2.2. táblázat. A prediktív intervallumok empirikus lefedettsége

    A (2.2) táblázat összefoglalja a megfelel® 50% és 90% prediktív intervallumok empirikuslefedettségét. Ez a PIT-hisztogramm középs® 10 illetve 18 beosztás alatti részéb®l is leolvas-ható.

    7Az irodalom gyakran Rosenblatt (1952) nevéhez f¶zi, de egészen Pearson (1933) munkásságáig visszave-zethet®.

    28

  • Most vizsgáljuk meg, hogy a logaritmikus szkór és a CRPS használatával milyen sorrendettudunk felállítani az el®rejelzések között. A 10.000 elemszámú minta alapján felírt átlag-szkórokat a következ® táblázat foglalja össze:

    El®rejelz® LogS CRPS

    Ideális 1.39 0.54Klimatológiai 1.77 0.77Nem-fókuszált 1.54 0.64Hamill 1.53 0.61

    2.3. táblázat. Átlagos szkór

    Leolvashatjuk, hogy mindkét szkór az ideális el®rejelz®t teszi meg a legjobbnak, ezután aHamill és a nem-fókuszált el®rejelz® következik szorosan egymás után, majd utolsóként aklimatológiai el®rejelz®. A Hamill el®rejelz®r®l beláttuk, hogy semelyik megismert kalibrációfeltételének nem tesz eleget, mégis mindkét szkór el®rébb sorolta a klimatológiai el®rejelz®nél,pedig láttuk, hogy ® valószín¶ségi és marginálisan is kalibrált. Ez azért van így, mert bárse nem valószín¶ségi, se nem marginálisan kalibrált a Hamill-el®rejelz®, a (2.8) és a (2.9)formulákból leolvashatjuk, hogy csak egy kicsit sérti meg mindegyik feltételt, így igen közelvan mindkét kalibráltsághoz.

    A következ® ábrán a {X < y}-re felírt BS(y) bináris Brier-szkórt8 láthatjuk az y küszöb-érték függvényeként. Az el®z® fejezetben látottak szerint CRPS = ∫ BS(y)dy, tehát a gör-bék alatti területek épp a CRPS megfelel® értékét adják.

    2.2. ábra. A Brier szkór és a CRPS kapcsolata�� ideális, - - - klimatológiai, -·-·- nem-fókuszált, - - - Hamill-el®rejelz®

    8BS(y)=−(FX(y)− 1{X < y})2

    29

  • Diszkrét el®rejelzések eseteAbban az esetben, ha a prediktív eloszlás diszkrét, akkor a PIT-értékek nem lesznek máregyenletesek az ideális el®rejelz® hipotézise esetében sem. Ezt orvoslandó sokan a következ®randomizált PIT -et javasolják: legyen P a prediktív eloszlás és legyen x P eloszlású véletlenegész, valamint v legyen x-t®l független (0, 1)-en egyenletes eloszlású szám. Ekkor

    u = Px−1 + v(Px − Px−1), x ≥ 1 (2.10)

    u = vP0, x = 0

    szintén egyenletes eloszlású (0, 1)-n.9

    Czado, Gneiting és Held [5]-ben a PIT-hisztogramm következ® nem-randomizált, mégisegyenletes verzióját ismerteti: ehhez a randomizált PIT-értékeket (2.11)-ben helyettesítsüka feltételes eloszlásfüggvényükkel adott x meg�gyelés mellett:

    F (u) =

    0, u ≤ Px−1u−Px−1

    Px−Px−1 , Px−1 ≤ u ≤ Px1, u ≥ Px

    (2.11)

    ha x ≥ 1, ésF (u) =

    {uP0, u ≤ P0

    1, u ≥ P0ha x = 0.

    A valószín¶ségi kalibráció ezután becsülhet® ezek el®rejelzések során kapott átlagát

    F (u) =1n

    n∑i=1

    F (i)(u), 0 ≤ u ≤ 1 (2.12)

    összevetve az egyenletes eloszlás eloszlásfüggvényével (azaz az identitással). Itt F (i) a meg-felel® P (i) prediktív eloszlás és az xi meg�gyelés alapján készített eloszlásfüggvény. Emellettfelrajzolhatjuk a nem-randomizált PIT-hisztogrammot: osszuk fel (0, 1)-et N egyenl® részre,majd számoljuk ki az fn = F

    (nN

    )− F

    (n−1N

    ) értékeket és rajzoljuk fel a hisztogrammota j. beosztásnál fj súllyal, ezután ellen®rizhetjük az egyenletességet. Fontos megjegyezni,hogy a PIT-hisztogramm egyenletessége igen er®s megkötés, és azzal ekvivalens, hogy min-den prediktív intervallum nominális lefedettséget mutat. Ezért a néha igen hasznos mód-szer, miszerint táblázat foglalják néhány prediktív intervallum tapasztalati lefedettségét, aPIT-hisztogramm speciális eseteként interpretálható. Vegyünk egy prediktív intervallumotα alsó és β fels® határral, ennek nominális lefedettsége β − α. Randomizálással a tapasz-talati lefedettség a randomizált PIT-értékek [α, β] intervallumba es® relatív gyakorisága, anem-randomizált esetben pedig F (β)−F (α)-ként számolható. Természetesen ez a különbséga randomizált PIT alapján számított empirikus lefedettség várható értéke. A PIT-értékekhisztogrammja nagy mintaelemszám esetén kihangsúlyozza az egyenletességt®l való apró el-téréseket is, és ezek kimutatásához általában 10 vagy 20 beosztás elegend®.

    9Itt Pk = ∑ki=0 pi.30

  • Esettanulmány

    Paraméterezzük a negatív binomiális eloszlást a következ®képpen: NB(λ, a) úgy, hogy a vár-ható értéke λ ≥ 0 legyen, míg a variancia λ(1 + aλ) ≥ 0. Ekkor a ≥ 0 és az a = 0 esetben aPoisson-eloszlást kapjuk speciális esetként. Egy 200 elem¶ mintát veszünk a NB(5, 12 ) elosz-lásból és a következ® három el®rejelz®t vizsgáljuk: NB(5, 0) = P (5), NB(5, 12 ) és NB(5, 1).A (2.3) ábra a nem-randomizált PIT-hisztogrammot mutatja 10 beosztással. Az els® esetbenhomorú diagrammot kapunk, ami a szórás alulbecslésére utal, azaz túl "sz¶k" a prediktíveloszlás; a második eset a valóságnak megfelel®; míg a harmadik esetben épp fordítva adomború diagramm a szórás túlbecsléséb®l, tehát egy túl "széles" prediktív eloszlásból szár-mazik.

    2.3. ábra. PIT-hisztogramm

    Általánosság megszorítása nélkül ez általánosítható arra az esetre is amikor nem feltét-len egészérték¶, de rendezett adatsorral van dolgunk. Tehát egy x mennyiség el®rejelzésé-vel foglalkozunk, amely az (xk)∞k=−∞ valós számokat veheti fel (pk)∞k=∞ valószín¶séggel ésxk−1 < xk < xk+1. (Pk)∞k=∞-t az el®z®ekhez hasonlóan képezzük. A PIT-transzformációáltalánosítható erre az esetre is. El®ször nézzük a randomizált verziót: ha x = xk a meg-�gyelés:

    u = Pk−1 + v(Pk − Pk−1) (2.13)ahol v x-t®l független standard egyenletes eloszlású változó. A nem-randomizált esetben,x = xk meg�gyelés mellett

    F (u) =

    0, u ≤ Pk−1u−Pk−1

    Pk−Pk−1 , Pk−1 ≤ u ≤ Pk1, u ≥ Pk

    (2.14)

    Melyek a nemnegatív egész értéket felvev® változók esetében a már ismert képleteketadják. Ismét aggregálunk, és a hisztogramm egyenletességét vizsgálhatjuk.

    Mint azt a következ®

    Gt ◦ F−1t (p) = P (Xt < F−1t (p)) = P (Ft(Xt) < p) = P (pt < p) (2.15)

    egyszer¶ átalakítás is mutatja, a valószín¶ségi kalibráltság ekvivalens a PIT-értékek egyen-letességével.

    31

  • A (2.4) ábrán a 200 mintaelemre kiszámolt szkórok tapasztalati eloszlását látjuk boxplotmódszerrel ábrázolva. A középs® vastag vonalak a mediánt, a dobozok határai az alsó és fels®kvartilist10, míg az alsó és fels® vonalak a legkisebb és legnagyobb szkórértékeket jelölik, haezek különbsége nem nagyobb a doboz magasságának 1,5-szeresénél. Ha ezen a határonkívülre is esnek meg�gyelések, azokat a kívülálló pontok jelölik.

    2.4. ábra. Boxplot

    Nyilván a Gt eloszlása a valóságban csak hipotetikus, a gyakorlatban nem ismert, ezért jóvolna, ha lenne egy olyan eszköz a kezünkben, mellyel a valódi háttéreloszlás ismerete nélkülis ellen®rizni tudnánk a valószín¶ségi kalibrációt. Persze Gt-t helyettesíthetjük az 1{xt ≤ x}tapasztalati eloszlásfüggvénnyel, és vizsgálhatjuk az így kapott mennyiséget, következ® tétele segítségével karakterizálja a valószín¶ségi kalibrációt:

    Tétel ([3]): Legyenek (Ft)t=1,2,... és (Gt)t=1,2,... folytonos és szigorúan monoton elosz-lásfüggvények sorozatai. Legyen xt eloszlásfüggvénye Gt és (xt) ∗-kever® sorozat. Ekkor

    1T

    T∑t=1

    1{pt ≤ p} → p 1 valószín¶séggel minden p-re (2.16)

    akkor és csak akkor teljesül, ha az (Ft)t=1,2,... sorozat valószín¶ségi kalibrált a (Gt)t=1,2,...sorozathoz.11

    10Ezek a 14és a 3

    4-szint¶ kvantilisek.11(xn) *-kever® sorozat, ha létezik N pozitív egész, és egy f valós érték¶ függvény, mely n ≥ N egészekre

    értelmezett a következ® két tulajdonsággal:(1) f monoton csökken® és limn→∞ f(n) = 0(2) ha n ≥ N és A ∈ ∑m1 illetve B ∈ ∑m+n, akkor |P (AB)− P (A)P (B)| ≤ f(n)P (A)P (B)ahol ∑n a legsz¶kebb σ-algebra, amire xn mérhet® és ∑nm a legsz¶kebb σ-algebra, amire xm, . . . , xn mér-het®ek.

    32

  • Kihangsúlyozottan: a (2.16) feltétel szükséges és elégséges a valószín¶ségi kalibrációhoz füg-getlenül attól, hogy mint (2.1) empirikus megfelel®jeként vezettük be.Egy hasonló karakterizáció adható a marginális kalibrációra is, ahogy azt a következ® rész-ben látni is fogjuk; az exceedance kalibráció esetében viszont nem ismert hasonló módszer,mely (2.2) tapasztalati megfelel®jével karakterizálná az exceedance kalibrációt.

    2.1.2. Marginális kalibráció becslése

    Marginális kalibráció diagrammKézenfekv® ötlet, hogy ha minden egyes meg�gyelés egy véletlen szám a megfelel® pre-

    diktív eloszlásból, akkor azt várnánk, hogy ha összesítjük ezeket a prediktív eloszlásokat,akkor az így kapott keverék eloszlás és a meg�gyelt adatok hisztogrammja statisztikailagösszeegyeztethet®ek. A marginális kalibráció diagramm egy x érték vagy egy (xa, xb] inter-vallum átlagos valószín¶ségét hasonlítja össze az x meg�gyelés empirikus gyakoriságávalvagy az (xa, xb] intervallum empirikus lefedettségével.

    A marginális kalibráció (2.3) feltételében Gt sorozat ismételten a valóságban csak hi-potetikus, a gyakorlatban nem ismert, ezért most is jó volna, ha lenne egy olyan eszköz akezünkben, mellyel a valódi háttéreloszlás ismerete nélkül is ellen®rizni tudnánk a margináliskalibrációt. Most is helyettesíthetjük Gt-t az 1{xt ≤ x} tapasztalati eloszlásfüggvénnyel, ésvizsgálhatjuk ĜT (x) = 1T

    ∑Tt=1 1{xt ≤ x} és FT kapcsolatát.

    Ezért is fontos a következ® tétel, mely szerint enyhe regularitási feltételek mellett a mar-ginális kalibráció szükséges és elegend® feltétele ĜT és FT aszimptotikus egyenl®ségének.

    Tétel ([3]): Legyenek (Ft)t=1,2,... és (Gt)t=1,2,... folytonos és szigorúan monoton elosz-lásfüggvények sorozatai. Legyen xt eloszlásfüggvénye Gt és (xt) ∗-kever® sorozat. Továbbátegyük fel, hogy

    F (x) = limT→∞

    {1T

    T∑t=1

    Ft(x)

    }(2.17)

    határérték létezik minden x ∈ R esetén és a határérték is szigorúan monoton. Ekkor

    ĜT (x) =1T

    T∑t=1

    1{xt ≤ x} → F (x) 1 valószín¶séggel minden x-re (2.18)

    akkor és csak akkor teljesül, ha az (Ft)t=1,2,... sorozat marginálisan kalibrált a (Gt)t=1,2,...sorozathoz.

    Így a marginális kalibráció ellen®rzése alapulhat a prediktív eloszlásfüggvények átlagának

    FT =1T

    T∑t=1

    Ft(x) x ∈ R (2.19)

    a meg�gyelések tapasztalati eloszlásfüggvényével

    ĜT (x) =1T

    T∑t=1

    1{xt ≤ x} x ∈ R (2.20)

    való összevetésén.

    33

  • A legegyszer¶bb gra�kus technika az FT (x) és a ĜT (x) függvények ábrázolása. Ennél sokkalinformatívabb az FT (x)− ĜT (x) különbség ábrázolása12 (els® ábra):

    2.5. ábra. Marginális kalibráció diagramm az eloszlás- és a kvantilisfüggvények esetében,�� az ideális, - - - - a klimatológiai, -·-·- a nemfókuszált, - - - pedig a Hamill el®rejelz®t jelzi

    A marginális kalibráció hipotézise mellett csak kis ingadozásokat várunk 0 körül, és ez teljesülis az ideális és a klimatológiai el®rejelz®re. Mivel a másik két el®rejelz® nem marginálisan ka-librált, így nagy kilengéseket tapasztalunk az ábrán. Hasonló olvasható le a másik ábráról is,ahol a két kvantilisfüggvény Q(FT , q)−Q(ĜT , q) különbsége látható. Megintcsak margináliskalibráció esetén 0 körüli kis �uktuációkat várunk, amely teljesül is az ideális és a klimatoló-giai el®rejelz® esetében. A másik kett® el®rejelz®nél a kvantilisfüggvények különbsége egyren® a negatív értékek felöl a pozitívak fele, túl szétterjedt el®rejelzett klímára utalva.

    2.2. ÉlességMint már említettem Gneiting, Raftery és mások a valószín¶ségi el®rejelzések célját a

    következ®képpen fogalmazzák meg: maximalizálni az eloszlás élességét rögzített kalibrá-ció mellett. Ez lényegében az ideális el®rejelzést jelenti, például a teljes er®s kalibráltságmegléte biztosítja az aszimptotikus ekvivalenciát. Tehát a bevezetett kalibrációfogalmaktól,azt várnánk, hogy egy megfelel®en elégségesen kalibrált prediktív eloszlás legalább annyiraszétterjedt mint az ideális el®rejelzés. Az er®s kalibráltság a teljesség nélkül nem t¶nik eléger®s megkötésnek, bár nem tudni ellenpéldáról. Azt viszont könnyen be lehet látni, hogy sea valószín¶ségi, se az exceedance, se a marginális kalibráció önmagában nem elég megkötés,azaz létezik el®rejelz®, mely valószín¶ségi, exceedance vagy marginálisan kalibrált, mégisélesebb az ideális el®rejelz®nél.

    12Az ábrán F.fcast=F T (x), F.obs=ĜT (x), Q.fcast=Q(F T , q) és Q.obs=Q(ĜT , q).

    34

  • A következ® példákban elég lesz a valószín¶ségi kalibráció véges (Ft)1≤t≤T és (Gt)1≤t≤Tsorozatokra vonatkozó megfelel®jével foglalkoznunk:

    1T

    T∑t=1

    Gt ◦ F−1t (p) = p minden p ∈ (0, 1) (2.21)

    Hasonlóan de�niálható a többi kalibráció is véges sorozatokra, például az exceedance kalib-rációra:

    1T

    T∑t=1

    G−1t ◦ Ft(x) = x minden x ∈ R (2.22)

    Legyen σ > 0, a > 1, 0 < λ < 1a és T = 2, illetve legyenek G1 és G2 folytonos, szigorúanmonoton eloszlásfüggvények, 0-ra szimmetrikus s¶r¶ségfüggvényekkel és véges szórásnégy-zetekkel: D2(G1) = σ2 és D2(G2) = λσ2.De�niáljuk ekkor F1-t és F2-t a következ®képpen:

    F1(x) =12

    {G1(x) +G2

    (xa

    )}F2(x) = F1(ax)

    Ekkor ezek varianciájára a következ® igaz:

    D2(F1) +D2(F2) =12

    (1 +

    1a2