SAE - Łukasz Wawrowski

23
Wprowadzenie Estymatory bezpośrednie Estymatory pośrednie Podsumowanie Literatura Statystyka Malych Obszarów w badaniach próbkowych Lukasz Wawrowski [email protected] Urząd Statystyczny w Poznaniu SKN Estymator, UEP 5.03.2012 Lukasz Wawrowski [email protected] Statystyka Malych Obszarów w badaniach próbkowych

Transcript of SAE - Łukasz Wawrowski

Page 1: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Statystyka Małych Obszaróww badaniach próbkowych

Łukasz [email protected]

Urząd Statystyczny w PoznaniuSKN Estymator, UEP

5.03.2012

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 2: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

1 WprowadzeniePodstawowe pojęciaBadanie

2 Estymatory bezpośrednieEstymator Horwitza-ThompsonaEstymator regresyjny

3 Estymatory pośrednieBroad Area Ratio Estimator

4 Podsumowanie

5 Literatura

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 3: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podstawowe pojęciaBadanie

Statystyka Małych Obszarów

gałąź metody reprezentacyjnej,

przedmiotem zainteresowania charakterystki podpopulacji,

szacowanie dziedzin nie objętych planem losowania,

losowa liczebność domeny w próbie,

szacunki nawet przy zerowej liczbności próby w podpopulacji,

wykorzystanie wszystkich dostępnych źródeł danych.

Mały obszar

Domena (obszar geograficzny, typ przedsiębiorstwa, grupawiekowa), której liczebność w próbie jest mała.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 4: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podstawowe pojęciaBadanie

Statystyka Małych Obszarów

gałąź metody reprezentacyjnej,

przedmiotem zainteresowania charakterystki podpopulacji,

szacowanie dziedzin nie objętych planem losowania,

losowa liczebność domeny w próbie,

szacunki nawet przy zerowej liczbności próby w podpopulacji,

wykorzystanie wszystkich dostępnych źródeł danych.

Mały obszar

Domena (obszar geograficzny, typ przedsiębiorstwa, grupawiekowa), której liczebność w próbie jest mała.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 5: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podstawowe pojęciaBadanie

Estymator bezpośredni

Estymator bezpośredni wykorzystuje informacje o zmiennej badanejy pochodzące wyłącznie z domeny będącej przedmiotem badaniaw danym momencie czasu.

Mała liczebność próby ⇒ duża wariancja,

ale nieobciążony,

więc wykorzystywany przy tworzeniu estymatorów pośrednich.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 6: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podstawowe pojęciaBadanie

Estymator pośredni

Estymator pośredni wykorzystuje informacje o wartościachzmiennej badanej y spoza okresu i domeny będącej przedmiotemzainteresowania.

Obciążony, ale niska wariancja,

„pożycza moc” spoza domeny przy spełnionych założeniach.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 7: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podstawowe pojęciaBadanie

Opis badania

Celem badania było poznanie odsetka studentów zaliczającychpraktyki zgodnie z regulaminem studiów.

Liczebność populacji: 308 osób,

liczebność próby: 62 osoby (20%),

badana domena: wydział.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 8: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podstawowe pojęciaBadanie

Przygotowanie zbioru

library(TeachingSampling)dane=read.csv(file="ankieta.csv")los=sample(dane$id, 62, replace=F)dane_los=dane[los,]p=rep(nrow(dane_los)/nrow(dane), nrow(dane_los))dane_los=cbind(dane_los, p)

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 9: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podstawowe pojęciaBadanie

Przygotowanie zbioru

dane1=dane_los[dane_los$m5==1, ] #WEdane2=dane_los[dane_los$m5==2, ] #WIGEdane3=dane_los[dane_los$m5==3, ] #WGMdane4=dane_los[dane_los$m5==4, ] #WTdane5=dane_los[dane_los$m5==5, ] #WZ

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 10: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podstawowe pojęciaBadanie

Tablica: Częstości

WydziałPopulacja Próba

N Tak Nie n Tak NieWE 112 96 16 18 17 1WIGE 28 24 4 7 6 1WGM 58 45 13 13 12 1WT 22 20 2 4 4 0WZ 88 75 13 20 18 2

Źródło: opracowanie własne.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 11: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Estymator Horwitza-ThompsonaEstymator regresyjny

Estymator Horwitza-Thompsona

yHTd =∑i∈sd

yiπi, (1)

gdzie: πi - prawdopodobieństwo wylosowania i-tego elementu dopróby.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 12: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Estymator Horwitza-ThompsonaEstymator regresyjny

Jak w R?

Funkcja:

E.SI(N, n, y)

Argumenty:N - wielkość populacji,n - wielkość próby,y - wektor zawierający dane jednostkowe zmiennej objaśnianej.Wynik:wartość wyestymowana, wariancja, współczynnik zmienności.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 13: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Estymator Horwitza-ThompsonaEstymator regresyjny

Przykład

Estymacja liczby osób, które odbyły praktykę zgodniez regulaminem na Wydziale Gospodarki Międzynarodowej.

E.SI(N=58, n=nrow(dane3), dane3$q1_tak)

yEstimation 53.538462Variance 15.443787CVE 7.340253

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 14: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Estymator Horwitza-ThompsonaEstymator regresyjny

GREG

yGREGd = yHTd + βd(xd − xHTd ), (2)

gdzie: βd - współczynnik regresji między zmienną objaśnianą,a zmiennymi dodatkowymi.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 15: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Estymator Horwitza-ThompsonaEstymator regresyjny

Jak w R?

Funkcja:

E.Beta(y, x, Pik, ck=1, b0=FALSE)GREG.SI(N, n, y, x, tx, b, b0=FALSE)

Argumenty:x - macierz zawierająca zmienne dodatkowe,Pik - wektor prawdopodobieństw dostania się do próby,ck - wektor wag,tx - wielkość populacji zmiennych dodatkowych,b0 - wyraz wolny.Wynik:wartość wyestymowana, wariancja, współczynnik zmienności.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 16: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Estymator Horwitza-ThompsonaEstymator regresyjny

Przykład

Estymacja liczby osób, które odbyły praktykę zgodniez regulaminem na Wydziale Gospodarki Międzynarodowejz wykorzystaniem zmiennych dodatkowych: płeć orazdoświadczenie.

dane_pom=cbind(dane3$q3, dane3$m1)b=E.Beta(dane3$q1_tak,dane_pom,dane3$p,b0=T)GREG.SI(58,nrow(dane3),dane3$q1_tak,dane_pom,58,b,b0=T)

yEstimation 58.000000Variance 13.384615CVE 6.307757

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 17: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Broad Area Ratio Estimator

Broad Area Ratio Estimator (BARE)

yBAREd =yHTdNnd , (3)

gdzie: N - populacja dużego obszaru, nd - populacja małegoobszaru.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 18: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Broad Area Ratio Estimator

Jak w R?

BARE.SI=function(N, n, nd, y){Total <- matrix(NA, nrow = 3, ncol = 1)rownames(Total) = c("Estimation", "Variance", "CVE")colnames(Total) = "y"ht=E.SI(N, n, y)BARE=(ht[1,1]/N)*ndvar=((nd/N)^2)*ht[2,1]Cve=100*sqrt(var)/BARETotal[,1]=c(BARE, var, Cve)return(Total)}

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 19: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Broad Area Ratio Estimator

Przykład

Estymacja liczby osób, które odbyły praktykę zgodniez regulaminem na Wydziale Gospodarki Międzynarodowejz wykorzystaniem wiedzy na temat całej populacji.

BARE.SI(N=308, n=62, nd=58, dane_los$q1_tak)

yEstimation 53.322581Variance 3.265668CVE 3.389026

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 20: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Zastosowanie

Statystyka Małych Obszarów wykorzystywana jest

w sytuacjach, w których tradycyjne metody okazują sięniewydolne i nieekonomiczne,

kiedy istnieje zapotrzebowanie na informację na niskimpoziemie agregacji przestrzennej,

przy ograniczonym budżecie.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 21: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Podsumowanie

W prezentacji został przedstawiony zarys SMO orazrandomizacyjne podejście do estymacji. Oprócz niego w SMOwyróżnia się także:

podejście modelowe,

podejście bayesowskie.

O czym innym razem... ¨

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 22: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Australian Bureau of Statistics, 2006, A Guide to Small AreaEstimation, Australia.

Paradysz J., 2009, Kryteria dobroci estymacji dla małychobszarów, Poznań.

Rao J.N.K., 2003, Small Area Estimation, John Wiley & Sons,New York.

Żądło T., 2008, Elementy statystyki małych obszarówz programem R, Wydawnictwo Akademii Ekonomicznejim. Karola Adamieckiego, Katowice.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych

Page 23: SAE - Łukasz Wawrowski

WprowadzenieEstymatory bezpośrednieEstymatory pośrednie

PodsumowanieLiteratura

Dziękuje za uwagę.

Łukasz Wawrowski [email protected] Statystyka Małych Obszarów w badaniach próbkowych