Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

1 Metoda reprezentacyjna i statystyka małych obszarów z SAS Instytut Statystyki i Demografii SGH dr Dorota Bartosińska Zajęcia 4 Wnioskowanie statystyczne.

Podobne prezentacje


Prezentacja na temat: "1 Metoda reprezentacyjna i statystyka małych obszarów z SAS Instytut Statystyki i Demografii SGH dr Dorota Bartosińska Zajęcia 4 Wnioskowanie statystyczne."— Zapis prezentacji:

1 1 Metoda reprezentacyjna i statystyka małych obszarów z SAS Instytut Statystyki i Demografii SGH dr Dorota Bartosińska Zajęcia 4 Wnioskowanie statystyczne o średniej, wartości globalnej i ilorazie z prób złożonych – zastosowanie procedury SURVEYMEANS. Estymatory ilorazowe.

2 Struktura zajęć 1.Szacowane parametry populacji 2.Estymatory średniej dla różnych schematów losowania próby 3.Ilorazowe estymatory średniej 4.Estymatory wartości globalnej 5.Estymator ilorazu 6.Pośrednie metody oceny wariancji estymatorów 7.Procedura SURVEYMEANS 8.Przykład zastosowania procedury SURVEYMEANS 2

3 3 Rozpatrujemy cechę ilościową Y: Y – cecha badana y i – wartości cechy badanej dla i-tej jednostki 1.1. Średnia cechy Y w populacji: 1.2. Wartość globalna (suma wartości zmiennej) 1.3. Iloraz dwóch wartości globalnych/średnich 1. Szacowane parametry populacji

4 2. Estymatory średniej dla różnych schematów losowania próby 2.1. Losowanie proste niezależne Estymatorem średniej populacji jest średnia z próby: Estymator ten jest nieobciążony, tzn.: 4

5 5 Wariancja estymatora średniej: D 2 – wariancja estymatora S 2 – wariancja cechy badanej w populacji Estymator wariancji estymatora: d 2 - estymator wariancji estymatora s 2 – estymator wariancji cechy badanej w populacji, czyli wariancja w próbie

6 Losowanie proste zależne Estymatorem średniej populacji jest średnia z próby: Estymator ten jest nieobciążony: Wariancja tego estymatora: Estymatorem wariancji jest: - poprawka na bezzwrotność losowania

7 Losowanie warstwowe Estymatorem średniej populacji jest średnia z próby warstwowej: Wariancja tego estymatora: - średnia cechy badanej Y w h-tej warstwie - liczebność populacji dla h-tej warstwy - liczebność próby dla h-tej warstwy - udział liczebności h-tej warstwy w populacji

8 Warstwowanie po wylosowaniu próby Zał. znane W h Estymator średniej: Wariancja tego estymatora: - frakcja, jaką stanowi próba w populacji - wariancja estymatora średniej w przyp. los. warstwowego proporcjonalnego

9 Losowanie dwustopniowe los. dwustopniowe (los. proste zależne na obu stopniach): I stopień – losujemy do próby m jednostek z M jednostek populacji, g - numer jednostki losowania I stopnia II stopień - losujemy do próby n g jednostek z N g jednostek i - numer jednostki losowania II stopnia Estymator średniej:

10 10 3. Ilorazowe estymatory średniej 3.1. Ilorazowy estymator średniej bez warstwowania - stosowany, gdy mamy informację o średniej cechy dodatkowej X w populacji - cecha dodatkowa X musi być skorelowana z cechą badaną Y - potrzebne są dane indywidualne o cesze pomocniczej R - iloraz, r - estymator ilorazu: - średnia cechy pomocniczej X w populacji - średnia cechy pomocniczej X w próbie - średnia cechy badanej Y w próbie

11 11 Ilorazowy estymator średniej - jest obciążony - jego wariancja: R - iloraz w populacji, - współczynnik korelacji między cechą pomocniczą X i cechą badaną Y S x - odchylenie standardowe cechy pomocniczej X w populacji S y - odchylenie standardowe cechy badanej Y w populacji

12 12 Ilorazowy estymator średniej jest bardziej efektywny niż średnia z próby, gdy: V(X) - współczynnik zmienności dla cechy pomocniczej X V(Y) - współczynnik zmienności dla cechy badanej Y Współczynnik zmienności cechy jest to iloraz odchylenia standardowego cechy przez średnią arytmetyczną tej cechy.

13 Ilorazowy warstwowy estymator średniej - stosowany, gdy mamy informację o średniej cechy dodatkowej X w populacji dla każdej z H warstw R h – iloraz wartości globalnych lub średnich cechy badanej Y i cechy pomocniczej X dla h-tej warstwy: - średnia cechy Y w populacji dla h-tej warstwy - średnia cechy X w populacji dla h-tej warstwy r h – estymator ilorazu wartości globalnych lub średnich cechy badanej Y i cechy pomocniczej X dla h-tej warstwy: - średnia cechy Y w próbie dla h-tej warstwy - średnia cechy X w próbie dla h-tej warstwy

14 14 Wariancja ilorazowego warstwowego estymatora średniej - współczynnik korelacji między cechą badaną Y i cechą pomocniczą X dla h-tej warstwy - wariancja cechy badanej Y dla h-tej warstwy - wariancja cechy pomocniczej X dla h-tej warstwy Estymator ten jest obciążony, zgodny (obciążenie maleje wraz ze wzrostem n h ).

15 15 4. Estymatory wartości globalnej Wartość globalna: Estymator wartości globalnej otrzymamy, mnożąc estymator średniej przez N: Wariancję estymatora wartości globalnej otrzymamy, mnożąc wariancję estymatora średniej przez N 2: Estymator wariancji estymatora wartości globalnej:

16 16 - mają zastosowanie wzory podane przy ilorazowym estymatorze średniej na r 5. Estymator ilorazu

17 6. Pośrednie metody oceny wariancji estymatorów W przypadku złożonych schematów losowania próby do szacowania parametrów populacji są stosowane estymatory warstwowe lub/i złożone „wielopiętrowe” estymatory zaliczające się do estymatorów typu ilorazowego. Ta złożoność schematów losowania próby i estymatorów jest w praktyce omijana poprzez użycie w procesie estymacji tzw. wag. Estymator średniej ma postać ilorazu: 17

18 Bezpośrednia estymacja wariancji estymatorów parametrów populacji jest utrudniona w przypadku złożonych schematów losowania próby i złożonych estymatorów. W takich sytuacjach do oceny wariancji estymatorów można wykorzystać metody pośrednie:  linearyzację Taylora (ang. Taylor series linearization),  metodę bootstrapową,  metodę jackknife,  metodę półprób zrównoważonych (ang. balanced repeated replication),  metodę grup losowych (ang. interpenetrating sub-samples).

19 PROC SURVEYMEANSPROC SURVEYMEANS opcje słowa kluczowe statystyk; BYBY zmienne grupujące ; CLASSCLASS zmienne jakościowe ; CLUSTERCLUSTER zmienne identyfikujące jednostki los. I stopnia; DOMAINDOMAIN zmienne domen ; RATIORATIO zmienna licznika / zmienna mianownika; REPWEIGHTSREPWEIGHTS zmienne ; STRATASTRATA zmienne warstwujące ; VARVAR zmienne analizowane ilościowe; WEIGHTWEIGHT zmienna ważąca; 7. Procedura SURVEYMEANS

20 Dane: Badanie Budżetów Gospodarstw Domowych GUS 2008 Populacja: ok. 13 mln gospodarstw domowych w Polsce Próba: ok. 37 tys. gospodarstw domowych (0,3%) Schemat losowania próby: dwustopniowy, warstwowy, z różnymi prawdopodobieństwami wyboru na I stopniu losowania. Jednostki losowania I stopnia – terenowe punkty badań. Jednostki losowania II stopnia – mieszkania. 8. Przykład zastosowania procedury SURVEYMEANS

21 Na I st. losowania – wykazy rejonów statystycznych, opracowane dla potrzeb NSP 2002, aktualizowane co roku, utworzono 783 tpb (w mieście 250 mieszkań, na wsi 150), przed losowaniem powarstwowane oddzielnie w każdym województwie według klasy miejscowości. Na II st. losowania – wykazy zamieszkanych mieszkań w wylosowanych tpb, opracowane przez urzędy statystyczne. Operaty losowania

22 Wagi pierwotne są odwrotnościami prawdopodobieństw wyboru do próby poszczególnych jednostek: W przypadku losowania wielostopniowego prawdopodobieństwa wylosowania jednostek do próby oraz wagi pierwotne otrzymuje się przez przemnożenie odpowiednio prawdopodobieństw i wag ze wszystkich stopni losowania próby. Prawdopodobieństwo wybrania j-tej jednostki losowania II stopnia w i- tej jednostce losowania I stopnia wynosi: Wagi pierwotne skorygowano danymi o strukturze gospodarstw domowych wg liczby osób w podziale na miasto i wieś z NSP Suma wag jest estymatorem liczebności populacji Konstrukcja wag

23 Oceny: parametrów błędów standardowych ocen współczynników zmienności ocen efekt schematu Prezentacja wybranych wyników

24 Wydatki gospodarstw domowych – proc surveymeans Podregiony 66


Pobierz ppt "1 Metoda reprezentacyjna i statystyka małych obszarów z SAS Instytut Statystyki i Demografii SGH dr Dorota Bartosińska Zajęcia 4 Wnioskowanie statystyczne."

Podobne prezentacje


Reklamy Google