Metody losowania próby Bogdan Sokalski
Metoda reprezentacyjna - wprowadzenie Przedmiotem badań metody reprezentacyjnej jest analiza własności cech (charakterystyk) zbioru obiektów zwanego populacją. Zwykle nie interesują nas wszystkie poziomy cech przypisane elementom populacji lecz pewne funkcje które mają syntetycznie opisywać własności populacji. Zaliczamy do nich średnią i wariancję cechy, współczynnik korelacji, parametry regresji.
Populacja Definicja 1: Zbiór obiektów Ω ( ω1,ω2,…,ωN), N<∞ jest nazywany populacją skończoną N - elementową Przykłady populacji: zbiór mieszkańców Polski, zbiór przedsiębiorstw. Definicja 2: Cechą (zmienną) w populacji nazywamy przyporządkowanie Ω →R1 takie że dla każdego i=1,…,N zachodzi y(ω) = y. Przykładami może tu być dla zbioru mieszkańców wzrost a dla przedsiębiorstw przychód.
Przyczyny losowania prób Zwykle populacje składają się z wielu tysięcy czy milionów obiektów (ludność Polski około 39 milionów osób). Obserwacja poziomów cech w takiej populacji byłaby długotrwała i kosztowna. Dlatego zazwyczaj badanie trzeba ograniczyć do podzbioru populacji zwanego próbą Trzeba ja tak wyodrębnić aby jak najlepiej reprezentowała strukturę badanej cechy w populacji
Wyodrębnianie prób Wyróżnia się dwa sposoby wyodrębniania prób: Wybór celowy Odbywa się na podstawie znanych racjonalnych przesłanek. Niemożliwy jest jednak ocena błędu wnioskowania. Wybór losowy Możliwa ocena błędu wnioskowania.
Warunki losowania próby Aby wystąpiła możliwość losowania próby trzeba dysponować spisem elementów populacji lub przynajmniej spisem ich rozłącznych podzbiorów zwanych zespołami. Taki spis nazywamy operatem losowania. Postuluje się aby operat losowania był kompletny, aktualny oraz identyfikowalny (np. PESEL). Ponadto dobry operat powinien zwierać informacje dodatkowe o elementach populacji.
Plan losowania a schemat losowania Planem losowania nazywamy prawdopodobieństwo z którym powinny być wybierane zestawy elementów populacji. Mechanizm losowania realizujący plan wyboru elementów populacji do próby według prawdopodobieństw warunkowych określonych na podstawie planu losowania nazywamy schematem losowania
Podstawowe schematy losowania próby prostej Plan zwrotnego losowania n –elementowej próby prostej s z N-elementowej populacji P określa się wzorem: Prawdopodobieństwo wyboru każdego elementu do próby wynosi:
Podstawowe schematy losowania próby prostej c.d. Schemat losowania według tego planu polega na zwrotnym losowaniu elementów z tym samym prawdopodobieństwem wynoszącym N-1. Schemat ten nazywamy zwrotnym schematem losowania indywidualnego i nieograniczonego ze stałym prawdopodobieństwem wyboru elementów do próby lub schematem losowania niezależnej próby prostej
Podstawowe schematy losowania próby prostej c.d. Plan bezzwrotnego losowania n-elementowej próby prostej s z N-elementowej populacji P określa się wzorem: Prawdopodobieństwo wyboru każdego elementu do próby wynosi:
Podstawowe schematy losowania próby prostej c.d. Schemat losowania próby prostej realizujący powyższym planem polega na wyborze bezzwrotnym kolejnych elementów do próby tak, aby prawdopodobieństwo wylosowania elementu o numerze ki w i-tym losowaniu pod warunkiem, że wcześniej już wybrano elementy k1,…,ki-1 wynosiło: Schemat taki nazywamy wariantem bezzwrotnym schematu losowania indywidualnego i nieograniczonego ze stałymi prawdopodobieństwami.
Schemat losowania systematycznego Plan losowania próby prostej systematycznej określa się wzorem: Prawdopodobieństwo wyboru elementu do próby wynosi:
Schemat losowania systematycznego c.d. Schemat losowania polega na tym że spośród pierwszych elementów losuje się jeden z nich a następnie wybiera się te elementami które są krotnościami liczby q. Taki schemat stasuje się często w księgowości, gdzie należy wylosować faktury do sprawdzenia.
Schemat losowania warstwowego Zakładamy że populacja Ω jest podzielona na niepuste podzbiory Ωh (h=1,..,H) zwane warstwami i że jest to zbiór zupełny obejmujący każdy element populacji. Liczbę elementów populacji tworzących h-tą warstwę oznaczamy przez 0<Nh≤N, przy czym suma Nh wynosi N. Plan losowania bezzwrotnego próby warstwowej ma postać ma postać:
Schemat losowania warstwowego - przykłady Schemat losowania warstwowego jest jednym z najczęściej używanych sposobów losowania próby. Estymatory otrzymane na podstawie tego schematu są zazwyczaj efektywniejsze od tych losowanych z próby prostej. Przykładem cech tworzących warstwę mogą być tu wiek lub płeć.
Schemat losowania grupowego Zakładamy że populacja Ω jest podzielona na niepuste podzbiory Ωp (p=1,..,G) zwane warstwami i że jest to zbiór zupełny obejmujący każdy element populacji. Zbiory te nazywamy grupami i przyjmujemy że są równoliczne o liczebności M. Plan losowania dla tego schematu losowania określa wzór:
Schemat losowania grupowego Próba wylosowana na podstawie takiego schematu losowania różni się od próby prostej tym że zamiast elementów losowane są grupy elementów. Schemat ten jest stosowany zazwyczaj gdy nie można określić dokładnego operatu losowania a tylko spis grup populacji. Przykładem może tu być np. spis bloków na osiedlu.
Losowanie dwustopniowe Schemat losowania dwustopniowego polega na bezzwrotnym wylosowaniu g grup, przy czym każda próba losowana jest z takim samym prawdopodobieństwem jej wyboru Następnie z każdej tak wybranej grupy jest losowana bezzwrotnie próba prosta. Plan losowania jest określony wzorem:
Losowanie dwustopniowe c.d. Schemat losowania dwustopniowego ma zazwyczaj zastosowanie gdy jest populacja jest bardzo duża i liczba grup, które ją tworzą jest znaczna. Przykładem może być tu najpierw wylosowanie bloków na pewnym osiedlu. A z tych bloków losujemy jeszcze numery mieszkań.
Dziękuję za uwagę