Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Twarze sondażu ADI 2014 Twarze sondażu Henryk Banaszak Zakład Statystyki, Demografii i Socjologii Matematycznej.

Podobne prezentacje


Prezentacja na temat: "Twarze sondażu ADI 2014 Twarze sondażu Henryk Banaszak Zakład Statystyki, Demografii i Socjologii Matematycznej."— Zapis prezentacji:

1 Twarze sondażu ADI 2014 Twarze sondażu Henryk Banaszak Zakład Statystyki, Demografii i Socjologii Matematycznej

2 Czym jest sondaż: pytanie Pudło z kulkami dwóch kolorów, czerwonym i zielonym. Kul jest bardzo dużo. Nie jesteśmy w stanie ustalić koloru wszystkich kul. Chcemy wiedzieć jaką część stanowią kule zielone. Pudło z kulkami dwóch kolorów, czerwonym i zielonym. Kul jest bardzo dużo. Nie jesteśmy w stanie ustalić koloru wszystkich kul. Chcemy wiedzieć jaką część stanowią kule zielone. odpowiedź Pytanie: jaka jest frakcja (odsetek, procent, proporcja)zielonych kul w tym pudle? Możemy ustalić kolor pewnej liczby kul wyjętych z pojemnika. Ustalenie koloru każdej kuli wyjętej z pojemnika kosztuje

3 Czym jest sondaż: wymagania wobec odpowiedzi Jaka jest frakcja (odsetek, procent, proporcja)zi elonych kul w pojemniku? Pytanie Odpowiedź Trafna - odpowiedź ma być bliska stanowi rzeczy Wiarygodna – wykorzystam w pełni wszystkie informacje, za które zapłaciłem, nic istotnego dla jakości odpowiedzi nie zostanie pominięte ani zniekształceone Precyzyjna - z jak największą dokładnością, z jak najlepszym przybliżeniem Tania – jak najmniejszym kosztem.

4 Czym jest sondaż: składniki problemu i rozwiązania Przedmiot Zakres Cel Metoda Wynik Kolor kul odsetek kul zielonych 1.Wybiorę z pudła n kul 2.Wybierał będę losowo ze zwracaniem 3.Policzę, ile wśród wybranych jest kul zielonych – k 4.Wyznaczę odsetek zielonych wśród wybranych p=k/n 5.Na podstawie p udzielę odpowiedzi 1.Wybiorę z pudła n kul 2.Wybierał będę losowo ze zwracaniem 3.Policzę, ile wśród wybranych jest kul zielonych – k 4.Wyznaczę odsetek zielonych wśród wybranych p=k/n 5.Na podstawie p udzielę odpowiedzi Odpowiedź jest przedziałem [p –  ; p +  ]

5 Czym jest sondaż: parametry rozwiązania Trafność Wiarygodność Precyzyja Koszt poziom ufności wniosku Koszt = n* 1 color cost

6 Czym jest sondaż: proporcja kul a „sondaż prawdziwy” Problem proporcji zielonych w pojemnikuW badaniu sondażowe 1Pudło z kulami to Populacja 2Nieznany odsetek zielonych kul w pudle to Parametr populacji – frakcja zielonych 3Liczba kul wybranych z populacji - n to Liczebność próby pobranej z populacji - n 4Sposób wybierania kul z pudła to Schemat doboru próby (losowania) 5Wybranie kul to Realizacja badania sondażówego 6Ustalenie koloru kul wybranych Ustalenie wartości zmiennej kolor dla każdej wybranej kuli - pomiar 7 Wyznaczenie proporcji zielonych wśród wybranych to Analiza danych w próbie 8p=k/n – proporcja zielonych to Wynik w próbie – statystyka z próby 9Odpowiedź na pytanie to Wniosek na temat populacji 10 Sposob sformułowania odpowiedzi (szerokość przedziału) to Reguła wnioskowania na temat wartości parametru poulacji na podstawie próby

7 losowanie ze zwracaniem skład próby: k kulek zielonych Estymacja  obliczenia PopulacjaSchemat doboru próby Nieznana proporcja zielonych w populacji Znana własność próby wniosek dokładność Czym jest sondaż pytanie odpowiedź Metoda wnioskowania Czym jest sondaż: struktura logiczna

8 Sondaż jest badaniem statystycznym Przedmiot Zakres Cel Metoda Wynik populacja zestaw pytań na temat rozkładów zmiennych w populacji zestaw zmiennych służących do wyznaczenia odpowiedzi na pytania badanie próby pobieranej z badanej populacji według schematu opisywanego w kategoriach probabilistycznych

9 Dlaczego sondaż jest zawsze badaniem statystycznym Sondaż jest diagnozą stanu populacji przeprowadzaną w warunkach niepewności i ryzyka popełnienia błędu Przedmiotem każdego badania sondażowego jest zbiorowość, agregat statystyczny nazywany populacją, Stan populacji (diagnoza) jest sformułowany stosownie do jej specyfiki - w języku statystyki opisowej O stanie populacji wnioskuje się na podstawie wyników uzyskanych w rezultacie badania próby wylosowanej z populacji Wynik uzyskany w wylosowanej i zbadanej próbie jest zdarzeniem losowym Sposób losowania próby opisany jest w języku rachunku prawdopodobieństwa Reguły wnioskowania na temat populacji na podstawie wyniku w próbie są wywiedzione z twierdzeń statytyki inferencyjnej Reguły wnioskowania na temat populacji na podstawie stanu próby wynikają ze sposobu jej losowania i wymagań odnośnie poziomu wiarygodności i precyzji wniosków

10 Kostrukcja reguł wnioskowania statystycznego Pytanie Parametr rozkładu zmiennej X w populacji Schemat losowania póby Próba Prawdopodobieństwa inkluzji Wynik Statystyka z próby Dobry estymator parametru Założenia Liczebność póby Poziom ufności Dokładnośc oszacowania Rozkład estymatora Reguła wnioskowania

11 Kostrukcja reguł wnioskowania statystycznego: przykład ogólny Pytanie Parametr rozkładu zmiennej X w populacji Schemat losowania póby Próba Estymator Statystyka z próby Założenia Dokładność oszacowania Losowanie ze zwracaniem Każdy obiekt ma identyczne p-two inkluzji równe P(  h  S) = n/N Poziom ufności  = 0,95 Reguła wnioskowania Centralne twierdzenie graniczne Rozkład estymatora

12 Kostrukcja reguł wnioskowania: dwa przykłady empiryczne DaneZ populacji uprawnionych do głosowania wylosowano ze zwracaniem 400 osób. Wśród wylosowanych 250 zamierza wziąć udział w wyborach. Na poziomie ufności 0,95 oszacuj populacyjną proporcję deklaracji udziału w wyborach Wniosek DaneZ populacji uprawnionych do głosowania wylosowano ze zwracaniem 400 osób. Wśród wylosowanych 15 zamierza głosować na kandydata X. Na poziomie ufności 0,95 oszacuj populacyjną proporcję deklaracji głosowania na kandydata X Wniosek TO niemożliwe !!!!! Przykład 1 Przykład 2

13 Kostrukcja reguł wnioskowania nie zawsze jest prosta: W populacji Ω składającej się z N elementów jest nieznana liczba M elementów wyrożnionych. Oszacuj przedziałowo populacyjną frakcję  = M/N na podstawie wyniku w n-elementowej próbie pobranej z populacji Ω. Problem Rozwiązanie ogólne Rozwiązanie przykładu 2 Reguła wnioskowania Przedział ufności dla frakcji

14 Specyfika badania statystycznego Wynik badania jest parametrem statystycznym Wynik badania jest obciążony niepewnością Rozmiar niepewności można wyliczyć znając: 1.Własności operatu 2.Schemat doboru próby 3.Poziom non-response 4.Poziom braków odpowiedzi 5.Jakość realizacji (false records)

15 Sondaż jest usługą Usługą jest udzielenie odpowiedzi na pytania na temat populacji Usługę można wykonać dobrze lub źle Statystyczna ocena jakości usługi sondażowej sprowadza się do oceny dokładności populacyjnych oszacowań Niestatystyczne kryteria oceny jakości sondażu to 1.trafność 2.czas 3.koszt

16 Dobrze odpowiada na pytania Które zamawiający postawił Odpowiada trafnie Odpowiada wiarygodnie Odpowiada precyzyjnie Kosztuje nie więcej niż to niezbędne Trwa nie dłużej niż to niezbędne Dobrze odpowiada na pytania Które zamawiający postawił Odpowiada trafnie Odpowiada wiarygodnie Odpowiada precyzyjnie Kosztuje nie więcej niż to niezbędne Trwa nie dłużej niż to niezbędne Sondaż dobrej jakości

17 Niezbędne elementy dobrego sondażu Dobry kwestionariusz: dobra teoria, trafne wskaźniki, dobre modele pomiarowe Umiejętność konstruowania dobrego kwestionariusza w pełni załuguje na określenie „sztuka”. Trzeba się jej nauczyć, najlepiej na cudzych błędach. Kopalnia inspiracji są kwestionariusze stosowane w badaniach rynkowych Dobra próba losowa – optymalne warstwowanie, optymalna alokacja, małe wariancje estymatorów Warto czasmi wydać nieco środków na zdobycie takich informacji o pulacji, które umożliwią zoptymalizować stosunek dokładności oszacowań do liczebności próby oraz kosztów terenowej realizacji badania. Zważywszy, że znaczną część kosztow realizacji stanowią dojazdy ankietera do osoby wylosowanej, warto uwzględnić ten czynnik na etapie alokacji próby. Dobra realizacja – wysoki response rate, równomierność realizacji, niski poziom braków danych, niska stopa oszustw, brak efektu ankieterskiego Szansę na szybką i wysokiej jakości realizację dają tylko agencje badawcze z wystaczającymi zasobami o doświadczeniem. Niestety, agencje takie są duże i mają nad nad klientem przewagę kompetencji, co utrudnia wyegzekwowanie niezbędnej jakości realizacji. Dobra analiza danych - adekwatny opis statystyczny i poprawne wnioskowanie Analizę danych powinna wykonywac ta sama osoba, która brała udział w projektowaniu badania. Musi mieć statystyczne i metodologiczne kwalifikacje. Dobry kwestionariusz: dobra teoria, trafne wskaźniki, dobre modele pomiarowe Umiejętność konstruowania dobrego kwestionariusza w pełni załuguje na określenie „sztuka”. Trzeba się jej nauczyć, najlepiej na cudzych błędach. Kopalnia inspiracji są kwestionariusze stosowane w badaniach rynkowych Dobra próba losowa – optymalne warstwowanie, optymalna alokacja, małe wariancje estymatorów Warto czasmi wydać nieco środków na zdobycie takich informacji o pulacji, które umożliwią zoptymalizować stosunek dokładności oszacowań do liczebności próby oraz kosztów terenowej realizacji badania. Zważywszy, że znaczną część kosztow realizacji stanowią dojazdy ankietera do osoby wylosowanej, warto uwzględnić ten czynnik na etapie alokacji próby. Dobra realizacja – wysoki response rate, równomierność realizacji, niski poziom braków danych, niska stopa oszustw, brak efektu ankieterskiego Szansę na szybką i wysokiej jakości realizację dają tylko agencje badawcze z wystaczającymi zasobami o doświadczeniem. Niestety, agencje takie są duże i mają nad nad klientem przewagę kompetencji, co utrudnia wyegzekwowanie niezbędnej jakości realizacji. Dobra analiza danych - adekwatny opis statystyczny i poprawne wnioskowanie Analizę danych powinna wykonywac ta sama osoba, która brała udział w projektowaniu badania. Musi mieć statystyczne i metodologiczne kwalifikacje.

18 Kwestionariusz Kwestionariusz – Próba – Realizacja – Analiza danych

19 model pomiarowy (estymacja parametru populacji) Cecha ukryta Dobry kwestionariusz: dobra teoria, trafne wskaźniki, dobre modele pomiarowe

20 Szacowanie frekwencji wyborczej w wyborach parlamentarnych Czy zamierza Pan(i) wziąć udział w wyborach w najbliższą niedzielę? 1. Tak 2. Nie 3. Nie wiem Jak Pan(i) sądzi, jaka będzie frekwencja w wyborach w najbliższą niedzielę? Jak Pan(i) sądzi, jaka będzie frekwencja w wyborach w najbliższą niedzielę? |___| % % odpowiedzi TAK Średnia odsetków podawanych przez respondentów

21 Wyznaczanie ceny produktu, przy której oczekiwana liczba nabywców będzie największa 1.Przy jakiej cenie uznałbyś produkt za zbyt tani, aby mógł być dobrej jakości? (Cheap) 2.Przy jakiej cenie uznałbyś produkt za tani, ale odpowiedniej jakości? (Too Cheap) 3.Przy jakiej cenie uznałbyś produkt za drogi, ale wart ewentualnego zakupu? (Expensive) 4.Przy jakiej cenie uznałbyś produkt za zbyt drogi i nie wart zakupu? (Too Expensive) 1.Przy jakiej cenie uznałbyś produkt za zbyt tani, aby mógł być dobrej jakości? (Cheap) 2.Przy jakiej cenie uznałbyś produkt za tani, ale odpowiedniej jakości? (Too Cheap) 3.Przy jakiej cenie uznałbyś produkt za drogi, ale wart ewentualnego zakupu? (Expensive) 4.Przy jakiej cenie uznałbyś produkt za zbyt drogi i nie wart zakupu? (Too Expensive) kwota średnia środkowa Za ile kupiłbyś produkt? |_______| zł

22 Socio-Economic-Index: skala społeczno-ekonomicznego statusu zawodu

23 Cecha ukryta: poziom zadowolenia Z Cecha ukryta: poziom zadowolenia Z X1X1 X2X2 X3X3 X4X4 Jak bardzo zadowolony(a) jest Pan(i) Y Wskaźniki typu „skutki”Wskaźniki typu „źródła” ze swoich sąsiadów z poziomu czystości z zaopatrzenia sklepów z placówek kulturalnych z poziomu bezpieczeństwa X5X5 Biorąc to wszystko pod uwagę, proszę powiedzieć, jak Panu(i) się żyje w Pana(i) okolicy? Wyznacz takie wartości Z, które najlepiej przewidują odpowiedź Y Skalowanie złożone: poziom zadowolenia z …. Jak bardzo zadwolony(a) jest Pan(i) ze swojego miejsca zamieszkania ? 1.Bardzo zadowolony(a) 2.Zadowolony(a) 3.Niezadowolony(a) 4.Bardzo niezadowolony(a) 1.Bardzo zadowolony(a) 2.Zadowolony(a) 3.Niezadowolony(a) 4.Bardzo niezadowolony(a) % odpowiedzi 1, 2

24 poziom wymagań względem usługi wskaźniki jakości poziom satysfakcji z usługi skargi na jakość usługi i sposób ich załatwiania zaufanie do jakości usługi w przyszłości Q1 ogólne oczekiwania Q6 ogólna satysfakcja Q11 polecanie usługi innym Q7 spełnianie oczekiwań Q8 porównanie z ideałem Q5 ogólna ocena jakości Q2 ocena jakości wymiaru 1 Q3 ocena jakości wymiaru 2 Q4 ocena jakości wymiaru 3 Q9 czy złożył skargę Q10A/B reakcja na skargę Q12 wiara w stabilność poziomu jakości odczuwana jakość usługi Skalowanie złożone: American Consumer Satisfaction Index (ACSI) Jak bardzo zadwolony(a) jest Pan(i) z usługi? 1.Bardzo zadowolony(a) 2.Zadowolony(a) 3.Niezadowolony(a) 4.Bardzo niezadowolony(a) 1.Bardzo zadowolony(a) 2.Zadowolony(a) 3.Niezadowolony(a) 4.Bardzo niezadowolony(a) % odpowiedzi 1, 2 Model pomiarowy ACSI dla usług

25 Skalowanie poziomu ekonomicznego i kulturowego kapitału jednostki Źródła kapitału ekonomicznego Kapitał sieciowy Manifestacje kapitału ekonomicznego Źródła kapitału kulturowego Manifestacje kapitału kulturowego Model skalowania strukturalnego inspirowany przez teorię Bourdieu Wskaźniki KE-in KE-out KK-in KK-out KE-in KE-out KK-in KK-out Liczba samochodów w gosp dom. Doch na 1 os w gosp dom Głowa rodziny kieruje pracą innych Liczba pracujących w gosp dom Resp pracuje w sektorze prywatnym Resp prowadzi własną firmę Samoocena sytuacji materialnej obecnej Wyjazd podczas urlopu Oczekiwana sytuacja materialna za 5 lat Wyjazd urlopowy za granicę Korzystanie z prywatnej służby zdrowia Zasoby czasu wolnego Wykszt resp Wykszt matki respo Liczba książek w gosp dom Wykszt głowy gosp dom Wykszt ojca resp Liczba DVD w gosp dom Liczba CD w gosp dom Poziom kompetencji komputerowej (skala) Liczba opanowanych jezyków obcych Rachunek bankowy obsługiwany internetowo Intensywność używania internetu Liczba przeczytanych książek Intensywność używania komputera Wskaźniki

26 Próba Kwestionariusz – Próba – Realizacja – Analiza danych

27 1)o wyborze obiektów do badania, decyduje mechanizm losowy o znanych własnościach, a w konsekwencji: 2)każdy obiekt populacji ma dającą się obliczyć szansę (prawdopodobieństwo) bycia wylosowanym, nazywaną prawdopodobieństwem inkluzji a w konsekwencji: 3)dla każdego składu próby (rezultatu losowania) daje się obliczyć prawdopodobieństwo jego uzyskania, a w konsekwencji: a)umożliwia obliczenie dokładności oszacowań parametrów populacji przy założonym schemacie doboru próby i założonym poziomie ufności wniosku, b)pozwala na ustalenie minimalnej liczebności próby niezbędnej do osiągnięcia założonej dokładności oszacowań błędu przy założonym schemacie doboru próby i założonym poziomie ufności wniosku Probabilistyczny sposób doboru próby

28 §Wynik losowania próby jest zdarzeniem losowym. §Wartości parametrów statystycznych wyznaczonych w próbie również są zdarzeniami losowymi. §Jeśli zdarzenie losowe jest charakteryzowane za pomocą liczb, mamy do czynienia ze zmiennymi losowymi. §Znajomość rozkładów prawdopodobieństwa na zbiorze rezultatów badania statystycznego, tak zwanych statystyk z próby, jest niezbędna do uzasadnienia reguł wnioskowania statystycznego. §Wnioskowanie statystyczne jest możliwe dzięki temu, iż rozkłady statystyk z próby bywają zbliżone do rozkładów zmiennych losowych dobrze znanych w rachunku prawdopodobieństwa. §Zbieżność rozkładów statystyk z póby badają zawodowi matematycy (specjaliści w zakresie raachunku prawdopodobieństwa) a rezultaty ich badań noszą nazwę twierdzeń granicznych Przy losowym doborze próby

29 Rozkład normalny  =10 Kwestionariusz – Próba – Realizacja – Analiza danych

30 Rozkład normalny standaryzowany  x Kwestionariusz – Próba – Realizacja – Analiza danych

31 Rozkład chi-kwadrat dla kilku stopni swobody r Kwestionariusz – Próba – Realizacja – Analiza danych

32 Forma twierdzeń granicznych Wraz ze wzrostem liczby losowanych obiektów rozkłady prawdopodobieństwa wyników badania statystycznego stają się tak podobne do rozkładów pewnych zmiennych losowych, że można używać tych zmiennych jako podstawy do estymacji parametrów populacji i testowania hipotez na jej temat Kwestionariusz – Próba – Realizacja – Analiza danych

33 próba nrskładpróbyX1X2średnia 1a1 11 1 2 a212 1,5 3a1a312 1,5 5a2a121 1,5 9a3a121 1,5 4a1a413 2 6a2 22 2 7 a322 2 10a3a222 2 11a3 22 2 13a4a131 2 8a2a423 2,5 12a3a423 2,5 14a4a232 2,5 15a4a332 2,5 16a4 33 3 Populacja a1a1 a2a2 a3a3 a4a4 Zmienna 1223

34 Twierdzenie o zbieżności rozkładu średniej z próby do rozkładu normalnego (CTG) Błąd oszacowania Minimalna liczebność próby Kwestionariusz – Próba – Realizacja – Analiza danych Przykład twierdzenia granicznego dla średniej z próby

35 Dokładność oszacowań frakcji populacyjnej a wielkość losowej próby

36 Wnioskowanie: dwa przykłady empiryczne DaneZ populacji uprawnionych do głosowania wylosowano ze zwracaniem 400 osób. Wśród wylosowanych 250 zamierza wziąć udział w wyborach. Na poziomie ufności 0,95 oszacuj populacyjną proporcję deklaracji udziału w wyborach Wniosek DaneZ populacji uprawnionych do głosowania wylosowano ze zwracaniem 400 osób. Wśród wylosowanych 15 zamierza głosować na kandydata X. Na poziomie ufności 0,95 oszacuj populacyjną proporcję deklaracji głosowania na kandydata X Wniosek TO niemożliwe !!!!! Przykład 1 Przykład 2

37 Kostrukcja reguł wnioskowania nie zawsze jest prosta: W populacji Ω składającej się z N elementów jest nieznana liczba M elementów wyrożnionych. Oszacuj przedziałowo populacyjną frakcję  = M/N na podstawie wyniku w n-elementowej próbie pobranej z populacji Ω. Problem Rozwiązanie ogólne Rozwiązanie przykładu 2 Reguła wnioskowania Przedział ufności dla frakcji

38 Proporcja w populacji Minimalny rozmiar próby  n 0,50 30 0,40 50 0,30 80 0,20 200 0,10 600 0,05 1400 Źródło: W.G.Cochran, Sampling Techniques, John Wiley and Sons, New York, 1953, s..41 Granice stosowalności CTG w estymacji populacyjnej frakcji

39 Wnioskowanie przy złożonych schematacch doboru próby Complex sampling Stratified sampling: fix the number sampled from a population stratum Cluster sampling: recruit participants in clusters, eg, to reduce travel time between interviews Unequal probability: oversample important subgroups, eg. high-poverty neighbourhoods Individuals are sampled with known probabilities  i Estimation of population total CLUSTERS; SAMPLING ERROR; DESIGN EFFECT; STANDARD ERROR; INTRACLASS CORRELATION; SAMPLE DESIGN; SAMPLING VARIANCE; SUBCLASS ANALYSIS; STRATIFICATION

40 Kish, Frankel (1974)

41 Sarndal (1992)

42 Losowy dobór prób – problemy praktyczne Jakość operatu a dokładność oszacowań Schemat doboru: – koszt i czas realizacji – dokładność oszacowań Kwestionariusz – Próba – Realizacja – Analiza danych

43 Operaty (Sarndal, 1992)

44 Operat = lista wszystkich obiektów badanej populacji Losowy dobór w praktyce - operat losowania Powinien być:Może być kompletny o dziurawy, nie obejmuje populacji, ignoruje istone i duze kategorie obiektów; (np. lista abonentów TPSA nie jest operatem dla populacji dorosłych Polaków) o skrzywiony; dziurawy systematycznie - zawiera dane o wielu obiektach pewnego rodzaju a niewiele o innych; (np. Lista prenumeratorów pisma jest złym operatem dla populacji jego czytelników), bezbłędny o niedokładny; ma wysoką stopę błędów w danych (zdarza się często, gdy lista jest tworzona przez obiekty populacji) aktualny o nieaktualny (migracje ludzi, likwidacja lub zmiany profilu firm, zmiany struktury zatrudnienia) Kwestionariusz – Próba – Realizacja – Analiza danych

45 Dostępne operaty dla prób ogólnopolskich PESELCentralny system ewidencji meldunkowej Zawiera informację o zameldowaniu a nie o faktycznym zamieszkiwaniu Stopa błędnych danych adresowych nie przekracza 5% Pozwala dokładnie kontrolować ankieterów Pozwala dokładnie wyznaczać response rate Konieczne złożone schematy doboru próby celem uniknięcia nadmiernych kosztów realizacji (dojazdy ) GUS – spis mieszkań  Prawie 100%-owa aktualność (mieszkania nie migrują)  Konieczne losowanie osoby z wylosowanego mieszkania – ankieter decyduje o tym, kto zostaje respondentem  Utrudniona kontrola pracy ankieterów Lokalne spisy wyborców  Starzeją się – migracje  Nieznana stopa błędów  Trudno dostępny (administracja) Kwestionariusz – Próba – Realizacja – Analiza danych

46 Schematy doboru prób Dobór prosty zależny po jednym obiekcie z badanej zbiorowości (jak liczby w normalnym lotku): przykłady: adresowa próba osób zamieszkałych we wskazanej gminie (uzyskiwana z PESEL,), próba mieszkań z rejonu spisowego (GUS); Dobór taki w postaci czystej dla badań ogólnopolskich nie jest stosowany - można by otrzymać np. 1000- osobową próbę rozrzuconą między 1000 miejscowości. Dobór prosty systematyczny „co k-ty obiekt wylosowany” - np. co 40-ty wychodzący z lokalu wyborczego. losuje się jedną tylko liczbę (od 1 do k) określającą punkt startowy; przykłady: co któryś wychodzący ( exit poll), stosowany także w badaniach audytoriów kinowych; Dobór zespołowy zbiorowość podzielona jest na zespoły (części) - losuje się części i potem bada wszystkie obiekty, które do nich należą; np. losowanie klas szkolnych (bada się wszystkich uczniów w klasie) Dobór wielostopniowy: warstwowy: najpierw dzieli się zbiorowość na rozłączne części - warstwy (np. na regiony, województwa, na część miejską i wiejską), a potem losuje obiekty z każdej z warstw osobno (być może nawet dla każdej w inny sposób); zazwyczaj celem badania jest szacowanie parametrów warstwy jak i populacji generalnej. zespołowy: losuje się najpierw zespół a potem z zespołu losuje się obiekty. Np. losujemy gminy (miejscowości) a potem osoby w nich zamieszkałe. Kwestionariusz – Próba – Realizacja – Analiza danych

47 Schematy doboru prób Kwestionariusz – Próba – Realizacja – Analiza danych

48 Próba adresowa gospodarstw domowych i schemat Kish Jednostką losowania jest mieszkanie losowane z operatu GUS W wylosowanym mieszkaniu ankieter przeprowadza mikrospis członków gospodarstwa domowego Po przeprowadzeniu mikrospisu ankieter wybiera (przy użyciu tabel z liczbami losowymi) losowo członka gospodarstwa, który staje się respondentem Wady: Trudność kontroli jakości mikrospisu trudność kontroli przyczyn niezrealizowania wywiadu Konieczność wyznaczania wag analitycznych post-factum Losowo-kwotowy dobór prób w badaniach typu OMNIBUS Populację dzieli się na warstwy terytorialne i klasy wielkości miejscowości Dla każdej z warstw losuje się taką liczbę gmin jaka wynika z założonego sposobu podziału próby między warstwy, W każdej z wylosowanych gmin ankieter rekrutuje respondentów zgodnie z listą ich profili definiowaną przez kryteria doboru (płeć, wiek, wykształcenie i ewentualne kryteria dodatkowe) Nielosowość doboru ogranicza się tu do wąskiej warstwy osób spełniających wszystkie kryteria rekrutacji Popularne złożone schematy doboru prób Kwestionariusz – Próba – Realizacja – Analiza danych

49 Dobór nielosowy Cechy doboru celowego: o składzie badanej próby decydują badacz (określa kryteria doboru) i ankieter - wybiera spośród obiektów spełniających kryteria, do określenia kryteriów doboru dla każdego respondenta potrzebna jest wiedza o łącznych rozkładach cech w interesującej badacza zbiorowości - należy ją zdobyć zwykle za pomocą badań na próbach losowych. Dobór losowo-kwotowy: losowa alokacja terytorialna (miasto-wieś, regiony, województwa, gminy wiejskie, miejskie) a następnie celowy dobór respondentów Pożądane własności nielosowych metod doboru: uzyskanie “dobrego przedstawicielstwa” populacji ze względu na ważne dla nas cechy, czyli reprezentatywności grupy zbadanej w przedmiotowym sensie. Pożądane własności nielosowych metod doboru: uzyskanie “dobrego przedstawicielstwa” populacji ze względu na ważne dla nas cechy, czyli reprezentatywności grupy zbadanej w przedmiotowym sensie. Dobrze skonstruowana próba kwotowa (dobierana celowo) daje niekiedy dokładniejsze oszacowania niż mało liczna próba losowa. Kwestionariusz – Próba – Realizacja – Analiza danych

50 LiczebnościPŁEĆ WYKSZTKobietaMężczyznaGrand Total podstawowe213 średnie4610 wyższe123 Grand Total7916 LiczebnościPŁEĆ WIEKKobietaMężczyznaGrand Total 15-19 lat101 20-29 lat134 30-39 lat213 40-49 lat235 50-59 lat112 60-64 lat011 Grand Total7916 LiczebnościWYKSZT WIEKpodstawoweśredniewyższe Grand Total 15-19 lat1001 20-29 lat1214 30-39 lat0303 40-49 lat0415 50-59 lat1012 60-64 lat0101 Grand Total310316 GMINAPŁEĆWYKSZTWIEK Warszawa-BemowoKobietaśrednie40-49 lat Warszawa-BemowoMężczyznaśrednie20-29 lat Warszawa-BemowoKobietawyższe20-29 lat Warszawa-BemowoMężczyznawyższe40-49 lat BolesławiecKobietapodstawowe15-19 lat BolesławiecMężczyznaśrednie30-39 lat BolesławiecMężczyznaśrednie60-64 lat BolesławiecKobietaśrednie30-39 lat BydgoszczMężczyznaśrednie20-29 lat BydgoszczKobietaśrednie40-49 lat BydgoszczMężczyznaśrednie40-49 lat BydgoszczMężczyznawyższe50-59 lat Bystrzyca KłodzkaKobietaśrednie30-39 lat Bystrzyca KłodzkaMężczyznaśrednie40-49 lat Bystrzyca KłodzkaKobietapodstawowe50-59 lat Bystrzyca KłodzkaMężczyznapodstawowe20-29 lat Próba losowo-kwotowa: konstrukcja Kwestionariusz – Próba – Realizacja – Analiza danych

51 Warto stosować losowo-kwotowe gdy:  Rozkłady zmiennych zależnych zależą silnie od regionu (typu) miejsca zamieszkania  Rozkłady zmiennych zależnych zależą silnie od tych cech, które mogą być kryteriami doboru respondentów (płeć, wiek, wykształcenie);  Rozkłady łączne cech doboru respondentów w populacji są dostępne i wiarygodne,  Target group stanowi niewielką część populacji generalnej lecz jego członkowie daja się łatwo (najlepiej bez pytania) zidentyfikować - wówczas przynależność do target group może być dodatkowym kryterium selekcji Kiedy warto stosować próby kwotowe Kwestionariusz – Próba – Realizacja – Analiza danych

52 Sondaże złe oraz nie-sondaże Sonda telefoniczna (na losowej próbie abonentów) RDD Populacja posiadaczy telefonów stacjonarnych różni się istotnie od populacji dorosłych Polaków; Wyniki sondażu nie dają się uogólnić na całą populację dorosłych Polaków (operat jest niepełny i skrzywiony) Ankieta pocztowa (oparta na imiennej próbie adresowej) Response rate rzadko przekracza 20% a nigdy 40%, co czyni wyniki bezwartościowymi Ankieta umieszczana w gazecie (periodyku), Sondaż internetowy, Ankieta uliczna, Audio-tele (SMS-y) Nielosowy dobór uczestników badania – potencjalny respondent sam decyduje czy weźmie udział w badaniu czy nie; Nie można ustalić response rate ani dokładności oszacowań Nie wiadomo jaką zbiorowość reprezentują zebrane odpowiedzi Kwestionariusz – Próba – Realizacja – Analiza danych

53 Firma badawcza X GUS NSP2002 WieśM-WMiastoRazem WieśM-WMiastoRazem 1 dolnośląskie76,4%-1,3%75,1%75,5% 57,7% 21,8% 79,5%74,1% 2 kujawsko-pomorskie70,7%-3,1%67,6%68,8% 53,2% 23,7% 77,0%69,2% 3 lubelskie73,6%10,4%84,0%78,8% 57,5% 20,1% 77,6%67,5% 4 lubuskie62,7%14,6%77,3%72,2% 61,5% 15,9% 77,5%72,4% 5 łódzkie63,5%5,9%69,4%67,4% 54,5% 20,8% 75,3%69,1% 6 małopolskie70,1%12,0%82,1%76,3% 67,2% 13,9% 81,1%75,3% 7 mazowieckie72,4%2,0%74,4%73,8% 58,0% 25,1% 83,1%75,6% 8 opolskie75,6%-0,3%75,3%75,4% 54,3% 13,9% 68,3%62,3% 9 podkarpackie70,9%15,7%86,5%77,4% 56,0% 26,8% 82,8%68,4% 10 podlaskie70,1%-1,7%68,3%69,0% 61,2% 19,0% 80,2%73,2% 11 pomorskie69,7%10,6%80,3%77,1% 55,4% 23,4% 78,7%72,6% 12 śląskie71,8%0,8%72,7%72,5% 57,2% 12,2% 69,4%67,2% 13 świętokrzyskie59,1%18,5%77,6%68,3% 44,5% 32,3% 76,8%60,9% 14 warmińsko-mazurskie60,9%12,1%73,0%68,2% 54,5% 15,9% 70,4%64,7% 15 wielkopolskie72,0%0,4%72,4%72,3% 67,0% 12,6% 79,6%75,1% 16 zachodniopomorskie56,1%14,2%70,3%66,3% 59,4% 16,9% 76,3%71,9% razem 69,6%5,2%74,8%72,9% 58,2% 19,0% 77,2%71,0% Pułapki sondaży telefonicznych min (M-W) -3,1% MAX (M-W) 18,5% min (M-W) 12,2% MAX (M-W) 32,3% Kwestionariusz – Próba – Realizacja – Analiza danych

54 Realizacja

55 Kwestionariusz – Próba – Realizacja – Analiza danych Sposoby komunikacji z respondentem i ich własności: PAPI – CAPI – CATI - WAPI Czy ankieterzy oszukują Efekt ankieterski. Dlaczego CAPI. Lekarstwo na złą realizację - terenowa kontrola jakości pracy ankieterów

56 Kryteria oceny jakości realizacji JAKOŚĆ KOSZTUJE Nie istnieją sondaże szybkie, tanie i dobrze zrealizowane

57 Jak pytać: CAPI Możliwość drobiazgowej kontroli ankietera Komputerowa rejestracja przebiegu wywiadu czas rozpoczęcia i zakończenia wywiadu – czas trwania wywiadu czas reakcji na poszczególne pytania długość przerwy między wywiadami Eliminacja efektu ankieterskiego

58 Kontrola jakości pracy ankietera Systematyczna: – wywiady zrealizowane – non-response (adresy osób wylosowanych) Zobiektywizowana: – Metodą F2F: kontroler dociera do respondenta lub osoby wylosowanej do badania, od której wywiadu nie uzyskano – Przeprowadzana przez firmę zewnętrzną Systematyczna: – wywiady zrealizowane – non-response (adresy osób wylosowanych) Zobiektywizowana: – Metodą F2F: kontroler dociera do respondenta lub osoby wylosowanej do badania, od której wywiadu nie uzyskano – Przeprowadzana przez firmę zewnętrzną

59 Konsekwencje dobrej kontroli Eliminacja wywiadów zrealizowanych budzących wątpliwości ankieterów, koordynatorów mało sprawnych, nierzetelnych systematyczna poprawa jakości danych Koszt kontroli

60 Populacja n -elementowa próba wylosowana z populacji Niedostępni, n 2 Zbadani, n 1 Response rate = = Response rate a dokładność oszacowań próba

61 Response rate a dokładność oszacowań Populacja dostępnychPopulacja nie-dostępnych n = 2000 n 1 = 1600 n 2 = 400 Quasi-przedział ufności dla frakcji populacyjnej

62 resp rate 95 90 85 80 75 70 wielkość próby dokładność przy 100%- owej realizacji próby optympesymoptympesymoptympesymoptympesymoptympesymoptympesym 10010,012,012,212,614,513,116,713,418,913,721,213,823,4 4005,06,07,46,39,76,512,16,714,56,816,86,919,2 9003,34,05,74,28,24,410,64,513,04,615,44,617,8 16002,53,04,93,27,43,39,83,412,23,414,73,517,1 Response rate a dokładność oszacowań populacyjnej frakcji optymistyczny rozkład w niezrealizowanej części próby 50% +/- 1/  n 2 pesymistyczny rozkład w niezrealizowanej części próby 50% +/- 50%

63 Do you think, woman should have the possibility of legal abortion, when: 1 Yes2 No8 DK p1p1   00 0-0- 0+0+ THERE IS STRONG CHANCE OF SERIOUS DEFECT of A CHILD 81,910,77,488%1,61%11,3%81%69,5%92,0% SHE IS MARRIED AND DOES NOT WANT ANY MORE CHILDREN 46,040,313,753%2,60%12,1%53%40,5%64,7% THE WOMAN'S OWN HEALTH IS SERIOUSLY ENDANGERED BY THE PREGNACY 84,58,47,191%1,44%11,2%83%71,6%93,9% FANY MORE CHILDREN 53,733,712,761%2,52%12,0%59%47,1%71,2% SHE BECAME PREGNANT AS RESULT OF RAPE 76,813,010,185%1,80%11,4%78%66,9%89,8% SHE IS NOT MARRIED AND DOES NOT WANT TO MARRY THE MAN 40,045,414,647%2,61%12,1%47%35,4%59,5% IF THE WOMAN WANTS IT FOR ANY REASON 38,748,013,345%2,58%12,1%46%33,6%57,8% n=2000; n 1 =1640 Response rate a przewidywanie wyników referendum Dane: PGSS 1992

64 Dokładność oszacowań w praktyce i piśmiennictwie Pojęcie „błędu” jest niepotrzebne wystarczy pojęcie „dokładności oszacowania” 1.Błąd pokrycia (coverage error) 2.Błąd wynikający ze schematu losowania (sampling error) 3.Błąd powodowany przez niepełną realizację próby (nonresponse error) 4.Błąd pomiaru (measurement error) spowodowany przez: 1.„efekt ankieterski” ( effects of interviewers on the respondents’ answers); 2.„efekt respondenta” (error due to respondents) pojawiający się, gdy respondent nie jest w stanie odpowiedzieć na pytanie (na przykład gdy nie rozumie jego treści) 3.„efekt złych pytań kwestionariuszowych” (error due to the weaknesses in the wording of survey questionnaires) 4.„efekt metody kontaktu z respondentem” (error due to effects of the mode of data collection) Groves (2004; str vi) : Weisberg (2005, str 2)

65 „Survey error” (Sarndal, 1992) Non-sampling errors Undercoverage Non-response

66 Statistics and survey sampling: Sarndal, 1992

67 1. wady operatu 2. złożoność schematu doboru próby 3. poziom non-response 4. stopa braków danych 5. poziom fałszerstw ankieterskich 1. wady operatu 2. złożoność schematu doboru próby 3. poziom non-response 4. stopa braków danych 5. poziom fałszerstw ankieterskich Dokładność oszacowań Dokładność sondażowych oszacowań

68 Populacja Schemat doboru próby Próba wylosowana lista obiektów populacji Operat Złożony wielstopniowy Dziurawa, stara Próba zbadana Non- response (400) No answer (30%) False responses (5%) Field-work Źródła obniżania precyzji oszacowań 1 2 3 4 5 2000 1600 Kostrukcja reguł wnioskowania nie zawsze jest prosta Nierówne p-twa inkluzji

69 Społeczny kontekst badań sondażowych

70 O czym sa sondaże Kto sondaże zamawia Po co zamawiane są sondaże Sondaż – przedsięwzięcie multi-dyscyplinarne Sondaż – niezbędne kwalifikacje zespołu Zamawianie sondażu – podział kompetencji Zamawianie sondażu – gra z wykonawcą

71 O czym są sondaże Prosta proporcja - polityków popularności wzrosty u spadki..... Zasięg pisma, segmentacja klientów: kim oni są i czym się różnią od siebie Badania cenowe - ile klienci zechcą zapłacić. Czym kierują się konsumenci kupując produkt - conjoint Dobra matura - dylematy kalibracji pytań testowych Budżet czasu - kiedy studenci Warszawy zasypiają satysfakcja konsumenta ocena jakości rządzenia Postawa wobec obcych

72 Kto zamawia sondaż nadawca, wydawca, dziennikarz urzędnik publicznej administracji sprzedawca, producent, agencja reklamowa naukowiec, zazwyczaj socjolog

73 Rynek Rozpoznanie klientów obecnych i potencjalnych (segmentacja, szacowanie popytu), wyznaczanie optymalnych cen produktów, ocena efektywności kampanii reklamowej Administracja Nauka Test hipotez teoretycznych, eksploracja struktury populacji, identyfikacja trendów, modelowanie dynamiki populacji (nauki społeczne, medyczne) Po co zamawia (teoria) Media Diagnoza potrzeb, ocena efektywności programów (unijnych), konsultacje decyzji, ocena jakości usług publicznych Aby poinformować widownię o jej preferencjach, nastrojach, ocenach wydarzeń, instytucji i osób

74 Za co płaci (praktyka) Rynek Administracja Nauka Media Aby podjąć optymalne decyzje o inwestycjach, polityce cenowej, kampanii relamowej Rozszerzyć lub zweryfikować wiedzę o populacji Aby wydać środki zaplanowane na badanie Aby utrzymać lub zwiększyć swoje audytorium: liczbę widzów, czytelników Kto potrzebuje sondażu dobrej jakości aby osiągnąć swój faktyczny cel ?

75 Sondaż: przedsięwzięcie multi-dyscyplinarne

76 Dobór próby Teoria zjawiska Teoria pomiaru Teoria skalowania Dobór wskaźników Pytania statystyczne „KWESTIONARIUSZ” Precyzja oszacowań Zmienne statystyczne Statystyczne odpowiedzi na statystyczne pytania Interpretacja wyników analiz w teorii zjawiska Analiza danych kompetencje statystyczne Fieldwork Estymacja Ankieterzy Sondaż – przedsięwzięcie multi-dyscyplinarne

77 Zamawianie sondażu – podział kompetencji

78 Operat Jakość realizacji badania Schemat doboru próby False records Missing values Response-rate Pominięte pytanie Odmowa odpowiedzi Liczebność Fieldwork Kwestionariusz Projekt Statystyczna wersja pytań zamawiającego Próba Wstępny projekt Pilotaże Czas trwania wywiadu Przetarg Kryteria wyboru oferty SIWZ + Umowa Realizacja Kontrola ankieterów Monitoring jakości Analiza danych Raport Dokumentacja badania Dokumentacja realizacji Przyczyny non-responsów Błędy operatu Metoda wywiadu

79 Zamawiający Zadaje pytania o stan populacji: JAK/CZY Dobiera wskaźniki – definiuje zmienne - konstruuje kwestionariusz Definiuje dopuszczalny poziom dokładności oszacowań Przekłada swoje pytania na pytania statystyczne Statystyk zamawiającego Szuka operatu doboru próby Projektuje optymalny dla operatu i kosztów badania schemat doboru próby Wyznacza wielkość błędu oszacowań z uwzględnieniem czynników 1,2,3,4,5 Uczestniczy w interpetacji wyników analizy danych Definiuje jakościowe kryteria wykonania „field-work” (przetarg) Podział zadań i odpowiedzialności

80 Taki podział ról i zadań jest możliwy, gdy

81 Budżet badania sondażowego: co kosztuje

82 Zamawia sondaż: instytucja publiczna Płaci za projekt i wykonanie sondażu: podatnik PRZETARG: projektant realizacja projekt wykonawca Jakość odpowiedzi na pytania zamawiającego Budżet badania Ile i co kosztuje

83 Jakość realizacji Jakość (możliwości) potencjalnego wykonawcy – jaki poziom jakości daje się osiągnąć w praktyce Wymagania zamawiającego zamówienie SIWZ budżet

84 Dokładność oszacowań Operat Jakość realizacji badania Schemat doboru próby False records Missing values Response-rate Pominięte pytanie Odmowa odpowiedzi Wielkość próby Koszt dojazdów Fieldwork Kwestionariusz Czas trwania - koszt 1 wywiadu Koszt operatu Koszt realizacji Koszt jakości Projekt Raport Koszt projektowania Zewnętrzna kontrola ankieterów wykonawcy Koszt kontroli jakości realizacji

85 Błędne przeświadczenia zamawiających Przedmiotem zamówienia jest pewna liczba dostarczonych zapisów wywiadów Agencja badawcza potrafi odpowiedzieć na pytania zamawiającego Agencja badawcza potrafi dopasować „metodologię” do potrzeb zamawiającego Zamawiający, który nie potrafi określić „metodologii” dopasowanej do własnych potrzeb potrafi ocenić „metodologie” oferowane przez potencjalnych wykonawców Cena jest racjonalnym kryterium wyboru wykonawcy sondażu Istnieją tanie sondaże dobrej jakości, szybko i dobrze wykonane W sondażu z wykorzystaniem ogólnopolskiej imiennej próby adresowej można osiągnąć response rate powyżej 50% płacąc za 1 wywiad nie więcej niż 100 PLN Dobry sondaż można zaprojektować, zamówić, skontrolować i opracować bez udziału statystyka „Sondaż” jest dyscypliną naukową

86 Zamawianie sondażu – gra zamawiającego z wykonawcą Asymetria kompetencji: wykonawca – specjalista od sondaży; zamawiający – laik, który nie zawsze wie, po co zamawia sondaż Strategia zamawiającego – ufam, że usługa zostanie dobrze wykonana, choć nie wiem za co płacę Strategia wykonawcy – maksymalizuję zyski wykorzystując popularne błędne przeświadczenia na temat sondażu

87 Popularne błędne przeświadczenia na temat sondażu - 1 1.Sondaż polega na zebraniu odpowiedzi na te same pytania od wielu osób: im więcej osób zapytamy tym sondaż jest lepszy 2.Sondaże są mniej lub bardziej naukowe 3.Naukowe sondaże nie są potrzebne poza nauką 4.Parametry populacji można oszacować bez losowania próby 5.Jakość realizacji można poprawić za pomocą „prób rezerwowych” 6.Im większa populacja tym większa musi być próba 7.Jakość realizacji można porawić za pomocą wag porealizacyjnych 8.Random route jest skutecznym antidotum na non-response 1.Sondaż polega na zebraniu odpowiedzi na te same pytania od wielu osób: im więcej osób zapytamy tym sondaż jest lepszy 2.Sondaże są mniej lub bardziej naukowe 3.Naukowe sondaże nie są potrzebne poza nauką 4.Parametry populacji można oszacować bez losowania próby 5.Jakość realizacji można poprawić za pomocą „prób rezerwowych” 6.Im większa populacja tym większa musi być próba 7.Jakość realizacji można porawić za pomocą wag porealizacyjnych 8.Random route jest skutecznym antidotum na non-response

88 Wielkość populacji a wielkość próby dokładność oszacowań zależy od wielkości populacji: z małej populacji powinno się losować małe próby, z dużych – duże; im mniejsza populacja tym mniejszą próbę należy z niej pobierać; Próba rezerwowa jeśli nie udało się próby zrealizować w 100%, sięganie do próby rezerwowej nie zmienia jakości uzyskanych wyników (dokładności oszacowań) Random route “random route” jest schematem losowego doboru próby jeśli nie udało się zrealizować w 100% imiennej adresowej próby pobranej z operatu PESEL, można bez szkody dla jakości wyników (dokładności oszacowań) dorobić brakuące wywiady metodą „random route” Wagi porealizacyjne jeśli próba zrealizowana (nie w pełni) jest niereprezentatywna (przedmiotowo) ze względu na kluczowe cechy (płeć, wiek, wykształcenie), bez szkody dla dokłądności oszacowań można „poprawić” jej strukturę za pomocą wag porealizacyjnych „Sondaże”, w których próba nie ma charakteru losowego, są mimo to wiarygodnym źródłem informacji o populacji: porzedwyborcza ankieta uliczna sondaż opinii publicznej: SMS-y wysyłane podczas trwania programu TV sondaż internetowy ogólnopolski sondaż telefoniczny w Polsce ankieta drukowana w czasopiśmie jako sondaż jej czytelników Popularne błędne przeświadczenia na temat sondażu - 2

89 Przykład udanej perswazji agencji badawczej - 1

90 Przykład udanej perswazji agencji badawczej - 2 Rynek usług telekomunikacyjnych w Polsce Badanie klientów indywidualnych 2012, strona 8

91 Zwodniczy termin „reprezentatywność próby zrealizowanej” Perswazyjna funkcja określenia „próba reprezentatywna” Wady potocznego rozumienia terminu „próba reprezentatywna” „Reprezentatywność” jako własność procedury doboru próby Ograniczony zakres zmiennych Stopniowalność Abstrakcja od problemu dokładności oszacowań

92 Pułapki potocznego rozumienia terminu „próba reprezentatywna” Reprezentatywność próby jest zawsze ograniczona do standardowych zmiennych stratyfikacyjnych Proporcje w próbieOdchylenia od proporcji w populacji Populacja N=30970613 Próba n=100 Próba n=400 Próba n=1600 Próba n=10000 Próba n=100 Próba n=400 Próba n=1600 Próba n=10000 1 Miasto 61,4% 67,0%65,3%62,3%61,3% 5,6%-1,8%-2,9%-1,0% 2 Wieś 38,6% 33,0%34,8%37,7%38,7% -5,6%1,8%2,9%1,0% Stopniowalność Abstrakcja od problemu dokładności oszacowań

93 „Reprezentatywność” jako własność procedury doboru próby Próba „reprezentatywna” oznacza tu tyle co „wylosowana”, „losowana”. „Taka, że na podstawie schematu jej doboru można wyliczyć, przy założonym poziomie ufności, dokładność populacyjnych oszacowań” Lissowski (2006, str. 3) proponuje: „Próba reprezentatywna dla populacji U ze względu na parametr T jest to próba dobrana w sposób, który gwarantuje z określonym prawdopodobieństwem otrzymanie oszacowań wartości tego parametru, które spełniają wymagania w kwestii dokładności”. Propozycja ta ma podobne usterki, co termin potocznie interpretowany: niepotrzebną relatywizację do jednej zmiennej i niekonkretność. Ta sama próba może bowiem spełniać pewne wymagania co do dokładności oszacowań parametru pewnej zmiennej a jednocześnie nie spełniać ich w odniesieniu do innej, co daje się powiedzieć po prostu, że dla obu zmiennych dokładność oszacowania jest różna co wiadomo stąd, iż dla obu zmiennych dokładność tę przy założonym poziomie ufności daje się wyliczyć Lissowski (2006, str. 3) proponuje: „Próba reprezentatywna dla populacji U ze względu na parametr T jest to próba dobrana w sposób, który gwarantuje z określonym prawdopodobieństwem otrzymanie oszacowań wartości tego parametru, które spełniają wymagania w kwestii dokładności”. Propozycja ta ma podobne usterki, co termin potocznie interpretowany: niepotrzebną relatywizację do jednej zmiennej i niekonkretność. Ta sama próba może bowiem spełniać pewne wymagania co do dokładności oszacowań parametru pewnej zmiennej a jednocześnie nie spełniać ich w odniesieniu do innej, co daje się powiedzieć po prostu, że dla obu zmiennych dokładność oszacowania jest różna co wiadomo stąd, iż dla obu zmiennych dokładność tę przy założonym poziomie ufności daje się wyliczyć

94 Przetarg

95 Dobry przetarg 1.Poprawne zamówienie 2.Szczegółowy SIWZ 3.Właściwy wybór wykonawcy 4.Kontrakt chroniący jakość 5.Kontrola jakości realizacji kontraktu 1.Poprawne zamówienie 2.Szczegółowy SIWZ 3.Właściwy wybór wykonawcy 4.Kontrakt chroniący jakość 5.Kontrola jakości realizacji kontraktu

96 Szczegółowy SIWZ Projekt analiz statystycznych ZamawiającyWykonawca CODEBOOK ZamawiającyWykonawca Odpowiedzi na pytania ZamawiającyWykonawca Kto projektuje Realizacja badania o wielkości porównywalnej z wielkością badania zamawianego Personel: liczba ankieterów Wyposażenie: liczba notebooków, oprogramowanie, serwer, łączność Warunki dopuszczenia do udziału w przetargu Response rate Równomierność realizacji Czas realizacji Kryteria wyboru oferty Kary za nieosiągnięcie response rate Kary za nierównomierność realizacji Kary za wywiady sfałszowane Kary za wywiady spóźnione Kontrakt z wykonawcą przewiduje Kto wykonuje /dostarcza Kto wykonuje /dostarcza Kwestionariusz ZamawiającyWykonawca Operat ZamawiającyWykonawca Warstwowanie, alokację i schemat doboru próby ZamawiającyWykonawca Jeśli chcemy maksymalizować stosunek jakości do kosztu badania powinniśmy jako kryterium wyboru oferty stosować iloraz błędu oszacowania do ceny za jeden wywiad (rekord) Podobną maksymalizację uzyskuje się zakładając docelową liczbę wywiadów zrealizowanych i wybierając takiego wykonawcę, który zażąda do tego najmniejszej póby

97 nr Czego dotycząCo zawierają symbol 1Populacja [!] Dokładna definicja populacji1.1 Jednostki niebadalne1.2 [!] Zasięg terytorialny badania1.3 2Operat Dokładny opis operatu2.1 Wielkość błędu pokrycia (stopa błędów operatu)2.2 4Dobór próby [!] Dokładny opis schematu losowania4.1 [!] Liczebność próby wylosowanej4.2 Alokacja między warstwy4.3 Wiązkowanie4.4 Stosowane nad-reprezentacje4.5 Wagi: sposób wyznaczania4.6 5Realizacja [!] Metoda kontaktu z respondentem5.1 [!] Czas zbierania danych5.2 Instrukcja ankietera5.3 Karty odpowiedzi i inne materiały pomocnicze5.4 Stosowane nagrody dla respondentów5.5 (*) Wyniki zewnętrznej kontroli ankieterów5.6 [!] Response rate5.7 6 Dokładność oszacowań Dokładność oszacowań dla zmiennych6.1 (*) Sposób wyznaczania dokładności oszacowań6.2 Obowiązki dokumentacyjne wykonawcy sondażu według AAPOR Informacje, które wykonawca sondażu powinien przekazać zamawiającemu AAPOR Code of Professional Ethics and Practices. (Revised May 2010)

98 Sondaż według podręcznika

99 Survey planning: Sarndal, 1992

100 Survey sequence – Groves et. al., 2004

101 Survey sequence – GATS, 2010

102 Dokumentacja projektu GATS DesignOverview and Partnerships Process Chart Tobacco Questions for Surveys A Subset of Key Questions QuestionnaireCore Questionnaire with Optional Questions Question by Question Specifications Sample Sample Design Manual Sample Weights Manual Fieldwork Field Interviewer Manual Field Supervisor Manual Mapping and Listing Manual Data Management Programmer’s Guide to General Survey System Core Questionnaire Programming Specifications Data Management Implementation Plan Data Management Training Guide Quality Quality Assurance: Guidelines and Documentation Analysis and ReportingFact Sheet Template Country Report: Tabulation Plan and Guidelines Indicator Definitions Data DisseminationData Release Policy Data Dissemination: Guidance for the Initial Release of the Data

103 Założenia projektu GATS GATS design

104 Typowe praktyczne problemy do rozwiązania w sondażu Optymalny dobór próby – koszty dojazdu Próba Dostępność operatu: indywidualna – mieszkaniowa - kwota Fieldwork Jak kontrolować ankietera Kwestionariusz Pilotaż laboratoryjny Pilotaż statystyczny Pilotaż laboratoryjny Pilotaż statystyczny Braki danych Non-response Missing value Trudno powiedzieć

105 1.Zestaw pytań, na które mają odpowiedzieć Zleceniodawcy wyniki sondażu 2.Definicja populacji, której odpowiedzi dotyczą, dostępność danych populacyjnych 3.Operatu – dostęność i jakość 4.Schemat posób doboru próby, jej wielkość oraz uzasadnienie 5.Metda kontaktu z obiektami wylosowanymi 6.Kwestionariusz, czasu trwania wywiadu, stopień złożoności wywiadu 7.Tety (pilotaże) kwestionariusza 8.Procedury kontroli jakości pracy ankieterów 9.Sposób wyznaczania wynagrodzenia Wykonawcy sondażu (szkic) 10.Sposób wyłonienia zwycięzcy przetargu/konkursu ofert 11.Szkic projektu analiz statystycznych 12.Szkic budżetu badania z podziałem na wynagrodzenie Wykonawcy i pozostałe koszty 1.Zestaw pytań, na które mają odpowiedzieć Zleceniodawcy wyniki sondażu 2.Definicja populacji, której odpowiedzi dotyczą, dostępność danych populacyjnych 3.Operatu – dostęność i jakość 4.Schemat posób doboru próby, jej wielkość oraz uzasadnienie 5.Metda kontaktu z obiektami wylosowanymi 6.Kwestionariusz, czasu trwania wywiadu, stopień złożoności wywiadu 7.Tety (pilotaże) kwestionariusza 8.Procedury kontroli jakości pracy ankieterów 9.Sposób wyznaczania wynagrodzenia Wykonawcy sondażu (szkic) 10.Sposób wyłonienia zwycięzcy przetargu/konkursu ofert 11.Szkic projektu analiz statystycznych 12.Szkic budżetu badania z podziałem na wynagrodzenie Wykonawcy i pozostałe koszty Sondaż w 12 krokach: co trzeba mieć i znać

106 Badanie sondażowe według podręcznika: co, z kim, za co Zamawiający - zadanie – zespół  Wymagania zamawiającego (sponsora): co musimy dostarczyć, z czego będziemy rozliczani  Jakie jest nasze zadanie: przetłumaczyć zamówienie sponsora na problem badawczy  Zespół: (doświadczenie + młodość + statystyk + admin) *zasoby czasu * motywacje indywidualne  Wymagania zamawiającego (sponsora): co musimy dostarczyć, z czego będziemy rozliczani  Jakie jest nasze zadanie: przetłumaczyć zamówienie sponsora na problem badawczy  Zespół: (doświadczenie + młodość + statystyk + admin) *zasoby czasu * motywacje indywidualne Budżet E1 – Kwerendy-projektowanie E2 – Pilotaże – dobór prób E3 – Przetarg-Kontrakt - SIWZ E4 – Realizacja w terenie E5 – Analiza danych E6 – Dokumentacja badania E7 - Raport E1 – Kwerendy-projektowanie E2 – Pilotaże – dobór prób E3 – Przetarg-Kontrakt - SIWZ E4 – Realizacja w terenie E5 – Analiza danych E6 – Dokumentacja badania E7 - Raport

107 Badanie sondażowe według podręcznika: Etap 0 - Przygotowania organizacyjne  - książka adresowa  - kalendarz  - tablica ogłoszeń (lista mailingowa)  - repozytorium publikacji, danych, sprawozdań wewnętrznych, raportów,  - książka adresowa  - kalendarz  - tablica ogłoszeń (lista mailingowa)  - repozytorium publikacji, danych, sprawozdań wewnętrznych, raportów, Budowa zespołu  podział zadań i funkcji  uzgodnienie zasad wynagradzania  podział zadań i funkcji  uzgodnienie zasad wynagradzania Infrastruktura informatycznej procedury komunikacyjne  - kto komu co i kiedy wysyła, zostawia, zapisuje

108 Badanie sondażowe według podręcznika: Etap 1 - Kwerendy - projekty Kwerenda teoretyczna: co na temat napisali inni Kwerenda faktograficzna: Kwerenda metodologiczna: jak badali to inni Wstępne ustalenia projektowe akceptacja i kontynuacja paradygmatu własny schemat teoretyczny zjawiska akceptacja i kontynuacja paradygmatu własny schemat teoretyczny zjawiska rozkłady podstawowych cech populacji identyfikacja zjawisk rzadkich lub powszechnych (pralka, NGO) rozkłady podstawowych cech populacji identyfikacja zjawisk rzadkich lub powszechnych (pralka, NGO) kontynuacja metodologii stosowanej dotychczas Własna metodologia:  Korzystamy z narzędzi z innych dyscyplin (marketing, psychologia eksperymentalna)  Własne rozwiązania (będą wymagały testów !!!) kontynuacja metodologii stosowanej dotychczas Własna metodologia:  Korzystamy z narzędzi z innych dyscyplin (marketing, psychologia eksperymentalna)  Własne rozwiązania (będą wymagały testów !!!) szkielet kwestionariusza – plan skalowań –modelowania–agregacji dostępność operatu schemat doboru próby technologia realizacji (PAPI, CATI, CAPI, CAWI, MOBI, skaner kodów, double screen, touch-screen, żetony, karty, makiety, rejestracja pasywna, telemetria, GPS ) szkielet kwestionariusza – plan skalowań –modelowania–agregacji dostępność operatu schemat doboru próby technologia realizacji (PAPI, CATI, CAPI, CAWI, MOBI, skaner kodów, double screen, touch-screen, żetony, karty, makiety, rejestracja pasywna, telemetria, GPS )

109 Badanie sondażowe według podręcznika: Etap 2 – Pilotaże – pilotaż jakościowy Pilotaż jakościowy Cel: zrozumiałość pytań (trafność „społeczna”) Pierwsza wersja kwestionariusz + instrukcje realizacyjne, filtry, skoki + metryczka Tekst kwestionariusza (MS Word) – wewnętrzne recenzje w zespole (interakcyjnie – rzutnik, zespół, pisarz) Wybór wykonawcy testu jakościowego Zlecenie na test: Translacja tekstu kwestionariusza oraz instrukcji na skrypt CAPI (wskaźniki czasu!!) Akcesoria (żetony, karty, przybory) Rekrutacja respondentów testowych (niski status !) Realizacja wywiadów za szybą (5-10-15-30) Nagrywanie dźwięku i obrazu Przebieg testu: 5 wywiadów - korekta – 5 wywiadów – korekta etc. Efekt: kwestionariusz zrozumiały i trafny Cel: zrozumiałość pytań (trafność „społeczna”) Pierwsza wersja kwestionariusz + instrukcje realizacyjne, filtry, skoki + metryczka Tekst kwestionariusza (MS Word) – wewnętrzne recenzje w zespole (interakcyjnie – rzutnik, zespół, pisarz) Wybór wykonawcy testu jakościowego Zlecenie na test: Translacja tekstu kwestionariusza oraz instrukcji na skrypt CAPI (wskaźniki czasu!!) Akcesoria (żetony, karty, przybory) Rekrutacja respondentów testowych (niski status !) Realizacja wywiadów za szybą (5-10-15-30) Nagrywanie dźwięku i obrazu Przebieg testu: 5 wywiadów - korekta – 5 wywiadów – korekta etc. Efekt: kwestionariusz zrozumiały i trafny

110 Badanie sondażowe według podręcznika: Etap 2 – Pilotaże – pilotaż statystyczny Pilotaż statystyczny Cel: wybór wskaźników Skrypt CAPI – znaczniki czasu przy każdym bloku pytań Próba 1000 (kwota, badanie typu omnibus) Realizacja pilotażu Raporty z analizy rozkładów w próbie i rekomendacje (wstępne skalowanie i modelowanie): - usunąć wskaźnik/blok wskaźników zbędny - zostawić wskaźnik/blok wskaźników niezbędny (pilotaż statystyczny jest w praktyce pierwszym etapem analizy danych, w tym praktycznym sprawdzianem modeli skalowania) Efekt: ostateczna wersja kwestionariusza zawiera minimalny zestaw wskaźników wystarczający do skalowania, modelowania i agregacji o czasie trwania nie przekraczającym możliwości respondenta i budżetu badania (1 minuta CAPI = 3 złote) Cel: wybór wskaźników Skrypt CAPI – znaczniki czasu przy każdym bloku pytań Próba 1000 (kwota, badanie typu omnibus) Realizacja pilotażu Raporty z analizy rozkładów w próbie i rekomendacje (wstępne skalowanie i modelowanie): - usunąć wskaźnik/blok wskaźników zbędny - zostawić wskaźnik/blok wskaźników niezbędny (pilotaż statystyczny jest w praktyce pierwszym etapem analizy danych, w tym praktycznym sprawdzianem modeli skalowania) Efekt: ostateczna wersja kwestionariusza zawiera minimalny zestaw wskaźników wystarczający do skalowania, modelowania i agregacji o czasie trwania nie przekraczającym możliwości respondenta i budżetu badania (1 minuta CAPI = 3 złote)

111 Badanie sondażowe według podręcznika: Etap 3 – Przetarg - Kontrakt Dokumenty Kto co komu przekazuje zamawiający  kwestionariusz, instrukcje, formularze raportów, instrukcje obsługi platformy komunikacyjnej (serwerowej) Wykonawca  informacje na temat sieci ankieterskiej, dane, raporty, protokoły zamawiający  kwestionariusz, instrukcje, formularze raportów, instrukcje obsługi platformy komunikacyjnej (serwerowej) Wykonawca  informacje na temat sieci ankieterskiej, dane, raporty, protokoły Czasy dostarczania raportów z przebiegu realizacji rekordów z zapisem odpowiedzi Zasady przyjmowania rekordów (formalna kontrola spójności) Zasady wyznaczania należności - stawka za 1 wywiad - kara z sufit (wyrzucanie wywiadów autora „sufitu”) - kara za spóźnienia (wywiad, raport, warstwa) - kara za response rate poniżej umownego - kara za nierównomierność realizacji - stawka za 1 wywiad - kara z sufit (wyrzucanie wywiadów autora „sufitu”) - kara za spóźnienia (wywiad, raport, warstwa) - kara za response rate poniżej umownego - kara za nierównomierność realizacji Kryteria wyboru oferty Na przykład: response-rate + czas + cena [np. 90% + 5% + 5%]

112 Badanie sondażowe według podręcznika: Etap 5 - Analiza danych Badanie sondażowe według podręcznika: Etap 6 - Dokumentacja badania Badanie sondażowe według podręcznika: Etap 7 - Raport  CodeBook (kwestionariusz + rozkłady brzegowe)  Zastosowane klasyfikacje (ISCO, ESCED, PKD)  Zastosowane skale/indeksy (SEI, inne)  Opis schematu doboru próby (prawdopodobieństwa inkluzji, wagi analityczne)  Projektowana dokładność oszacowań  Raport z przebiegu realizacji (rozkłady przyczyn non-responsów)  Zastosowane procedury imputacji oraz łączenia danych zewnętrznych  Uzyskana dokładność oszacowań po uwzględnieniu operatu i realizacji

113 Przykłady: zamówienia przetargowe UW, 2011 Gdańsk 2013-11-06 PFRON 2013 Przykład: badanie norweskie

114 Patologie przetargów – przykłady 2013 Gdańsk 2013-11-06 II.1.4) Określenie przedmiotu oraz wielkości lub zakresu zamówienia: W ramach przedmiotu zamówienia Wykonawca jest zobowiązany do: 1) konsultowania na etapie sporządzania raportu metodologicznego, szczegółów narzędzi badawczych, 2)przygotowania kwestionariuszy materiałów do badania, 3)realizacji prac terenowych oraz realizacji badania zgodnie z zakresem i minimum metodologicznym określonym w pkt 1 ppkt 4 SIWZ 4)przeprowadzenia (liczba z oferty) kwestionariuszy wywiadu 5)zapewnienia respondentom pełnej anonimowości w celu uzyskania jak najbardziej wiarygodnych danych IV.2.1) Kryteria oceny ofert: cena oraz inne kryteria związane z przedmiotem zamówienia: 1 - Cena - 50 2 - narzędzia badawcze - 50 Gdańsk 2013-11-06 II.1.4) Określenie przedmiotu oraz wielkości lub zakresu zamówienia: W ramach przedmiotu zamówienia Wykonawca jest zobowiązany do: 1) konsultowania na etapie sporządzania raportu metodologicznego, szczegółów narzędzi badawczych, 2)przygotowania kwestionariuszy materiałów do badania, 3)realizacji prac terenowych oraz realizacji badania zgodnie z zakresem i minimum metodologicznym określonym w pkt 1 ppkt 4 SIWZ 4)przeprowadzenia (liczba z oferty) kwestionariuszy wywiadu 5)zapewnienia respondentom pełnej anonimowości w celu uzyskania jak najbardziej wiarygodnych danych IV.2.1) Kryteria oceny ofert: cena oraz inne kryteria związane z przedmiotem zamówienia: 1 - Cena - 50 2 - narzędzia badawcze - 50

115 Patologie przetargów – przykłady 2013 PFRON 2013 (…) 5. ZAKRES PRAC WYKONAWCY Zakres prac Wykonawcy obejmuje: 1. opracowanie szczegółowej metodologii badania, 2. opracowanie narzędzi badawczych, 3. (…) wylosowanie prób badawczych, 4. realizację badania, 5. analizę danych i przygotowanie raportu z badania, 6. prezentację wyników na spotkaniu/konferencji (…) IV.2.1) Kryteria oceny ofert: cena oraz inne kryteria związane z przedmiotem zamówienia: 1 - Cena - 40 2 - Ocena merytoryczna – 60 (…) a) podkryterium koncepcja badania (MK), tj. - kompleksowość i przydatność badawcza zaproponowanej koncepcji z punktu widzenia celu badania (MK1) – od 0 do 13 pkt, - lista pytań badawczych (MK2) – od 0 do 20 pkt PFRON 2013 (…) 5. ZAKRES PRAC WYKONAWCY Zakres prac Wykonawcy obejmuje: 1. opracowanie szczegółowej metodologii badania, 2. opracowanie narzędzi badawczych, 3. (…) wylosowanie prób badawczych, 4. realizację badania, 5. analizę danych i przygotowanie raportu z badania, 6. prezentację wyników na spotkaniu/konferencji (…) IV.2.1) Kryteria oceny ofert: cena oraz inne kryteria związane z przedmiotem zamówienia: 1 - Cena - 40 2 - Ocena merytoryczna – 60 (…) a) podkryterium koncepcja badania (MK), tj. - kompleksowość i przydatność badawcza zaproponowanej koncepcji z punktu widzenia celu badania (MK1) – od 0 do 13 pkt, - lista pytań badawczych (MK2) – od 0 do 20 pkt

116 Poprawne zamówienie - przykład Uniwersytet Warszawski, 2011 (fragment ogłoszenia przetargowego) § 3 Opis przedmiotu zamówienia (…) 2. (…) 13000 wywiadów indywidualnych metodą CAPI na imiennej próbie adresowej ludności w wieku 18 lub więcej lat pobranej z operatu PESEL i dostarczonej przez Zamawiającego, przy użyciu kwestionariusza dostarczanego przez Zamawiającego. W ramach sondażu wykonawca będzie miał za zadanie zrealizować poniższe prace: 1) wysyłkę listów zapowiednich, 2) podjęcie próby uzyskania wywiadu od każdej z osób w próbie 3) dostarczanie danych z przebiegu realizacji wywiadu w czasie trwania badania 4) Uzyskanie założonych liczebności wywiadów zrealizowanych w każdej z pod-prób 5) maksymalizację równomierności terytorialnej poziomu response-rate, przy założeniu osiągnięcia powyższych celów. Uniwersytet Warszawski, 2011 (fragment ogłoszenia przetargowego) § 3 Opis przedmiotu zamówienia (…) 2. (…) 13000 wywiadów indywidualnych metodą CAPI na imiennej próbie adresowej ludności w wieku 18 lub więcej lat pobranej z operatu PESEL i dostarczonej przez Zamawiającego, przy użyciu kwestionariusza dostarczanego przez Zamawiającego. W ramach sondażu wykonawca będzie miał za zadanie zrealizować poniższe prace: 1) wysyłkę listów zapowiednich, 2) podjęcie próby uzyskania wywiadu od każdej z osób w próbie 3) dostarczanie danych z przebiegu realizacji wywiadu w czasie trwania badania 4) Uzyskanie założonych liczebności wywiadów zrealizowanych w każdej z pod-prób 5) maksymalizację równomierności terytorialnej poziomu response-rate, przy założeniu osiągnięcia powyższych celów. PŁACIMY WYKONAWCY NIE (TYLKO) ZA DOSTARCZENIE USTALONEJ LICZBY WYWIADÓW LECZ PODJĘCIE PRÓBY UZYSKANIA WYWIADU OD KAŻDEJ Z JEDNOSTEK W PRÓBIE

117 Badanie sondażowe według podręcznika Projekt „norweski”

118 FILARY PROJEKTU Sondaż ludności Polski (n=13 000, CAPI) Diagnoza barier i katalizatorów partycypacji obywatelskiej Pomiar satysfakcji obywatelskiej z usług publicznych Badanie przedstawicieli administracji publicznej (n=3000, CAWI) Perspektywa administracji na problemy badane w sondażu Kształt relacji między poszczególnymi szczeblami administracji Badanie przedstawicieli III Sektora (n=1000, CAWI) Ustalenie jak z perspektywy potencjalnych partnerów społecznych układa się współpraca z jednostkami administracji Warsztaty Dialogu Społecznego (Biłgoraj, Gołdap, Słupsk, Poznań) Praktyczny eksperyment społeczny Modelowe konsultacje społeczne z udziałem mieszkańców, samorządu i organizacji III sektora Poradniki dobrych praktyk (2): poradnik diagnozy lokalnej i tworzenia lokalnych strategii, poradnik dla samorządu i organizacji pozarządowych o strategiach komunikacyjnych

119 – Badanie sondażowe obejmuje populację dorosłych mieszkańców Polski i składa się z dwóch przedsięwzięć: Sondaż ludności Polski Diagnoza barier partycypacjiMonitor Jakości Rządzenia (MJR) Cel socjologiczny: Opisać rzeczywistość i odpowiedzieć na pytanie, co powstrzymuje obywatelską aktywność Polaków Cele szczegółowe: Ujawnić czynniki, które: - powstrzymują obywatelską aktywność (są barierami partycypacji) - sprzyjają obywatelskiej aktywności (są jej katalizatorami) Ustalić relacje między nimi Cel pragmatyczny: Dostarczyć wiedzy o ocenie jakości usług świadczonych obywatelom przez państwo z punktu widzenia ich codziennych użytkowników Cele szczegółowe: Wypracować użyteczne miary jakości rządzenia pozwalające porównywać: -jakość rządzenia na różnych poziomach (od szczebla gminy przez powiat i województwo) - jakość rządzenia w różnych jego aspektach (oświata, służba zdrowia, bezpieczeństwo). Wspólną cechą obu przedsięwzięć było świadome ograniczenie zakresu badania do poziomu lokalnego: aktywności obywatelskiej na szczeblu lokalnym, w pobliżu miejsca zamieszkania. lokalnego poziomu rządzenia (władzy, usług publicznych)

120 Schemat pomiarowy Katalizatory/Bariery Potencjał partycypacyjny Orientacje partycypacyjne aktywność„ładowanie” Wartości/Normy Wiedza Kapitały społeczny ekonomiczny kulturowy Zachowania „obywatelskie” Chęć działania w organizacjach pozarządowych Zainteresowanie sprawami lokalnymi Potrzeba współdecydowania o sprawach lokalnych ŚRODOWISKO: okolica, w której mieszkam Proces przebiega zawsze w jakimś lokalnym środowisku

121 Analiza danych Zasoby kapitałów społecznych Generator zasobów Generator pozycji Skalogram Mokkena Skalogram Rascha Świadomość prawna Test kompetencyjny Pilotaż testu – selekcja pozycji Model pomiarowy 3PL Potencjał partycypacyjny jednostki Katalizatory: zasoby kapitałów Zachowania partycypacyjne Moderatory środowiskowe Model pomiarowy SEM-PLS Jakość rządzenia Indeks satysfakcji użytkownika usługi publicznej (MJR) Model pomiarowy SEM-PLS Koncept operacjonalizacjaProcedura

122 – kapitał społeczny to ”zbiór zasobów posiadanych przez członków siecispołecznych, które (zasoby) mogą stać się dostępne dla jednostek jako rezultat historii powiązań w obrębie sieci” – Ilość oraz rodzaj kapitału społecznego zależy od tego: kogo znamy jak dobrze go znamy co może osoba z którą utrzymujemy kontakt danego rodzaju. Pomiar kapitału społecznego w ujęciu sieciowym Kapitał społeczny jest więc zasobem jednostki a nie zbiorowości W tej definicji kapitału społecznego rezygnuje się z uwzględniania pojęć determinowanych kulturowo czyli norm oraz zaufania. Ma charakter neutralny Występuje jako zmienna wyjaśniana Kapitał społeczny jest więc zasobem jednostki a nie zbiorowości W tej definicji kapitału społecznego rezygnuje się z uwzględniania pojęć determinowanych kulturowo czyli norm oraz zaufania. Ma charakter neutralny Występuje jako zmienna wyjaśniana

123 Technika pomiaru kapitału społecznego: „generatory”

124 GENERATOR POZYCJI Czy zna Pan(i) osobiście kogoś, kto jest Jeśli TAK, to czy jest to ktoś z rodziny, przyjaciel, znajomy? 4. Ja sam(a) jestem 1. Rodzina 2. Przyjaciel 3. Znajomy 1 Radnym 1 Tak2 Nie □□□□ 2 Urzędnikiem Gminy 1 Tak2 Nie □□□□ 3 Pracownikiem naukowym wyższej uczelni – profesorem, doktorem 1 Tak2 Nie □□□□ 4 Dziennikarzem 1 Tak2 Nie □□□□ 5 Lekarzem 1 Tak2 Nie □□□□ 6 Pielęgniarką, innym pracownikiem służby zdrowia 1 Tak2 Nie □□□□ 7 Przedsiębiorcą, właścicielem firmy 1 Tak2 Nie □□□□

125 GENERATOR ZASOBÓW Czy zna Pan(i) osobiście kogoś, kto mógłby Panu(i) pomóc w następujących kwestiach Jeśli TAK, to czy jest to ktoś z rodziny, przyjaciel, znajomy? 4. Sam(a) bym sobie z tym poradził(a) 1. Rodzina 2. Przyjaciel 3. Znajomy 1 Dokonać w domu drobnej naprawy (wymienić gniazdko, przepchać zlew) 1 Tak2 Nie □□□□ 2 Zrobić zakupy, gdy Pan(i) i inni domownicy są chorzy 1 Tak2 Nie □□□□ 3Znaleźć wakacyjną pracę dla Pana(i) dziecka1 Tak2 Nie □□□□ 4Znaleźć dla Pana(i) pracę za granicą1 Tak2 Nie □□□□ 5Znaleźć dla Pana(i) stałą pracę1 Tak2 Nie □□□□ 6 Pożyczyć Panu(i) znaczną sumę pieniędzy (więcej niż 5000 zł) 1 Tak2 Nie □□□□ 7 Wypełnić dla Pana(i) PIT (zeznanie podatkowe) 1 Tak2 Nie □□□□

126 , gdzie licznik ułamka oznacza kowariancję zaobserwowaną w rozkładzie empirycznym, zaś mianownik jest graniczną wartością tej kowariancji

127 państwo to: usługi świadczone obywatelom za pieniądze podatników państwo to: usługi świadczone obywatelom za pieniądze podatników obywatel to: użytkownik państwa klient - – petent - interesariusz obywatel to: użytkownik państwa klient - – petent - interesariusz FILARY MONITORA: państwo-usługa-klient-jakość

128 Metodologia: założenia i problemy Jakość usługi mierzona jest na podstawie pomiaru satysfakcji tylko tych osób, które faktycznie z niej korzystały Satysfakcja z usługi jest zmienną ukrytą, której wartość średnią w populacji użytkowników należy oszacować Problem: reprezentatywność próby użytkowników Problem: strukturalny model pomiarowy satysfakcji Dobór póby SEM/PLS

129 Założenia modelu poniarowego satysfakcji z usług publicznych generalizacjadyspozycja oczekiwania wobec danej usługi publicznej doświadczenie w korzystaniu z usługi zachowania i deklaracje dotyczące przyszłości: - skargi na jakość - zaufanie - rekomendacje poziom satysfakcji

130 Wyzwania metodologiczne Jak alokować próbę aby móc porównywać jakość koszyka usług na poziomie wojwództw Jak zrealizować badanie aby zminimalizować efekt ankietera Jak dobrać próbę aby uzyskać reprezentatywne próby użytkowników jak największej liczby usług publicznych Jak realizować badanie aby zminimalizować efekt respondenta Jak uzyskać wysoką jakość danych Jakie usługi można zbadać w sondażu

131 Sondaż duży i złożony Próby Polska 4x n=2500 Biłgoraj n=1000 Gołdap n=1000 Słupskn=1000 Poznańn=1000 AdministracjaWA PolicjaWP EdukacjaWE ZdrowieWZ NGON Kwestionariusze „Obywatelski” MJR Władza lokalna dostawca usług publicznych N Usługi publiczne: S1 S2 …. S12 Percepcja użytkowników usług publicznych Percepcja otoczenia

132 Liczebności próby (liczba wiązek) zostały wybrane po: Analizie oczekiwanego response rate dla warstwy. Analizie precyzyjnych danych dla każdej gminy (baza DEMOGRAF)DEMOGRAF) Efektywny dobór wiązek - ankieter był w stanie odwiedzić wszystkie adresy z wiązki w ciągu jednego dnia (rozmiary wiązek różne dla różnych warstw) Analiza opierała się na rzeczywistych danych z badań sondażowych prowadzonych w próbach dobieranych w porównywalny sposób (PBC, ESS). Algorytm Marka Stycznia zapewniający kompletną kontrolę nad prawdopodobieństwami doboru jednostek do próby przy losowaniu z operatu PESEL „Jakość próby” była kluczowa dla wyboru Wykonawcy badania - nowatorska funkcja punktująca za szerokość przedziału ufności (80%) i tylko w niewielkim stopniu (20%) za cenę oferty. Przykład złożonego badania sondażowego - próba

133 Przykład złożonego schematu doboru próby w projekcie norweskim Imienna, adresowa próba PESEL Losowane pojedyncze osoby z wylosowanych miejscowości Znane personalia respondenta możliwa kontrola realizacji badania Próba docelowa (netto) N = 9000 IIIIIIIV DOLNOŚLĄSKIE 141 KUJAWSKO-POMORSKIE 141 LUBELSKIE 141 LUBUSKIE 141 ŁÓDZKIE 141 MAŁOPOLSKIE 141 MAZOWIECKIE 141 OPOLSKIE 141 PODKARPACKIE 141 PODLASKIE 141 POMORSKIE 141 ŚLĄSKIE 141 ŚWIĘTOKRZYSKIE 141 WARMIŃSKO-MAZURSKIE 141 WIELKOPOLSKIE 141 ZACHODNIO-POMORSKIE 141 Alokacja wiązek gminnych IIIIIIIV DOLNOŚLĄSKIE 16 1716 KUJAWSKO-POMORSKIE 16 1716 LUBELSKIE 16 1716 LUBUSKIE 16 1716 ŁÓDZKIE 16 1716 MAŁOPOLSKIE 16 1716 MAZOWIECKIE 16 1716 OPOLSKIE 16 1716 PODKARPACKIE 16 1716 PODLASKIE 16 1716 POMORSKIE 16 1716 ŚLĄSKIE 16 1716 ŚWIĘTOKRZYSKIE 16 1716 WARMIŃSKO-MAZURSKIE 16 1716 WIELKOPOLSKIE 16 1716 ZACHODNIO-POMORSKIE 16 1716 warstwa wiesm. pon 20m. 20 - 99m. 100 + Zakładany response rate62%51%43%35% zakładany rozmiar wiązki 78910 liczba wiązek w 1 gminie 3445 liczba losowanych gmin 256 272256 Opis warstw: I – gmina wiejska II – miasto < 20 tys. III – miasto < 100 tys. IV – miasto > 100 tys.

134 etap badanieParametrywykonawca Pilotaż Screening usług publicznych Próba adresowa imienna (PESEL) n=8000 (netto) Pilotaż jakościowy 30 wywiadów z poglądem i rejestracją Test skryptu, kart, instrukcji ankietera Pilotaż statystyczny Próba losowo-kwotowa z badania screeningowego, selekcja wskaźników n=1000, czas trwania: 21 dni Fieldwork Badanie główne Próba losowa adresowa imienna (PESEL) n=13000 (netto), wywiad CAPI, czas trwania: 90 dniwywiad CAPI Kontrola terenowa 1000 adresów kontrolowanych przez firmę zewnętrzną; wywiad kontrolny F2F - PAPI "Bbs„ Biuro Badań Społecznych Barbara Danecka Przykład złożonego badania sondażowego

135 TechnologiaNarzędzieEfekt CAPI Skrypty sterujące przebiegiem wywiaduEliminacja efektu ankieterskiego Randomizacja kolejności pytań dla każdego respondenta Minimalizacja efektu pierwszeństwa, kolejności Ekran + karty + żetonySkrócenie czasu wywiadu Rejestracja przebiegu wywiadu w czasie rzeczywistym Możliwość kontroli ankieterów, detekcja anomalii SERWERY Platforma O3 SpacesWspomaganie pracy grupowej Serwis internetowy administracji sieci ankieterskiej i kontroli terenowej ankieterów Stały monitoring fazy terenowej, szybsza komunikacja z Wykonawcą Portal „Wiem jak jest” Bieżące, stale uaktualniane informacje na temat projektu Technologie informatyczne w realizacji dużych i złożonych badań sondażowych

136 Gdzie się uczyć sondażu – także na błędach Badania międzynarodowe Badania krajowe

137 Duże między-narodowe badania sondażowe GSS – ISSP – PGSS ESS PISA GATS - WHO GSS – ISSP – PGSS ESS PISA GATS - WHO

138 Duże badania sondażowe w Polsce - PGSS/ISSP, - ESS, - PISA, - Diagnoza Społeczna - Badanie prezydencko-premierskie CBOS 2007 - Badania GUS: SILC, BAEL, BGD, Z-12, moduły tematyczne BGD - PGSS/ISSP, - ESS, - PISA, - Diagnoza Społeczna - Badanie prezydencko-premierskie CBOS 2007 - Badania GUS: SILC, BAEL, BGD, Z-12, moduły tematyczne BGD Polskie firmy badawcze: Staff Sieć Próby Technologia Ceny Jakość Polskie firmy badawcze: Staff Sieć Próby Technologia Ceny Jakość Ośrodki kompetencji sondażowej (oprócz IS UW) IFiS PAN: Sztabińscy, Sawiński, Słomczyński, Mach, Domański GUS-Łódź Ośrodki kompetencji sondażowej (oprócz IS UW) IFiS PAN: Sztabińscy, Sawiński, Słomczyński, Mach, Domański GUS-Łódź

139 Źródła wiedzy i kompetencji Pisma POLSKA Wiadomości Statystyczne Statistics in Transition ASK Web Sources: FCSM Statistics Canada JOS Survey Practice The AAPOR e-journal Instytucje FCSM Statistics Sweeden EUROSTAT GESIS –ZUMA

140


Pobierz ppt "Twarze sondażu ADI 2014 Twarze sondażu Henryk Banaszak Zakład Statystyki, Demografii i Socjologii Matematycznej."

Podobne prezentacje


Reklamy Google