Dobór pytań w metodzie zliczania odpowiedzi (Item Count Method).

Slides:



Advertisements
Podobne prezentacje
Leszek Smolarek Akademia Morska w Gdyni 2005/2006
Advertisements

Procenty repetytorium
CAŁA POLSKA CZYTA DZIECIOM – raport Przygotowany dla Fundacji ABC XXI 30 października 2006.
Ocena dokładności i trafności prognoz
SYMULACYJNA ANALIZA SZEREGU CZASOWEGO
Wykład 5 Standardowy błąd a odchylenie standardowe
Analiza współzależności zjawisk
Podejście modelowe metody reprezentacyjnej
Analiza przeprowadzonej ankiety na temat.
Estymacja przedziałowa
Modelowanie symulacyjne
Pisemne dzielenie liczb naturalnych
BIOSTATYSTYKA I METODY DOKUMENTACJI
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 4 Przedziały ufności
Modele (hipotezy) zagnieżdżone
Wzory ułatwiające obliczenia
Wioleta Nowak Gimnazjum nr 20 w Poznaniu
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
ANALIZA BADANIA STATYSTYCZNEGO
Średnie i miary zmienności
Analiza wariancji.
Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych
Konstrukcja, estymacja parametrów
Ocena rozkładu na podstawie wykresów kwantylowych
Uniwersytety Trzeciego Wieku
Elementy Rachunku Prawdopodobieństwa i Statystyki
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
na podstawie materiału – test z użyciem komputerowo generowanych prób
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Elementy Rachunku Prawdopodobieństwa i Statystyki
Quiz Liczby na co dzień Rozpocznij Quiz.
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
PROPOZYCJE MEXX JESIEŃ NOWA KOLEKCJA Ceny od 40zł.
Wstęp do ekonomiki informacji
Seminarium licencjackie Beata Kapuścińska
U RZĄD S TATYSTYCZNY W R ZESZOWIE Warszawa, kwiecień 2014 Paweł Markocki.
ANALIZA ANOVA - KIEDY? Wiele przedsięwzięć badawczych zakłada porównanie pomiędzy średnimi z więcej niż dwóch populacji lub dwóch warunków eksperymentalnych.
Teoria perspektywy Daniela Kahnemana i Amosa Tversky`ego
Ekonometryczne modele nieliniowe
Poszukiwania łamania CP w wielociałowych rozpadach mezonów D A.Ukleja Charm mixing and CPV at LHCb25/07/20141 PLB 728 (2014) 585 f 0 (980)  f 2 (1270)/f.
TEORIA WAGNERA UTLENIANIA METALI
Wnioskowanie statystyczne
Metoda reprezentacyjna i statystyka małych obszarów z SAS Instytut Statystyki i Demografii SGH dr Dorota Bartosińska Zajęcia 4 Wnioskowanie statystyczne.
P1: Jaki jest obecnie odsetek zwolenników partii X w populacji uprawnionych do głosowania (w elektoracie) Pytania i odpowiedzi P2: Czy w porównaniu z ubiegłym.
Wykład 5 Przedziały ufności
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Względna efektywność układów mieszanych
IFS, IFSP I GRA W CHAOS ZBIORY FRAKTALNE I WYBRANE SPOSOBY ICH GENEROWANIA.
Model ekonometryczny Jacek Szanduła.
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
STATYSTYKA – kurs podstawowy wykład 6 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Niepewności pomiarów. Błąd pomiaru - różnica między wynikiem pomiaru a wartością mierzonej wielkości fizycznej. Bywa też nazywany błędem bezwzględnym.
Zastosowanie układów równań do rozwiązywania zadań tekstowych
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Dobór pytań w metodzie zliczania odpowiedzi (Item Count Method). Michał Mierzwa

Pytanie o charakterystykę niewrażliwą Pytanie o charakterystykę niewrażliwą to pytanie, na którą z dużym prawdopodobieństwem respondenci udzielą odpowiedzi prawdziwej: Przykład: Czy urodziłaś/eś się w styczniu? Czy umiesz pływać?

Pytania o charakterystykę wrażliwą Pytanie o charakterystykę wrażliwą to pytanie, na którą respondenci mogą nie chcieć udzielić odpowiedzi lub udzieliliby odpowiedzi fałszywej. Przykład: Czy w Twoim zakładzie pracy rozpowszechniane są narkotyki? Czy kiedykolwiek wręczyłaś/eś łapówkę?

Metoda Zliczania Odpowiedzi (Item Count Method) Metoda mająca na celu uzyskanie wiarygodnych wyników dotyczących kwestii wrażliwych. Polega na sformułowaniu pytań w taki sposób, aby respondenci byli skłonni udzielać prawdziwych odpowiedzi na pytania o charakterystyce wrażliwej. Po przeprowadzeniu badania ankietowego zliczane są odpowiedzi w sposób, który pozwala na wiarygodne oszacowanie odsetka występowania charakterystyki wrażliwej wśród respondentów.

Niech oznacza populację o znanej liczebności , oraz , jeśli i-ta osoba posiada wrażliwą charakterystykę , oraz , jeśli i-ta osoba posiada - dopełnienie Problem stanowi estymacja frakcji występowania charakterystyki wrażliwej

Zastosowanie Metody Zliczania Odpowiedzi wymaga stworzenia dwóch list z pytaniami, na których znajduje się G takich samych pytań niewrażliwych. Niech: jeśli i-ta osoba posiada niewrażliwą charakterystykę F , oraz jeśli i-ta osoba posiada - dopełnienie F

Pytanie G+1 na pierwszej liście uwzględnia wrażliwą charakterystykę A, niewrażliwą F oraz obydwie te charakterystyki jednocześnie Pytanie G+1 na drugiej liście zawiera dopełnienie charakterystyki A, dopełnienie charakterystyki F oraz iloczyn dopełnień charakterystyk wrażliwej i niewrażliwej

Następnie dwie niezależne próby i są losowane z populacji wykorzystując plan losowania . Respondenci z pierwszej próby proszeni są o podanie dotyczącej ich liczby zachowań z listy pierwszej. Respondenci z drugiej próby proszeni są o podanie dotyczącej ich liczby zachowań z listy drugiej. Stąd w populacji:

Estymator parametru Estymator frakcji charakterystyki wrażliwej Estymator średniej liczby zachowań w pierwszej grupie respondentów Estymator średniej liczby zachowań w drugiej grupie respondentów Znana frakcja pytania dodatkowego G+1

Problem badawczy Na jakim poziomie należy ustalić frakcję charakterystyki F, Jak w przybliżeniu powinna kształtować się frakcja odpowiedzi poszczególnych pytań z zestawu G, Ile powinna wynosić liczba pytań G - tak, aby błąd średniokwadratowy estymatora był jak najmniejszy.

Symulacje Symulacje badawcze przeprowadzone zostały metodą Monte Carlo o liczbie iteracji 10 000 w programie R. Liczebność respondentów grupy 1. i 2. założona została na poziomie 50. Obliczenia wykonano dla frakcji 0.1, 0.2, 0,3 … 0.9.

RMSE estymatora frakcji charakterystyki wrażliwej a frakcja charakterystyki niewrażliwej F (w %)

Ustalenie frakcji odpowiedzi pytań z zestawu G Ustalenie frakcji odpowiedzi pytań z zestawu G. dla kombinacji frakcji pierwszych G=2 pytań. frakcja 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,108 0,120 0,128 0,134 0,132 0,121 0,107 0,130 0,139 0,140 0,145 0,142 0,131 0,147 0,150 0,151 0,138 0,129 0,155 0,156 0,149 0,133 0,157 0,146 0,135 0,143 0,154 0,141 0,127 0,137 0,119 0,118 0,126 0,122 0,106

dla różnych kombinacji frakcji odpowiedzi na pytania.

dla różnej liczby pytań G. Frakcja pytań dodatkowych =0,2 liczba pytań G 1 2 3 4 5 6   0,10431 0,13247 0,15421 0,17366 0,18973 0,20409 przyrost bezwzględny RMSE 0,02816 0,02175 0,01945 0,01608 0,01436 Frakcja pytań dodatkowych =0,5 liczba pytań G 1 2 3 4 5 6   0,12672 0,16228 0,18768 0,21439 0,23594 0,25810 przyrost bezwzględny RMSE 0,03553 0,02539 0,02671 0,02155 0,02215

Pytania ankietowe: Dla grupy 1 i 2 Tylko dla grupy 1 Tylko dla grupy 2 Czy dojeżdżasz na uczelnię środkami komunikacji miejskiej? Czy obchodzisz urodziny w czwartym kwartale? Tylko dla grupy 1 Czy korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest równa lub większa od 2 lub jedno i drugie? Tylko dla grupy 2 Czy nigdy nie korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest mniejsza lub równa 1 lub jedno i drugie? Frakcja pytania F (o numer albumu) jest znana i wynosi 0,205.

Bibliografia Cassel C.M., Särndal C.E., Wretman J.H., Foundations of Inference in Survey Sampling, John Wiley & Sons, New York-London-Sydney-Toronto, 1977. Chaudhuri A., Christofides T. C., Item Count Technique in estimating the proportion of people with a sensitive feature, Journal of Statistical Planning and Inference, 137, pp. 2007. Fox J. P., Randomize Item Theory Response Models, Journal of Educational and Behavioral Statistics, Vol. 30, No. 2, pp., 2005. Kuk A. Y. C., Asking Sensitive Questions Indirectly, Biometrika, Vol. 77, No. 2 Jun., 1990. Pal S., Estimating The Proportion Of People Bearing Sensitive Issue With an Option To Item Count Lists And Randomized Response, Statistics In Transitions- new series, Vol. 8, No. 2, pp., 2007. R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org, 2012. Rouse B. A., Kozel N. J., Louise G. Richards, Self Report Methods of Estimating Drug Use: Meeting Current Challenges to Validity, NIDA Research Monograph 57, 1985. Tsuchiya T., Domain Estimators for the Item Count Technique, Survey Methodology, Vol. 31, no. 1, pp., 2005. Wywiał J. Elementy metody reprezentacyjnej z wykorzystaniem statystycznego pakietu SPSS. Akademia Ekonomiczna w Katowicach, Katowice 1999.