Dobór pytań w metodzie zliczania odpowiedzi (Item Count Method). Michał Mierzwa
Pytanie o charakterystykę niewrażliwą Pytanie o charakterystykę niewrażliwą to pytanie, na którą z dużym prawdopodobieństwem respondenci udzielą odpowiedzi prawdziwej: Przykład: Czy urodziłaś/eś się w styczniu? Czy umiesz pływać?
Pytania o charakterystykę wrażliwą Pytanie o charakterystykę wrażliwą to pytanie, na którą respondenci mogą nie chcieć udzielić odpowiedzi lub udzieliliby odpowiedzi fałszywej. Przykład: Czy w Twoim zakładzie pracy rozpowszechniane są narkotyki? Czy kiedykolwiek wręczyłaś/eś łapówkę?
Metoda Zliczania Odpowiedzi (Item Count Method) Metoda mająca na celu uzyskanie wiarygodnych wyników dotyczących kwestii wrażliwych. Polega na sformułowaniu pytań w taki sposób, aby respondenci byli skłonni udzielać prawdziwych odpowiedzi na pytania o charakterystyce wrażliwej. Po przeprowadzeniu badania ankietowego zliczane są odpowiedzi w sposób, który pozwala na wiarygodne oszacowanie odsetka występowania charakterystyki wrażliwej wśród respondentów.
Niech oznacza populację o znanej liczebności , oraz , jeśli i-ta osoba posiada wrażliwą charakterystykę , oraz , jeśli i-ta osoba posiada - dopełnienie Problem stanowi estymacja frakcji występowania charakterystyki wrażliwej
Zastosowanie Metody Zliczania Odpowiedzi wymaga stworzenia dwóch list z pytaniami, na których znajduje się G takich samych pytań niewrażliwych. Niech: jeśli i-ta osoba posiada niewrażliwą charakterystykę F , oraz jeśli i-ta osoba posiada - dopełnienie F
Pytanie G+1 na pierwszej liście uwzględnia wrażliwą charakterystykę A, niewrażliwą F oraz obydwie te charakterystyki jednocześnie Pytanie G+1 na drugiej liście zawiera dopełnienie charakterystyki A, dopełnienie charakterystyki F oraz iloczyn dopełnień charakterystyk wrażliwej i niewrażliwej
Następnie dwie niezależne próby i są losowane z populacji wykorzystując plan losowania . Respondenci z pierwszej próby proszeni są o podanie dotyczącej ich liczby zachowań z listy pierwszej. Respondenci z drugiej próby proszeni są o podanie dotyczącej ich liczby zachowań z listy drugiej. Stąd w populacji:
Estymator parametru Estymator frakcji charakterystyki wrażliwej Estymator średniej liczby zachowań w pierwszej grupie respondentów Estymator średniej liczby zachowań w drugiej grupie respondentów Znana frakcja pytania dodatkowego G+1
Problem badawczy Na jakim poziomie należy ustalić frakcję charakterystyki F, Jak w przybliżeniu powinna kształtować się frakcja odpowiedzi poszczególnych pytań z zestawu G, Ile powinna wynosić liczba pytań G - tak, aby błąd średniokwadratowy estymatora był jak najmniejszy.
Symulacje Symulacje badawcze przeprowadzone zostały metodą Monte Carlo o liczbie iteracji 10 000 w programie R. Liczebność respondentów grupy 1. i 2. założona została na poziomie 50. Obliczenia wykonano dla frakcji 0.1, 0.2, 0,3 … 0.9.
RMSE estymatora frakcji charakterystyki wrażliwej a frakcja charakterystyki niewrażliwej F (w %)
Ustalenie frakcji odpowiedzi pytań z zestawu G Ustalenie frakcji odpowiedzi pytań z zestawu G. dla kombinacji frakcji pierwszych G=2 pytań. frakcja 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,108 0,120 0,128 0,134 0,132 0,121 0,107 0,130 0,139 0,140 0,145 0,142 0,131 0,147 0,150 0,151 0,138 0,129 0,155 0,156 0,149 0,133 0,157 0,146 0,135 0,143 0,154 0,141 0,127 0,137 0,119 0,118 0,126 0,122 0,106
dla różnych kombinacji frakcji odpowiedzi na pytania.
dla różnej liczby pytań G. Frakcja pytań dodatkowych =0,2 liczba pytań G 1 2 3 4 5 6 0,10431 0,13247 0,15421 0,17366 0,18973 0,20409 przyrost bezwzględny RMSE 0,02816 0,02175 0,01945 0,01608 0,01436 Frakcja pytań dodatkowych =0,5 liczba pytań G 1 2 3 4 5 6 0,12672 0,16228 0,18768 0,21439 0,23594 0,25810 przyrost bezwzględny RMSE 0,03553 0,02539 0,02671 0,02155 0,02215
Pytania ankietowe: Dla grupy 1 i 2 Tylko dla grupy 1 Tylko dla grupy 2 Czy dojeżdżasz na uczelnię środkami komunikacji miejskiej? Czy obchodzisz urodziny w czwartym kwartale? Tylko dla grupy 1 Czy korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest równa lub większa od 2 lub jedno i drugie? Tylko dla grupy 2 Czy nigdy nie korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest mniejsza lub równa 1 lub jedno i drugie? Frakcja pytania F (o numer albumu) jest znana i wynosi 0,205.
Bibliografia Cassel C.M., Särndal C.E., Wretman J.H., Foundations of Inference in Survey Sampling, John Wiley & Sons, New York-London-Sydney-Toronto, 1977. Chaudhuri A., Christofides T. C., Item Count Technique in estimating the proportion of people with a sensitive feature, Journal of Statistical Planning and Inference, 137, pp. 2007. Fox J. P., Randomize Item Theory Response Models, Journal of Educational and Behavioral Statistics, Vol. 30, No. 2, pp., 2005. Kuk A. Y. C., Asking Sensitive Questions Indirectly, Biometrika, Vol. 77, No. 2 Jun., 1990. Pal S., Estimating The Proportion Of People Bearing Sensitive Issue With an Option To Item Count Lists And Randomized Response, Statistics In Transitions- new series, Vol. 8, No. 2, pp., 2007. R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org, 2012. Rouse B. A., Kozel N. J., Louise G. Richards, Self Report Methods of Estimating Drug Use: Meeting Current Challenges to Validity, NIDA Research Monograph 57, 1985. Tsuchiya T., Domain Estimators for the Item Count Technique, Survey Methodology, Vol. 31, no. 1, pp., 2005. Wywiał J. Elementy metody reprezentacyjnej z wykorzystaniem statystycznego pakietu SPSS. Akademia Ekonomiczna w Katowicach, Katowice 1999.