Wykonali: inż. Rafał Bajno inż. Tomasz Baryłowicz Paradoks Simpsona Wykonali: inż. Rafał Bajno inż. Tomasz Baryłowicz
Paradoks Simpsona Kim jest Edward H. Simpson? Czym jest Paradoks Simpsona (PS)? Wykorzystanie PS Przykłady Podsumowanie
Kim jest Edward H. Simpson? Brytyjski statystyk, urodzony w 1922, absolwent Cambridge. Najbardziej znany z opublikowania metody Paradoksu Simpsona.
Czym jest Paradoks Simpsona (PS)? Jest to paradoks statystyczny opisany przez E. H. Simpsona w opublikowanej w 1951 roku pracy pt. „The Interpretation of Interaction in Contingency Tables”, zaobserwowany także w 1903 roku przez George’a Udney’a Yule’a. Jest to dobrze przyjęta zasada, że im większy zestaw danych, tym bardziej wiarygodne wnioski. Polega on na tym, że efekt działania kilku grup wydaje się być odwrócony, kiedy grupy są połączone.
Wykorzystanie PS Paradoks Simpsona często wykorzystywany jest w nauce statystystyki matematycznej do zobrazowania studentom jak wielką wagę należy przykładać do interpretowania danych.
Przykłady Przykład (procentowy) jakiś edytowanych dokumentów przez dwie jednostki: Zbigniewa i Ziute: Procentowo Ziuta poprawiła w każdym miesiącu więcej dokumentów niż Zbigniew, natomiast po analizie danych z całego okresu to Zbigniew poprawił ich więcej. DLACZEGO? :X Miesiąc 1 Miesiąc 2 Suma Zbigniew 60,0 % 10,0 % 55,5 % Ziuta 90,0 % 30,0 % 35,5 % tab. 1)
Przyjrzyjmy się teraz dokładnej analizie poprawionych dokumentów: Przykłady Przyjrzyjmy się teraz dokładnej analizie poprawionych dokumentów: Tak naprawdę to Zbigniew poprawił ich ilościowo więcej, Ziuta poprawiła mniejszą ilość edytowanych dokumentów. Miesiąc 1 Miesiąc 2 Suma Zbigniew 60,0 % 10,0 % 55,5 % Ziuta 90,0 % 30,0 % 35,5 % tab. 1) Miesiąc 1 Miesiąc 2 Suma Zbigniew 60 / 100 1 / 10 61 / 110 Ziuta 9 / 10 30 / 100 39 / 110 tab. 2)
Przykłady 1-wszy miesiąc: SA(1) = 60% - Zbigniew poprawił 60% dok, ze wszystkich które edytował SB(1) = 90% - Ziuta poprawiła 90% w tym samym czasie 2-gi miesiąc: SA(2) = 10% - 10% poprawionych dok. (1 z 10 edytowanych) SB(2) = 30% - 30% poprawionych dok. ( 30 z 100 edytowanych)
Przykłady SA = 61 / 100 - ilość poprawionych dokumentów dla Zbigniewa SB = 39 / 100 - ilość poprawionych dokumentów dla Ziuty SA > SB - więcej procentowo poprawił Zbigniew