Wykład 10 Układ zrandomizowany blokowy Staramy się kontrolować zróżnicowanie badanych obiektów poprzez zapewnienie ``jednorodności’’ obiektów w każdej grupie zabiegowej. Najpierw dzielimy obiekty na bloki. Co to są bloki ? Blok to jednorodna grupa obiektów Chcemy aby obiekty w jednym bloku miały podobne wartości zmiennych ``zakłócających’’.
Przykłady bloków Owocówki z jednej linii wsobnej Pacjenci podobni pod względem wieku, płci, diagnozy i/lub historii choroby Rośliny rosnące blisko siebie w cieplarni Rośliny kukurydzy rosnące na tym samym fragmencie pola
Przyporządkowanie Obiekty dzielimy na jednorodne bloki Dokonujemy randomizacji (losowego przyporządkowania obiektów do poszczególnych zabiegów) w obrębie każdego z bloków To zapewnia, że w każdej grupie zabiegowej mamy tę samą liczbę obiektów z każdego bloku Tak więc ``wstępne’’ rozkłady badanej cechy w grupach zabiegowych są do siebie podobne.
Przykład Porównujemy efekt działania nowego lekarstwa z placebo Obiekty – ochotniczki, u których w ciągu ostatniego roku stwierdzono raka piersi Niektóre miały lumpektomię, inne radykalną mastektomię (2) Niektóre były poddane naświetlaniom, inne nie (2) U niektórych zidentyfikowano ryzyko genetyczne BRCA1, BRCA2, u innych nie (3) Te czynniki są znane ale nie kontrolowane w tym badaniu
Dzielimy pacjentki na 223=12 bloków, tzn. lumpektomia, naświetlania, BRCA1 lumpektomia, naświetlania, BRCA2, …. mastektomia, brak naświetlań, nie zidentyfikowano ryzyka genetycznego Potem w każdym bloku losowo wybrana połowa kobiet otrzymuje lekarstwo, a druga połowa placebo To zapewnia, że grupy kobiet biorących lekarstwo i placebo mają w przybliżeniu tą samą strukturę
Inne czynniki używane do blokowania: Laboratorium lub osoba dokonująca pomiarów Laboratorium lub osoba wykonująca zabieg Geografia Genetyka Czynniki socjo-ekonomiczne Blokujemy tylko względem tych czynników, które mogą mieć wpływ na odpowiedź.
Stratyfikacja ``Blokowanie’’ względem zmiennej, której wartości można uporządkować (często ciągłej). Wtedy dzielimy na ``warstwy’’ a nie na bloki. Przykłady Niskie, średnie, wysokie dochody Grupy wiekowe Stopień rozwoju choroby Randomizujemy w obrębie każdej warstwy. Czasami definiujemy warstwy przed próbkowaniem, aby pobrać podobną liczbę obserwacji z każdej warstwy: próbkowanie warstwowe.
Powiązane pary Obserwacje występują w parach Takich jak: Układ blokowy dwuzabiegowy, gdzie każdy blok składa się z dwu obiektów Dwa pomiary na tym samym obiekcie (dwa dni, dwie strony, przed/po…) Obserwujemy dwie grupy w czasie
Przykłady: Obiekty naturalnie występują w parach, takich jak pary identycznych blizniaków Obiekty łaczymy w pary o podobnym wieku, płci, zawodzie, stanie rozwoju choroby, etc Ten sam obiekt mierzony przy dwu okazjach
Test Studenta dla powiązanych par Do produkcji butów używamy dwóch różnych materiałów, A i B. Obserwacje: zużycie podeszew w butach noszonych przez 10 chłopców. Każdy chłopiec ma podeszwę w jednym bucie zrobioną z materiału A, a w drugim z materiału B Randomizujemy (lewy albo prawy)
Zużycie podeszew Chłopiec A B A-B 1 13.2 14.0 -0.8 2 8.2 8.8 -0.6 … …. 10 13.3 13.6 -0.3 średnia -0.41 s 0.38
Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d) Hipoteza H0 : d = A - B=0 Ha : d ≠ 0 Liczymy d= Y1- Y2, średnią(d), SD(d), SE(d) liczymy ts = średnia(d)/SE(d) = df = nd-1= P-wartość=
Co się stanie jeżeli wykorzystamy test Studenta dla prób niezależnych ? Ta sama hipoteza =10.63, =11.04 =1.11 ts=(10.63-11.04)/1.11=-0.369 P-wartość =
Skąd taka rozbieżność? Bardzo różne SE Test dla par : SE = 0.12 Test dla dwóch niezależnych prób: SE=1.11 Jeżeli jest duże zróżnicowanie między obiektami może ono ukryć wpływ zabiegu To zróżnicowanie można zredukować łącząc obiekty w pary
Skąd wiadomo czy użyć testu dla par czy testu dla niezależnych prób ? Na ogół łatwo stwierdzić czy istnieją naturalne pary obiektów z jednej i drugiej grupy zabiegowej. Kiedy zaplanować eksperyment w oparciu o powiązane pary ? Trudniejsze: oczekujemy, że zmienne zakłócające mogą istotnie zwiększyć rozrzut wyników i staramy się utworzyć dwuelementowe bloki, jednorodne ze względu na zmienne zakłócające.
Założenie Test Studenta dla par jest oparty na założeniu, że różnice mają w przybliżeniu rozkład normalny.
Test znaków Co zrobić jeżeli obserwacje nie mają rozkładu normalnego ? Dla dwóch niezależnych prób liczyliśmy test Wilcoxona-Manna-Whitneya. Gdy występują sparowane obserwacje możemy zastosować test znaków. Patrzymy na znak różnicy między każdą parą obserwacji. Jeżeli zabiegi się nie różnią, liczba plusów powinna być w przybliżeniu równa liczba minusów lub inaczej p-stwo, że w dowolnej parze dostaniemy plus powinno być równe
= p-stwo, że w dowolnej ustalonej parze pierwszy zabieg daje lepszy wynik niż drugi. H0: = HA: Dla każdej pary obserwacji zapisujemy (+) gdy y1–y2 jest dodatnie lub (–) gdy jest ujemne Zliczamy liczbę + (= N+) i – (= N–) (nie liczymy zer)
Statystyka testowa Bs = max( N+, N– ) (dla testu dwustronnego) Wartości krytyczne na kolejnym slajdzie. n = #par z niezerowymi wynikami. Tabela daje wartości krytyczne dla testu jedno i dwustronnego Odrzucamy H0 gdy Bs wartości krytycznej Można także policzyć p-wartości korzystając ze wzorów na rozkład Bernoulliego.
------+-------------------------------------------------+---- N | CRITICAL VALUES FOR THE SIGN TEST, N = 5..44 | Alpha | 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 | 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) | ------+-------------------------------------------------+---- N | ----| 5 | 5 . . . . . 6 | 6 6 . . . . 7 | 7 7 7 . . . 8 | 7 8 8 8 . . 9 | 8 8 9 9 9 . | | 10 | 9 9 10 10 10 10 11 | 9 10 10 11 11 11 12 | 10 10 11 11 12 12 13 | 10 11 12 12 12 13 14 | 11 12 12 13 13 13 15 | 12 12 13 13 14 14 16 | 12 13 14 14 14 15 17 | 13 13 14 15 15 16 18 | 13 14 15 15 16 16 19 | 14 15 15 16 16 17 20 | 15 15 16 17 17 18 21 | 15 16 17 17 18 18 22 | 16 17 17 18 18 19 23 | 16 17 18 19 19 20 24 | 17 18 19 19 20 20 This public domain table was made by APL programs written by the author. William Knight <http://www.math.unb.ca/~knight> Friday,
William Knight <http://www.math.unb.ca/~knight> Friday, CRITICAL VALUES FOR THE SIGN TEST, N =25..44 | Alpha | 1 Sided 0.05 0.025 0.01 0.005 0.0025 0.001 | 2 Sided (0.10) (0.05) (0.02) (0.01) (0.005) (0.002) | 25 | 18 18 19 20 20 21 26 | 18 19 20 20 21 22 27 | 19 20 20 21 22 22 28 | 19 20 21 22 22 23 29 | 20 21 22 22 23 24 | | 30 | 20 21 22 23 24 24 31 | 21 22 23 24 24 25 32 | 22 23 24 24 25 26 33 | 22 23 24 25 25 26 34 | 23 24 25 25 26 27 35 | 23 24 25 26 27 27 36 | 24 25 26 27 27 28 37 | 24 25 27 27 28 29 38 | 25 26 27 28 29 29 39 | 26 27 28 28 29 30 40 | 26 27 28 29 30 31 41 | 27 28 29 30 30 31 42 | 27 28 29 30 31 32 43 | 28 29 30 31 32 32 44 | 28 29 31 31 32 33 This public domain table was made by APL programs written by the author. William Knight <http://www.math.unb.ca/~knight> Friday,
Dla testu jednostronnego HA jest albo < 0.5 (w dowolnej parze druga obserwacja ma większą szansę być większa) (Bs = N–) lub HA jest > 0.5; (w dowolnej parze pierwsza obserwacja ma większą szansę być większa) (Bs = N+)
P-wartość Gdy HA jest > 0.5, wtedy Bs = N+, i P-wartość jest Pr(Y Bs ) Gdy HA jest < 0.5, wtedy Bs = N–, i P-wartość jest Pr(Y Bs ) Gdy HA jest 0.5, wtedy Bs = max(N+, N–), i P-wartość = 2Pr(Y Bs ) gdzie Y ma rozkład Bernoulliego (n, 0.5)
Przykład: przeszczepy skóry Po dwóch stronach ciała 11 ochotników zastosowano przeszczepy skóry. Jeden przeszczep ma dobre dopasowanie HLA z odbiorca, drugi nie. Obserwujemy czas do odrzucenia przeszczepu (nie ma rozkładu normalnego więc nie można stosować testu Studenta). Czy dobre dopasowanie HLA zwiększa czas przetrwania przeszczepu ?
dobre 37 19 57 93 16 23 20 63 29 60 18 złe 13 15 26 11 43 42 znak + -
Testu znaków używamy gdy Dane nie mają rozkładu normalnego Gdy dane zapisane są w postaci preferencji a nie wielkości liczbowej, np. lepsze/gorsze, mniejsze/większe itp.
Test znakowany Wilcoxona Podobny do testu znaków ale bardziej czuły Metoda Liczymy różnice w parach Znajdujemy wartość bezwzględną Przyporządkowujemy rangi wartościom bezwzględnym (1 dla najmniejszej, n dla największej) Każdej randze przyporządkowujemy jej znak (+,-)
W+ : suma rang dodatnich W- : suma rang ujemnych Ws : min(W+, W-) Odrzucamy H0 gdy Ws ≤ wartość krytyczna Tabela wartości krytycznych jest dostępna w kartotece z wykładami.
Obs Y1 Y2 d |d| Rank Sign+R 1 33 25 8 6 2 39 38 3 27 -2 4 29 20 9 7 5 50 54 -4 -3 45 40 36 30
Przed & Po vs. Grupa kontrolna Czasami obserwujemy obiekty przed i po pewnym zabiegu i mierzymy wpływ zabiegu na poszczególne obiekty Dostajemy pary zależnych obserwacji Czasami parujemy podobne (ze względu na zmienne zakłócające) obiekty z grupy zabiegowej i kontrolnej Również dostajemy pary zależnych obserwacji
Czasami obiektów w grupie kontrolnej i zabiegowej nie można w naturalny sposób połączyć w pary takie obserwacje traktujemy jako dwie niezależne próby
Czasami oczekujemy, że obiekty w naturalny sposób się zmieniają w trakcie eksperymentu. Chcemy odróżnić zmiany wywołane zabiegiem od zmian wynikających z upływu czasu Obserwujemy grupę zabiegową i kontrolną przed i po zabiegu Obiekty w grupie kontrolnej dostarczają nam informacji jakiej zmiany należy oczekiwać jedynie w wyniku upływu czasu Obiekty w grupie zabiegowej dostarczają nam informacji o wpływie zabiegu Cztery grupy obserwacji
Możemy porównać obiekty z grupy zabiegowej przed i po zabiegu za pomocą testu dla par Również obiekty z grupy kontrolnej możemy porównać przed i po zabiegu za pomocą testu dla par Dowiemy się czy była zmienność w każdej z grup Naprawdę interesuje nas porównanie zmian wartości cechy (przed i po zabiegu) Zwykle w takim przypadku analizujemy różnice po-przed za pomocą testu dla dwu prób