One flew over... statistics czyli statystyka w 8 godzin

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

ESTYMACJA PRZEDZIAŁOWA
Rangowy test zgodności rozkładów
Statystyczne metody dowodzenia biorównoważności
Statystyczne metody dowodzenia biorównoważności
Statystyka Wojciech Jawień
Układy eksperymentalne analizy wariancji. Analiza wariancji Planowanie eksperymentu Analiza jednoczynnikowa, p poziomów czynnika, dla każdego obiektu.
Estymacja. Przedziały ufności.
Układy eksperymentalne analizy wariancji. Analiza wariancji Planowanie eksperymentu Analiza jednoczynnikowa, p poziomów czynnika, dla każdego obiektu.
Wykład 9 Analiza wariancji (ANOVA)
Wykład 7: Moc Moc testu to prawdopodobieństwo odrzucenia H0, gdy prawdziwa jest HA Moc=czułość testu Moc = 1 – Pr (nie odrzucamy H0, gdy prawdziwa jest.
Analiza współzależności zjawisk
Analiza wariancji jednoczynnikowa
Analiza wariancji Marcin Zajenkowski. Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna.
Skale pomiarowe – BARDZO WAŻNE
BUDOWA MODELU EKONOMETRYCZNEGO
Analiza wariancji Analiza wariancji (ANOVA) stanowi rozszerzenie testu t-Studenta w przypadku porównywanie większej liczby grup. Podział na grupy (czyli.
Statystyka w doświadczalnictwie
Nowy kod Statistica 6.1 HEN6EUEKH8.
Analiza korelacji.
Wykład 11 Analiza wariancji (ANOVA)
Wykład 4 Przedziały ufności
Próby niezależne versus próby zależne
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Testy nieparametryczne
Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną zależność.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Testy nieparametryczne
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Modelowanie ekonometryczne
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Testy statystycznej istotności
Porównywanie średnich 2 i więcej prób o rozkładach innych niż normalny
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
Co to jest dystrybuanta?
ANALIZA ANOVA - KIEDY? Wiele przedsięwzięć badawczych zakłada porównanie pomiędzy średnimi z więcej niż dwóch populacji lub dwóch warunków eksperymentalnych.
Dopasowanie rozkładów
Wnioskowanie statystyczne
Statystyka medyczna Piotr Kozłowski
Wykład 5 Przedziały ufności
Weryfikacja hipotez statystycznych
Estymatory punktowe i przedziałowe
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Testowanie hipotez Jacek Szanduła.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
STATYSTYKA – kurs podstawowy wykład 11
Wnioskowanie statystyczne. Próbkowanie (sampling)
Testy nieparametryczne
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Analiza współzależności zjawisk
Zapis prezentacji:

One flew over... statistics czyli statystyka w 8 godzin testowanie hipotez statystyka opisowa data mining teoria estymacji modele probabilistyczne statystyczna teoria decyzji modelowanie dr Krystyna Stanisz-Wallis dr Wojciech Jawień http://farmacja.uj.edu.pl/dyd/doc <wojciech.jawien@uj.edu.pl>

ABC...

Zmienna losowa Jeżeli wynik eksperymentu wyrazimy w postaci liczbowej, to otrzymamy zmienną losową. Gdy zmienna losowa może przybierać dowolne wartości z pewnego przedziału, nazywamy ją zmienną losową ciągłą. Jeśli natomiast przyjmuje tylko pewne wartości, a nie przyjmuje wartości pośrednich, nazywamy ją zmienną losową dyskretną.

Zmienna losowa Wszystkie zmienne losowe, z którymi spotykamy się w praktyce, są dyskretne. Zmienna losowa ciągła pozostaje użyteczną idealizacją. Często analizę teoretyczną i praktyczne obliczenia łatwiej przeprowadzić dla zmiennych losowych ciągłych niż dyskretnych.

Zmienna losowa ciągła Losujemy w sposób równomierny liczbę z przedziału [0,1] – to nasza zmienna losowa X. Jakie są prawdopodobieństwa:

Zmienna losowa ciągła Dla zmiennych losowych ciągłych celowe jest rozważanie prawdopodobieństw w przedziałach a nie punktach. Można dla tych zmiennych wprowadzić funkcję gęstości rozkładu prawdopodobieństwa.

Funkcja gęstości – właściwości Funkcja gęstości rozkładu prawdopodobieństwa pozwala obliczać prawdopodobieństwo znalezienia zmiennej losowej w dowolnym przedziale.

Funkcja gęstości

Rozkłady prawdopodobieństwa Różne eksperymenty opisywane mogą być różnymi funkcjami gęstości, czyli zmienne losowe mogą mieć różne rozkłady prawdopodobieństwa. W praktyce bardzo często spotykamy rozkład normalny.

Rozkład normalny Parametry: wartość oczekiwana odchylenie standardowe

Galeria rozkładów ciągłych

Ogólna teoria testów statystycznych Teoria Neymana*-Pearsona** *Jerzy Spława-Neyman, 1894-1981 **Egon Pearson, syn Karla, 1895-1950

Hipotezy Hipoteza – dowolna wypowiedź o rozkładzie zmiennej losowej parametryczna (mówi o wartościach parametrów rozkładu) nieparametryczna Hipoteza parametryczna prosta (jedna wartość) złożona (zbiór wartości, np. przedział)

Hipotezy - przykłady AUC nie ma rozkładu normalnego. Wartość oczekiwana tmax wynosi 2h. Odchylenie standardowe Cmax nie przekracza 3 mg/l. (E – wartość oczekiwana, V – wariancja = ) lub: albo:

Cel testowania Zadaniem testu jest obalenie hipotezy zerowej (H0) na rzecz hipotezy alterna-tywnej (H1). Obalenie hipotezy polega na wykazaniu, że gdyby była ona prawdziwa, to uzyskanie takich wyników pomiarów jak otrzymane byłoby mało prawdopodobne.

Weryfikacja Na podstawie wyniku badania (próby) obliczamy tzw. statystykę testową T. Wybór T zależy od H0 i H1, planu eksperymentu i przyjętych założeń o rozkładzie wyników pomiarów. W oparciu o H0 i H1, ew. inne, niejawne założenia i (nieraz głęboką) wiedzę statystyczną konstruujemy dla T obszar krytyczny K.

Weryfikacja Jeśli T znajdzie się w tym obszarze, H0 odrzucamy i twierdzimy, że prawdziwa jest H1 W przeciwnym razie słuszność hipotez H0 lub H1 pozostaje nierozstrzygnięta. Absence of evidence is not evidence of absence. Dr Carl Sagan, astrofizyk

Błędy Błąd I rodzaju – odrzucenie słusznej hipotezy. Prawdopodobieństwo tego błędu oznaczamy  i nazywamy poziomem istotności. Z reguły =0,05, czyli 5%.

Błędy Błąd II rodzaju – niepowodzenie obalenia H0, mimo że prawdziwa jest H1 Prawdopodobieństwo błędu II rodzaju oznaczamy . Nie jest ono zwykle równe 1- (i na ogół trudno je obliczyć). Prawdopodobieństwo udanej weryfikacji nazywa się mocą testu, jest ona równa 1-.

Przykład: Test t-Studenta Dwie grupy pomiarów: na tych samych podmiotach, np. przed i po posiłku (zmienne połączone) na różnych podmiotach, np. ♀ i ♂ (zmienne niepołączone) Zakładamy, że pomiary podlegają rozkładowi normalnemu. Dla zmiennych niepołączonych dodatkowo zakładamy równość wariancji w grupach.

Test t-Studenta Hipoteza zerowa: Hipotezy alternatywne test jednostronny test dwustronny

Przykład – test t-Studenta, zmienne połączone Czy dieta (np. sok grejpfrutowy) wpływa na DB? Y – wielkość będąca miarą DB. Przeformułowanie problemu:

test t-Studenta (cd) Wykonujemy eksperyment i wyznaczamy dla każdego osobnika Di. Wyznaczamy estymaty (oszacowania) wartości oczekiwanej i odchylenia standardowego zmiennej losowej D

test t-Studenta (cd) Odchylenie standardowe średniej jest razy mniejsze: Jeśli D ma rozkład normalny to statystyka ma rozkład t-Studenta z n-1 stopniami swobody.

test t-Studenta (cd)

Test t-Studenta – moc W przedstawionym teście H0 była hipotezą prostą, a jej alternatywa – hipotezą złożoną. Przypuśćmy, że zachodzi jeden ze składników alternatywy:

Test t-Studenta – moc Wtedy a rozkład zmiennej t jest nieco inny (nazy-wa się niecentralnym rozkładem t ). Ze wzrostem maleje  , a więc zwiększa się moc testu.

Test t-Studenta – moc Moc zwiększa się ze wzrostem liczebności próby. Dokładne określenie mocy testu nie jest możliwe, gdyż nie znamy dokładnie potrzebnych parametrów.

Moc i liczebność próby Ocena mocy, choć trudna, jest ważnym elementem planowania badań. Staramy się tak dobrać liczbę pomiarów, aby uzyskać spodziewaną moc co najmniej 80%. To call in the statistician after the experiment is done may be no more than asking him to perform a post-mortem examination: he may be able to say what the experiment died of. Sir Ronald Fisher, wielki statystyk

Test t-Studenta, jedno- i dwustronny W teście jednostronnym porównujemy wartość t z . W teście dwustronnym porównujemy |t| z . Jeśli są przesłanki przemawiające za tes-tem jednostronnym, warto go stosować. Postawą tej decyzji nie może być jednak bieżący eksperyment.

Test t-Studenta, zmienne niepowiązane Test dla zmiennych niepowiązanych zawiera istotne założenie o równości wariancji w obu grupach (jednorodność wariancji). Jeśli założenie to nie jest spełnione, należy stosować przybliżony wariant opracowany przez Satterthwaite’a. Spotyka się też nazwę test Welcha.

Inne testy parametryczne dla ciągłych zmiennych losowych

Test równoważności Test t-Studenta pozwala udowodnić istnienie różnic między grupami. W celu udowodnienia braku tych różnic chciałoby się w teście dwustronnym zamienić role hipotezy zerowej i alternatywnej: vs

Test równoważności Niestety, moc takiego testu byłaby równa dokładnie 0. Test równoważności ma udowodnić, że różnica wartości oczekiwanych nie przekracza z góry zadanego zakresu.

Test równoważności Taki test, opracowany przez Schuirmanna, używany bywa do wykazywania równoważ-ności postępowania terapeutycznego. Określenie granic i należy do ekspertów z zakresu nauk medycznych, a nie do statystyków.

Test równości wariancji Test F-Fishera-Snedecora pozwala porównać wariancje (a więc i odchylenia standardowe) w dwu grupach pomiarów. Zakłada się w nim rozkład normalny w obu grupach. Test może być jednostronny lub dwustronny: lub

Analiza wariancji Analiza wariancji (ANOVA) stanowi rozszerzenie testu t-Studenta w przypadku porównywania większej liczby grup. Podział na grupy (czyli klasyfikacja) dokonywany jest na podstawie jednego lub kilku czynników. Mówimy więc o jednoczynnikowej (one-way) lub wieloczynnikowej analizie wariancji.

Analiza wariancji Czynnik może przybierać pewną liczbę wartości, zwanych poziomami. Np. czynnik płeć ma tylko dwa poziomy (♀,♂), czynnik grupa krwi – cztery poziomy (0,A,B,AB). Należy odróżniać liczbę czynników od liczby poziomów danego czynnika. Jeszcze ważniejsze jest odróżnianie wyniku od czynnika.

Analiza wariancji Założenia Podobnie jak w teście t-Studenta zakłada się, że wyniki podlegają rozkładowi normalnemu, a wariancje we wszystkich grupach są takie same. Procedury analizy wariancji są dość odporne na naruszenie tych założeń.

Jednoczynnikowa analiza wariancji Najprostszy plan eksperymentu – układ kompletnie zrandomizowany. Na każdym podmiocie pomiar wykonywany jest tylko raz. Ten układ jest więc odpowiednikiem testu t-Studenta dla zmiennych niepołączonych.

Jednoczynnikowa analiza wariancji Hipoteza zerowa: wartość oczekiwana w każdej grupie jest taka sama. Hipoteza alternatywna: nie wszystkie wartości oczekiwane są jednakowe.

Jednoczynnikowa analiza wariancji Weryfikacja hipotezy polega na estymacji wariancji na dwa niezależne od siebie sposoby: uśredniając wyniki uzyskane dla każdej grupy badając zmienność średnich między grupami O ile H0 jest słuszna, obie wariancje powinny być jednakowe. Sprawdzamy to jednostronnym testem F.

Jednoczynnikowa analiza wariancji Wyniki przedstawia się w postaci tabeli analizy wariancji: Źródło zmienności Sumy kwadratów St. swobody Średni kwadrat F Pomiędzy grupami k-1 Wewnątrz grup (błąd) n-k Całkowita n-1

Jednoczynnikowa analiza wariancji Pozytywny wynik testu (odrzucenie hipotezy zerowej) nie daje odpowiedzi na pytanie, które wartości oczekiwane różnią się między sobą. Odpowiedzi takiej udzielają testy po analizie wariancji, zwane porównaniami post-hoc.

Testy po analizie wariancji Porównania post-hoc są w istocie równoczesnym wykonaniem wielu testów. Jeśli pojedynczy test miałby poziom istotności , to poziom istotności wszystkich porównań mógłby być znacznie wyższy.

Testy po analizie wariancji Wybór testu post-hoc zależy od porównań, jakie zamierzamy przeprowadzić. Jeśli porównujemy grupy z kontrolą, możemy użyć testu Dunnetta. Gdy chcemy dokonać porównań typu każdy z każdym przyda się nam test Tukeya (lub Tukeya-Kramera dla niejednakowo licznych grup).

Testy post-hoc Wymienione testy zapewniają poziom istotności dla całego zbioru porównań.

Skale pomiarowe

Dyskretne zmienne losowe a skale pomiarowe. Gdy zbiór zdarzeń elementarnych jest skończony, odwzorowywanie go w zbiór liczb (czyli tworzenie zmiennej losowej) może być mniej użyteczne niż w przypadku zmiennej losowej ciągłej.

Skala nominalna Jeśli zbiór zdarzeń elementarnych nie wykazuje naturalnego uporządkowania, mówimy o skali nominalnej Przykłady: grupa krwi (0,A,B,AB), rozpoznanie, czynnik etiologiczny, sympatie polityczne, wyznanie, narodowość, rasa...

Skala porządkowa Gdy w zbiorze zdarzeń istnieje naturalne uporządkowanie, ale wprowadzanie odległości nie ma sensu, mamy do czynienia ze skalą porządkową. Przykłady: wynik leczenia (pogorszenie,b.z., poprawa), wykształcenie (brak, podst., gimn., średnie, wyższe...), WBC (poniżej, w normie, powyżej)

Skala interwałowa (równomierna) Gdy w skończonym zbiorze zdarzeń elementarnych istnieje odległość, pre-zentacja wyników w postaci zmiennej losowej jest w pełni uzasadniona. Przykłady: tętno, WBC (tys./mm3), liczba dzieci w rodzinie Gdy liczba możliwych wartości jest duża, traktujemy taką zmienną jako ciągłą.

Skale pomiarowe Pojęcie skali pomiarowej ma zastosowa-nie nie tylko do zmiennych losowych (wyników pomiarów), ale także w odniesieniu do wielkości kontrolowanych w eksperymencie (czynników).

Testy nieparametryczne

Testy zgodności rozkładów Test dla zmiennych połączonych – test rang Wilcoxona. Zmienna losowa nie musi być zmienną ciągłą, ale może być zmienną porządkową. Dla zmiennych niepołączonych analogicznym testem jest test rang U – Manna-Whitney’a.

Nieparametryczne testy zgodności Jak nieparametrycznie wyrazić hipotezy analogiczne do hipotez testu t-Studenta? Hipoteza zerowa: Hipotezy alternatywne: test jednostronny, np.: test dwustronny

Testy zgodności Rozszerzenia tych testów na porównanie większej liczby grup to: Test Kruskala-Wallisa dla zmiennych niepołączonych. Test Friedmana dla zmiennych połączonych.

Testy normalności Do badania, czy pomiary podlegają rozkładowi normalnemu służą testy: Lillieforsa Shapiro-Wilka D-Kołmogorowa-Smirnowa

Test zgodności z rozkładem teoretycznym Test zgodności Kołmogorowa

Test Q-Dixona Test Q-Dixona służy do eliminacji pomiarów, co do których spodziewamy się błędu grubego. Może być źródłem nadużyć. Można go użyć do odrzucenia tylko jednego pomiaru w danej próbie.

Zmienne skategoryzowane Pomiary o skali nominalnej lub porządkowej nazywamy zmiennymi skategoryzowanymi. Wyniki tego typu badań przedstawia się często w postaci tablicy kontyngencji.

Tablice kontyngencji

Tablice kontyngencji Podstawowym narzędziem badania takich tablic jest test niezależności . Gdy oczekiwane liczebności w niektórych polach tabeli są małe (<5), stosuje się tzw. test dokładny (oryginalny test . -Pearsona opiera się na przybliżeniu słusznym przy dużych próbach).

Tablice kontyngencji Szczególnie często spotykamy tablice 2x2 Przykład: Mann i wsp. (1975)

Tablice kontyngencji – iloraz szans szansa 1) p11/p12 2) p21/p22 iloraz szans (odds ratio)

Iloraz szans Estymator ilorazu szans

W postępowaniu z takimi zmiennymi zaciera się często granica między czynnikiem a wynikiem. Iloraz szans nie zmieni się, gdy zamienimy wiersze z kolumnami.

Tablice kontyngencji zmienne połączone Taką tabelę można badać testem McNemary.

Typy badań w naukach medycznych Badania eksperymentalne Badania obserwacyjne kohortowe case-control przekrojowe

Typy badań Badania prospektywne: W badaniach eksperymentalnych przydzielamy obiekty do grup losowo (randomizacja) W badaniu kohortowym obiekt sam wybiera grupę

Typy badań Badania retrospektywne Case-control – wybieramy do badań pod-mioty, u których stwierdzono przynależność do grupy wynikowej (a ustalamy, jakim poziomom czynników objaśniających były poddane). Przekrojowe – podmioty wybieramy losowo z populacji generalnej i ustalamy zarówno grupę wynikową jak i czynniki objaśniające.

Układy eksperymentalne analizy wariancji

Analiza wariancji Planowanie eksperymentu Analiza jednoczynnikowa, p poziomów czynnika, dla każdego obiektu jest tylko jeden pomiar. Obiekty przydzielane są do grup w wyniku losowania. Taki plan eksperymentalny nazywa się układem kompletnie zrandomizowanym. Układ ten jest rozszerzeniem testu t-Stu-denta dla zmiennych niepołączonych. Była już o nim mowa.

Układ kompletnie zrandomizowany Model: wynik pomiaru na obiekcie i w grupie j ogólna wartość oczekiwana efekt czynnika na poziomie j błąd losowy Zakładamy, że wszystkie błędy są wzajem-nie niezależne i mają taki sam rozkład normalny o wartości oczekiwanej 0:

Układ kompletnie zrandomizowany Hipotezy ANOVA dla tego układu można teraz zapisać tak: H0: dla wszystkich j H1: istnieje takie j, że W wyniku analizy wariancji otrzymujemy estymaty i Dla jednoznaczności trzeba założyć, że:

Układ kompletnie zrandomizowany Błąd losowy zawiera w sobie wpływ czynników niekontrolowanych w doświadczeniu, w tym zmienność międzyosobniczą jak i wewnątrzosobniczą. Inne układy eksperymentalne, jeśli mogą być zastosowane, służą zmniejszeniu tego błędu przez eliminację wpływu czynników zakłócających.

Układ bloków losowych Model: wynik pomiaru na obiekcie i w grupie j ogólna wartość oczekiwana wpływ czynnika na poziomie j wpływ bloku i błąd losowy

Układ bloków losowych Układ ten jest rozszerzeniem testu t-Stu-denta dla zmiennych połączonych na przypadek wielu grup. Pozwala wyeliminować wpływ jednego źródła zakłóceń. Np. wykonując pomiary na tym samym osobniku eliminujemy wpływ zmienności międzyosobniczej.

Układ kwadratu łacińskiego Układ ten pozwala wyeliminować wpływ dwóch czynników zakłócających ( ). Czynniki te muszą mieć tyle samo poziomów co czynnik będący przedmiotem badania. Model błędu jest tu bardziej skomplikowany.

Układ kwadratu łacińskiego Obiekty przydziela się do grup (wyznaczonych przez kombinacje czynnika badanego i zakłócających) jak zwykle w wyniku losowania.

Układ kwadratu łacińskiego B C D A B C D A B C D i jeszcze 573 inne możliwości...

Dwuczynnikowy układ kompletnie zrandomizowany Model: wynik pomiaru na obiekcie i w grupie o poziomie j 1. czynnika i poz. k 2. czynnika ogólna wartość oczekiwana wpływ czynnika 1. na poziomie j wpływ czynnika 2. na poziomie k interakcja czynników 1 i 2 na poz. j oraz k błąd losowy

Dwuczynnikowy układ kompletnie zrandomizowany W układzie tym możemy niezależnie weryfikować trzy hipotezy: H0: dla wszystkich j H0: dla wszystkich k H0(): dla wszystkich j oraz k Tabela analizy wariancji dla tego układu zawiera trzy różne statystyki F.

Dwuczynnikowy układ kompletnie zrandomizowany Przykład: 1. czynnik – pracownik laboratorium 2. czynnik – przyrząd (np. mikroskop) W badaniu możemy niezależnie zweryfikować trzy hipotezy: H01: wynik badania nie zależy od laboranta H02: wynik badania nie zależy od przyrządu H0(12): nie ma interakcji między laborantem a przyrządem.

Dwuczynnikowy układ kompletnie zrandomizowany Możliwe przypadki interakcji: laborantowi najlepiej pracuje się na własnym mikroskopie laborant nie lubi jednego z mikroskopów