Seminarium magisterskie Zajęcia szóste – sprawdzamy jak to jest z przeżywaniem...

Slides:



Advertisements
Podobne prezentacje
ESTYMACJA PRZEDZIAŁOWA
Advertisements

Modele oparte o dane przekrojowo-czasowe
Statystyka Wojciech Jawień
Układy eksperymentalne analizy wariancji. Analiza wariancji Planowanie eksperymentu Analiza jednoczynnikowa, p poziomów czynnika, dla każdego obiektu.
Porównywanie średnich dwóch prób niezależnych o rozkładach normalnych (test t-studenta)
Analiza wariancji Marcin Zajenkowski. Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna.
BUDOWA MODELU EKONOMETRYCZNEGO
Metody wnioskowania na podstawie podprób
Analiza wariancji Analiza wariancji (ANOVA) stanowi rozszerzenie testu t-Studenta w przypadku porównywanie większej liczby grup. Podział na grupy (czyli.
Metody ekonometryczne
Metody ekonometryczne
Statystyka w doświadczalnictwie
Analiza korelacji.
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Modele (hipotezy) zagnieżdżone
Próby niezależne versus próby zależne
Porównywanie średnich dwóch prób zależnych
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 4: Generowanie zdarzeń  Dr inż. Halina Tarasiuk p. 337, tnt.tele.pw.edu.pl.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Testy nieparametryczne
Konstrukcja, estymacja parametrów
Testowanie hipotez statystycznych
Prognozowanie (finanse 2011)
Testy nieparametryczne
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Testy nieparametryczne
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Elementy Rachunku Prawdopodobieństwa i Statystyki
Modelowanie ekonometryczne
podsumowanie wiadomości
Prognozowanie (finanse 2011)
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
ANALIZA ANOVA - KIEDY? Wiele przedsięwzięć badawczych zakłada porównanie pomiędzy średnimi z więcej niż dwóch populacji lub dwóch warunków eksperymentalnych.
Ekonometryczne modele nieliniowe
Wnioskowanie statystyczne
Metoda reprezentacyjna i statystyka małych obszarów z SAS Instytut Statystyki i Demografii SGH dr Dorota Bartosińska Zajęcia 4 Wnioskowanie statystyczne.
Ekonometria stosowana
Weryfikacja hipotez statystycznych
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Podstawowe pojęcia i terminy stosowane w statystyce
Model ekonometryczny Jacek Szanduła.
Seminarium magisterskie Zajęcia siódme – wykorzystać pełnię wiedzy...
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
Logistyka – Ćwiczenia nr 6
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Tytuł projektu Wywiady #1. Które założenia testowaliśmy? Które KONKRETNIE hipotezy z modelu biznesowego (BMC) poddaliście sprawdzeniu?
Wzrastający wiek nie wpływa na czas zastosowania adekwatnej terapii w prewencji pierwotnej ICD/CRT-D: analiza ryzyk konkurencyjnych.
Treść dzisiejszego wykładu l Metoda Najmniejszych Kwadratów (MNK) l Współczynnik determinacji l Koincydencja l Kataliza l Współliniowość zmiennych.
Wstęp do regresji logistycznej
Testy nieparametryczne
Statystyka matematyczna
Ekonometria stosowana
Statystyka matematyczna
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Analiza przeżycia.
Analiza przeżycia Ćw 5 - Zastosowanie statystyki w bioinżynierii
Własności asymptotyczne ciągów zmiennych losowych
Ćw 10 - Zastosowanie statystyki w bioinżynierii
Zapis prezentacji:

Seminarium magisterskie Zajęcia szóste – sprawdzamy jak to jest z przeżywaniem...

Na czym polega tajemnica przeżycia?  Początki wszystkiego w medycynie i biologii  Pytanie kluczowe: czy możemy mówić o determinantach przeżycia od t1 do t2, wiedząc, że część pacjentów przeżyła od t0 do t1?  Nie ma czarodziejskich różdżek – przyszłości się nie zgadnie, ale Prawdopodobieństwo przeżycia do chwili T, ozn. S(T) = P(Y>T) Estymujemy P(Y>T) na podstawie próby (losowość?) Czas w odcinkach (aż zostaje jedna obserwacja) P(przeżycia do czasu T) = S(T) = P(Y>T)= p(t 1 ) · p(t 2 ) ·... · p(t N ) 2 t1t1t2t2t3t3 tNtN t0t0 T Seminarium magisterskie - zajęcia 7

Techniczne tło  W każdym okresie można wyestymować probit/logit: P(żyję w t | przeżyłam do t-1)  De facto, ciąg estymacji p(live_t|live_t-1), p(live_t+1|live_t), p(live_t+2|live_t+1), itp.  Dla każdego t i wyznaczamy: n i-1 - liczbę osób w grupie ryzyka w czasie t i-1, czyli „chwilę wcześniej” d i - liczbę jednostek, które zaginęły pomiędzy t i-1 a t i n i = n i-1 – d i, n 0 =N  Prawdopodobieństwo przeżycia odcinka pomiędzy ti-1 a ti: p(t i ) = P(t i |Y>t i-1 ) = (n i-1 – d i )/n i-1 = 1 – d i /n i Seminarium magisterskie - zajęcia 7

4 Dane kliniczne  20 obserwacji, 10 zgonów, 10 obserwacji cenzurowanych – osoby żyjące w dniu zakończenia obserwacji  Czas obserwacji (FU) liczony w miesiącach od daty zakończenia leczenia Przykład Seminarium magisterskie - zajęcia 7

5 Estymator Kaplana Meiera S(t1) = P(Y>t1) = P(t1|Y>t0)*P(Y>t0) = (1- 1/20)*1=0.95 t0=0 t1= n0=20 d1=1, c1=0 n1 = 20 – 1 =19 i t2,372,402,793,193,916,647,108,028,058,21 d c Seminarium magisterskie - zajęcia 7

6 Estymator Kaplana Meiera i t11,4711,7915,6415,7019,7021,9424,30 d c S(t19)=P(Y>t19)= P(t19|Y>t18)*P(Y>t18) = (1- 1/2)* = 0.5*0.39=0.19 t18= t19= n18=2 d19=1, c19=0 n19 = 2 – 1 = Seminarium magisterskie - zajęcia 7

Estymator Kaplana Meiera Seminarium magisterskie - zajęcia 77

Dodatkowe utrudnienia: funkcje  Gdy założyć, że przeżycie jest jakąś funkcją (a nie tylko obrazkiem danych) Konieczne założenie o rozkładzie prawdopodobieństwa przeżycia:  Wykładnicze: λ(t)= λ /stałe wraz z próbą?/  Weibull: λ(t) = λ p pt p-1 /zmienne, ale jak?/  Gompertz-Makeham: λ(t) = e {α+βt} /też zmienne…? /  Gamma: S(t) = 1 - I k (λ t) /też zmienne…? /  Wiele różnych… Seminarium magisterskie - zajęcia 78

Zalety i wady estymatora KM  Zalety: Intuicyjny Nie potrzebuje wielu obserwacji Wyliczany z danych (zawsze wyjdzie)  Wady: Nie możliwości warunkowania cechami Nieciągłości (jaki sens, gdy N duże) Nie ma testów statystycznych, hipotez, itp.  Słowem: narzędzie wizualizacji danych  Potrzeba podejścia funkcyjnego, z możliwością testowania hipotez Seminarium magisterskie - zajęcia 79

Inne podobne estymatory  Estymator Nelsona-Aalena Ideowo nie wnosi wiele Podobnie jak KM – szacowany z danych i tylko je odzwierciedla Różnica: NA startuje z tzw. funkcji ryzyka, a KM bezpośrednio z funkcji przeżycia  Proste modele porównujące dwie/kilka grup: Mantel-Haenszel Cox Różne inne kombinacje – nieczęsto spotykane (czasem potrzebne) Seminarium magisterskie - zajęcia 710

Model Mantel-Haenszel Seminarium magisterskie - zajęcia 711

12 Funkcja ryzyka – model Cox’a  Można zdefiniować: h(t) - funkcja ryzyka  chwilowe prawdopodobieństwo zgonu w czasie t pod warunkiem przeżycia do chwili t x1, x2,..., xk – testowany zbiór czynników ryzyka h0(t) – bazowa funkcja ryzyka w grupie, t – czas obserwacji β1, β 2,..., β k – współczynniki modelu Seminarium magisterskie - zajęcia )( )( )0,( )1,( b b b e eth eth xth xth == = = × ×

13 Wady i zalety modely Cox’a  Wady: iloraz funkcji ryzyka STAŁY W CZASIE! brak informacji (bezpośredniej) dotyczącej h 0 (t) Tylko bardzo proste hipotezy (czy grupy się różnią)  Zalety Graficzny test: krzywe ln(-ln(S(t)) dla porównywanych grup Model Cox’a może być warunkowany dodatkowymi zmiennymi Seminarium magisterskie - zajęcia 7

Jak to zrobić w STATA? Bez survival?  Funkcje przeżycia twoway line S age  Funkcję ryzyka gen H = - log(S) gen h = H[_n] - H[_n-1] gen logh = log(h) gen agem = age if h <. twoway line logh agem, xtitle("age") Seminarium magisterskie - zajęcia 7

Jak to działa w STATA?  Generalnie dwa podejścia: Z danych (tzw. nieparametryczne) stscox, stsgraph Z założeniem o rozkładzie prawdopodobieństwa (tzw. parametryczne) stsreg, stscurve  Najpierw trzeba zadeklarować dane w formacie survival: Zmienna określająca śmierć + zmienna okreslająca czas stset czas, failure(smierc) Seminarium magisterskie - zajęcia 7

Jak to zrobić w STATA  W wersji parametrycznej stset czas, fail(smierc) streg wszystkie_zmienne_determinujace, distribution(rozklad)  W wersji nieparametrycznej sts graph /Kaplan Meier/ sts graph, by(group) /Kaplan Meier/ sts test group /Mantel-Haenszel/ stcox group /Cox/ stphtest, plot(group) /test potwierdzający, czy Cox dobry/ stphplot, by(treated) /graficzne potwierdzenie testu PH/  I to mniej więcej wszystko Seminarium magisterskie - zajęcia 7

Przykładowa estymacja streg Seminarium magisterskie - zajęcia 717

Przykładowy wynik stcox Seminarium magisterskie - zajęcia 718

Przykładowy test na proporcjonalność Seminarium magisterskie - zajęcia 719

20 Podsumowanie  Nie jest to narzędzie specjalnie wyrafinowane  Na jak skomplikowane pytania odpowiemy – zależy od nas i specyfikacji modelu  Przy dużych zbiorach – metody nieparametryczne mają swoje zalety  Przy niewielkich zbiorach – metody parametryczne mogą dawać słabe rezultaty  Nie jest to metoda „z założenia” przyczynowo-skutkowa Seminarium magisterskie - zajęcia 7