Anna Mueck grupa A/B, OAM

Slides:



Advertisements
Podobne prezentacje
BADANIE KORELACJI ZMIENNYCH
Advertisements

Ocena wartości diagnostycznej testu – obliczanie czułości, swoistości, wartości predykcyjnych testu. Krzywe ROC. Anna Sepioło gr. B III OAM.
Ocena dokładności i trafności prognoz
Pochodna Pochodna  funkcji y = f(x)  określona jest jako granica stosunku przyrostu wartości funkcji y do odpowiadającego mu przyrostu zmiennej niezależnej.
materiał specjalny Kwartalnika Edukacja Biologiczna i Środowiskowa
Rola badań biochemicznych we wczesnym wykrywaniu nowotworów złośliwych
Jak mierzyć asymetrię zjawiska?
Statystyka w doświadczalnictwie
Wpływ warunków na niewiadome na wyniki wyrównania.
Jakość sieci geodezyjnych. Pomiary wykonane z największą starannością, nie dostarczają nam prawdziwej wartości mierzonej wielkości, lecz są zwykle obarczone.
Analiza korelacji.
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Alfred Stach Instytut Paleogeografii i Geoekologii
Korelacje, regresja liniowa
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Temat: Cechy populacji biologicznej.
Indeks glikemiczny.
Opracowała: Justyna Piegat
Analiza wyników egzaminów zewnętrznych absolwentów roku 2011 w Gimnazjum Nr 2 w Ciechanowie z wykorzystaniem metody EWD w ewaluacji wewnątrzkolnej. Opracowanie:
Średnie i miary zmienności
DIAGNOSTYKA LABORATORYJNA
Jednoczynnikowa analiza wariancji (ANOVA)
Diagnoza edukacyjna pomaga uczyć efektywniej
Hipotezy statystyczne
Konstrukcja, estymacja parametrów
Analiza współzależności cech statystycznych
Metody matematyczne w inżynierii chemicznej
Elementy Rachunku Prawdopodobieństwa i Statystyki
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Mikroekonomia A.14 Maciej Wilamowski.
na podstawie materiału – test z użyciem komputerowo generowanych prób
Farseer Physics Engine. Farseer Physics Engine jest silnikiem fizycznym napisanym dla platformy.NET. Został on zainspirowany przez silnik Box2D znany.
Obliczanie objętości robót ziemnych
Podstawy statystyki, cz. II
Właściwości testów diagnostycznych
Diagnostyka laboratoryjna nowotworów
SYSTEMY EKSPERTOWE I SZTUCZNA INTELIGENCJA
PROCENTY %.
Magdalena Wawrzyk Zespół ostrej moszny u dzieci – korelacja między badaniem ultrasonograficznym a obrazem śródoperacyjnym Kierownik Kliniki: prof. dr hab.
Henryk Rusinowski, Marcin Plis
Regresja wieloraka.
Seminarium licencjackie Beata Kapuścińska
Magdalena Wawrzyk Ocena wartości badania USG w kwalifikacji do zabiegu operacyjnego ostrego zapalenia wyrostka robaczkowego u dzieci Kierownik Kliniki:
Co to jest dystrybuanta?
Teoria perspektywy Daniela Kahnemana i Amosa Tversky`ego
Dopasowanie rozkładów
Krzywe ROC Ocena trafności testu diagnostycznego
Wnioskowanie statystyczne
Statystyka medyczna Piotr Kozłowski
JAKOŚĆ TECHNICZNA WĘGLA
Wykład Rozwinięcie potencjału znanego rozkładu ładunków na szereg momentów multipolowych w układzie sferycznym Rozwinięcia tego można dokonać stosując.
ANALIZA WRAŻLIWOŚCI.
EWD gimnazjalne Czym jest metoda edukacyjnej wartości dodanej (EWD)? Efektywność pracy szkoły, przed kilku laty, oceniano jedynie na podstawie wyników.
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Halina Klimczak Katedra Geodezji i Fotogrametrii Akademia Rolnicza we Wrocławiu WYKŁAD 2 ZMIENNE GRAFICZNE SKALA CIĄGŁA I SKOKOWA.
Modele nieliniowe sprowadzane do liniowych
Liczba ludności – liczba osób zamieszkujących dany obszar (np. jednostkę osadniczą, jednostkę administracyjną, państwo, kontynent itp.) w danym momencie.
Niepewności pomiarów. Błąd pomiaru - różnica między wynikiem pomiaru a wartością mierzonej wielkości fizycznej. Bywa też nazywany błędem bezwzględnym.
Rodzaje zmian zachodzących w otoczeniu przedsiębiorstwa:
BMI.
Wstęp do regresji logistycznej
Zarządzanie populacjami zwierząt
Zapis prezentacji:

Anna Mueck grupa A/B, OAM Ocena wartości diagnostycznej testu – obliczanie czułości, swoistości, wartości predykcyjnych testu. Krzywe ROC. Anna Mueck grupa A/B, OAM

Czułość diagnostyczna Czułość diagnostyczna określa zdolność testu do wykrywania osób chorych. Jest to stosunek wyników prawdziwie dodatnich do sumy wyników prawdziwie dodatnich i fałszywie ujemnych (pomnożone przez 100%). Czułość 100% oznaczałaby, że wszystkie osoby chore lub ogólnie z konkretnymi poszukiwanymi zaburzeniami zostaną rozpoznane.

Czułość diagnostyczna = PD / (PD + FU)

Przykład: Jeżeli wartość czułości diagnostycznej wynosi 70%, oznacza to, że 70% pacjentów z daną jednostką chorobową, przy pomocy danego testu będzie dobrze sklasyfikowane. 30% natomiast, zostanie źle sklasyfikowane. Im wyższa czułość testu, tym jest on bardziej przydatny diagnostycznie. Idealny byłby test o 100% czułości.

Swoistość diagnostyczna Swoistość diagnostyczna określa zdolność testu do poprawnego wykluczenia choroby. Jest to stosunek wyników prawdziwie ujemnych do sumy wyników prawdziwie ujemnych i fałszywie dodatnich (pomnożone przez 100%). Swoistość 100% oznaczałaby, że wszyscy ludzie zdrowi w wykonanym teście diagnostycznym zostaną oznaczeni jako zdrowi. Test o wysokiej swoistości posiada niski błąd drugiego typu.

Swoistość diagnostyczna = PU / (PU + FD)

przykład: Jeżeli wartość swoistości diagnostycznej wynosi 40%, oznacza to, że 40% pacjentów zdrowych, przy pomocy danego testu będzie dobrze sklasyfikowane. 60% natomiast, zostanie źle sklasyfikowane. Im wyższa swoistość testu, tym jest on bardziej przydatny diagnostycznie. Idealny byłby test o 100% swoistości.

Inne parametry oceniające wartość diagnostyczną testu Dodatnia wartość predykcyjna Ujemna wartość predykcyjna

Wartość predykcyjna dodatnia Wartość predykcyjna dodatnia (PPV) – prawdopodobieństwo, że osobnik miał chorobę mając pozytywny wynik testu. Jeśli więc badana osoba otrzymała pozytywny wynik testu, to PPV daje jej informację na ile może być pewna, że cierpi na daną chorobę.

Dodatnia wartość predykcyjna = PD / (PD + FD)

Ujemna wartość predykcyjna Wartość predykcyjna ujemna (NPV) – prawdopodobieństwo, że osobnik nie miał choroby mając negatywny wynik testu. Jeśli więc badana osoba otrzymała negatywny wynik testu, to NPV daje jej informację na ile może być pewna, że nie cierpi na daną chorobę.

Ujemna wartość predykcyjna = PU / (PU + FU)

Krzywe ROC krzywe ROC są często stosowaną metodą służącą do opisania dokładności diagnostycznej testu. Służą one do porównywania testów diagnostycznych, analizy czy dany test jest efektywny w odróżnianiu różnych populacji, i ustalania wartości odcięcia. Krzywe ROC opisują cały zakres pracy klasyfikatora i pozwalają na miarodajne porównanie wyników z różnych klasyfikatorów. Zaletą stosowania krzywych ROC jest też ich niezależność od jednostek i skal stosowanych w danym badaniu oraz możliwość stosowania do danych skategoryzowanych (nie tylko binarnie).

FP: wyniki fałszywie dodatnie FN: wyniki fałszywie ujemne TP: wyniki prawdziwie dodatnie TN: wyniki prawdziwie ujemne

Chorzy Zdrowi

Diagram obrazujący centralną pozycję krzywych ROC w oszacowaniu dokładności diagnostycznej

Krzywe ROC Potrzebny jest „złoty środek” aby dobrze zaklasyfikować chorych i zdrowych Liczba osób chorych i osób zdrowych powinna być zbliżona Zdrowi i chorzy powinni reprezentować populacje dla której wykonuje się oznaczenia Krzywa ROC jest to zależność pomiędzy czułością a (1- swoistością) Cel: ustalenie wartości decyzyjnej

Kryteria ustalenia wartości decyzyjnej Cel badania (przesiewowe, potwierdzające) „strata społeczna” – ile będzie kosztowało zakwalifikowanie osoby do kategorii „zdrowy” lub „chory” Częstość choroby w populacji

Bardzo istotne jest właściwe umieszczenie punktu odcięcia na krzywej Przesunięci punktu odcięcia w prawo spowoduje spadek czułości diagnostycznej ponieważ większa część chorych zostanie zakwalifikowana jako zdrowi. Natomiast wzrośnie swoistość ponieważ wszystkich tych którzy są zdrowi zakwalifikujemy prawidłowo czyli wykluczymy chorobę. Gdy wzrasta czułość to spada swoistość i na odwrót. Analogiczna sytuacja zaistnieje gdy punkt odcięcia zostanie przesunięty w lewo (wzrośnie czułość, a spadnie swoistość).

Wykres krzywej ROC (ang Wykres krzywej ROC (ang. Receiver Operating Curve) jest w praktyce klinicznej narzędziem ułatwiającym wybór wartości progowej testu diagnostycznego, dla którego uzyskujemy optymalne parametry czułości i swoistości. Krzywa to graficzne przedstawienie zależności pomiędzy odsetkami wyników testu prawdziwie dodatnimi (czułość) oraz odsetkami wyników fałszywie dodatnimi (1-swoistość).

Zwiększenie czułości testu wiąże się ze zmniejszeniem odsetka wyników fałszywie ujemnych, ale jednocześnie ze zmniejszeniem swoistości (zwiększeniem odsetka wyników fałszywie dodatnich).

Zwiększenie swoistości testu wiąże się ze zmniejszeniem odsetka wyników fałszywie dodatnich, ale jednocześnie ze zmniejszeniem czułości (zwiększeniem odsetka wyników fałszywie ujemnych).

Optymalna wartość progowa wyniku testu (możliwie wysoka czułość testu przy wysokiej swoistości), to w  większości przypadków wartość najbardziej zbliżona do lewego górnego rogu wykresu (odpowiadającego 100% czułości i swoistości).

Pole powierzchni pod wykresem krzywej ROC – AUC (ang Pole powierzchni pod wykresem krzywej ROC – AUC (ang. Area Under Curve), przyjmujące wartości w przedziale od 0 do 1, określa zdolność testu do rozgraniczenia wyników prawidłowych i nieprawidłowych. Im większe jest AUC (im bardziej wklęsła będzie funkcja ROC) tym większa jest moc diagnostyczna testu. Tym samym zdolność rozdzielcza testu jest lepsza. Większość testów w diagnostyce reprezentuje moc diagnostyczną wyrażająca się wielkościami AUC pomiędzy 0,80 a 0,95.

AUC Do uzyskania zwartej informacji o skuteczności klasyfikacji można użyć AUC (Area Under Curve), czyli pole powierzchni pod krzywą ROC. Pole powierzchni pod krzywą ROC to prawdopodobieństwo, że klasyfikator nada wyższą rangę losowo wybranemu przypadkowi z odpowiedniej grupy, a nie losowo wybranemu przypadkowi z grupy, w której wiadomo że szukane dane nie występują. W AUC zawarty jest opis precyzji detekcji w całym zakresie pracy systemu. Wartość AUC równą 0.5 można opisać jako działanie losowe, a wartość równa 1.0 to wskaźnik idealny. Oznacza to, że krzywa przechodząca bliżej górnego lewego rogu obrazuje większą dokładność diagnostyczną.

Często stosowany opis jakości testów diagnostycznych jest wzorowany na amerykańskim systemie edukacji i może być opisany w następujący sposób: Obliczenie AUC wykonywane jest przed programy komputerowe. Pole powierzchni obliczane jest najczęściej według dwóch metod: - Metoda nie parametryczna (ang. non-parametric) oparta jest na konstruowaniu trapezoidów pod krzywą w celu oszacowania pola powierzchni pod wykresem. - Metoda parametryczna oparta jest na zasadzie określania maksymalnego prawdopodobieństwa (ang. maximum likelyhood estymator) aby dopasować linie ciągłą do wykresu danych. · 0.9-1.0 = bardzo dobry · 0.8-0.9 = dobry · 0.7-0.8 = satysfakcjonujący · 0.6-0.7 = średni · 0.5-0.6 = niedostateczny

Przykładowe krzywe ROC dla przypadku idealnego, testu rzeczywistego i dla przypadkowej selekcji na obecność patologii, zupełnie niezdeterminowanej informacją użyteczną.

Wpływ częstości choroby na wartość diagnostyczną testu Prevalance (częstość) – proporcja ludzi z chorobą w danej populacji, w szczególnym momencie czasu Incidence (nowe przypadki) – liczba nowych przypadków choroby pojawiających się w danym okresie czasu (n/1000/rok)

Odds ratio i likelihood ratio Odds ratio (iloraz prawdopodobieństwa) – prawdopodobieństwo obecności danej choroby podzielone przez prawdopodobieństwo jej nieobecności Likelihood ratio (iloraz wiarygodności) – prawdopodobieństwo pojawienia się danego wyniku (gdy choroba jest obecna) podzielone przez prawdopodobieństwo tego samego wyniku gdy nie ma choroby

Dziękuję za uwagę 