Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Statystyka - to nie boli Elżbieta Kalicińska, Mateusz Sokolski Klinika Chorób Serca, Akademia Medyczna we Wrocławiu.

Podobne prezentacje


Prezentacja na temat: "Statystyka - to nie boli Elżbieta Kalicińska, Mateusz Sokolski Klinika Chorób Serca, Akademia Medyczna we Wrocławiu."— Zapis prezentacji:

1 Statystyka - to nie boli Elżbieta Kalicińska, Mateusz Sokolski Klinika Chorób Serca, Akademia Medyczna we Wrocławiu

2 Aby dane były policzalne muszą być uporządkowane baza danych:

3 ZMIENNE PRZYPADKI

4 Przypadek i zmienna: Przypadki: wiersze w bazie danych (jeden wiersz ~ zestaw wartości zmiennych odnotowanych u np. jednego pacjenta)

5 Przypadek i zmienna: Zmienne: kolumny w bazie danych, inaczej cechy statystyczne

6 ZMIENNE = Cechy statystyczne zmienne ilościowe (= mierzalne = ciągłe) Np. wzrost, masa ciała, ciśnienie skurczowe zmienne jakościowe (=niemierzalne ) = kategorie, do których można przyporządkować przypadki, np. kobieta lub mężczyzna.

7 * dodawanie zmiennych

8 * dodawanie przypadków

9 * formatowanie danych

10 Jak opisać cechę jakościową? Aby zmienne jakościowe były policzalne musimy nadać im kody wpisując dane do bazy danych przyjmujemy, że kobieta = 1, mężczyzna 0 (więcej kategorii = więcej cyfr)

11 ZMIENNA JAKOŚCIOWA PRZYPADKI ZMIENNA ILOŚCIOWA

12 Rozkład normalny normalny ~ symetryczny ~najwięcej przeciętnych, mało skrajnych (min- max) liczebność wartość cechy średnia minmax

13 Rozkład normalny Niektóre dane układają się w rozkład normalny, np. wzrost Pewne dane nigdy nie będą miały rozkładu normalnego, np. NTproBNP Sprawdzanie rozkładu dotyczy zmiennych ciągłych

14 Średnia- to suma wartości znajdujących się w rozkładzie podzielona przez ich liczbę Mediana- to wartość, która dzieli zbiór na dwie równe części (połowa obserwacji (50%) leży powyżej, a druga połowa poniżej jej wartości) Odchylenie standardowe (SD)- odchylenie standardowe pokazuje jak daleko wartości zmiennej rozrzucone są wokół średniej. Kwartyle- dzielą rozkład na 4 części co 25%.

15 SE (standard error) Błąd standardowy to odchylenie standardowe dla wartości średniej (swiadzczy o stopniu rozproszenia średnich). SE nie jest równy SD przedział ufności (95% CI, confidence interval ) Im większa i bardziej reprezentatywna próba tym węższy jest przedział ufności - określa stopień precyzji

16 μ +/- 1σ, znajduje się 68.3% obserwacji, μ +/- 2σ, znajduje się 95.45% obserwacji, μ +/- 3σ, znajduje się 99.7% obserwacji,

17 Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej

18 Kiedy sprawdzać czy rozkład jest normalny? Analiza cech ciągłych Normalność rozkładu testujemy na każdej populacji (osobno każdą grupę, gdy dokonujemy podziału ze względu na cechy) Liczebność próby, n>30

19 W jakim celu sprawdzać czy rozkład jest normalny? 1) By określić sposób prezentowania wyników - średnia ± SD (odchylenie standardowe) dla rozkładu normalnego - mediana (~50%) (Q1-Q3 = dolny i górny kwartyl~25 i 75% ) dla rozkładów niemających cech rozkładu normalnego 2) By określić jakie testy stosować w dalszej analizie - parametryczne - nieparametryczne

20 TESTY: - parametryczne – testy mocniejsze (silniejszy argument) - nieparametryczne – słabsze, na małych liczebnościach, mogą być wątpliwe

21 * unormalnienie rozkładu Jeśli zmienna CIĄGŁA nie ma rozkładu normalnego, ale mamy ponad 30 przypadków – można spróbować unormalnić rozkład: Logarytmując każdą wartość ALE! Należy sprawdzić rozkład po zlogarytmowaniu (być może mimo to nie dało się uzyskać normalności). - log naturalny - log dziesiętny

22 * unormalnienie rozkładu

23 Przekształcanie danych do rozkładu normalnego – logarytmowanie –pierwiastkowanie –potęgowanie

24 Jak testować normalność? 1)Czy rozkład jest normalny? 2)Wybrać zmienne

25 Test Kołmogorowa-Smirnowa (K-S)

26 P > 0.05 = ROZKŁAD JEST NORMALNY ; P< 0.05 = ROZKŁAD NIE JEST NORMALNY!

27 Co można testować? Istotność różnic średnich wartości między grupami / ZMIENNYMI – próby zależne – próby niezależne Istotność korelacji (związków)

28 Testy Cel testowaniaTesty parametryczneTesty nieparametryczne Zbadanie istotności różnic między 2 grupami (próby niezależne) T- studentaTest U Manna- Whitneya Zbadanie istotności różnic między >2 grupami (próby niezależne) ANOVA testowanie parametryczne ANOVA testowanie nieparametryczne Zbadanie różnic (pary wiązane, próby zależne) T- studenta dla prób wiązanych Test znaków Zbadanie korelacji (związku) Korelacja r-PearsonaKorelacja r- Spearmana

29 Test T - studenta Porównanie ze sobą średnich maksymalnie DWÓCH grup. Nie więcej!!! czy średnia wyniki w jednej grupie są większe bądź mniejsze niż w drugiej grupie

30 Test T - studenta dla prób niezależnych (dwie niezależne grupy) Sprawdzenie czy kobiety w danej populacji mają mniejsze BMI niż mężczyźni

31 Test T - studenta dla prób niezależnych (dwie niezależne grupy) Sprawdzenie czy kobiety w danej populacji mają mniejsze BMI niż mężczyźni

32 Testy Cel testowaniaTesty parametryczneTesty nieparametryczne Zbadanie istotności różnic między 2 grupami (próby niezależne) T- studentaTest U Manna- Whitneya Zbadanie istotności różnic między >2 grupami (próby niezależne) ANOVA testowanie parametryczne ANOVA testowanie nieparametryczne Zbadanie różnic (pary wiązane, próby zależne) T- studenta dla prób wiązanych Test znaków Zbadanie korelacji (związku) Korelacja r-PearsonaKorelacja r- Spearmana

33 Test U Manna-Whitneya Założenie: sprawdzenie czy osoby o etiologii niedokrw. i nie-niedokrwiennej różnią się pod względem BMI

34 Test U Manna-Whitneya

35 wybieramy 2 rodzaje zmiennych: -niezależną (tutaj BMI): musi być cechą ilościową (ciągłą) ale nie musi mieć rozkładu normalnego -grupującą (ta która wyznacza kryteria podziału porównywanych grup; tutaj etiologia CAD lub nie-CAD): musi być cechą jakościową, dychotomiczną

36 Test U Manna-Whitneya

37 wynikiem testu jest Z (tutaj: 0,40) p = 0,68 interpretacja: badane 2 grupy nie różnią się istotnie pod względem BMI (p>0,05)

38 Testy Cel testowaniaTesty parametryczneTesty nieparametryczne Zbadanie istotności różnic między 2 grupami (próby niezależne) T- studentaTest U Manna- Whitneya Zbadanie istotności różnic między >2 grupami (próby niezależne) ANOVA testowanie parametryczne ANOVA Kruskala-Wallisa Zbadanie różnic (pary wiązane, próby zależne) T- studenta dla prób wiązanych Test znaków Zbadanie korelacji (związku) Korelacja r-PearsonaKorelacja r- Spearmana

39 ANOVA Jeśli mamy do czynienia z więcej niż dwiema "skorelowanymi próbami" (np. przed zabiegiem, po zabiegu 1 i po zabiegu 2 ), wtedy należy zastosować analizę wariancji w wersji z powtarzanymi pomiarami (więcej niż dwie zmienne z tej samej próby )

40 ANOVA cel analizy wariancji (ANOVA): testowanie istotności różnic pomiędzy średnimi możemy oceniać wpływ każdego z czynników, kontrolując wszystkie pozostałe; jest to prawdziwa przyczyna, dla której ANOVA charakteryzuje się wyższą mocą niż prosty test t (tzn. potrzebujemy mniej obserwacji, aby stwierdzić istotny wpływ).

41 Test znakow

42

43 Test T - studenta 2. dla prób zależnych (jedna grupa) Sprawdzenie istotności różnić pomiędzy masa ciała przed i po diecie: ta sama grupa ważona przed leczeniem i po miesiącu stosowania diety

44 Test T – studenta (dla prób zależnych) Po wybraniu zmiennych przycisk Testy t

45 Test T – studenta (dla prób zależnych) Otrzymujemy tabele wyników: wartość w kolumnie 'p' podaje odpowiedni poziom istotności (p<0,05)

46 Korelacja Korelacja jest miarą powiązania pomiędzy dwiema liczbą zmiennych Współczynniki korelacji przyjmują wartości z przedziału od -1,00 do +1,00. Wartość - 1,00 reprezentuje doskonałą korelację ujemną, a wartość +1,00 doskonałą korelacją dodatnią. Wartość 0.00 wyraża brak korelacji.korelację ujemną korelacją dodatnią

47 Korelacja r - Pearsona określa stopień w jakim dwie zmienne są "proporcjonalne" względem siebie (np. korelacja między wysokością a masą ciała) określenie proporcjonalne oznacza zależność liniową to znaczy, że korelacja jest silna, jeśli może być "opisana" przy pomocy linii prostej (nachylonej do góry lub na dół) linia regresji stwierdzenie, czy zaobserwowana zależność ma charakter przypadkowy, czy jest typowa dla całej populacji

48 * Linia regresji = linia szacowana metodą najmniejszych kwadratów, ponieważ jej parametry określane są w ten sposób, by suma kwadratów odchyleń punktów pomiarowych od tej linii była minimalna

49 * Współczynnik korelacji współczynnik korelacji (r) wyraża liniową zależność między dwiema zmiennymi.

50 Korelacja r - Pearsona zależności czasu leczenia i poziomu enzymu w organizmach chorych analizę korelacji wykonujemy z modułu Podstawowe statystyki i tabele z menu Analiza wybieramy opcję Macierze Korelacji

51 Korelacja r - Pearsona Wybieramy do analizy zmienne PŁEĆ i ENZ. z menu Dwie listy zmiennych

52 Korelacja r - Spearmana interpretacja jak korelacji r – Pearsona

53 Test chi-kwadrat Stosowany do sprawdzania różnic w cechach jakościowych między dwiema grupami NP: W grupie 1 (np. osob chorych) jest 34 mężczyzn i 25 kobiet, W grupie 2 (np,. Os. Zdrowych=gr. kontrolnej) jest 40 mężczyzn i 30 kobiet Czy grupy te różnią się pod względem liczby kobiet i mężczyzn????

54

55

56

57

58

59

60


Pobierz ppt "Statystyka - to nie boli Elżbieta Kalicińska, Mateusz Sokolski Klinika Chorób Serca, Akademia Medyczna we Wrocławiu."

Podobne prezentacje


Reklamy Google