Podstawowe pojęcia i terminy stosowane w statystyce Podstawowe pojęcia i terminy stosowane w statystyce. Zasady planowania eksperymentu naukowego
Plan wykładu Rodzaje danych Graficzna prezentacja danych Opis danych (miary położenia, miary rozproszenia)
Rodzaje danych Dane vs zmienne Obserwacje jednej lub wielu zmiennych Każda wielkość podlegająca zmianom nosi nazwę zmiennej Dane uzyskuje się z próby, która reprezentuje populację
Rodzaje danych Typy danych
Rodzaje danych Rozróżnianie typów danych Typ danych determinuje rodzaj metod statystycznych Rozróżnienie jest zazwyczaj proste Czasami mamy problemy Dane porządkowe z dużą liczbą kategorii vs dane ilościowe dyskretne Dane ilościowe ciągłe vs dyskretne (np. wiek)
Rodzaje danych Dane pochodne Procenty Proporcje lub ilorazy Częstości Punktacja
Rodzaje danych Dane ucięte Metody laboratoryjne – poniżej czułości metody W badaniach, w których część pacjentów wypada z grupy badanej przed czasem zakończenia badania
Graficzna prezentacja danych Jedna zmienna – dane jakościowe rozkład częstości (empiryczny) Wykres słupkowy lub kolumnowy Wykres kołowy
Graficzna prezentacja danych Jedna zmienna – dane ilościowe Histogram
Graficzna prezentacja danych Jedna zmienna – dane ilościowe Wykres punktowy
Graficzna prezentacja danych Jedna zmienna – dane ilościowe Wykres skrzynkowy (pudełko z wąsami, ramka-wąsy)
Graficzna prezentacja danych Dwie zmienne – dane jakościowe
Graficzna prezentacja danych Dwie zmienne – dane ilościowe Wykres rozrzutu
Graficzna prezentacja danych Kształt rozkładu częstości symetryczny
Graficzna prezentacja danych Kształt rozkładu częstości Prawoskośny, dodatnio skośny, przekrzywiony w prawo
Graficzna prezentacja danych Kształt rozkładu częstości Lewoskośny, ujemnie skośny, przekrzywiony w lewo
Opis danych Miary położenia Średnia arytmetyczna Mediana Wartość modalna Średnia geometryczna Średnia ważona
Opis danych Miary położenia Średnia arytmetyczna
Opis danych Miary położenia mediana N nieparzyste N parzyste Szereg 1, N= 13 [0 2 5 7 10 12 14 16 18 20 24 28 50] Szereg 2, N= 12 [0 2 5 7 10 12 14 16 18 20 24 28]
Opis danych Miary położenia wartość modalna (moda, dominanta) to wartość najczęściej pojawiająca się w zbiorze danych zmienne dyskretne – wartość o największym prawdopodobieństwie wystąpienia zmienne ciągłe wartość, dla której funkcja gęstości prawdopodobieństwa ma największą wartość modalna dla grup
Opis danych Miary położenia Średnia ważona Przykład: wśród pacjentów przeprowadzono dwa testy psychomotoryczne - oba oceniane w skali od 0 do 100. Psycholog uznał, że waga wyników testów powinna wynosić 2:3. Jeżeli osoba otrzymała z pierwszego testu 40, a z drugiego 55 punktów, to średnia arytmetyczna ważona wynosi: (2*40 (80)+3*55(165))/(2+3) = 49 pkt. Dla wagi 3:4 średnia arytmetyczna ważona wynosi: (120+220)/7=48,6 pkt.
Opis danych Miary rozrzutu (rozproszenia) Rozstęp Rozstęp międzykwartylowy Wariancja Odchylenie standardowe
Opis danych Miary rozrzutu -rozstęp różnica między największą i najmniejszą wartością w zbiorze danych
Opis danych Miary rozrzutu - kwantyle Percentyle Wartość zmiennej x, poniżej której w uporządkowanym szeregu znajduje się 1% wartości, jest zwana pierwszym percentylem
Opis danych Miary rozrzutu - kwantyle decyle Wartości x, które dzielą uporządkowany zbiór na 10 równych części, nazywamy decylami 10 percentyl – 1 decyl (D1) 20 percentyl – 2 decyl (D2), itd.
Opis danych Miary rozrzutu - kwartyle Wartości x, które dzielą uporządkowany zbiór na 4 równe części, nazywamy kwartylami pierwszy kwartyl Q1, dolny kwartyl, 25 percentyl drugi kwartyl Q2, 50 percentyl, wartość środkowa, mediana trzeci kwartyl Q3, 75 percentyl, górny kwartyl
Opis danych Miary rozrzutu rozstęp międzykwartylowy różnica pomiędzy Q3 i Q1 zawiera 50% środkowych wartości z uporządkowanego szeregu 25% leży poniżej dolnej granicy, 25% powyżej górnej granicy
Opis danych Miary rozrzutu Rozstęp międzydecylowy różnica pomiędzy D9 i D1
Opis danych Miary rozrzutu Rozstęp 2,5 i 97,5 percentylem Przedział referencyjny
Opis danych Miary rozrzutu
Opis danych Miary rozrzutu wariancja 1/(n-1)
Opis danych Miary rozrzutu Odchylenie standardowe Mówi, o ile jednostek wartości cechy przeciętnie różnią się od jej średniej