Parametry rozkładów Metodologia badań w naukach behawioralnych II
Średnia I K. Szymanek Metodologia badań II2 Średnia arytmetyczna może być zrozumiana lepiej za pomocą analogii ze środkiem ciężkości. Aby układ dwóch ciężarków na powyższym rysunku pozostał w równowadze, powinien być podparty w miejscu wskazanym strzałką. Miejsce to znajduje się w połowie odległości między ciężarkami. Średnia arytmetyczna może być zrozumiana lepiej za pomocą analogii ze środkiem ciężkości. Aby układ dwóch ciężarków na powyższym rysunku pozostał w równowadze, powinien być podparty w miejscu wskazanym strzałką. Miejsce to znajduje się w połowie odległości między ciężarkami.
Średnia II K. Szymanek Metodologia badań II3 Analogicznie: średnia arytmetyczna liczb 0 i 50 leży w połowie odległości między tymi liczbami. Podobnie jest z innymi liczbami… Analogicznie: średnia arytmetyczna liczb 0 i 50 leży w połowie odległości między tymi liczbami. Podobnie jest z innymi liczbami…
Średnia III K. Szymanek Metodologia badań II4 Średnia arytmetyczna liczb 10 i 16 leży dokładnie w połowie odległości między tymi liczbami
Średnia IV K. Szymanek Metodologia badań II5 Średnia arytmetyczna liczb 1 i 2 leży w połowie odległości między tymi liczbami. Średnia arytmetyczna liczb 1 i 2 leży w połowie odległości między tymi liczbami. 1 1,5 2
Średnia V K. Szymanek Metodologia badań II6 Dołożenie ciężarka w punkcie równowagi nie zmienia położenia punktu równowagi. Analogicznie, dołączenie do zbioru liczb liczby równej średniej nie zmienia średniej całości. Przykład: średnia z 4 i 6 wynosi 5. Obliczmy średnią z 4, 5, 6: ( )/3 = 5. Średnia z 4, 5, 5, 6 też równa jest 5. Dołożenie ciężarka w punkcie równowagi nie zmienia położenia punktu równowagi. Analogicznie, dołączenie do zbioru liczb liczby równej średniej nie zmienia średniej całości. Przykład: średnia z 4 i 6 wynosi 5. Obliczmy średnią z 4, 5, 6: ( )/3 = 5. Średnia z 4, 5, 5, 6 też równa jest 5.
Średnia VI K. Szymanek Metodologia badań II7 Punkt równowagi znajduje się w 1/3 odległości między ciężarkami d 2 x d
Średnia VI K. Szymanek Metodologia badań II8 Średnia z 0, 0, 90 wynosi
Średnia VI K. Szymanek Metodologia badań II9 Średnia z 100, 100, 130 wynosi
K. Szymanek Metodologia badań II10 ABCDABCD Gdzie jest punkt równowagi – na rysunku A, B, C czy D?
K. Szymanek Metodologia badań II11 Suma odległości od średniej do wyników mniejszych od niej równa jest sumie odległości do wyników większych
K. Szymanek Metodologia badań II12 Suma odległości od średniej do wyników mniejszych od niej równa jest sumie odległości do wyników większych
Zadanie domowe (a) Obliczyć średnią m zespołu liczb: 8, 12, 12, 12, 13, 16, 17, 18, 18 (b) Obliczyć sumę X wszystkich odległości od liczb mniejszych od m do m (c) Obliczyć sumę Y wszystkich odległości od liczb większych od m do m (d) Zauważyć, że X = Y (a) Obliczyć średnią m zespołu liczb: 8, 12, 12, 12, 13, 16, 17, 18, 18 (b) Obliczyć sumę X wszystkich odległości od liczb mniejszych od m do m (c) Obliczyć sumę Y wszystkich odległości od liczb większych od m do m (d) Zauważyć, że X = Y K. Szymanek Metodologia badań II13
Mediana I 14K. Szymanek Metodologia badań II
Mediana II 15K. Szymanek Metodologia badań II
Mediana III 16K. Szymanek Metodologia badań II
Mediana III 17K. Szymanek Metodologia badań II
Mediana IV 18K. Szymanek Metodologia badań II
Mediana V Wielkość mediany zależy tylko od tego, ile wyników leży poniżej i powyżej jej wartości. Ich oddalenie nie wpływa na medianę: nie ma znaczenia, czy dany wynik jest tylko nieznacznie większy (mniejszy), czy też bardzo odbiega od mediany. Mówimy, że mediana nie jest czuła na obecność wyników ekstremalnych. Wielkość mediany zależy tylko od tego, ile wyników leży poniżej i powyżej jej wartości. Ich oddalenie nie wpływa na medianę: nie ma znaczenia, czy dany wynik jest tylko nieznacznie większy (mniejszy), czy też bardzo odbiega od mediany. Mówimy, że mediana nie jest czuła na obecność wyników ekstremalnych. 19K. Szymanek Metodologia badań II
Mediana i średnia 20K. Szymanek Metodologia badań II
Mediana i średnia 21K. Szymanek Metodologia badań II
Mediana i średnia 22K. Szymanek Metodologia badań II
Mediana i średnia 23K. Szymanek Metodologia badań II
Mediana i średnia Średnia, w odróżnieniu od mediany, jest wrażliwa na lokalizację każdego wyniku. Nowy wynik zmienia ją tym bardziej, im bardziej jest od niej odległy. Ponieważ średnia odzwierciedla wszystkie wyniki, więc mają na nią wpływ wyniki ekstremalne, przez co czasami obraz rzeczywistości może być przez średnią zniekształcony. K. Szymanek Metodologia badań II24
Przykład W pewnym zakładzie pracy zatrudnionych jest 7 pracowników. Ich zarobki miesięczne (w tys. zł) są następujące: K. Szymanek Metodologia badań II25 1,0 1,5 1,8 2,0 2,2 50,0 m = 9,6 me = 2,0 Który parametr lepiej opisuje wielkość zarobków?
Przykład W Polsce średni zarobek w 2012 wynosił 3,7 tys. zł | mediana 2,9 tys. zł Niewielka grupa Polaków zarabia bardzo dużo, co podwyższa średnią, ale nie wywiera wyraźnego wpływu na medianę. Rozkład liczebności zarobków w Polsce jest prawostronnie skośny (dodatnio skośny). Pojęcie skośności będzie omówione dalej. K. Szymanek Metodologia badań II26
Mediana czy średnia? (a)Czas na 100 m osiągany przez zawodników biorących udział w sztafecie (b)Umiejętność udzielania pierwszej pomocy ofiarom wypadków przez kierowców (c)Wiedza o świecie nabywana przez uczniów w szkołach (d)Wielkość szkód powodowanych przez ubezpieczonych (z punktu widzenia firmy ubezpieczeniowej) K. Szymanek Metodologia badań II27
Mediana czy średnia? W praktyce badań społecznych średnia pojawia się dużo częściej niż mediana. Powody tego są następujące: (a)średnia odzwierciedla dokładniej zbiór wyników, co skutkuje większą precyzją np. wniosków (b)średnia jest bardziej od mediany podatna na operacje matematyczne (c)za pomocą średniej formułuje się prawa statystyki, których z użyciem mediany w ogóle nie dałoby się wyrazić, albo też stałyby się dużo słabsze Mediana natomiast znajduje szerokie zastosowanie w opisie zmiennych rangowych, gdy średniej liczyć nie można. K. Szymanek Metodologia badań II28
Wyznaczanie mediany na podstawie rozkładów liczebności Jeśli liczba wszystkich elementów wynosi N, to (a) Jeśli N jest nieparzyste, to mediana jest wartością przyjmowaną przez element „środkowy”, o numerze (N/2)+0,5. Przykład: 2, 3, 7, 11, 13, 14, 20 (N = 7, N/2 = 3,5) me = 11 (b) Jeśli N jest parzyste, to mediana jest wartością wyznaczoną przez elementy o numerach N/2 oraz N/ Bierzemy średnią wartości obu tych elementów. Przykład: 3, 5, 6, 8, 13, 15 (N = 6, N/2 = 3) me = (6 + 8)/2 = 7 K. Szymanek Metodologia badań II
Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu dokładnego (bez grupowania). K. Szymanek Metodologia badań II30 WynikiLiczebność RAZEM 59 59/2 = 29,5 Medianę wyznacza wartość przyjmowana przez 30 element, a więc wynik 3. Odp.: me = 3 59/2 = 29,5 Medianę wyznacza wartość przyjmowana przez 30 element, a więc wynik 3. Odp.: me = 3 Dla ilu elementów wynik wynosi 3 lub więcej? Dla = 34 > 29,5 Dla ilu elementów wynik wynosi 3 lub mniej? Dla = 40 > 29,5 Dla ilu elementów wynik wynosi 3 lub więcej? Dla = 34 > 29,5 Dla ilu elementów wynik wynosi 3 lub mniej? Dla = 40 > 29,5
Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu dokładnego (bez grupowania). K. Szymanek Metodologia badań II31 WynikiLiczebnośćLiczebność skumulowana RAZEM 59xxxxxxxxx 59/2 = 29,5 Medianę wyznacza wartość przyjmowana przez 30 element, a więc wynik 3. Odp.: me = 3 59/2 = 29,5 Medianę wyznacza wartość przyjmowana przez 30 element, a więc wynik 3. Odp.: me = 3 Rubryka z liczebnością skumulowaną może ułatwić znalezienie mediany. Rubryka z liczebnością skumulowaną może ułatwić znalezienie mediany. 30
Wyznaczyć medianę I K. Szymanek Metodologia badań II32 WynikiLiczebność RAZEM /2 = 69 Medianę wyznaczają wartości przyjmowane przez 69 i 70 element, a więc 4. Odp.: me = 4 138/2 = 69 Medianę wyznaczają wartości przyjmowane przez 69 i 70 element, a więc 4. Odp.: me = 4 Dla ilu elementów wynik wynosi 4 lub więcej? Dla = 73 > 69 Dla ilu elementów wynik wynosi 4 lub mniej? Dla = 97 > 69 Dla ilu elementów wynik wynosi 4 lub więcej? Dla = 73 > 69 Dla ilu elementów wynik wynosi 4 lub mniej? Dla = 97 > 69
Wyznaczyć medianę II K. Szymanek Metodologia badań II33 WynikiLiczebność RAZEM /2 = 66,5 Odp.: me = 7 133/2 = 66,5 Odp.: me = 7
Wyznaczyć medianę III K. Szymanek Metodologia badań II34 WynikiLiczebność RAZEM 77 76/2 = 38 Medianę wyznacza 38 i 39 element, ale wartości dla tych elementów są różne: dla jednego 8, dla drugiego 7 Dlatego me = 7,5 76/2 = 38 Medianę wyznacza 38 i 39 element, ale wartości dla tych elementów są różne: dla jednego 8, dla drugiego 7 Dlatego me = 7,5 38
Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II35 WynikiLiczebność [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 RAZEM 20 20/2 = 10 Medianę wyznaczają wartości przyjmowane przez 10 i 11 element, a więc jakąś wartość z przedziału [16, 24). 20/2 = 10 Medianę wyznaczają wartości przyjmowane przez 10 i 11 element, a więc jakąś wartość z przedziału [16, 24).
Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II36 WynikiLiczebność [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 RAZEM 20 20/2 = 10 Medianę wyznacza wynik przyjmowany przez 10 i 11 element, a więc jakąś wartość z przedziału [16, 24). 20/2 = 10 Medianę wyznacza wynik przyjmowany przez 10 i 11 element, a więc jakąś wartość z przedziału [16, 24).
Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II37 WynikiLiczebność [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 RAZEM 20 20/2 = 10 Medianę wyznacza wynik przyjmowany przez 10 element, a więc jakiś wynik z przedziału [16, 24). 20/2 = 10 Medianę wyznacza wynik przyjmowany przez 10 element, a więc jakiś wynik z przedziału [16, 24). Ten przedział ma szerokość 24 – 16 = 8 i zawiera 4 elementy. Na każdy z nich przypada 8/4 = 2 jednostki. Medianę wyznacza 2. od dołu element, zatem me = 2 = 20 20/2 = 10 Medianę wyznaczają wartości przyjmowane przez 10 i 11 element, a więc jest to wartość z przedziału [16, 24) 20/2 = 10 Medianę wyznaczają wartości przyjmowane przez 10 i 11 element, a więc jest to wartość z przedziału [16, 24) Taki sam rezultat osiągniemy licząc od góry Medianę wyznacza 2. od góry element, zatem me = 24 – 2 2 = 20
Mediana na histogramie liczebności K. Szymanek Metodologia badań II38 WynikiLiczebności [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)
Mediana na histogramie częstości K. Szymanek Metodologia badań II39 WynikiCzęstości [24, 32)0,40 [16, 24)0,20 [8, 16)0,25 [0, 8)0, me = 20
Mediana na histogramie częstości K. Szymanek Metodologia badań II40 WynikiCzęstości [24, 32)0,40 [16, 24)0,20 [8, 16)0,25 [0, 8)0, % me = 20
Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II41 WynikiLiczebność [30, 40)2 [20, 30)4 [10, 20)7 [0, 10)3 RAZEM 16 16/2 = 8 Medianę wyznacza wynik przyjmowany przez 8 i 9 element, a więc jest to wartość z przedziału [10, 20) 16/2 = 8 Medianę wyznacza wynik przyjmowany przez 8 i 9 element, a więc jest to wartość z przedziału [10, 20)
Wyznaczanie mediany na podstawie rozkładów liczebności Przypadek rozkładu z grupowaniem. K. Szymanek Metodologia badań II42 WynikiLiczebność [30, 40)2 [20, 30)4 [10, 20)7 [0, 10)3 RAZEM 16 16/2 = 8 Medianę wyznacza wartość przyjmowana przez 8 i 9 element, a więc jest to wartość z przedziału [10, 20) 16/2 = 8 Medianę wyznacza wartość przyjmowana przez 8 i 9 element, a więc jest to wartość z przedziału [10, 20) Ten przedział ma szerokość 20 – 10 = 10 i zawiera 7 elementów. Na każdy z nich przypada 10/7 = 1,43 jednostki. Medianę wyznacza 5. element od dołu, zatem me = 1,43 = 17,15 Alternatywnie można obliczyć medianę biorąc 2. element od góry (niebieski): me = 20 – 2 1,43 = 17,14 (różnica bierze się z zaokrągleń)
Mediana na histogramie liczebności K. Szymanek Metodologia badań II % WynikiLiczebność [30, 40)2 [20, 30)4 [10, 20)7 [0, 10)3 RAZEM 16 me =17,15
Mediana na histogramie częstości K. Szymanek Metodologia badań II % WynikiLiczebność [30, 40)2 [20, 30)4 [10, 20)7 [0, 10)3 RAZEM 16 me =17,15
Wyznaczanie średniej z rozkładu liczebności Przypadek rozkładu dokładnego: (a) najpierw liczymy 6 0 = 168 (b) następnie dzielimy wynik przez N = /58 = 2,90 K. Szymanek Metodologia badań II45 WynikiLiczebność RAZEM 58
Wyznaczanie średniej z rozkładu liczebności Przypadek liczebności pogrupowanych K. Szymanek Metodologia badań II46 WynikiLiczebność [24, 32)8 [16, 24)4 [8, 16)5 [0, 8)3 RAZEM 20 (a)Zastępujemy przedziały klasowe liczbami środkowymi, czyli średnimi granic klas. Zamiast [24,32) bierzemy więc (24+32)/2=28 Zamiast [16, 24) bierzemy (16+24)/2 = 20 itd.
Wyznaczanie średniej z rozkładu liczebności Przypadek liczebności pogrupowanych K. Szymanek Metodologia badań II47 WynikiŚrodkiLiczebność [24, 32)288 [16, 24)204 [8, 16)85 [0, 8)43 RAZEM 20 (a)Zastępujemy przedziały klasowe liczbami środkowymi, czyli średnimi granic klas. Zamiast [24,32) bierzemy więc (24+32)/2=28 Zamiast [16, 24) bierzemy (16+24)/2 = 20 itd.
Wyznaczanie średniej z rozkładu liczebności Przypadek liczebności pogrupowanych K. Szymanek Metodologia badań II48 WynikiŚrodkiLiczebność [24, 32)288 [16, 24)204 [8, 16)85 [0, 8)43 RAZEM 20 (a)Zastępujemy przedziały klasowe liczbami środkowymi, czyli średnimi granic klas. Zamiast [24,32) bierzemy więc (24+32)/2=28 Zamiast [16, 24) bierzemy (16+24)/2 = 20 itd. (b) Teraz liczymy tak, jak w przypadku rozkładu dokładnego: (8 4)/20 = 17,80
Moda (dominanta, modalna) Moda (dominanta, modalna) to wartość przyjmowana najczęściej. Przykład: 2, 3, 4, 5, 5, 7, 10, 10, 10, 14, 15, 15 moda = 10 K. Szymanek Metodologia badań II49
Moda K. Szymanek Metodologia badań II50 WynikiLiczebność RAZEM 58 moda = 2
Obliczanie mody dla rozkładów pogrupowanych K. Szymanek Metodologia badań II51 d1d1 d2d2 X s
Przykład WynikiLiczebności [24, 32)25 [16, 24)30 [8, 16)20 [0, 8)10 K. Szymanek Metodologia badań II52 X = 16, s = 8 d 1 = 30 – 20 = 10 d 2 = 30 – 25 = 5 d 1 + d 2 = 15 moda = 0,67 = 21,36
Moda często nie jest określona (a)3, 5, 8, 13, 20, 33 (moda = ) (b) 2, 2, 4, 5, 6, 7, 7, 12, 13 (moda = ) (c) (moda = ) K. Szymanek Metodologia badań II53