MIARY STATYSTYCZNE Warunki egzaminu.

Slides:



Advertisements
Podobne prezentacje
w szkole średniej Wykonały: Alicja Makowska i Beata Karwowska
Advertisements

Estymacja. Przedziały ufności.
W dalszej części zajęć wyróżniać będziemy następujące
Analiza współzależności zjawisk
Biostatystyka inż. Jacek Jamiołkowski Wykład 2 Statystyka opisowa.
Badania marketingowe na rynkach produktów sektora wysokich technologii Wybrane metody analizy danych.
Skale pomiarowe – BARDZO WAŻNE
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
Charakterystyki opisowe rozkładu jednej cechy
Jak mierzyć asymetrię zjawiska?
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Właściwości średniej arytmetycznej
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Miary położenia Miary położenia opisują umiejscowienie typowych wartości cechy statystycznej na osi liczbowej.
MIARY ZMIENNOŚCI Główne (wywołujące zmienność systematyczną)
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
BIOSTATYSTYKA I METODY DOKUMENTACJI
Dane informacyjne: Gimnazjum im. Marii Skłodowskiej-Curie
Niepewności przypadkowe
Korelacje, regresja liniowa
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Co to są rozkłady normalne?
Co to są rozkłady normalne?
Konstrukcja, estymacja parametrów
Kurs specjalistyczny dla pielęgniarek, mgr Adam Dudek, PWSZ Nysa 2007
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Analiza wariancji jednoczynnikowa.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Dane INFORMACYJNE Nazwa szkoły: Zespół Szkół nr 5 w Szczecinku i Zespół Szkół w Opalenicy ID grupy: 97/41_mf_g2 i 97/71_mf_g1 Kompetencja:
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
Statystyka ©M.
Podstawy statystyki, cz. II
Statystyka i opracowanie wyników badań
Statystyka - to „nie boli”
Planowanie badań i analiza wyników
Regresja wieloraka.
1 Analiza wyników sprawdzianu ‘2014 Zespół Szkolno-Przedszkolny w Krowiarkach – XI 2014 – XI 2014 Opracował: J. Pierzchała.
Analiza struktury na podstawie parametrów klasycznych i pozycyjnych
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Statystyka medyczna Piotr Kozłowski
Statystyczna analiza danych
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Korelacje dwóch zmiennych. Korelacje Kowariancja.
ze statystyki opisowej
SKALA CIĄGŁA I SKOKOWA.
STATYSTYKA – kurs podstawowy wykład 2 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Parametry rozkładów Metodologia badań w naukach behawioralnych II.
STATYSTYKA – kurs podstawowy wykład 11
Statystyka Wykłady dla II rok Geoinformacji rok akademicki 2012/2013
Jak mierzyć zróżnicowanie zjawiska?
Małgorzata Podogrodzka, SGH ISiD
Statystyka matematyczna
Radosław Hołówko Konsultant: Agnieszka Pożyczka
Jednorównaniowy model regresji liniowej
Wykorzystywanie wyników sprawdzianu w pracy dydaktycznej
Korelacja i regresja liniowa
statystyka podstawowe pojęcia
Zapis prezentacji:

MIARY STATYSTYCZNE Warunki egzaminu

MIARY STATYSTYCZNE Charakterystyki liczbowe (estymatory i parametry), które pozwalają opisać właściwości rozkładu badanej cechy (zmiennej)

MIARY STATYSTYCZNE MIARY KLASYCZNE MIARY POZYCYJNE Podział ze względu na zakres danych użytych do wyznaczenia miary MIARY KLASYCZNE Miary opisujące rozkład badanej cechy w zbiorowości, które obliczamy na podstawie wszystkich zaobserwowanych wartości cechy MIARY POZYCYJNE Miary opisujące rozkład badanej cechy statystycznej, które obliczamy na podstawie tylko niektórych wartości cechy, zajmujących szczególną pozycję w szeregu statystycznym

MIARY STATYSTYCZNE MIARY POŁOŻENIA MIARY ZRÓŻNICOWANIA MIARY ASYMETRII Podział ze względu na opisywane cechy rozkładu MIARY POŁOŻENIA Opisują średni lub typowy poziom wartości cechy. Określają tą wartość cechy, wokół której skupiają się wszystkie pozostałe wartości badanej cechy. Wśród nich można wyróżnić miary tendencji centralnej wskazujące położenie centralnych (przeciętnych) wartości cechy w rozkładzie MIARY ZRÓŻNICOWANIA (rozproszenia, rozrzutu, dyspersji) miary opisujące jak bardzo zróżnicowane są wartości cechy w zbiorowości MIARY ASYMETRII (skośności) miary opisujące asymetrię rozkładu cechy w zbiorowości

MIARY STATYSTYCZNE Miary klasyczne Miary pozycyjne Miary tendencji centralnej średnia arytmetyczna średnia geometryczna średnia harmoniczna inne średnie dominanta mediana kwantyle Miary zróżnicowania odchylnie przeciętne wariancja odchylenie standardowe klasyczny współczynnik zmienności Rozstęp (max-min) pozycyjny współczynnik zmienności Miary skośności klasyczny współczynnik asymetrii kurtoza pozycyjny współczynnik asymetrii Klasyczno-pozycyjny współczynnik skośności Pearsona

x ŚREDNIA ARYTMETYCZNA Suma wszystkich wartości cechy (zmiennej) podzielona przez liczbę wszystkich jednostek zbiorowości xi – i-ta wartość cechy (zmiennej) N – liczebność

ŚREDNIA WŁAŚCIWOŚCI OGRANICZENIA Średnia 6 7 8 3 2 4 5 5,0 50 11,4 może być obliczona tylko dla zmiennych ilościowych wielkość abstrakcyjna, tzn. jej wartość nie musi występować w szeregu statystycznym na podstawie którego była wyznaczana (badany o średnim wzroście nie istnieje ) jest wielkością mianowaną wyrażoną w takich jednostkach miary jak badana cecha (średnia zarobków jest wyrażona np. w zł, tak jak wartości zmiennej płaca) spełniona jest relacja minimum < średnia < maksimum jest „wrażliwa” na wartości odstające Średnia 6 7 8 3 2 4 5 5,0 50 11,4 OGRANICZENIA Średniej arytmetycznej nie należy wyznaczać jeśli: zbiorowość jest niejednorodna czyli nie wszystkie badane jednostki posiadają badaną cechę występują wartości odstające, nietypowe (ekstremalne)

Wartość najczęściej występująca w zbiorze wartości cechy DOMINANTA (MODALNA, MODA) D0 Wartość najczęściej występująca w zbiorze wartości cechy WŁAŚCIWOŚCI charakteryzuje „typowe” jednostki w zbiorowości jedyna miara położenia, którą można wyznaczyć dla zmiennych nominalnych w zbiorze wartości może występować więcej niż jedna wartość dominanty jeśli nie można wyznaczyć średniej (np. z powodu występowania wartości odstających) wyznacza się wartość dominanty

DOMINANTA (MODALNA, MODA) Liczba nb N 10 1 12 2 4 3 Studenci najczęściej opuścili jedne zajęcia (D0=1). Wykształcenie N Zawodowe 7 Średnie 3 Wyższe 22 „Typowy” badany ma wykształcenie wyższe (D0=„Wyższe”) Wyniki sprawdzianu N Niedostateczny 5 Dopuszczający 4 Dostateczny 7 Dobry 10 Bardzo dobry Uczniowie najczęściej otrzymali ocenę dobrą lub bardzo dobrą (dwie wartości modalne) (D0=„dobry”, D0=„bardzo dobry”)

MEDIANA (WARTOŚĆ ŚRODKOWA) Me Taka wartość cechy (zmiennej), że co najmniej połowa jednostek zbiorowości ma wartości nie większe (czyli mniejsze lub równe) od tej wartości i równocześnie co najmniej połowa jednostek zbiorowości ma wartości nie mniejsze (większe lub równe) od tej wartości Wartość cechy (zmiennej) w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji

MEDIANA (WARTOŚĆ ŚRODKOWA) Egzamin PJ (9,5): 3, 5, 6, 7, 11, 15 16, 17, 18 Me=11 Co najmniej połowa zdających uzyskała co najwyżej 11 punktów, co najmniej połowa zdających uzyskała przynajmniej 11 punktów Jeśli liczba obserwacji w próbie jest parzysta, wówczas mediana jest wyznaczana jako średnia z dwóch wartości leżących pośrodku Egzamin PJ (10,5-6): 1, 3, 5, 6, 7, 11, 15 16, 17, 18 Me=9 Połowa zdających uzyskała mniej niż 9 punktów, druga połowa zdających uzyskała więcej niż 9 punktów

MEDIANA (WARTOŚĆ ŚRODKOWA) Interpretacja mediany jako wartości, która dzieli zbiorowość na pół czyli dwie równoliczne części (mówimy, że połowa wartości jest mniejsza, połowa wartości większa od mediany) jest uproszczeniem! 1) nie da się podzielić zbiorowości o nieparzystej liczbie jednostek na pół 2) wartość mediany może występować w zbiorze wielokrotnie Me=11 Egzamin PJ (16,8-9): 1, 3, 4, 4, 5, 6, 7, 11, 11, 11, 11, 13, 15 16, 17, 18 W praktyce, kiedy zbiory danych są liczne dopuszcza się taką interpretację

KWANTYLE KWARTYLE DECYLE CENTYLE (PERCENTYLE) Wartości cechy (zmiennej), które dzielą zbiorowość na określone części pod względem liczby jednostek KWARTYLE dzielą zbiorowość na 4 części DECYLE dzielą zbiorowość na 10 części CENTYLE (PERCENTYLE) dzielą zbiorowość na 100 części

KWARTYLE Q Dzielą zbiorowość na 4 części: Pierwszy kwartyl (Q1), taka wartość jednostki, która dzieli zbiorowość, tak, że 25% jednostek jest od niej mniejszych, 75% większych Drugi kwartyl (Q2), wartość jednostki, że 50% jednostek jest od niej mniejszych, 50% większych (mediana!) Trzeci kwartyl (Q3), taka wartość jednostki, że 75% jednostek jest od niej mniejszych, 25% większych Wartości jednostek Q1 Q2 Q3 min max 25% 50% 75% Liczba jednostek Najbardziej typowe wartości zmiennej znajdują się między pierwszym a trzecim kwartylem

SIATKI CENTYLOWE

SIATKI CENTYLOWE

Odchylenie przeciętne (163zł) Odchylenie przeciętne (56zł) Zarobki w zespole A Zarobki w zespole A Odchylenie przeciętne (163zł) Średnia (405zł) Zarobki w zespole B Odchylenie przeciętne (56zł)

ODCHYLENIE PRZECIĘTNE d x=12 d=3 N=8 xi Res. 1 15 Res. 2 10 Res. 3 12 Res. 4 14 Res. 5 16 Res. 6 8 Res. 7 Res. 8 6 Suma 96 Średnia xi-x 3 -2 2 4 -4 -6 |xi-x| 3 2 4 6 24

ODCHYLENIE PRZECIĘTNE d Średnia arytmetyczna wartości bezwzględnych odchyleń (różnic) poszczególnych wartości cechy od średniej Odchylenie przeciętne jest miarą rozrzutu. Mówi o tym, o jaką wartość różnią się przeciętnie wartości cechy (zmiennej) od średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej

WARIANCJA S2 Średnia arytmetyczna kwadratów odchyleń (różnic) poszczególnych wartości cechy od średniej

ODCHYLENIE STANDARDOWE S Odchylenie standardowe jest pierwiastkiem kwadratowym z wariancji

ODCHYLENIE STANDARDOWE S Zarobki w zespole A Zarobki w zespole A Odchylenie standardowe (195zł) Odchylenie przeciętne (163zł) Średnia (405zł) Zarobki w zespole B Odchylenie standardowe (76 zł) Odchylenie przeciętne (56zł)

ODCHYLENIE STANDARDOWE S Odchylenie standardowe jest miarą rozrzutu. Mówi o tym, jak wartości cechy (zmiennej) są rozrzucone wokół średniej. Im większa wartość odchylenia tym większe zróżnicowanie wartości zmiennej, im mniejsze odchylenie tym mniejsze zróżnicowanie Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej, im większa wartość odchylenia tym obserwacje są bardziej oddalone od średniej

Odchylenie od średniej Odchylenie standardowe 100 zł 0 zł Odchylenie od średniej Odchylenie standardowe średnia 50 zł

KLASYCZNY WSPÓŁCZYNNIK ZMIENNOŚCI VS VS – klasyczny współczynnik zmienności S - odchylenie standardowe x - średnia Klasyczny współczynnik zmienności informuje jaki procent średniej arytmetycznej stanowi odchylenie standardowe Wartość KWZ Zróżnicowanie cechy 0-20% Słabe 20-40% Umiarkowane 40-60% Silne Powyżej 60% Bardzo silne Silne lub bardzo silne zróżnicowanie cechy wskazuje, że zbiorowość jest niejednorodna, w takiej sytuacji średnia arytmetyczna jest niemiarodajną miarą – ma małą wartość poznawczą.

KLASYCZNY WSPÓŁCZYNNIK ZMIENNOŚCI Zarobki w zespole A Zarobki w zespole A Odchylenie standardowe (195zł) Średnia (405zł) Klasyczny współczynnik zmienności 48% Zarobki w zespole B Odchylenie standardowe (76 zł) Średnia (405zł) Klasyczny współczynnik zmienności 19%

ROZKŁAD NORMALNY KRZYWA GAUSSA, KRZYWA DZWONOWA Zmienna losowa: przyjmuje wartości zależne od przypadku :) Zmienne o rozkładzie normalnym: poziom inteligencji, wzrost wyniki egzaminu Własności: symetryczny, średnia = dominanta = modalna

„miłosierdzie egzaminacyjne” ;-)

REGUŁA 3 SIGM Reguła trzech sigm (odchyleń standardowych) mówi, że dla rozkładu normalnego: 68,3% wartości cechy leży w odległości jednego odchylenia standardowego od średniej arytmetycznej 95,5% wartości cechy leży w odległości dwóch odchyleń od średniej 99,7% wartości cechy leży w odległości trzech odchyleń standardowych od średniej arytmetycznej

ILORAZ INTELIGENCJI średnia: µ= 100 odchylenie standardowe: =15 68,3% populacji ma iloraz inteligencji mieszczący się w przedziale 85-115 (100±15) 95,5% populacji ma iloraz inteligencji mieszczący się w przedziale 70-130 (100±2*15) 99,7% populacji ma iloraz inteligencji mieszczący się w przedziale 55-145 (100±3*15)

ŚREDNIA Z SESJI średnia: µ= 4,0 odchylenie standardowe:  =0,3 68,3% studentów ma średnią z sesji mieszczącą się w przedziale 3,7-4,3 95,5% studentów ma średnią z sesji mieszczącą się w przedziale 3,4-4,6 99,7% studentów ma średnią z sesji mieszczącą się w przedziale 3,1-4,9