Krzysztof Jurek Statystyka Spotkanie 4
Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają od przeciętnej. Miary zmienności dzielimy na: 1.Klasyczne wariancja odchylenie standardowe odchylenie przeciętne wsp ó łczynnik zmienności 2. Pozycyjne rozstęp odchylenie ćwiartkowe wsp ó łczynnik zmienności
dla szeregu wyliczającego dla szeregu rozdzielczego punktowego dla szeregu rozdzielczego przedziałowego ODCHYLENIE PRZECIĘTNE określa o ile wszystkie jednostki danej zbiorowości różnią się średnio ze względu na wartość zmiennej od średniej arytmetycznej tej zmiennej: Odchylenie przeciętne ma małe zastosowanie, łatwo w nim o błąd. Inne oznaczenie odchylenia przeciętnego to OP
WARIANCJA jest średnią arytmetyczną z kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej całej zbiorowości: dla szeregu wyliczającego dla szeregu rozdzielczego punktowego dla szeregu rozdzielczego przedziałowego
dla dwu lub więcej grup, lub wariancja dla wielu podgrup gdzie: N – liczebność ogólna zbiorowości s i 2 – średnia arytmetyczna ważona z wariancji wewnątrzgrupowych x – średnia arytmetyczna całej populacji x i - średnia arytmetyczna i-tej grupy s 2 (x i ) - wariancja średnich grupowych (wariancja międzygrupowa) n i – liczebność poszczególnych grup
ODCHYLENIE STANDARDOWE określa o ile wszystkie jednostki badanej zbiorowości różnią się średnio ze względu na wartość badanej zmiennej od średniej arytmetycznej tej zmiennej: Odchylenie standardowe mówi jak standardowo poszczególne wyniki różnią się od średniej, ale poprzez podniesienie do kwadratu wartość odchylenia jest lekko zawyżona. Dlatego wprowadza się tzw. poprawkę Sheparda
68% wartości cechy leży w odległości od wartości oczekiwanej; 95,5% wartości cechy leży w odległości od wartości oczekiwanej; 99,7% wartości cechy leży w odległości od wartości oczekiwanej.
Odchylenie standardowe wykorzystujemy do wyznaczenia TYPOWY OBSZAR ZMIENNOŚCI. Pokazuje on jakie są typowe, najczęstsze wyniki. W obszarze tym mieści się ok. 2/3 jednostek badanej cechy.
UWAGI: Wariancję i odchylenie standardowe wykorzystuje się do wielu dalszych obliczeń w analizie danych. Posługując się nimi możemy wyeliminować wyniki mało wiarygodne. Najczęściej przyjmuje się, że w 1,96 odległości (odchylenia standardowego) od średniej mieści się 95% wyników wiarygodnych. Odchylenie standardowe i wariancja są wartościami bezwzględnymi i zależą od jednostek. W celu wyeliminowania tej bezwzględności stosujemy współczynniki względności wyrażone w procentach. Mamy wtedy jasny punkt odniesienia – 100%. W obliczeniach ważna jest wielkość odchylenia a nie jego kierunek, stąd jego interpretacja łatwa jest tylko w przypadku rozkładów symetrycznych lub umiarkowanie skośnych,
WSPÓŁCZYNNIK ZMIENNOŚĆI jest ilorazem bezwzględnej miary dyspersji do odpowiednich wartości średnich: dla odchylenia standardowego dla odchylenia przeciętnego dla odchylenia ćwiartkowego dla kwartyli
ODCHYLENIE ĆWIARTKOWE opiera się na wartościach kwartyla pierwszego i trzeciego i mierzy poziom zróżnicowania środkowej części jednostek badanej zbiorowości:
Jeżeli do opisu tendencji centralnej użyto mediany, to wykorzystując odchylenie ćwiartkowe można wyznaczyć TYPOWY OBSZAR ZMIENNOŚCI: Gdy przedziały są otwarte nie można obliczyć odchylenia standardowego, stosujemy medianę i odchylenie ćwiartkowe. Pomiędzy odchyleniami ćwiartkowym, przeciętnym i standardowym zachodzi następująca zależność: