dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Slides:



Advertisements
Podobne prezentacje
PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
Advertisements

W dalszej części zajęć wyróżniać będziemy następujące
Analiza współzależności zjawisk
Biostatystyka inż. Jacek Jamiołkowski Wykład 2 Statystyka opisowa.
Rachunek prawdopodobieństwa 2
Analiza wariancji jednoczynnikowa
Analiza wyników konkursów przedmiotowych
Skale pomiarowe – BARDZO WAŻNE
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
Jak mierzyć asymetrię zjawiska?
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Właściwości średniej arytmetycznej
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Miary położenia Miary położenia opisują umiejscowienie typowych wartości cechy statystycznej na osi liczbowej.
MIARY ZMIENNOŚCI Główne (wywołujące zmienność systematyczną)
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyka w doświadczalnictwie
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
BIOSTATYSTYKA I METODY DOKUMENTACJI
BIOSTATYSTYKA I METODY DOKUMENTACJI
Dane informacyjne: Gimnazjum im. Marii Skłodowskiej-Curie
Wzory ułatwiające obliczenia
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Co to są rozkłady normalne?
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Testy nieparametryczne
Agnieszka Jankowicz-Szymańska1, Wiesław Wojtanowski1,2
Konstrukcja, estymacja parametrów
Analiza współzależności cech statystycznych
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Elementy Rachunku Prawdopodobieństwa i Statystyki
Rozkłady wywodzące się z rozkładu normalnego standardowego
Testy nieparametryczne
Analiza wariancji jednoczynnikowa.
Hipotezy statystyczne
Dane INFORMACYJNE Nazwa szkoły: Zespół Szkół nr 5 w Szczecinku i Zespół Szkół w Opalenicy ID grupy: 97/41_mf_g2 i 97/71_mf_g1 Kompetencja:
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
Statystyka ©M.
Podstawy statystyki, cz. II
EcoCondens Kompakt BBK 7-22 E.
EcoCondens BBS 2,9-28 E.
WYNIKI EGZAMINU MATURALNEGO W ZESPOLE SZKÓŁ TECHNICZNYCH
Testogranie TESTOGRANIE Bogdana Berezy.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
Co to jest dystrybuanta?
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Statystyka medyczna Piotr Kozłowski
Elementy geometryczne i relacje
Strategia pomiaru.
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
ze statystyki opisowej
Człowiek – najlepsza inwestycja
Jak mierzyć zróżnicowanie zjawiska?
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
MIARY STATYSTYCZNE Warunki egzaminu.
Zapis prezentacji:

dr hab. Dariusz Piwczyński, prof. nadzw. UTP Wprowadzenie do statystyki matematycznej Miary tendencji centralnej i rozproszenia. dr hab. Dariusz Piwczyński, prof. nadzw. UTP

Statystyka Nauka poświęcona metodom badania zjawisk masowych. Polega na systematyzowaniu, obserwowaniu cech ilościowych i jakościowych oraz przedstawieniu wyników w postaci zestawień tabelarycznych, wykresów, posługuje się rachunkiem prawdopodobieństwa.

Po co nam statystyka? Z ilu pomiarów należy obliczyć średnią? Ilu pomiarów należy użyć, aby mieć do tej średniej zaufanie? Ile winniczków powinniśmy poddać kontroli masy ciała?

Czy istnieje różnica między grubością rogówki przed założeniem szkieł kontaktowych a w 4. tygodniu ich noszenia? http://www.zdrowie.med.pl/oczy/anat_i_fizjo/a_oczy.html

Czy kobiety i mężczyźni w równym stopniu lubią słodycze?

Szeregi czasowe

Dzietność kobiet w latach 1960-2008

Czy istnieje zależność między masą noworodków a oceną w skali APGAR?

Statystyka matematyczna Dział matematyki zajmujący się metodami wnioskowania o prawach prawdopodobieństwa rządzących danym zjawiskiem na podstawie obserwacji tego zjawiska. Statystyka matematyczna zajmuje się badaniem własności zbiorów na podstawie znajomości własności ich części.

Populacja generalna Zbiorowość statystyczna, zbiór dowolnych elementów, nieidentycznych z punktu widzenia badanej cech. Z reguły jest ona dla nas niedostępna w całości do badań, jednak nas interesuje. Przykład: zbiór wszystkich osobników gatunku Ślimak winniczek, Kret.

Populacja próbna Podzbiór populacji generalnej, który podlega bezpośrednio badaniu ze względu na rozpatrywaną cechę, co pozwala na wyciągnięcie wniosków o kształtowaniu się wartości cechy w całej populacji generalnej.

Próba powinna być reprezentatywna! Powinna w jak najlepszy sposób oddawać strukturę populacji. Najprostszym przykładem takiej próby jest próba losowa prosta, otrzymywana jest, gdy każdy element populacji ma taką samą szansę dostania się do próby.

Zmienna losowa Cecha, a wartości tej cechy poszczególnych elementów populacji to realizacja zmiennej. Zmienna losowa może przyjmować z określonym prawdopodobieństwem każdą z wartości należących do wyszczególnionego zbioru, np. rzut kostką do gry – zmienna losowa, czyli cecha może przyjmować dowolną wartość ze zbioru od 1 do 6. Każdej wartości zmiennej losowej możemy przyporządkować jej prawdopodobieństwo wystąpienia.

Cechy ilościowe jakościowe

Cecha ilościowa Wynik zjawiska lub procesu, który daje się wyrazić ilościowo (za pomocą liczb). Cechy ilościowe oznaczane są za pomocą liter: X, Y, Z.

Cechy ilościowe, skokowe tzw. dyskretne. W badaniach biologicznych cechy skokowe wyrażane są za pomocą liczb naturalnych. Na ogół przyjmują one kilka lub kilkanaście wartości liczbowych. Ich modelami matematycznymi są zmienne losowe skokowe. Przykład – liczba urodzonych dzieci.

Cechy ilościowe, ciągłe Przyjmują wszystkie wartości z pewnego przedziału liczbowego liczb rzeczywistych. Ich modelami matematycznymi są zmienne losowe ciągłe, często ich rozkład prawdopodobieństwa jest zbliżony do rozkładu normalnego.

Cecha jakościowa Cechy, których nie możemy zapisać w postaci liczby, np. kolor oczu.

Zmienne dziecko Apgar masa dlugosc mleko jaja ospa piers kodPiers matka 1 6 2400 49 10 9 3 31 2 3750 55 7 22 4050 54 23 4 4000 11 5 8 3300 53 3200 52 12 36 33 3850 25

Zanim rozpoczniemy analizę statystyczną konieczne jest ustalenie skali, w jakiej wyrażana jest nasza cecha!!!

Skale pomiaru, nominalna nominalna – porządek właściwie dowolny, np.: rasa zwierzęcia, siedlisko, forma spędzania wolnego czasu     nominalna dychotomiczna, np. płeć, stan zdrowia („CHORY, ZDROWY”)

Skale pomiaru, porządkowa Wartościom cechy można przypisać rangi. Musi zatem istnieć możliwość logicznego uporządkowania wartości zmiennej. Przykład: wykształcenie osoby (podstawowe, zawodowe, średnie, wyższe), stan finansów (zły, średni, dobry, bardzo dobry)

Skale pomiaru, przedziałowa pozwala uporządkować wartości zmiennej, zakłada się, że dotyczy zbioru liczb rzeczywistych.

Rozkład zmiennej losowej Polega na przyporządkowaniu każdej wartości zmiennej losowej prawdopodobieństwo jej wystąpienia.

Doświadczenie Postępowanie, które służy weryfikacji istniejącego stanu wiedzy lub pozyskaniu nowych informacji. Polega ono na rozpoczęciu i obserwowaniu pewnego zjawiska w warunkach kontrolowanych.

Jednostka doświadczalna, Roślina lub zwierzę poddane działaniu danego poziomu czynnika doświadczalnego i w odniesieniu, do której prowadzimy obserwację cechy ilościowej, będącej odpowiedzią na działanie czynnika.

Czynnik doświadczalny Rodzaj zmiennej, która jest kontrolowana w doświadczeniu i która jest przyczyną kształtowania się cech zjawisk dotyczących głównie zwierząt, roślin czy środowiska, w którym bytują.

Poziom czynnika doświadczalnego Określone przez badacza warianty czynnika, w ramach których zamierza się prowadzić obserwacje nad kształtowaniem się interesujących nas cech. Gatunek: Carabus auratus Carabus cancellatus Carabus granulatus Carabus hortensis Carabus violaceus

Doświadczenia jednoczynnikowe W jednym czasie analizujemy wpływ jednego czynnika na cechy ilościowe roślin lub zwierząt, wieloczynnikowe W jednym czasie badamy wpływ wielu czynników na cechy ilościowe roślin lub zwierząt.

Statystyczny opis zmiennej losowej

Statystyki Pewne funkcje wartości pomiarowych służące do wyznaczenia przybliżonych wartości parametrów statystycznych. Należy do nich, m. in.: mediana, średnia arytmetyczna. Statystyki dotyczą populacji próbnej. Oznaczane są literami łacińskimi. Statystyka elementarna zajmuje się obliczaniem statystyk.

Parametry Parametry charakteryzują rozkład badanej cechy w populacji generalnej. Dotyczą populacji generalnej! Oznaczane są literami greckimi ,  Parametry Statystyki Średnia  Wariancja 2 s2 Odchylenie standardowe  s

Miary położenia i zmienności, podział

Podział miar statystycznych, miary asymetrii i koncentracji Asymetria rozkładu: skośność Koncentracja rozkładu: kurtoza

Miary położenia KLASYCZNE pozwalają określić, gdzie w zbiorze wartości liczbowych znajdują się wartości badanej cechy, tym samym pozwalają na umiejscowienie rozkładu cechy.

Średnia arytmetyczna gdzie: N – liczba wszystkich jednostek, xi – wartość cechy u i-tej jednostki.

Średnia arytmetyczna ważona Stosowana wtedy, gdy poszczególnym obserwacjom przypisujemy wagi związane z ich znaczeniem. wi – wagi przypisane poszczególnym obserwacjom. Przykład (Dobek, Szwaczkowski). Student biologii uzyskał 16 punktów z I kolokwium, 14 punktów z II kolokwium i 18 punktów z egzaminu. Przypiszmy egzaminowi wagę 3, a kolokwium wagę 1.

Własności średniej arytmetycznej Jest to taka wartość zmiennej, która podstawiona na miejsce wszystkich poszczególnych wartości nie zmieni ich sumy Suma odchyleń poszczególnych wartości od średniej arytmetycznej jest równa zero. Suma kwadratów odchyleń poszczególnych wartości zmiennej od średniej arytmetycznej jest najmniejsza w porównaniu z sumami kwadratów odchyleń od jakiejkolwiek innej liczby w szeregu.

Średnia ważona liczebnościami (dane przedstawione w formie szeregu rozdzielczego) gdzie: N – liczba wszystkich jednostek, ni - liczba jednostek posiadających i-tą wartość cechy, k – liczba klas, xi – i-ta wartość cechy

Średnia ważona

Szereg rozdzielczy zawiera pomiary pogrupowane na klasy. W ramach szeregu rozdzielczego tworzone są przedziały klasowe oraz zliczana jest liczba pomiarów w każdym przedziale klasowym.

Szereg rozdzielczy

Średnia harmoniczna gdzie: xi – wartość cechy, N – liczebność odnosząca się do wartości cechy xi. Średnia harmoniczna jest odwrotnością średniej arytmetycznej z odwrotności elementów próby! Stosowana m.in. w analizie wariancji układów nieortogonalnych (nieproporcjonalnych - przy nierównej ilości osobników w grupach). Nie można jej obliczyć, gdy jakaś wartość cechy równa się „0” lub jest ujemna. W badaniach, w których obserwowana jest wydajność w czasie – rozkład cechy odbiega od symetrycznego, ma przebieg hiperboliczny.

Średnia harmoniczna. Przykład (Dobek, Szwaczkowski) W gospodarstwie produkującym jaja stwierdzono, że pierwsze 1000 jaj pozyskiwano z prędkością 120 jaj/tydzień, drugi 1000 z prędkością 150 jaj/tydzień, a ostatni 1000 z prędkością 100 jaj/tydzień. Jaka była średnia wydajność tygodniowa w okresie, w którym uzyskano 3000 jaj?

Średnia geometryczna Stosowana, gdy jedna z wartości skrajnych zmiennej bardzo różni się od pozostałych (duże rozproszenie wartości skrajnych), w takim przypadku średnia geometryczna bardziej prawidłowo scharakteryzuje położenie danej cechy w szeregu liczbowym niż średnia arytmetyczna. Miara popularna w badaniach mikrobiologicznych, zmienne posiadają rozkłady prawostronne.

Arytmetyczna, geometryczna i harmoniczna

Obliczenie średniej geometrycznej jest równoznaczne z obliczeniem średniej arytmetycznej: a następnie powrót do oryginalnej skali pomiaru poprzez transformację: co jest równoznaczne z obliczeniem średniej geometrycznej

Miary położenia POZYCYJNE wskazują wartość cechy, która odgrywa w szeregu szczególną rolę, np. dzieli szereg na dwie połowy. Punktem wyjścia do ich określenia jest uporządkowanie szeregu liczbowego, konieczna jest przy tym znajomość liczebności.

Dominanta (Mo) Zwana wartością szczytowa, modą, wartością modalną. Jest to taka wartość zmiennej, która występuje w populacji największą ilość razy. Jest najbardziej typowa dla danego zjawiska. Jednak nie należy jej obliczać, gdy rozkład danej cechy nie posiada jednego, wyraźnie zaznaczonego maksimum liczebności. Wartość modalna wyznacza szczyt krzywej liczebności. Pozwala scharakteryzować populację pod względem jej typowości.

Kwartyle (kwantyle) (Q1,Q2,Q3) Są to takie wartości cechy, które pozwalają podzielić uporządkowany szereg liczbowy na 4 części. Kwartyl drugi dzieli szereg na połowy, zwany jest też medianą. Jeśli liczebności ćwiartek są liczbami parzystymi, to wartość kwartyli obliczamy jako średnią arytmetyczną z wartości kończących i rozpoczynających kolejne ćwiartki. W szeregu nieparzystym medianę stanowi środkowy wyraz szeregu.

Kwartyle stosujemy w odniesieniu do cech jakościowych trudno mierzalnych, w badaniach mikrobiologicznych przy określaniu średniej liczby drobnoustrojów.

MIARY ZMIENNOŚCI (DYSPERSJI) Problem, jaki wiąże się z powyższym zagadnieniem, to odpowiedź na pytanie: jak bardzo poszczególne wartości cechy różnią się od siebie?

Rozstęp Najprostsza miara zmienności. Jest to tzw. obszar zmienności, określa on całkowitą zmienność cechy. Obliczany jest z poniższego wzoru: Ox=xmax-xmin   Rozstęp jest traktowany jedynie jako wstępna miara zmienności z oczywistych względów (opieramy się jedynie o wartości skrajne).

Odchylenie ćwiartkowe

Średnie odchylenie przeciętne odchyleniem poszczególnych wartości zmiennej (xi) od średniej arytmetycznej.

Wariancja Wariancja jest średnią z kwadratów różnic średniej arytmetycznej od poszczególnych wartości cechy. W przypadku małych prób (poniżej 30) suma kwadratów dzielona jest przez N-1, w przeciwnym zaś przypadku przez N. Wariancja jest miarą, która nie posiada interpretacji.

Odchylenie standardowe Jest to liczba mianowana. Pozwala ona określić typowy obszar zmienności wartości cechy. Wskazuje ono, o jaką wartość poszczególne wartości cechy odbiegają przeciętnie od średniej arytmetycznej. Im większe odchylenie standardowe, tym poszczególne obserwacje są bardziej oddalone od średniej arytmetycznej, tym większe jest rozproszenie próby. Mówi się, że próba jest mało wyrównana.

Wskaźnik zmienności Pearsona Miary względnego zróżnicowania Stosowana w sytuacji, gdy badane zjawisko mierzone jest w różnych jednostkach miary lub kształtuje się na niejednakowym poziomie przeciętnym.

Przykład Badano stężenie jonów żelaza (mg/l) w dopływie do stawu wodnego. W tym celu wykonano 30 prób (tab. ). Oblicz podstawowe miary położenia klasyczne i pozycyjne oraz miary zmienności w zakresie badanej cechy.

Szereg nieuporządkowany Szereg uporządkowany Kwartyle lp x x2 lp'   1 0,10 0,01 12 0,08 2 0,40 0,16 13 0,09 3 0,14 0,02 23 4 5 0,47 0,22 6 7 8 1,10 1,21 9 Q1 = 0,10 30 0,11 10 0,13 20 0,12 11 0,84 0,71 15 14 1,09 1,19 19 0,20 29 0,24 Me = (0,24 + + 0 ,37) / 2 = 0,305 0,42 0,18 18 16 0,37 17 0,63 27 0,04 21 0,60 0,36 22 0,50 0,25 Q3 = 0,63 24 1,16 1,35 26 0,77 25 1,83 3,35 0,59 28 2,92 8,53 0,06 Suma 15,3100 19,0083

Skrzynka z wąsami

Wykres pudełkowy, objaśnienie W tej ostatniej nie zaobserwowano wartości nietypowych, czyli nie znalazły się takie wartości cechy, które byłyby oddalone od krawędzi skrzynki więcej niż wynosi półtora odstępu międzykwartylowego (1,5 x IQR). Ponadto, można stwierdzić, że wszystkie cechy posiadają rozkład prawostronny, gdyż wartość mediany jest mniejsza niż średniej arytmetycznej.