Podstawy statystyki, cz. II

Slides:



Advertisements
Podobne prezentacje
Badania statystyczne Wykłady 1-2 © Leszek Smolarek.
Advertisements

BADANIE KORELACJI ZMIENNYCH
PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
Szereg rozdzielczy Szereg rozdzielczy jest zestawieniem, w którym wartości badanej cechy statystycznej rozdzielone są na określone grupy (klasy), a każdej.
W dalszej części zajęć wyróżniać będziemy następujące
Analiza współzależności zjawisk
Podsumowanie wykładu 1. Najpełniejszą charakterystyką wybranej zmiennej jest jej rozkład.
Skale pomiarowe – BARDZO WAŻNE
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
Elementy Modelowania Matematycznego
Charakterystyki opisowe rozkładu jednej cechy
Prezentacja danych liczbowych Wykład 2 dr Małgorzata Radziukiewicz
Jak mierzyć asymetrię zjawiska?
Graficzna prezentacja danych Wykład 2 dr Małgorzata Radziukiewicz
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Właściwości średniej arytmetycznej
Analiza współzależności
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Powinien być określony w sposób zwięzły i precyzyjny, np
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Opis i prezentacja materiału statystycznego
Statystyka w doświadczalnictwie
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
BIOSTATYSTYKA I METODY DOKUMENTACJI
Analiza współzależności dwóch zjawisk
Średnie i miary zmienności
Hipotezy statystyczne
Konstrukcja, estymacja parametrów
Analiza współzależności cech statystycznych
dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US
Cechy zbiorowości i grupowanie statystyczne
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Testy nieparametryczne
Analiza szeregów czasowych
Analiza wyników sprawdzianu ‘2013
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
Statystyka ©M.
Analiza matury 2013 Opracowała Bernardeta Wójtowicz.
Rachunek różniczkowy funkcji jednej i wielu zmiennych
Regresja wieloraka.
1 Analiza wyników sprawdzianu ‘2014 Zespół Szkolno-Przedszkolny w Krowiarkach – XI 2014 – XI 2014 Opracował: J. Pierzchała.
Testogranie TESTOGRANIE Bogdana Berezy.
Co to jest dystrybuanta?
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Narzędzia.
Elementy geometryczne i relacje
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
SKALA CIĄGŁA I SKOKOWA.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
Grupowanie danych statystycznych „ Człowiek – najlepsza inwestycja”
Człowiek – najlepsza inwestycja
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Halina Klimczak Katedra Geodezji i Fotogrametrii Akademia Rolnicza we Wrocławiu WYKŁAD 2 ZMIENNE GRAFICZNE SKALA CIĄGŁA I SKOKOWA.
STATYSTYKA – kurs podstawowy wykład 11
Małgorzata Podogrodzka, SGH ISiD
Statystyka matematyczna
Analiza współzależności zjawisk
MIARY STATYSTYCZNE Warunki egzaminu.
Zapis prezentacji:

Podstawy statystyki, cz. II Kurs specjalistyczny dla pielęgniarek, mgr Adam Dudek, PWSZ Nysa 2007

Szereg statystyczny … Szereg statystyczny - jest to zbiór wyników obserwacji uporządkowanych według określonych cech (kryteriów), których miernikiem są zmienne. Szereg szczegółowy - jest to uporządkowany ciąg wartości badanej cechy statystycznej, stosowany, gdy przedmiotem badania jest niewielka liczba jednostek, np. zmienna X przyjmuje wartości: x1, x2, ..., xn, wartości cechy porządkujemy rosnąco: x1 ≤ x2 ≤ ... ≤ xn lub malejąco x1 ≥ x2 ≥ ... ≥ xn. Szereg rozdzielczy - stanowi zbiorowość statystyczną, podzieloną na części (klasy) według określonej cechy jakościowej lub ilościowej z podaniem liczebności lub częstości każdej z wyodrębnionych klas.

Szereg rozdzielczy punktowy … Szereg rozdzielczy punktowy - jest stosowany do klasyfikacji danych statystycznych w przypadku gdy mamy do czynienia z niewielką liczbą wariantów cechy (powyżej 12) i dużą próbą n >30. Konstrukcja szeregu punktowego polega na wyznaczeniu liczebności poszczególnych wariantów cechy statystycznej i przedstawieniu ich w postaci tabeli. W opisie struktury za pomocą szeregu rozdzielczego punktowego bardzo często wykorzystuje się parametr zwanym wskaźnikiem struktury. Wskaźnikiem struktury wi lub częstością (liczebność względna, frakcja) występowania danego wariantu cechy nazywa się stosunek liczby jednostek o danej wartości cechy do liczebności próby. Wskaźnik struktury przyjmuje wartości od 0 do 1 włącznie. Suma wszystkich wartości wskaźników struktury odpowiadających poszczególnym wariantom cechy jest równa 1

Szereg rozdzielczy punktowy … Szereg rozdzielczy skumulowany - uzyskuje się poprzez przyporządkowanie kolejnym wariantom cechy odpowiadających im liczebności (częstości) skumulowanych, informuje, dla ilu jednostek badanej zbiorowości cecha przyjmuje wartości nie większe od górnej granicy poszczególnego przedziału klasowego. Przykład: W wybranej klasie liceum przeprowadzono sprawdzian z matematyki. Uczniowie otrzymali następujące oceny: 2, 5, 3, 4, 3, 4, 2, 4, 3, 2, 5, 4, 3, 4, 1, 2, 3, 2, 3, 1, 6, 4, 5, 3, 4, 3, 3, 4, 4, 3. Opracowanie materiału statystycznego Zbiorowość (populacja) generalna: uczniowie Zbiorowość próbna (próba): wybrana klasa Cecha statystyczna: ocena ze sprawdzianu z matematyki Uczniowie badani są pod względem ocen otrzymanych ze sprawdzianu z matematyki, "ocena z matematyki" jest cechą mierzalną skokową. Liczebność próby n: 30 Liczba wariantów cechy k: 6 Warianty cechy xi: 1, 2, 3, 4, 5, 6 Szereg szczegółowy: 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 6

Szereg rozdzielczy punktowy …

Szereg rozdzielczy przedziałowy … Szereg rozdzielczy przedziałowy - jest stosowany do klasyfikacji danych statystycznych w przypadku gdy mamy do czynienia z dużą próbą (n > 30) oraz dużą liczbą wariantów cechy (k > 12). W tym przypadku klasyfikację danych przeprowadza się zarówno dla cechy ciągłej jak i skokowej. W procesie klasyfikacji danych za pomocą szeregu rozdzielczego przedziałowego można wyróżnić trzy zasadnicze etapy: ustalenie liczby klas ustalenie rozpiętości przedziałów klasowych ustalenie granic poszczególnych klas

Szereg rozdzielczy przedziałowy … Ustalenie liczby przedziałów klasowych Liczba przedziałów klasowych istotnie zależy od obszaru zmienności badanej cechy, liczebności zbiorowości oraz celu badania. Zmienność można określić jako różnicę pomiędzy wartością maksymalną i minimalną cechy. Im większy jest obszar zmienności oraz liczebność próby tym więcej przedziałów należy utworzyć. Zbyt mała liczba przedziałów klasowych powoduje zacieranie istotnych prawidłowości rozkładu cechy, materiał jest za bardzo skondensowany. Bardzo często przyjmuje się założenie: gdzie k - liczba przedziałów, n - liczebność próby.

Szereg rozdzielczy przedziałowy … Rozpiętość przedziału hi (długość, interwał, rozstęp przedziałowy) - jest to różnica pomiędzy górną xi0 i dolną granicą xi1 i-tej klasy. Zależy od liczby klas i obszaru zmienności cechy. Z reguły przyjmuje się, że rozpiętość przedziałów klasowych jest taka sama. W tym przypadku przybliżoną rozpiętość przedziału można wyznaczyć z zależności: R – rozstęp R = xmax - xmin

Szereg rozdzielczy przedziałowy … Przykład: Przeprowadzić klasyfikację i z badać strukturę województw (stary podział administracyjny) pod względem liczby gmin. Liczba gmin w 49 województwach - szereg szczegółowy: 17, 30, 32, 37, 37, 39, 40, 40, 40, 40, 41, 41, 42, 42, 43, 43, 43, 44, 45, 46, 46, 47, 47, 47, 48, 48, 49, 51, 54, 54, 55, 55, 55, 56, 57, 57, 58, 58, 58, 59, 59, 62, 63, 63, 65, 69, 74, 78, 91. Liczba gmin jest cechą skokową, liczba wariantów jest duża oraz liczebność populacji, stąd do klasyfikacji danych należy zastosować szereg rozdzielczy przedziałowy. Dane podstawowe: wartość minimalna xmin: 17 wartość maksymalna xmax: 91 rozstęp R = xmax - xmin = 91 - 17 = 74 Ustalenie liczby przedziałów: Rozpiętość przedziałów klasowych: h=74/7 = 11 Początek pierwszego przedziału klasowego X01 = Xmin = 17 Przyjmujemy, że rozpiętość przedziałów klasowych jest taka sama dla wszystkich klas.

Szereg rozdzielczy przedziałowy …

Tablice danych statystycznych Tablice statystyczne - są wykorzystywane do prezentacji danych statystycznych według określonego kryterium. Podział tablic statystycznych: proste - charakteryzują strukturę lub dynamikę jednej zbiorowości pod względem jednej cechy (ilościowej lub jakościowej), złożone - opisują badaną zbiorowość według kilku cech lub kilka zbiorowości według jednej cechy

Współczynnik korelacji … Zależność korelacyjna charakteryzuje się tym, że określonym wartościom jednej zmiennej przyporządkowane są ściśle określone średnie wartości drugiej zmiennej. Stopień zależności liniowej pomiędzy badanymi cechami mierzalnymi określany jest za pomocą współczynnika korelacji rxy

Korelacyjny wykres rozrzutu …

Korelacja … Korelacja dodatnia występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada wzrost średnich wartości drugiej cechy Korelacja ujemna występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada spadek wartości drugiej cechy Współczynnik korelacji Pearsona, który przyjmuje wartości z przedziału [-1,1] jest miarą związku liniowego między cechami Przy interpretacji współczynnika korelacji należy zawsze zdawać sobie sprawę z tego, że wartość współczynnika bliska zeru nie oznacza braku zależności, a jedynie brak zależności liniowej

Współczynnik korelacji - przykład Dane miesięczne o wielkości zużycia pewnego surowca S potrzebnego do produkcji wyrobu A oraz o wielkości produkcji tego wyrobu w pewnym zakładzie przedstawiono w tabeli obok. Na podstawie tych danych można podjąć próbę określenia siły i kierunku zależności między zużyciem surowca a produkcją wyrobu.

Współczynnik korelacji - przykład cd.