Dopasowanie rozkładów

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Excel Narzędzia do analizy regresji
ESTYMACJA PRZEDZIAŁOWA
Ocena dokładności i trafności prognoz
Statystyka Wojciech Jawień
Porównywanie średnich dwóch prób niezależnych o rozkładach normalnych (test t-studenta)
Zmienne losowe i ich rozkłady
Analiza wariancji jednoczynnikowa
Zmienne losowe i ich rozkłady
BUDOWA MODELU EKONOMETRYCZNEGO
Estymacja przedziałowa
Jak mierzyć asymetrię zjawiska?
Statystyka w doświadczalnictwie
Statystyka w doświadczalnictwie
ROZKŁADY DOCHODÓW 8.
BIOSTATYSTYKA I METODY DOKUMENTACJI
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 14 Liniowa regresja
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Test t-studenta dla pojedynczej próby
Próby niezależne versus próby zależne
Próby niezależne versus próby zależne
Test t-studenta dla pojedynczej próby
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Co to są rozkłady normalne?
Jednoczynnikowa analiza wariancji (ANOVA)
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Testy nieparametryczne
Konstrukcja, estymacja parametrów
Ocena rozkładu na podstawie wykresów kwantylowych
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Hipotezy statystyczne
Projekt wykonany przez studentów I roku ARI Politechniki Wrocławskiej:
Elementy Rachunku Prawdopodobieństwa i Statystyki
Planowanie badań i analiza wyników
Porównywanie średnich 2 i więcej prób o rozkładach innych niż normalny
Regresja wieloraka.
Co to jest dystrybuanta?
Statystyka medyczna Piotr Kozłowski
Program przedmiotu “Opracowywanie danych w chemii” 1.Wprowadzenie: przegląd rodzajów danych oraz metod ich opracowywania. 2.Podstawowe pojęcia rachunku.
Weryfikacja hipotez statystycznych
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Estymatory punktowe i przedziałowe
Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.
Podstawowe pojęcia i terminy stosowane w statystyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Model ekonometryczny Jacek Szanduła.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Testy nieparametryczne
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
ROZKŁAD NORMALNY 11 października 2017.
Korelacja i regresja liniowa
Test t-studenta dla pojedynczej próby
Zapis prezentacji:

Dopasowanie rozkładów

Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2 zmienne nie spełniają rozkładu normalnego -> testy nieparametryczne

Dopasowanie rozkładów- ogólny cel Cele prognostyczne Często dla celów prognostycznych jest wskazane zrozumienie kształtu rozważanego rozkładu populacji.

Najczęściej używane rozkłady Bernoulliego Beta Dwumianowy Chi-kwadrat Wykładniczy F (Snedeckora) Gamma Geometryczny Gompertza Logistyczny Logarytmiczno- normalny Pareto Poissona Prostokątny Rayleigha t-studenta Weibulla NORMALNY

ROZKŁAD NORMALNY Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do średniej.

ROZKŁAD NORMALNY Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: Występuje silna tendencja do przyjmowania wartości położonych blisko środka rozkładu;

ROZKŁAD NORMALNY Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: Dodatnie i ujemne odchylenia od środka rozkładu są jednakowo prawdopodobne;

ROZKŁAD NORMALNY Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: Liczność odchyleń gwałtownie spada wraz ze wzrostem ich wielkości.

ROZKŁAD NORMALNY Podstawowy mechanizm tworzący rozkład normalny: nieskończoną liczbę niezależnych zdarzeń losowych które generują wartości danej zmiennej. Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka (olbrzymia liczba genów, sposób odżywiania, przebyte choroby itd.). Tak więc należy spodziewać się, że w populacji wzrost podlega rozkładowi normalnemu.

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 1. obliczenie skośności i kurtozy 2. analiza histogramu 3. analiza wykresów P-P 4. testy normalności

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 1. obliczenie skośności i kurtozy Skośność mierzy odchylenie rozkładu od symetrii. Jeśli wartość skośności jest wyraźnie różna od zera, wówczas dany rozkład jest asymetryczny. Rozkład normalny jest symetryczny (skośność jest bliska 0)

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 1. obliczenie skośności i kurtozy Kurtoza mierzy "spiczastość" rozkładu. Jeśli wartość kurtozy jest wyraźnie <0, wówczas rozkład jest bardziej płaski, a jeśli jest wyraźnie >0 to rozkład jest bardziej spiczasty niż rozkład normalny. Wartość kurtozy dla rozkładu normalnego wynosi 0!

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 2. Analiza histogramu

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 3. Analiza wykresów P-P Wykres prawdopodobieństwo-prawdopodobieństwo Dystrybuanta empiryczna kreślona jest względem dystrybuanty teoretycznej. Jeśli teoretyczny rozkład dobrze przybliża rozkład obserwowany, wówczas punkty na wykresie powinny leżeć blisko przekątnej.

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 3. Analiza wykresów P-P

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności W celu zidentyfikowania rozkładu zazwyczaj dopasowuje się rozkład empiryczny do rozkładu teoretycznego poprzez: porównanie częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? częstości zaobserwowane w danych rzeczywistych częstości oczekiwane rozkładu teoretycznego

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Porównania częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego dokonuje się za pomocą testów statystycznych: chi kwadrat Kołmogorowa-Smirnowa Lillieforsa Shapiro-Wilka

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Test Kołmogorowa-Smirnowa: Wykorzystuje maksymalną wartość różnicy między dystrybuantą z próby, a założoną dystrybuantą teoretyczną. p< 0.05 -> rozkład różni się istotnie od normalnego p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Test chi-kwadrat: Stopnie swobody: df = liczba kategorii - liczba parametrów - 1 liczba kategorii - liczba klas w tablicy liczności, w której liczności oczekiwane są wyższe niż 5, liczba parametrów- liczba parametrów odpowiedniego rozkładu teoretycznego. p< 0.05 -> rozkład różni się istotnie od normalnego p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Test W Shapiro-Wilka: preferowany test normalności ze względu na jego dużą moc w porównaniu z innymi testami. p< 0.05 -> rozkład różni się istotnie od normalnego p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Test Lillieforsa: test oparty na badaniu maksymalnej różnicy pomiędzy dystrybuantą empiryczną (z próby) a dystrybuantą rozkładu normalnego o takiej samej średniej i wariancji jak oszacowana z próby p< 0.05 -> rozkład różni się istotnie od normalnego p> 0.05 -> rozkład jest normalny