Dopasowanie rozkładów

Slides:

Advertisements

Podobne prezentacje

Regresja i korelacja materiały dydaktyczne.

Advertisements

Excel Narzędzia do analizy regresji

ESTYMACJA PRZEDZIAŁOWA

Ocena dokładności i trafności prognoz

Statystyka Wojciech Jawień

Porównywanie średnich dwóch prób niezależnych o rozkładach normalnych (test t-studenta)

Zmienne losowe i ich rozkłady

Analiza wariancji jednoczynnikowa

Zmienne losowe i ich rozkłady

BUDOWA MODELU EKONOMETRYCZNEGO

Estymacja przedziałowa

Jak mierzyć asymetrię zjawiska?

Statystyka w doświadczalnictwie

Statystyka w doświadczalnictwie

ROZKŁADY DOCHODÓW 8.

BIOSTATYSTYKA I METODY DOKUMENTACJI

Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego

Wykład 14 Liniowa regresja

Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.

Metody Przetwarzania Danych Meteorologicznych Wykład 4

Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.

Test t-studenta dla pojedynczej próby

Próby niezależne versus próby zależne

Próby niezależne versus próby zależne

Test t-studenta dla pojedynczej próby

Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.

Wykład 4. Rozkłady teoretyczne

Co to są rozkłady normalne?

Jednoczynnikowa analiza wariancji (ANOVA)

Hipotezy statystyczne

Analiza wariancji jednoczynnikowa

Testy nieparametryczne

Konstrukcja, estymacja parametrów

Ocena rozkładu na podstawie wykresów kwantylowych

Hipotezy statystyczne

Elementy Rachunku Prawdopodobieństwa i Statystyki

BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:

Analiza wariancji jednoczynnikowa.

Testy nieparametryczne

Elementy Rachunku Prawdopodobieństwa i Statystyki

Hipotezy statystyczne

Projekt wykonany przez studentów I roku ARI Politechniki Wrocławskiej:

Elementy Rachunku Prawdopodobieństwa i Statystyki

Planowanie badań i analiza wyników

Porównywanie średnich 2 i więcej prób o rozkładach innych niż normalny

Regresja wieloraka.

Co to jest dystrybuanta?

Statystyka medyczna Piotr Kozłowski

Program przedmiotu “Opracowywanie danych w chemii” 1.Wprowadzenie: przegląd rodzajów danych oraz metod ich opracowywania. 2.Podstawowe pojęcia rachunku.

Weryfikacja hipotez statystycznych

Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.

Estymatory punktowe i przedziałowe

Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.

Podstawowe pojęcia i terminy stosowane w statystyce

Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.

Statystyczna analiza danych

Model ekonometryczny Jacek Szanduła.

Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.

ze statystyki opisowej

Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.

STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.

Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.

Testy nieparametryczne

Statystyka matematyczna

Jednorównaniowy model regresji liniowej

Analiza niepewności pomiarów Zagadnienia statystyki matematycznej

ROZKŁAD NORMALNY 11 października 2017.

Korelacja i regresja liniowa

Test t-studenta dla pojedynczej próby

Zapis prezentacji:

Dopasowanie rozkładów

Dopasowanie rozkładów- ogólny cel Porównanie średnich dwóch zmiennych 2 zmienne posiadają rozkład normalny -> test parametryczny (t- studenta) 2 zmienne nie spełniają rozkładu normalnego -> testy nieparametryczne

Dopasowanie rozkładów- ogólny cel Cele prognostyczne Często dla celów prognostycznych jest wskazane zrozumienie kształtu rozważanego rozkładu populacji.

Najczęściej używane rozkłady Bernoulliego Beta Dwumianowy Chi-kwadrat Wykładniczy F (Snedeckora) Gamma Geometryczny Gompertza Logistyczny Logarytmiczno- normalny Pareto Poissona Prostokątny Rayleigha t-studenta Weibulla NORMALNY

ROZKŁAD NORMALNY Rozkład o charakterystycznym kształcie "krzywej dzwonowej", symetrycznej w stosunku do średniej.

ROZKŁAD NORMALNY Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: Występuje silna tendencja do przyjmowania wartości położonych blisko środka rozkładu;

ROZKŁAD NORMALNY Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: Dodatnie i ujemne odchylenia od środka rozkładu są jednakowo prawdopodobne;

ROZKŁAD NORMALNY Ogólnie jest dobrym modelem dla rozkładu zmiennej losowej, w sytuacji gdy: Liczność odchyleń gwałtownie spada wraz ze wzrostem ich wielkości.

ROZKŁAD NORMALNY Podstawowy mechanizm tworzący rozkład normalny: nieskończoną liczbę niezależnych zdarzeń losowych które generują wartości danej zmiennej. Przykład: istnieje prawdopodobnie prawie nieograniczona liczba czynników determinujących wzrost człowieka (olbrzymia liczba genów, sposób odżywiania, przebyte choroby itd.). Tak więc należy spodziewać się, że w populacji wzrost podlega rozkładowi normalnemu.

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 1. obliczenie skośności i kurtozy 2. analiza histogramu 3. analiza wykresów P-P 4. testy normalności

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 1. obliczenie skośności i kurtozy Skośność mierzy odchylenie rozkładu od symetrii. Jeśli wartość skośności jest wyraźnie różna od zera, wówczas dany rozkład jest asymetryczny. Rozkład normalny jest symetryczny (skośność jest bliska 0)

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 1. obliczenie skośności i kurtozy Kurtoza mierzy "spiczastość" rozkładu. Jeśli wartość kurtozy jest wyraźnie <0, wówczas rozkład jest bardziej płaski, a jeśli jest wyraźnie >0 to rozkład jest bardziej spiczasty niż rozkład normalny. Wartość kurtozy dla rozkładu normalnego wynosi 0!

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 2. Analiza histogramu

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 3. Analiza wykresów P-P Wykres prawdopodobieństwo-prawdopodobieństwo Dystrybuanta empiryczna kreślona jest względem dystrybuanty teoretycznej. Jeśli teoretyczny rozkład dobrze przybliża rozkład obserwowany, wówczas punkty na wykresie powinny leżeć blisko przekątnej.

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 3. Analiza wykresów P-P

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności W celu zidentyfikowania rozkładu zazwyczaj dopasowuje się rozkład empiryczny do rozkładu teoretycznego poprzez: porównanie częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? częstości zaobserwowane w danych rzeczywistych częstości oczekiwane rozkładu teoretycznego

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Porównania częstości zaobserwowanych w danych rzeczywistych do częstości oczekiwanych rozkładu teoretycznego dokonuje się za pomocą testów statystycznych: chi kwadrat Kołmogorowa-Smirnowa Lillieforsa Shapiro-Wilka

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Test Kołmogorowa-Smirnowa: Wykorzystuje maksymalną wartość różnicy między dystrybuantą z próby, a założoną dystrybuantą teoretyczną. p< 0.05 -> rozkład różni się istotnie od normalnego p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Test chi-kwadrat: Stopnie swobody: df = liczba kategorii - liczba parametrów - 1 liczba kategorii - liczba klas w tablicy liczności, w której liczności oczekiwane są wyższe niż 5, liczba parametrów- liczba parametrów odpowiedniego rozkładu teoretycznego. p< 0.05 -> rozkład różni się istotnie od normalnego p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Test W Shapiro-Wilka: preferowany test normalności ze względu na jego dużą moc w porównaniu z innymi testami. p< 0.05 -> rozkład różni się istotnie od normalnego p> 0.05 -> rozkład jest normalny

JAK OKREŚLIĆ, CZY ROZKŁAD JEST NORMALNY? 4. Testy normalności Test Lillieforsa: test oparty na badaniu maksymalnej różnicy pomiędzy dystrybuantą empiryczną (z próby) a dystrybuantą rozkładu normalnego o takiej samej średniej i wariancji jak oszacowana z próby p< 0.05 -> rozkład różni się istotnie od normalnego p> 0.05 -> rozkład jest normalny