Ocena rozkładu na podstawie wykresów kwantylowych

Slides:



Advertisements
Podobne prezentacje
ESTYMACJA PRZEDZIAŁOWA
Advertisements

Test zgodności c2.
BADANIE KORELACJI ZMIENNYCH
BIOSTATYSTYKA I METODY DOKUMENTACJI Ćwiczenie 1
Wykład 5 Standardowy błąd a odchylenie standardowe
Wykład 14 Diagnostyka Diagnostyka – ocena prawidłowości założeń
Porównywanie średnich dwóch prób niezależnych o rozkładach normalnych (test t-studenta)
Wizualizacja rozkładu zmiennej
Zmienne losowe i ich rozkłady
WYKRES ANCONY Uwaga: Do wykładu przydadzą się: ołówek, linijka, gumka, kolorowe cienkopisy.
Test zgodności Joanna Tomanek i Piotr Nowak.
Metody wnioskowania na podstawie podprób
Graficzna prezentacja danych Wykład 2 dr Małgorzata Radziukiewicz
Statystyka w doświadczalnictwie
ROZKŁADY DOCHODÓW 8.
BIOSTATYSTYKA I METODY DOKUMENTACJI
OPIS SEPARACJI JAKO KLASYFIKACJA
Konstrukcje rozkładów poprzez składanie funkcji odwrotnych
Zofia Hanusz i Joanna Tarasińska Uniwersytet Przyrodniczy w Lublinie
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 14 Liniowa regresja
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Modele (hipotezy) zagnieżdżone
Test t-studenta dla pojedynczej próby
Próby niezależne versus próby zależne
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
SPRAWDZIAN Matematyka
Wykład 4. Rozkłady teoretyczne
Testy nieparametryczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Funkcje liniowe Wykresy i własności.
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Konstrukcja, estymacja parametrów
Analiza współzależności cech statystycznych
Rozkłady wywodzące się z rozkładu normalnego standardowego
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
na podstawie materiału – test z użyciem komputerowo generowanych prób
Elementy Rachunku Prawdopodobieństwa i Statystyki
Przesunięcie wykresu funkcji
Projekt wykonany przez studentów I roku ARI Politechniki Wrocławskiej:
Statystyka ©M.
Bez rysunków INFORMATYKA Plan wykładu ELEMENTY MECHANIKI KLASYCZNEJ
Regresja wieloraka.
Rozwiązywanie układów równań liniowych różnymi metodami
Dopasowanie rozkładów
Jak narysować wykres korzystając z programu Excel?
Prezentacja dla klasy III gimnazjum Przedmiot: matematyka Dział: Funkcja liniowa Temat: Pole czworokąta a funkcja liniowa.
Wykład 5 Przedziały ufności
Materiały pochodzą z Platformy Edukacyjnej Portalu Wszelkie treści i zasoby edukacyjne publikowane na łamach Portalu
Program przedmiotu “Opracowywanie danych w chemii” 1.Wprowadzenie: przegląd rodzajów danych oraz metod ich opracowywania. 2.Podstawowe pojęcia rachunku.
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Prezentacja dla klasy III gimnazjum
Estymatory punktowe i przedziałowe
Zbiory fraktalne I Ruchy browna.
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Statystyka Powtorzenie
Statystyka matematyczna
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Ocena rozkładu na podstawie wykresów kwantylowych
Korelacja i regresja liniowa
Zapis prezentacji:

Ocena rozkładu na podstawie wykresów kwantylowych Zofia Hanusz, Joanna Tarasińska Katedra Zastosowań Matematyki i Informatyki Uniwersytet Przyrodniczy w Lublinie

Jednowymiarowe wykresy kwantylowe - niezależne punkty powinny się układać wzdłuż linii kwantyl z próby rzędu kwantyl z N(0,1) Miarą współliniowości punktów jest statystyka Shapiro-Wilka. Jej małe wartości świadczą o braku współliniowości i powodują odrzucenie hipotezy o normalności rozkładu.

kwantyl z rozkładu o dystrybuancie F Jeśli próba nie pochodzi z rozkładu normalnego, to punkty Pi układają się przeważnie w krzywą nieliniową a po jej kształcie można czasem odgadnąć takie cechy rozkładu, jak skośność czy rodzaj „ogonów”. Na dalszych rysunkach przedstawiono teoretyczny kształt krzywych, wzdłuż których układają się punkty gdy próba jest generowana z określonych rozkładów. Krzywe te opisane są równaniem : kwantyl z rozkładu F kwantyl z rozkładu o dystrybuancie F kwantyl z N(0,1)

rozkład jednostajny na (0,1) n=20 p-value= 0.0734 n=100 p-value= 0.0013

rozkład Beta(2,2) n=20 p-value=0,1534 n=100 p-value=0,0169

Rozkład t(1) n=20 p-value = 4,427 E-05 n=100 p-value = 2,2 E-16

Rozkład t(5) n=20 p-value = 0,0592 n=100 p-value = 0,0066

Rozkład wykładniczy(l=1) n=20 p-value = 0,00074 n=100 p-value = 3,21 E-11

Mieszanina ½ z N(0,1), ½ z N(5,1) n=20 p-value = 0,0324 n=100 p-value = 6,256 E-06

scale contaminated normal (Tukey) Mieszanina Mieszanina ½ z N(0,1), ½ z N(0,9) scale contaminated normal (Tukey) n=100 p-value = 6.758 E-05 n=20 p-value = 0.1542

dwumianowy (10,0.1) n=20 p-value = 0.001575 n=100 p-value = 3.994 E-09

Poissona (l=1) n=100 p-value = 4,344 E-10 n=20 p-value = 0,0085

Poissona (l=20) n=20 p-value = 0,737 n=100 p-value = 0,7532

Dane wielowymiarowe – metoda graficzna Small’a (Small, 1978, Biometrika 65) - iid (Gnanadesikan & Kettenring, 1972, Biometrika 28) as. niezależne powinny ułożyć się wzdłuż prostej c=d kwantyl rozkładu Beta rzędu (Blom,1958,”Statistical estimates and transformed Beta-variables” Wiley, New York)

Następnie narysowano (czerwoną) linię łączącą punkty Obliczono średnie Aby znaleźć prawdziwą teoretyczną linię, wokół której układają się punkty w metodzie Smalla generowano 100 000 prób o liczebności n z ustalonego rozkładu. Dla każdej próby znaleziono ciąg Następnie narysowano (czerwoną) linię łączącą punkty ( ) i j c .

Rozkład t(1)p n=20, p= 2 p-value 4.796 E-06 n=100, p=2, p-value = 0

Rozkład jednostajny(0,1)p n=20, p=2, p-value = 0.158 Uwaga! tu słaba moc H-Z a na wykresie Smalla wyraźnie widać nienormalność n=100, p=2, p-value = 0.0001

n=20, p=2, jedn(0,1)p Beta(2,2)p MPII(0) t(1)p t(2)p MPVII(2)

N(0,I) t(2)2 MPVII(2)

Symetryczny czy skośny? n = 20, p = 2 t(1)p t’(1,l=5)p

Mieszanina ½ z N([0,0],I), ½ z N([5,0],I) n=20, p=2 p-value = 0.106 (widać, że kiepsko Small wykrywa) n=100, p=2 p-value = 0.0004

Rozkład dwumianowy(n=10, q=0,1)p 100-elementowa próba p=4, p-value = 4.430 E-07 p=2, p-value = 6.668 E-05

Dane wielowymiarowe – wykres kwantylowy Adaptacja pomysłu Roystona (Royston , 1983, „Some techniques for assessity multivariate normality based on Shapiro-Wilk W”, Appl. Statist.32, 121-133) dystr. asymp.

Aby znaleźć teoretyczną linię, wokół której układają się punkty na wykresie kwantylowym generowano po 10 000 prób o liczebności n z różnych rozkładów . Dla każdej próby j znaleziono ciąg statystyk porządkowych Narysowano linię łączącą punkty punkty powinny ułożyć się wzdłuż prostej y = x

n=100, p=2 Rozkład t(1)2 Roystona Smalla

n=100, p=2 Rozkład jednost.(0,1)2 Roystona Smalla

Mieszanina ½ z N([0,0],I), ½ z N([5,0],I) n=100, p=2 Mieszanina ½ z N([0,0],I), ½ z N([5,0],I) Smalla Roystona