Ilustracja związku dystrybuanty teoretycznej z empiryczną

Slides:



Advertisements
Podobne prezentacje
Przykład liczbowy Rozpatrzmy dwuwymiarową zmienną losową (X,Y), gdzie X jest liczbą osób w rodzinie, a Y liczbą izb w mieszkaniu. Niech f.r.p. tej zmiennej.
Advertisements

Wnioskowanie statystyczne
Statystyka Wojciech Jawień
Wykład 5 Standardowy błąd a odchylenie standardowe
Ilustracja obliczania całek oznaczonych metodą Monte Carlo
Kierunek Teleinformatyka
HERD BEHAVIOR AND AGGREGATE FLUCTUATIONS IN FINANCIAL MARKETS Rama Cont & Jean-Philipe Bouchaud. Macroeconomic Dynamics, 4, 2000, Cambridge University.
Rachunek prawdopodobieństwa 2
Zmienne losowe i ich rozkłady
Zmienne losowe i ich rozkłady
Wnioskowanie statystyczne
BUDOWA MODELU EKONOMETRYCZNEGO
Metody wnioskowania na podstawie podprób
Statystyka w doświadczalnictwie
ROZKŁADY DOCHODÓW 8.
Uogólniony model liniowy
Rachunek prawdopodobieństwa 1
Konstrukcje rozkładów poprzez składanie funkcji odwrotnych
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 5 Przedziały ufności
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Wykład 4 Przedziały ufności
Proces analizy i rozpoznawania
Elementy Rachunku Prawdopodobieństwa c.d.
Elementy Rachunku Prawdopodobieństwa c.d.
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Wzory ułatwiające obliczenia
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 4: Generowanie zdarzeń  Dr inż. Halina Tarasiuk p. 337, tnt.tele.pw.edu.pl.
Średnie i miary zmienności
Zadanie 3 Gimnazjum nr 1, klasa 3f.
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Konstrukcja, estymacja parametrów
Elementy Rachunku Prawdopodobieństwa i Statystyki
Ekonometria. Co wynika z podejścia stochastycznego?
Elementy Rachunku Prawdopodobieństwa i Statystyki
Rozkłady wywodzące się z rozkładu normalnego standardowego
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
na podstawie materiału – test z użyciem komputerowo generowanych prób
Testy nieparametryczne
Projekt wykonany przez studentów I roku ARI Politechniki Wrocławskiej:
Podstawy analizy matematycznej I
Planowanie badań i analiza wyników
Co to jest dystrybuanta?
Dopasowanie rozkładów
Metody matematyczne w inżynierii chemicznej Wykład 3. Całkowanie numeryczne.
Wykład 5 Przedziały ufności
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Modele zmienności aktywów Model multiplikatywny Parametry siatki dwumianowej.
Estymatory punktowe i przedziałowe
Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
STATYSTYKA – kurs podstawowy wykład 4 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Testy nieparametryczne
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
Statystyka matematyczna
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Ilustracja związku dystrybuanty teoretycznej z empiryczną

Opis zadania Dla dystrybuanty F(x), która ma dobrze określoną funkcję odwrotną: losujemy niezależnie liczby u1, u2, . . . , un z rozkładu jednostajnego U [0, 1]; przekształcamy xk = F−1(uk) dla k = 1, 2, . . . , n; przez Sn(x) oznaczamy ilość tych elementów ciągu x1, x2,..., xn, których wartość jest mniejsza niż x. nazywamy dystrybuantą empiryczną. Dla kilku konkretnych przykładów dystrybuant F oraz dla kilku rzędów parametru n porównać (m.in. graficznie) otrzymaną dystrybuantę empiryczną Fn(x) z dystrybuantą teoretyczną F(x).

Dystrybuanta empiryczna a PWL Zauważamy, że Sn oznacza ilość sukcesów w n próbach Bernoulliego, gdzie sukces w i-tej próbie to zdarzenie {Xi < x} , a p=F(x) Zatem Sn ma rozkład Bernoulliego z parametrami n i p=F(x) Możemy zastosować tw. Borela, z którego wynika: Co oznacza, że dla odpowiednio dużego n Fn(x)≈F(x), czyli dystrybuanta empiryczna jest przybliżeniem dystrybuanty teoretycznej

Rozkład wykładniczy n=5 Błąd średniokwadratowy: 0,0210044 Największe odchylenie: 0,324

Rozkład wykładniczy n=20 Błąd średniokwadratowy: 0,00193983 Największe odchylenie: 0,1799

Rozkład wykładniczy n=100 Błąd średniokwadratowy: 0,000781755 Największe odchylenie: 0,0281

Rozkład wykładniczy n=1000 Błąd średniokwadratowy: 1,6035 · 10-7 Największe odchylenie: 0,0006999997

Rozkład Cauchy’ego n=5 Błąd średniokwadratowy: 0,00684262 Największe odchylenie: 0,0965

Rozkład Cauchy’ego n=20 Błąd średniokwadratowy: 7,5326 · 10-5 Największe odchylenie: 0,0381

Rozkład Cauchy’ego n=50 Błąd średniokwadratowy: 0,000646874 Największe odchylenie: 0,0256

Rozkład Cauchy’ego n=100 Błąd średniokwadratowy: 1,43857 · 10-5 Największe odchylenie: 0,0038

Rozkład Cauchy’ego n=1000 Błąd średniokwadratowy: 1,59877 · 10-7 Największe odchylenie: 0,0003999

Rozkład arcsin n=5 Błąd średniokwadratowy: 0,00706723 Największe odchylenie: 0,1878

Rozkład arcsin n=20 Błąd średniokwadratowy: 0,000405924 Największe odchylenie: 0,0442997

Rozkład arcsin n=100 Błąd średniokwadratowy: 0,000122224 Największe odchylenie: 0,0110998

Rozkład arcsin n=500 Błąd średniokwadratowy: 2,54179 · 10-7 Największe odchylenie: 0,0014028

Rozkład arcsin n=2000 Błąd średniokwadratowy: 8,76349 · 10-8 Największe odchylenie: 0,000296098

Rozkład Pareto z param. 2 n=5 Błąd średniokwadratowy: 0,0285624 Największe odchylenie: 0,1733

Rozkład Pareto z param. 2 n=20 Błąd średniokwadratowy: 0,00223757 Największe odchylenie: 0,0477

Rozkład Pareto z param. 2 n=100 Błąd średniokwadratowy: 0,000619006 Największe odchylenie: 0,0249999

Rozkład Pareto z param. 2 n=500 Błąd średniokwadratowy: 4,75187 · 10-5 Największe odchylenie: 0,00690007

Rozkład Pareto z param. 2 n=2000 Błąd średniokwadratowy: 4,00494 · 10-8 Największe odchylenie: 0,000400007

Rozkład kwadratowy n=5 Błąd średniokwadratowy: 0,0262666 Największe odchylenie: 0,183

Rozkład kwadratowy n=20 Błąd średniokwadratowy: 0,00031811 Największe odchylenie: 0,0185

Rozkład kwadratowy n=100 Błąd średniokwadratowy: 2,99292 · 10-6 Największe odchylenie: 0,0173001

Rozkład kwadratowy n=1000 Błąd średniokwadratowy: 4,57001 · 10-9 Największe odchylenie: 0,0021

Wnioski: Gdy liczba prób o rozkładzie, którego dystrybuanta wynosi F(x), dąży do nieskończoności to dystrybuanta empiryczna tych prób dąży do dystrybuanty teoretycznej Niektóre dystrybuanty empiryczne dążą szybciej do odpowiadającym im dystrybuant teoretycznych. Przy odpowiedniej liczbie prób możemy rozpoznać jakiego typu jest przybliżana dystrybuanta

Dziękujemy za uwagę!