Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałPrzemysław Mateusiak Został zmieniony 11 lat temu
1
Ilustracja związku dystrybuanty teoretycznej z empiryczną
2
Opis zadania Dla dystrybuanty F(x), która ma dobrze określoną funkcję odwrotną: losujemy niezależnie liczby u1, u2, , un z rozkładu jednostajnego U [0, 1]; przekształcamy xk = F−1(uk) dla k = 1, 2, , n; przez Sn(x) oznaczamy ilość tych elementów ciągu x1, x2,..., xn, których wartość jest mniejsza niż x. nazywamy dystrybuantą empiryczną. Dla kilku konkretnych przykładów dystrybuant F oraz dla kilku rzędów parametru n porównać (m.in. graficznie) otrzymaną dystrybuantę empiryczną Fn(x) z dystrybuantą teoretyczną F(x).
3
Dystrybuanta empiryczna a PWL
Zauważamy, że Sn oznacza ilość sukcesów w n próbach Bernoulliego, gdzie sukces w i-tej próbie to zdarzenie {Xi < x} , a p=F(x) Zatem Sn ma rozkład Bernoulliego z parametrami n i p=F(x) Możemy zastosować tw. Borela, z którego wynika: Co oznacza, że dla odpowiednio dużego n Fn(x)≈F(x), czyli dystrybuanta empiryczna jest przybliżeniem dystrybuanty teoretycznej
4
Rozkład wykładniczy n=5 Błąd średniokwadratowy: 0,0210044
Największe odchylenie: 0,324
5
Rozkład wykładniczy n=20 Błąd średniokwadratowy: 0,00193983
Największe odchylenie: 0,1799
6
Rozkład wykładniczy n=100 Błąd średniokwadratowy: 0,000781755
Największe odchylenie: 0,0281
7
Rozkład wykładniczy n=1000 Błąd średniokwadratowy: 1,6035 · 10-7
Największe odchylenie: 0,
8
Rozkład Cauchy’ego n=5 Błąd średniokwadratowy: 0,00684262
Największe odchylenie: 0,0965
9
Rozkład Cauchy’ego n=20 Błąd średniokwadratowy: 7,5326 · 10-5
Największe odchylenie: 0,0381
10
Rozkład Cauchy’ego n=50 Błąd średniokwadratowy: 0,000646874
Największe odchylenie: 0,0256
11
Rozkład Cauchy’ego n=100 Błąd średniokwadratowy: 1,43857 · 10-5
Największe odchylenie: 0,0038
12
Rozkład Cauchy’ego n=1000 Błąd średniokwadratowy: 1,59877 · 10-7
Największe odchylenie: 0,
13
Rozkład arcsin n=5 Błąd średniokwadratowy: 0,00706723
Największe odchylenie: 0,1878
14
Rozkład arcsin n=20 Błąd średniokwadratowy: 0,000405924
Największe odchylenie: 0,
15
Rozkład arcsin n=100 Błąd średniokwadratowy: 0,000122224
Największe odchylenie: 0,
16
Rozkład arcsin n=500 Błąd średniokwadratowy: 2,54179 · 10-7
Największe odchylenie: 0,
17
Rozkład arcsin n=2000 Błąd średniokwadratowy: 8,76349 · 10-8
Największe odchylenie: 0,
18
Rozkład Pareto z param. 2 n=5 Błąd średniokwadratowy: 0,0285624
Największe odchylenie: 0,1733
19
Rozkład Pareto z param. 2 n=20 Błąd średniokwadratowy: 0,00223757
Największe odchylenie: 0,0477
20
Rozkład Pareto z param. 2 n=100 Błąd średniokwadratowy: 0,000619006
Największe odchylenie: 0,
21
Rozkład Pareto z param. 2 n=500 Błąd średniokwadratowy: 4,75187 · 10-5
Największe odchylenie: 0,
22
Rozkład Pareto z param. 2 n=2000
Błąd średniokwadratowy: 4,00494 · 10-8 Największe odchylenie: 0,
23
Rozkład kwadratowy n=5 Błąd średniokwadratowy: 0,0262666
Największe odchylenie: 0,183
24
Rozkład kwadratowy n=20 Błąd średniokwadratowy: 0,00031811
Największe odchylenie: 0,0185
25
Rozkład kwadratowy n=100 Błąd średniokwadratowy: 2,99292 · 10-6
Największe odchylenie: 0,
26
Rozkład kwadratowy n=1000 Błąd średniokwadratowy: 4,57001 · 10-9
Największe odchylenie: 0,0021
27
Wnioski: Gdy liczba prób o rozkładzie, którego dystrybuanta wynosi F(x), dąży do nieskończoności to dystrybuanta empiryczna tych prób dąży do dystrybuanty teoretycznej Niektóre dystrybuanty empiryczne dążą szybciej do odpowiadającym im dystrybuant teoretycznych. Przy odpowiedniej liczbie prób możemy rozpoznać jakiego typu jest przybliżana dystrybuanta
28
Dziękujemy za uwagę!
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.