Pobierz prezentację
1
Estymacja. Przedziały ufności.
2
Umiemy, korzystając z funkcji gęstości rozkładu, obliczać prawdopodobieństwo znalezienia zmiennej losowej w zadanym przedziale: Często musimy rozwiązywać zadanie odwrotne: Mamy z góry zadane prawdopodobieństwo P, a szukamy odpowiednich a i b.
3
Zadanie to nie jest jednoznaczne.
Przykład: P=0,9=90%. a,b - ? P nazywamy poziomem ufności i często zapisujemy w postaci , gdyż zwykle jest nieco mniejsze od 100% (najczęściej 95%, wtedy )
4
Wybór przedziału ufności
5
Wybór przedziału ufności
W praktyce stosujemy: symetryczny (dwustronny) wybór przedziału (równe prawdopodobieństwa po obu stronach) jednostronny wybór granicy przedziału prawostronny lewostronny
6
Fraktyle
7
Fraktyle, kwartyle, percentyle...
Liczbę , taką że nazywamy fraktylem rozkładu prawdopodobieństwa zmiennej X. Nietrudno zauważyć, że x0,5 nazywamy medianą, x0,75 pierwszym, a x0,25 – trzecim kwartylem. Podobnie mówimy o (per)centylach, albo kwantylach. W symbolice panuje bałagan.
8
Fraktyle i wybór przedziału.
9
Symetryczny wybór przedziału
Przy symetrycznym wyborze przedziału mamy Jeśli funkcja gęstości jest parzysta (symetryczna względem zera) to: więc Rozkłady: standardowy normalny i t-Studenta są parzyste.
10
Symetryczny przedział dla stand. rozkładu normalnego.
11
Przedziały ufności Załóżmy, że X podlega rozkładowi normalnemu.
Wiemy, że W takim razie
12
Przedziały ufności
13
Przedziały ufności
14
Przedziały ufności Rozwiązując te nierówności tak, aby w środku pozostało otrzymamy: Z prawdopodobieństwem (zwanym poziomem ufności) wyznaczony prze-dział zawiera wartość oczekiwaną .
15
Przedziały ufności Na przeszkodzie praktycznemu stosowaniu tego wzoru stoi nieznajomość . Czy popełnimy duży błąd zastępując jego estymatą s ?
16
Przedziały ufności Gosset badał rozkład zmiennej losowej
Rozkład ten różni się trochę od rozkładu normalnego. Nazywa się rozkładem t-Stu-denta. Dokładny jego kształt określa liczba r = n-1, zwana liczbą stopni swobody.
17
Przedziały ufności Rozumowanie bardzo podobne do poprzedniego, prowadzi do wzoru: dla r > 30 różnica między t i u jest znikoma
18
Rozkład estymatora s2 Jeśli X ma rozkład normalny, to
ma rozkład zwany rozkładem (chi-kwadrat) Pearsona. Kształt tego rozkładu zależy od liczby stopni swobody r = n – 1. Dla dużych n zbliża się on do rozkładu normalnego.
19
Przedział ufności wariancji
Dla dodatnich a,b,c a<b<c pociąga: Np.
20
Przedział ufności wariancji.
Z powyższego wynika, że przedział ufności wariancji dany jest wzorem: Przedział ufności dla odchylenia standar-dowego otrzymamy pierwiastkując wszystkie strony tej nierówności.
21
Statystyka opisowa
22
Statystyka opisowa Pełna wiedza o ciągłym rozkładzie prawdopodobieństwa zawarta jest w jego funkcji gęstości. Często jednak chcemy wyodrębnić pewne cechy rozkładu, jak np. jego symetrię. Podajemy wtedy parametry charakterystyczne, takie jak lub .
23
Momenty Momenty zwykłe rzędu k: Momenty centralne rzędu k:
24
Momenty Wartość oczekiwana to pierwszy moment zwykły:
Wariancja to drugi moment centralny: Inne parametry rozkładu definiowane przy pomocy momentów to skośność i kurtoza.
25
Skośność i kurtoza nazywamy skośnością lub współ-
czynnikiem asymetrii. nazywamy kurtozą. Kurtoza rozkładu normalnego jest równa 3. Nazwa ‘kurtoza’ często stosowana jest do nadwyżki kurtozy ponad 3, tj.
26
Kurtoza Kurtoza mniejsza od 3 (0) wskazuje, że rozkład jest bardziej płaski (platykurtyczny) od normalnego. Rozkład o większej kurtozie niż normalny (ostrzejszy) nazywa się leptokutycznym.
27
Kurtoza - niuanse Rozkład t-Studenta ma dla liczby stopni swobody mniejszej od 5 nieskończoną kurtozę. Przy r ≤ 2 nieskończona jest nawet wariancja.
28
Kurtoza - niuanse
29
Moda Moda (lub modalna), to wartość x dla której funkcja gęstości f(x) osiąga maksimum. Jeśli jest kilka maksimów lokalnych rozkład nazywamy wielomodalnym. Dla rozkładu normalnego moda, mediana i wartość oczekiwana są sobie równe.
30
Skośność i moda Skośność > 0 Rozkład skośny w prawo
(skewed to right) Skośność < 0 Rozkład skośny w lewo Rozkład dwumodalny
31
Estymacja parametrów opisowych
Należy pamiętać, że prawdziwe wartości wymienionych parametrów pozostają zazwyczaj nieznane (podobnie jak sama funkcja gęstości rozkładu). Wielkości wyznaczane na podstawie próby są tylko ich oszacowaniami (estymatami).
32
Dla odróżnienia parametru od estymaty, te ostatnie oznaczamy daszkiem lub zupełnie innym symbolem, np.:
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.