Estymacja. Przedziały ufności.

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

ESTYMACJA PRZEDZIAŁOWA
Ocena dokładności i trafności prognoz
BIOSTATYSTYKA I METODY DOKUMENTACJI Ćwiczenie 1
Statystyka Wojciech Jawień
Wykład 5 Standardowy błąd a odchylenie standardowe
Zmienne losowe i ich rozkłady
Zmienne losowe i ich rozkłady
Skale pomiarowe – BARDZO WAŻNE
Estymacja przedziałowa
Jak mierzyć asymetrię zjawiska?
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Analiza wariancji Analiza wariancji (ANOVA) stanowi rozszerzenie testu t-Studenta w przypadku porównywanie większej liczby grup. Podział na grupy (czyli.
Statystyka w doświadczalnictwie
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
Podstawowe pojęcia prognozowania i symulacji na podstawie modeli ekonometrycznych Przewidywaniem nazywać będziemy wnioskowanie o zdarzeniach nieznanych.
Analiza korelacji.
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 4 Przedziały ufności
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Analiza wariancji.
Rozkład t.
Hipotezy statystyczne
Konstrukcja, estymacja parametrów
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Rozkłady wywodzące się z rozkładu normalnego standardowego
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Podstawy analizy matematycznej II
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Statystyka – zadania 4 Janusz Górczyński.
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Kilka wybranych uzupelnień
Błędy i niepewności pomiarowe II
Wykład 16 Inne zagadnienia z prostej regresji liniowej.
Ekonometryczne modele nieliniowe
Testowanie hipotez statystycznych
Wnioskowanie statystyczne
Statystyka medyczna Piotr Kozłowski
Wykład 5 Przedziały ufności
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
MODELOWANIE ZMIENNOŚCI CEN AKCJI
Estymatory punktowe i przedziałowe
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Testowanie hipotez Jacek Szanduła.
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Model trendu liniowego
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
Parametry rozkładów Metodologia badań w naukach behawioralnych II.
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Zmienna losowa. Wybrane rozkłady zmiennej. Przedział ufności.
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
MIARY STATYSTYCZNE Warunki egzaminu.
Zapis prezentacji:

Estymacja. Przedziały ufności.

Umiemy, korzystając z funkcji gęstości rozkładu, obliczać prawdopodobieństwo znalezienia zmiennej losowej w zadanym przedziale: Często musimy rozwiązywać zadanie odwrotne: Mamy z góry zadane prawdopodobieństwo P, a szukamy odpowiednich a i b.

Zadanie to nie jest jednoznaczne. Przykład: P=0,9=90%. a,b - ? P nazywamy poziomem ufności i często zapisujemy w postaci , gdyż zwykle jest nieco mniejsze od 100% (najczęściej 95%, wtedy )

Wybór przedziału ufności

Wybór przedziału ufności W praktyce stosujemy: symetryczny (dwustronny) wybór przedziału (równe prawdopodobieństwa po obu stronach) jednostronny wybór granicy przedziału prawostronny lewostronny

Fraktyle

Fraktyle, kwartyle, percentyle... Liczbę , taką że nazywamy fraktylem rozkładu prawdopodobieństwa zmiennej X. Nietrudno zauważyć, że x0,5 nazywamy medianą, x0,75 pierwszym, a x0,25 – trzecim kwartylem. Podobnie mówimy o (per)centylach, albo kwantylach. W symbolice panuje bałagan.

Fraktyle i wybór przedziału.

Symetryczny wybór przedziału Przy symetrycznym wyborze przedziału mamy . Jeśli funkcja gęstości jest parzysta (symetryczna względem zera) to: więc Rozkłady: standardowy normalny i t-Studenta są parzyste.

Symetryczny przedział dla stand. rozkładu normalnego.

Przedziały ufności Załóżmy, że X podlega rozkładowi normalnemu. Wiemy, że W takim razie

Przedziały ufności

Przedziały ufności

Przedziały ufności Rozwiązując te nierówności tak, aby w środku pozostało otrzymamy: Z prawdopodobieństwem (zwanym poziomem ufności) wyznaczony prze-dział zawiera wartość oczekiwaną .

Przedziały ufności Na przeszkodzie praktycznemu stosowaniu tego wzoru stoi nieznajomość . Czy popełnimy duży błąd zastępując jego estymatą s ?

Przedziały ufności Gosset badał rozkład zmiennej losowej Rozkład ten różni się trochę od rozkładu normalnego. Nazywa się rozkładem t-Stu-denta. Dokładny jego kształt określa liczba r = n-1, zwana liczbą stopni swobody.

Przedziały ufności Rozumowanie bardzo podobne do poprzedniego, prowadzi do wzoru: dla r > 30 różnica między t i u jest znikoma

Rozkład estymatora s2 Jeśli X ma rozkład normalny, to ma rozkład zwany rozkładem (chi-kwadrat) Pearsona. Kształt tego rozkładu zależy od liczby stopni swobody r = n – 1. Dla dużych n zbliża się on do rozkładu normalnego.

Przedział ufności wariancji Dla dodatnich a,b,c a<b<c pociąga: Np.

Przedział ufności wariancji. Z powyższego wynika, że przedział ufności wariancji dany jest wzorem: Przedział ufności dla odchylenia standar-dowego otrzymamy pierwiastkując wszystkie strony tej nierówności.

Statystyka opisowa

Statystyka opisowa Pełna wiedza o ciągłym rozkładzie prawdopodobieństwa zawarta jest w jego funkcji gęstości. Często jednak chcemy wyodrębnić pewne cechy rozkładu, jak np. jego symetrię. Podajemy wtedy parametry charakterystyczne, takie jak lub .

Momenty Momenty zwykłe rzędu k: Momenty centralne rzędu k:

Momenty Wartość oczekiwana to pierwszy moment zwykły: Wariancja to drugi moment centralny: Inne parametry rozkładu definiowane przy pomocy momentów to skośność i kurtoza.

Skośność i kurtoza nazywamy skośnością lub współ- czynnikiem asymetrii. nazywamy kurtozą. Kurtoza rozkładu normalnego jest równa 3. Nazwa ‘kurtoza’ często stosowana jest do nadwyżki kurtozy ponad 3, tj.

Kurtoza Kurtoza mniejsza od 3 (0) wskazuje, że rozkład jest bardziej płaski (platykurtyczny) od normalnego. Rozkład o większej kurtozie niż normalny (ostrzejszy) nazywa się leptokutycznym.

Kurtoza - niuanse Rozkład t-Studenta ma dla liczby stopni swobody mniejszej od 5 nieskończoną kurtozę. Przy r ≤ 2 nieskończona jest nawet wariancja.

Kurtoza - niuanse

Moda Moda (lub modalna), to wartość x dla której funkcja gęstości f(x) osiąga maksimum. Jeśli jest kilka maksimów lokalnych rozkład nazywamy wielomodalnym. Dla rozkładu normalnego moda, mediana i wartość oczekiwana są sobie równe.

Skośność i moda Skośność > 0 Rozkład skośny w prawo (skewed to right) Skośność < 0 Rozkład skośny w lewo Rozkład dwumodalny

Estymacja parametrów opisowych Należy pamiętać, że prawdziwe wartości wymienionych parametrów pozostają zazwyczaj nieznane (podobnie jak sama funkcja gęstości rozkładu). Wielkości wyznaczane na podstawie próby są tylko ich oszacowaniami (estymatami).

Dla odróżnienia parametru od estymaty, te ostatnie oznaczamy daszkiem lub zupełnie innym symbolem, np.: