Elementy Rachunku Prawdopodobieństwa i Statystyki

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

ESTYMACJA PRZEDZIAŁOWA
Rangowy test zgodności rozkładów
Statystyka Wojciech Jawień
Estymacja. Przedziały ufności.
Wykład 5 Standardowy błąd a odchylenie standardowe
Analiza wariancji jednoczynnikowa
Estymacja przedziałowa
Metody wnioskowania na podstawie podprób
Opinie, przekonania, stereotypy
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Analiza wariancji Analiza wariancji (ANOVA) stanowi rozszerzenie testu t-Studenta w przypadku porównywanie większej liczby grup. Podział na grupy (czyli.
Wnioskowanie statystyczne CZEŚĆ III
Statystyka w doświadczalnictwie
Wykład 7 Przedział ufności dla 1 – 2
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Wykład 4 Przedziały ufności
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Analiza wariancji.
Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych
Rozkład t.
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Konstrukcja, estymacja parametrów
Elementy Rachunku Prawdopodobieństwa i Statystyki
Testowanie hipotez statystycznych
Elementy Rachunku Prawdopodobieństwa i Statystyki
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
dr hab. Dariusz Piwczyński
Elementy Rachunku Prawdopodobieństwa i Statystyki
Modelowanie ekonometryczne
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Błędy i niepewności pomiarowe II
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
Ekonometryczne modele nieliniowe
Wnioskowanie statystyczne
Statystyka medyczna Piotr Kozłowski
Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia Wykład 3.
Wykład 5 Przedziały ufności
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Weryfikacja hipotez statystycznych
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Testowanie hipotez Jacek Szanduła.
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Zapis prezentacji:

Elementy Rachunku Prawdopodobieństwa i Statystyki Wykład 11 Wstęp do teorii estymacji Przedziały ufności Testowanie hipotez statystycznych – podejmowanie decyzji – słowo wstępne Tomasz Szumlak, WFiIS, 14/06/2013

Statystyka -> funkcja Z.L.-ych O estymatorach Statystyka -> funkcja Z.L.-ych Konkretna wartość statystyki zależy od próby losowej Statystyka sama jest Z.L. Statystyk używamy do estymacji parametrów populacji Wybrana statystyka nazywana jest nieobciążonym estymatorem danego parametru populacji, jeżeli, jej wartość oczekiwana jest równa temu parametrowi. Odpowiadająca danemu estymatorowi wartość (t.j. wyznaczona dla konkretnej próby) nazywana jest wówczas nieobciążoną estymatą parametru. Przykład Wartość oczekiwana i wariancja z próby ( , ), zdefiniowane jak poniżej:

są nieobciążonymi estymatorami wartości średniej oraz wariancji populacji: dla konkretnej próby wyznaczymy więc wartości: które nazwiemy estymatami nieobciążonymi wartości oczekiwanej i wariancji badanej populacji. Jeżeli rozkłady eksperymentalne dwóch typów statystyk posiadają tą samą wartość oczekiwaną to wyboru jednej z nich możemy dokonać na podstawie wartości ich wariancji. Mówimy że, estymator o mniejszej wariancji charakteryzuje się większą wydajnością Np. dla rozkładu normalnego – rozkłady średnich raz median (z pobranych prób) charakteryzują się taką samą wartością oczekiwaną , jednakże wariancja rozkładu średnich jest mniejsza niż rozkładu median.

Estymacja punktowa i przedziałowa. Jeżeli estymata pewnego parametru populacji wyrażona jest przy pomocy jednej liczby to nazywamy ją punktową Jeżeli na drodze pomiaru uzyskamy dwa punkty, które stanowią krańce przedziału, który powinien (wierzymy w to na gruncie analizy statystycznej) zawierać estymowany parametr, mówimy wówczas o estymacji przedziałowej. Przykład Mierzymy głębokość penetracji amunicji typu X w pewnym materiale. Podając wynik jako: dokonujemy estymacji punktowej. Jeżeli natomiast podamy wynik w formie: to dokonujemy estymacji przedziałowej. Poza wartością parametru estymowanego podajemy również informację dotyczącą niepewności (lub inaczej precyzji) pomiaru.

Przedziały ufności dla estymowanych parametrów. Rozważmy pewną statystykę St, której rozkład posiada wartość oczekiwaną oraz wariancję odpowiednio: Jeżeli założymy, że rozkład ten jest w przybliżeniu normalny, wówczas spodziewamy się, że wartości tej statystyki powinny zawierać się w przedziałach: z prob. odpowiednio: 68.27%, 95.45% oraz 99.73%. Odpowiada to stwierdzeniu, że estymowany parametr znajduje się z takim samym prob. w przedziałach: Przedziały te nazywane są przedziałami ufności na danym poziomie (np. 95.45%). Pamiętając własności rozkładu normalnej zmiennej standardowej, możemy użyć znacznie wygodniejszego (ze względów praktycznych) zapisu:

Przedziały ufności dla estymowanych parametrów. Poziomy ufności (wyrażone w procentach) odpowiadają w sposób jednoznaczny wartościom krytycznym zc i vice versa – znając wartość krytyczną możemy wyznaczyć poziom ufności. W ogólności, możemy spotkać się ze statystykami, które podlegają innym rozkładom niż normalny (np. wariancja - ), wówczas, musimy odpowiednio zmodyfikować przedziały ufności. Poziom ufności

Przedziały ufności dla wartości średnich z prób. Przypadek dużych próbek (n > 30) Statystyka jest wartością oczekiwaną dla próby: 95% oraz 99% przedziały ufności podajemy jako: W ogólności dany przedział ufności dla wartości średniej z populacji dany jest: odpowiednio, w przypadku losowania bez zwracania (małe populacje) W ogólności, wartość odchylenia standardowego dla populacji nie jest znana! Stosujemy odpowiedni estymator (S – wariancja z próby).

Przedziały ufności dla wartości średnich z prób. Przypadek małych próbek (n < 30) Różnica polega na tym, że zamiast rozkładu normalnego używamy rozkładu t-Studenta aby uzyskać odpowiednie przedziały ufności: Normalny

Przykład (niezniszczalny przykład rozkładu wysokości…) Chcemy poznać rozkład wysokości studentów uniwersytetu University, pobieramy w tym celu próbę losową o liczności n = 100. Cała populacja N = 1865. Po pomiarach dostaliśmy następujące wartości średniej i wariancji z próby: nieobciążona i wydajna estymata prawdziwej wartości oczekiwanej populacji: nieobciążona i wydajna estymata prawdziwej wariancji populacji: Dla estymowanej wartości średniej, możemy następnie wyznaczyć 99% przedział ufności: Dla otrzymanej próbki mamy:

Przedziały ufności dla różnic i sum statystyk. Sumy i różnice: Jeżeli badamy wartości oczekiwane: Przykład Dwa typy żarówek (wykład 9): A i B. Średni czas życia dla typu A wynosi 1400 h dla typu B wyznaczono 1200 h. Odpowiednie odchylenia standardowe czasu życia wynoszą 120 oraz 80 h. Przedział ufności 99% dla różnicy wartości oczekiwanych:

Przedziały ufności dla wariancji (rozkład normalny). Poprzednio stwierdziliśmy, że Z.L.: Posiada rozkład χ2 o n – 1 stopni swobody. Możemy więc wyznaczyć odpowiednie przedziały ufności. Odchylenie standardowe populacji znajduje się więc (z 99% prob.) w przedziale:

Przykład Badamy rozkład wzrostu uczniów pewnej szkoły (N = 800). Pobieramy próbę n = 18 i wyznaczamy odchylenie standardowe z próby s = 5.8 cm. Chcemy wyznaczyć 99% przedział ufności dla prawdziwego odchylenia standardowego całej populacji. Krańce przedziału ufności 99%: W naszym przypadku n – 1 = 16 – 1 = 15 stopni swobody, odpowiednie wartości dla rozkładu χ2 znajdujemy z tablic: oraz Czyli:

Testowanie hipotez – wstęp. Podejmowanie decyzji dotyczącej badanej populacji używając informacji z pobranej próby – decyzje statystyczne. Np. czy nowy program nauczania na uczelniach jest lepszy niż stary? Czy nowy lek jest lepszy niż ten poprzedniej generacji. Hipotezy statystyczne – hipotezy zerowe. Zwykle w procesie podejmowania decyzji, musimy dokonać „rozsądnego założenia” co do własności R.G.P. opisującego badaną cechę. W ten sposób tworzymy tzw. hipotezę zerową (może być fałszywa!). Np. badamy czy dana moneta jest symetryczna Nasza hipoteza zerowa, H0, może być następująca: zakładam, że moneta jest uczciwa, lub w języku statystyki p(R) = p(O) = 0.5 Hipoteza, która różni się od zerowej nazywana jest hipotezą alternatywną, H1. Np. moneta jest w istocie fałszywa: p(R) = 0.65

Hipotezy i znaczącość (significance). Powiedzmy, że przyjęliśmy pewną hipotezę zerową jako prawdziwą - H0 Pobieramy próbę w celu weryfikacji – jeżeli uzyskane wyniki różnią się znacznie od przyjętej hipotezy – w sensie statystycznym różnica może wynikać z fluktuacji lub wskazywać, że hipoteza „zerowa” jest fałszywa. Np. rzucimy 20 razy monetą i dostaniemy 16 reszek to możemy nabrać wątpliwości co do uczciwości badanej monety. Narzędzia i reguły podejmowania decyzji opisuje właśnie teoria testowania hipotez.