Weryfikacja hipotez statystycznych

Slides:



Advertisements
Podobne prezentacje
Opracowali: Patryk Klemczak Tomasz Klemczak ODSIECZ WIEDEŃSKA.
Advertisements

Kształtowanie się granic II Rzeczypospolitej
Wykład 4: Systemy nawigacji satelitarnej
WNIOSEK O PRZYZNANIE POMOCY
POGŁĘBIONA OCENA SYTUACJI FINANSOWEJ NA PODSTAWIE ANALIZY WSKAŹNIKOWEJ
Machine learning Lecture 3
Identyfikacja dansylowanych aminokwasów metodą cienkowarstwowej chromatografii na płytkach poliamidowych Gawahir Hassan.
Mechanika kwantowa dla niefizyków
Program Rozwoju Obszarów Wiejskich
Przyszłe zmiany sposobu finansowania zadań oświatowych
Wybrane bloki i magistrale komputerów osobistych (PC)
HELIOTECHNIKA W chwili obecnej jest niekonkurencyjna w porównaniu ze źródłami konwencjonalnymi, ale jest to „czysta energia” dlatego wiąże się z nią wiele.
Tolerancje i pasowania
B R Y Ł Y P L A T O Ń S K I E.
Bankowość Pieniądz Podstawowe informacje o bankach
Krakowskie Sympozjum Naukowo-Techniczne
Zasilacze prądu stałego Czyli rzeczywiste źródła napięcia
Prof. nadzw. dr hab. inż. Jarosław Bartoszewicz
Mechanika kwantowa dla niefizyków
Grzegorz Karasiewicz Katedra Marketingu Wydział Zarządzania UW
1 czerwca w zerówce.
„ Mały Miś i polskie tradycje Bożego Narodzenia”
Box Behnken Design w optymalizacji procesu biosyntezy β-karotenu w hodowlach drożdży Rhodotorula rubra Ludmiła Bogacz-Radomska(1), Joanna Harasym(1,2,3),
Projekt z dnia 30 maja 2017 r. Ustawa z dnia …. ……………
Prof. dr hab. Roman Sobiecki Rachunki makroekonomiczne
CAPS LOCK - CERTYFIKOWANE SZKOLENIA JĘZYKOWE I KOMPUTEROWE
Prezentacje wykonali: Marcin Łukasik Wiktor Kołek
GOSPODAROWANIE ZASOBAMI W ORGANIZACJI
Co to jest SSC Master… SSC Master to platforma elektronicznego obiegu, dekretacji i akceptacji dokumentów w organizacji. Dzięki szerokiemu i elastycznemu.
Podstawy pomagania SPPiIK, 2016 Anna Gromińska.
Chemia biopierwiastków
Sedymentacja.
Współczesne kierunki polityki społecznej
Hiszpania,Portugalia,Litwa,Polska,Turcja,Włochy,Chorwacja Desery.
Prawo pracy – ćwiczenia (IX)
Dotarcie do specyficznej grupy docelowej
Sprawozdanie roczne z realizacji Planu działania Krajowej Sieci Obszarów Wiejskich na lata za rok 2016 Warszawa, 26 czerwca 2017 r. Materiał.
Srebrna Małopolska regionalne inicjatywy na rzecz seniorów
Stan Wojenny.
O UTWORZENIE ZWIĄZKU METROPOLITALNEGO W WOJEWÓDZTWIE ŚLĄSKIM
Wojewódzki Inspektorat Ochrony Środowiska w Białymstoku
ZAWODOZNAWSTWO Materiały zrealizowane w ramach projektu
Wykład 8: Złożone problemy przetwarzania mobilnego
Realizacja sprzężenia od siły w układzie sterowania robotem do zastosowań neurochirurgicznych Dorota Marszalik Wieliczka,
Funkcje generujące w kombinatoryce
Ruch turystyczny w Krakowie w 2015 roku
© dr hab. Inż. Paweł Jabłoński
Adsorpcja faza stała/ gazowa lub ciekła faza ciekła/ gazowa lub ciekła
MODELE EPIDEMIOLOGICZNE
Dowody matematyczne - zadania podstawowe
Zagadnienie prawdy Andrzej Łukasik Zakład Ontologii i Teorii Poznania
Ewolucja gwiazd.
Potencjał chemiczny Potencjał chemiczny ma charakter siły uogólnionej,
STAŁE RÓWNOWAGI REAKCJI PROTOLITYCZNYCH
Optymalizacja sieci drogowej propozycja algorytmu
Nie ma innego – Tylko Jezus Mariusz Śmiałek
W ramach stypendium Ministerstwa Kultury i Dziedzictwa Narodowego
R- Punkt referencyjny (wyjściowy) obrabiarki
Parki krajobrazowe na Podlasiu
Publicznej Szkole Podstawowej nr 4 im. Tadeusza Kościuszki
Materiały pochodzą z Platformy Edukacyjnej Portalu
Zasady poprawnej komunikacji – jak uniknąć konfliktów ?
Gimnazjum nr 3 im. J. Chełmońskiego w Zielonej Górze
Moje dziecko i jego potrzeby.
Edukacja psychologiczna
GMINA RUDZINIEC.
Czym jest mowa nienawiści?
Wykład 7 Prawo urzędnicze.
Wsparcie dla przedsiębiorców oferowane przez Powiatowy Urząd Pracy
Zapis prezentacji:

Weryfikacja hipotez statystycznych Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie Weryfikacja hipotez statystycznych dr Marta Marszałek e-mail: marta.marszalek@sgh.waw.pl

Wnioskowanie statystyczne Estymacja Weryfikacja hipotez statystycznych Szacowanie wartości parametrów rozkładu populacji (lub jego postaci funkcyjnej) na podstawie próby losowej. Sprawdzanie przypuszczeń dot. parametrów rozkładu populacji (lub jego postaci funkcyjnej) na podstawie próby losowej.

Hipoteza statystyczna Hipoteza statystyczna – dowolne przypuszczenie dotyczące parametrów lub postaci funkcyjnej rozkładu populacji generalnej. Prawdziwość tego przypuszczenia jest sprawdzana na podstawie próby losowej. Hipotezy parametryczne – przypuszczenia dotyczące parametrów populacji generalnej Hipotezy nieparametryczne – przypuszczenia dotyczące kształtu rozkładu populacji generalnej (postaci funkcyjnej).

Hipotezy parametryczne przypuszczenia dotyczące parametrów populacji generalnej. 1. Hipoteza zerowa (ma zawsze postać równości), np: H0: m=28; m1=m2; p=0,6 ; p1=p2 2. Hipoteza alternatywna (H1) – konkurencyjna do H0 (Uwaga: nie zawsze jest zaprzeczeniem do H0!)

Cel weryfikacji hipotez Podstawą weryfikacji hipotezy jest założenie, że Ho jest prawdziwa (np. m=28; czyli przeciętna l. punktów uzyskanych z egzaminu ze statystyki = 28). Prawdziwość hipotezy (przypuszczenia) sprawdzamy na podstawie wyników próby losowej. Obliczona na podstawie próby wartość estymatora ( 𝑿 ) nie powinna znacząco odbiegać od założonej wartości, a jeśli różni się to powinno zdarzać się to rzadko (tj. z niewielkim prawdopodobieństwem). Uzyskanie wyniku z próby znacząco różniącego się od spodziewanej wartości parametru podważa prawdziwość założenia (hipotezy zerowej).

Test statystyczny Test statystyczny – „narzędzie” stosowane do weryfikacji hipotezy statystycznej. To reguła postępowania rozstrzygająca, jakie wyniki próby pozwalają uznać sprawdzaną hipotezę za fałszywą i ją odrzucić, a jakie nie dają podstaw do podjęcia takiej decyzji. Test należy budować tak, aby uchronić się przed popełnieniem: błędu I rodzaju (odrzucenie hipotezy prawdziwej), błędu II rodzaju (przyjęcie hipotezy fałszywej).

Wniosek o hipotezie nie odrzucać odrzucać Rzeczywistość: Hipoteza H0 Wniosek o hipotezie nie odrzucać odrzucać prawdziwa prawidłowy nieprawidłowy błąd I rodzaju nieprawdziwa błąd II rodzaju Błąd I rodzaju – błąd wnioskowania statystycznego polegający na odrzuceniu hipotezy, gdy w rzeczywistości jest ona prawdziwa.   Błąd II rodzaju – błąd wnioskowania statystycznego polegający na nieodrzuceniu hipotezy, gdy w rzeczywistości jest ona fałszywa.

Poziom istotności α Prawdopodobieństwo popełnienia błędu I rodzaju = poziom istotności α (w praktyce 𝛼 ≤ 0,1). Równoczesna minimalizacja prawdopodobieństw popełnienia obu błędów nie jest możliwa. Teoria statystyki oferuje m.in. : testy najmocniejsze – decyzje podejmuje się minimalizując prawdop. popełnienia błędu II rodzaju przy ustalonym z góry poziomie prawdop. popełnienia błędu I rodzaju. testy istotności – decyzję podejmuje się przy ustalonym prawdopodobieństwie popełnienia błędu I rodzaju. Kwestia błędu II rodzaju jest pomijana.

Etapy weryfikacji hipotez statystycznych Sformułowanie hipotezy zerowej H0 i hipotezy alternatywnej H1 Wybór odpowiedniego testu weryfikacyjnego [in. estymatora (statystyki)] – w celu sprawdzenia H0. Wyznaczenie wartości empirycznej testu (na podstawie wyników próby). Wyznaczenie obszaru krytycznego (obszaru odrzuceń hipotezy zerowej). Decyzja weryfikacyjna i wniosek (jeśli test przyjmie wartość należącą do obszaru krytycznego – H0 odrzucamy, w przeciwnym przypadku stwierdzamy brak podstaw do odrzucenia H0).

Ogólny wzór testu 𝑋 − 𝑚 0 𝜎 𝑛 = 𝑒𝑠𝑡𝑦𝑚𝑎𝑡𝑜𝑟 −ℎ𝑖𝑝𝑜𝑡𝑒𝑡𝑦𝑐𝑧𝑛𝑎 𝑤𝑎𝑟𝑡𝑜ść 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑢 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑𝑜𝑤𝑦 𝑏łą𝑑 𝑒𝑠𝑡𝑦𝑚𝑎𝑡𝑜𝑟𝑎

Weryfikacja hipotez – decyzje weryfikacyjne Rezultat weryfikacji hipotezy: jeśli test przyjmie wartość należącą do obszaru krytycznego – H0 odrzucamy, jeśli wartość testu znajdzie się poza obszarem krytycznym to stwierdzamy brak podstaw do odrzucenia H0. np. 𝑡 𝑒𝑚𝑝 =3,15 𝜆=(−∞;−2,228>∪<2,228;+∞) 𝜆:(−∞;−2,228>∪<2,228;+∞) x np. 𝑢 𝑒𝑚𝑝 =0,75 𝜆:<1,96;+∞)

Test istotności dla wartości średniej (𝒎) w populacji generalnej o rozkładzie normalnym ze znanym σ Założenie: Populacja gener. ma rozkład N, m - nieznane, σ - znane Hipotezy: H0: m=m0 H1: m≠m0 Test weryfikacyjny dla H0: 𝑥 z próby, o rozkładzie 𝑁(𝑚; 𝜎 𝑛 ) Jeśli H0 jest prawdziwa to statystyka: ma rozkład N(0,1) i jej moduł nie powinien przyjmować zbyt dużych wartości, tzn. nie powinien przekraczać tzw. wartości krytycznej 𝑢𝛼, takiej, że 𝑃( 𝑈 ≥𝑢𝛼)=𝛼

Wyznaczanie obszaru krytycznego (obszaru odrzucenia hipotezy zerowej) Obszar nieodrzucenia 1-α obszar odrzucenia obszar odrzucenia α/2 α/2 -uα uα u

Przykład – test istotności dla m w populacji o rozkładzie normalnym ze znanym σ Należy sprawdzić przypuszczenie, że przeciętna liczba punktów uzyskanych na egzaminie ze statystyki wynosi 28. Zakłada się, że ta zmienna ma rozkład normalny z odchyleniem standardowym 5. W losowej próbie 25 studentów otrzymano X̄ = 29,2; s=4,5. Przyjąć α=0,05. H0: m=28 czyli m0= 28 H1: m≠28 X̄ ma rozkład , więc ma rozkład N(0,1)

Przykład – test istotności dla m w populacji o rozkładzie normalnym ze znanym σ Z tablic rozkładu normalnego odczytujemy: 𝑢0,05=1,96, więc ǀ𝑢ǀ<𝑢0,05 czyli obliczona wartość nie należy do obszaru krytycznego 𝜆:(− ∞, −1,96> 𝜐 <1,96, ∞). Decyzja weryfikacyjna: Na poziomie istotności 𝛼=0,05 brak podstaw do odrzucenia 𝐻 0 , Interpretacja (odpowiedź): to oznacza, że przeciętna liczba punktów uzyskana z egzaminu ze statystyki wynosi 28.

Wyznaczanie obszaru krytycznego (obszaru odrzucenia hipotezy zerowej) Obszar nieodrzucenia 0,95 obszar odrzucenia obszar odrzucenia 0,025 0,025 . -1,96 1,2 1,96 • u Decyzja: Na poziomie istotności 𝛼=0,05 brak podstaw do odrzucenia H0, Interpretacja (odpowiedź): średnia liczba punktów uzyskanych z egzaminu ze statystyki wynosi 28.

Testy jednostronne Test prawostronny: H0: m=m0 H1: m>m0 Prawostronny obszar krytyczny: < u2α, +∞) taki, że P(U≥u2α)=α

Wyznaczanie prawostronnego obszaru krytycznego Obszar nieodrzucenia 1-α obszar odrzucenia α u2α

Testy jednostronne Test lewostronny: H0: m=m0 H1: m<m0 Lewostronny obszar krytyczny: (-∞, -u2α,> taki, że P(U≤-u2α)=α

Wyznaczanie lewostronnego obszaru krytycznego Obszar nieodrzucenia 1-α obszar odrzucenia α -u2α

Krytyczny poziom istotności α Krytyczny poziom istotności α* (significant level, probability level, p-value, istotność) – najniższy poziom istotności, przy którym hipoteza zerowa, dla otrzymanej wartości testu, może być odrzucona, (inaczej mówiąc) – to poziom istotności, przy którym następuje zmiana decyzji weryfikacyjnej. Jeśli α* ≤ α - H0 odrzucamy α* > α - brak podstaw do odrzucenia H0

Krytyczny poziom istotności α* ≤ α Obszar nieodrzucenia 1-α α - poz.istotności u2α •uobl α* - kryt. poz. istotn. α* ≤ α : H0 odrzucamy

Krytyczny poziom istotności α* > α Obszar nieodrzucenia 1-α α – poz.istotności u2α •uobl α* –kryt. poz. istotn. α* > α: brak podstaw do odrzucenia H0

Test istotności dla wartości średniej w populacji generalnej o rozkładzie N, σ - nieznane, mała próba Założenia: Populacja gener. ma rozkład N, m, σ - nieznane, n - małe Hipotezy: H0: m=m0 H1: m≠m0 Test weryfikacyjny dla H0: , która przy założeniu prawdziwości H0 ma rozkład t-Studenta z n-1 stopniami swobody i jej moduł nie powinien przyjmować zbyt dużych wartości, tzn. nie powinien przekraczać tzw. wartości krytycznej tα takiej, że 𝑃(│𝑡│≥𝑡𝛼)=𝛼

Test istotności dla wartości średniej w populacji generalnej o dowolnym rozkładzie, duża próba. Założenia: populacja generalna ma dowolny rozkład, m, σ - nieznane, n - duże Sfromułowanie hipotezy: H0: m=m0 H1: m≠m0 Test weryfikacyjny: korzystamy z granicznego rozkładu 𝑥 z próby. Jeśli H0 jest prawdziwa to statystyka: ma asymptotyczny rozkład N(0,1) Dwustronny obszar krytyczny testu wyznaczamy w oparciu o relację: 𝑃(│𝑈│≥ 𝑢𝛼)=𝛼

Test istotności dla dwóch średnich w populacji generalnej o rozkładzie normalnym ze znanymi σ1 i σ2 Założenia: X1:N(m1,σ1) ; X2:N(m2,σ2), σ1 i σ2 - znane Sformułowanie hipotezy: H0: m1 = m2 H1: m1 ≠ m2 Jeśli H0 jest prawdziwa to statystyka: ma rozkład N(0,1) Dwustronny obszar krytyczny testu wyznaczamy w oparciu o relację: 𝑃(│𝑈│≥ 𝑢𝛼)=𝛼

Test istotności dla dwóch średnich w populacji generalnej o rozkładzie normalnym z nieznanymi, ale jednakowymi σ1 i σ2 Założenia: X1:N(m1,σ1) ; X2:N(m2,σ2), 𝜎1=𝜎2=𝜎 − nieznane Sformułowanie hipotezy: H0: m1 = m2 H1: m1 ≠ m2 Jeśli H0 jest prawdziwa to statystyka: ma rozkład t-Studenta o 𝑣=𝑛1+𝑛2−2 Dwustronny obszar krytyczny testu wyznaczamy w oparciu o relację: 𝑃(│𝑡│≥ 𝑡𝛼)=𝛼

Test istotności dla dwóch średnich w populacji generalnej o dowolnym rozkładzie Założenia: X1i X2 mają dowolne rozkłady o nieznanych parametrach, 𝑛 1 , 𝑛 2 − duże Sformułowanie hipotezy: H0: m1 = m2 H1: m1 ≠ m2 Jeśli H0 jest prawdziwa to statystyka: ma rozkład as.N(0,1) Dwustronny obszar krytyczny testu wyznaczamy w oparciu o relację: 𝑃(│𝑈│≥ 𝑢𝛼)=𝛼

Test istotności dla różnicy średnich – próby zależne Założenia: Różnice par zmiennych Ri=Xi1-Xi2 mają rozkład N(mR,σR) Sformułowanie hipotezy: H0: mR = m0 H1: mR ≠ m0 Niech: Test weryfikacyjny: to statystyka która przy założeniu prawdziwości H0 ma rozkład t-Studenta z 𝑛−1 stopniami swobody. Obszar krytyczny: 𝑃(│𝑡│≥𝑡𝛼)=𝛼

Test istotności dla frakcji Założenia: Populacja ma rozkład 0−1 z parametrem p (frakcja w populacji, prawdopodobieństwo), n - duże Sformułowanie hipotezy: H0: p = p0 H1: p ≠ p0 Test weryfikacyjny dla H0: 𝒑 = 𝑿 𝒏 , (wskaźnik struktury z próby) o rozkładzie as. N (por. do odpowiedniego twierdz. granicznego) Jeśli H0 jest prawdziwa to statystyka: ma rozkład asN(0,1) Dwustronny obszar krytyczny: 𝑃(│𝑈│≥ 𝑢𝛼)=𝛼

Test istotności dla różnicy frakcji Założenia: Dwie populacje mają rozkład 0−1 z parametrami: p1 i p2 (frakcje elementów wyróżnionych), n1 i n2 - duże Sformułowanie hipotezy: H0: 𝑝1 = 𝑝2 H1: 𝑝1 ≠ 𝑝2 Frakcje (wskaźniki struktury z prób): 𝑝 1 = 𝑋 1 𝑛 1 , 𝑝 2 = 𝑋 2 𝑛 2 Wspólna frakcja z próby: 𝑝 = 𝑋 1 + 𝑋 2 𝑛 1 + 𝑛 2 Jeśli H0 jest prawdziwa to statystyka: ma rozkład as.N(0,1) Dwustronny obszar krytyczny: 𝑃(│𝑈│≥ 𝑢𝛼)=𝛼

Dziękuję dr Marta Marszałek e-mail: marta.marszalek@sgh.waw.pl