Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Nierówność informacyjna Informacja zawarta w próbie Zależność między wariancją estymatora S parametru a informacją Jeżeli obciążenie estymatora (B) jest.

Podobne prezentacje


Prezentacja na temat: "Nierówność informacyjna Informacja zawarta w próbie Zależność między wariancją estymatora S parametru a informacją Jeżeli obciążenie estymatora (B) jest."— Zapis prezentacji:

1 Nierówność informacyjna Informacja zawarta w próbie Zależność między wariancją estymatora S parametru a informacją Jeżeli obciążenie estymatora (B) jest równe zeru

2 Weryfikacja hipotez statystycznych Hipoteza statystyczna – założenie co do rozkładu cech w populacji. Test statystyczny – narzędzie weryfikacji tej hipotezy. Testy parametryczne: weryfikacja hipotez parametrycznych, które dotyczą parametrów rozkładu danej cechy w populacji generalnej. Testy nieparametryczne: weryfikacja hipotez nieparametrycznych dotyczących, np. zgodności rozkładu cech w populacji z rozkładem teoretycznym, zgodności rozkładów cech w dwóch różnych populacjach, losowości próby.

3 Hipotezy i testy parametryczne Hipoteza prosta – zakłada wartości wszystkich parametrów rozkładu. Hipoteza złożona – wartość co najmniej jednego parametru jest nieznana (np. zakładamy tylko postać funkcyjną rozkładu). Hipoteza zerowa (H o ) – hipoteza, którą weryfikujemy. Hipoteza alternatywna (H 1 ) – co najmniej jeden z parametrów rozkłady jest różny od tego z hipotezy zerowej.

4 Błąd pierwszego rodzaju (false negative) – odrzucenie prawdziwej hipotezy H o. Błąd drugiego rodzaju (false positive) – przyjęcie fałszywej hipotezy H o. Błędy popełniane podczas weryfikacji hipotez statystycznych

5 Poziom istotności ( ) P(|x| x o )= (test dwustronny) P(x x o )= (test jednostronny) Obszar krytyczny (S c ): P(x S c |H o )= Poziom istotności definiuje prawdopodobieństwo popełnienia błędu pierwszwego rodzaju (odrzucenia prawdziwej hipotezy zerowej).

6 Moc testu: prawdopodobieństwo odrzucenia hipotezy zerowej w zależności od hipotezy alternatywnej. M(S c, )=P(X S c |H)=P(X S c | ) Test najmocniejszy hipotezy prostej H o względem hipotezy alternatywnej H 1 : P(S c, 1 )=1- =max Test jednostajnie najmocniejszy: test najmocniejszy względem jakiejkolwiek hipotezy alternatywnej.

7 Test F Fishera równości wariancji Mamy dwie populacje o rozkładzie normalnym (np. przypadek pomiaru tej samej wielkości różnymi przyrządami). Pytanie: czy te populacje mają tą samą wariancję. W tym celu rozważamy iloraz F=s 1 2 /s 2 2

8

9 Porównywanie wartości średnich (test Studenta)

10 Weryfikacja hipotezy, że x= 0

11 Weryfikacja hipotezy o równości wartości średnich z dwóch serii pomiarów

12 Przykład: porównywanie średnich z dwóch serii oznaczeń azotu w cynchoninie Grupa 1 9,299,53 9,389,48 9,359,61 9,439,68 średnia9,3639,575 odch.stand.0,0580,088

13 Test Studenta dla par wiązanych Oznaczanie zawartości NaOH w dwóch seriach roztworu po elektrolizie NaCl (mg/dm 3 ) przed (x) i za filtrem (y) xyd=y-x 100,196,6-3,5 115,1115,6+0,5 130,0125,5-4,5 93,694,0+0,4 108,3103,3-5,0 137,2134,4-2,8 104,4100,2-4,2 97,3 0

14 Wykrywanie błędów grubych: test Dixona (nieparametryczny) x 1 – wynik podejrzany o błąd gruby x 2 – wynik mu najbliższy Wynik x 1 możemy odrzucić na poziomie istotności jeżeli Q > Q(, n) (n jest liczbą pomiarów).

15 Wartości krytyczne testu Dixona n

16 Przykład: pomiar zawartości grafitu w żeliwie 12,86 22,89 32,90 42,91 52,99

17 Testy nieparametryczne Testy losowości: badamy, czy próba jest losowa –test mediany (Stevensa). Testy zgodności: badamy, czy rozkład z próby jest zgodny z założonym –Test 2, test W Shapiro-Wilka, test Kołmogorowa test Lillieforsa (badanie normalności rozkładu). Testy jednorodności: badamy, czy dwie próby pochodzą z tej samej populacji –test serii Walda-Wolfowitza, test U Manna-Whitneya, test Kołmogorowa-Smirnowa (dla prób niezależnych), –test znaków, test kolejnosci par Wilcoxona (dla prób zależnych).

18 Test 2 dobroci dopasowania g i : wynik i-tego pomiaru f i : wartość teoretyczna wyniku i-tego pomiaru i : odchylenie standardowe i-tego pomiaru. Wielkości u i mają rozkład normalny o zerowej średniej i jednostkowej wariancji a zatem wielkość T ma rozkład 2 o N-p stopniach swobody, gdzie p jest liczbą estymowanych parametrów funkcji f. Dopasowanie uznajemy za złe na poziomie istotności jeżeli T

19 Zastosowanie testu 2 do weryfikacji hipotezy o rozkładzie częstości obserwacji }}}} x f(x) … k … r

20 Hipotezę o zgodności rozkładu obserwowanego z rozkładem założonym odrzucamy na poziomie istotności a jeżeli dla f stopni swobody. f=liczba stopni swobody=r-p-1 gdzie p jest liczbą parametrów rozkładu (najwyżej r-1 stopni swobody). n i : liczba obserwacji wielkości w i-tym przedziale; n: całkowita liczba obserwacji. np i : wartość oczekiwana liczby obserwacji w i-tym przedziale Wartość oczekiwana wariancji liczby obserwacji.

21 Przykład: porównanie liczby zliczeń par elektron-pozyton w komorze pęcherzykowej naświetlonej promieniowaniem z rozkładem Poissona. 2 = =16.81 Nie ma zatem podstaw do odrzucenia rozkładu Poissona.

22 Zastosowanie testu 2 do analizy tabeli wkładów y1y1 y2y2 …ylyl x1x1 n 11 n 12 …n 1l x2x2 n 21 n 22 …n 2l …………… xkxk n k1 n k2 …n kl x, y: zmienne losowe mogące przyjmować wartości odpowiednio x 1, x 2,…, x k oraz y 1, y 2,…, y l. Każdej kombinacji zmiennych (x i,y j ) przyporządkowana jest liczba obserwacji n ij. Jeżeli zmienne są współzależne na poziomie istotności to dla f=kl-1- (k+l-2)=(k-1)(l-1) stopni swobody.

23 y1y1 y2y2 x1x1 n 11 =an 12 =b x2x2 n 21 =cn 22 =d Przykład z medycyny: ocena skuteczności dwóch metod leczenia danej choroby. x 1 : pierwsza metoda leczenia x 2 : druga metoda leczenia y 1 : przypadki wyleczone y 2 : przypadki niewyleczone f=liczba stopni swobody=(2-1)(2-1)=1 Jeżeli metody leczenia mają różną skuteczność to

24 Test mediany (badanie losowości próby) 1.Wyznaczamy medianę (m). 2.Danym nieuporządkowanym przyporządkowujemy następujące oznaczenia: A gdy xmB gdy x>m 0 gdy x=m0 gdy x=m 3.Obliczamy liczbę następujących po sobie serii AAA…A i BBB…B. Liczby serii spełniają rozkład normalny z następującą wartością średnią i wariancją n a – liczba pomiarów A; n b – liczba pomiarów B; n – liczba pomiarów

25 74,5191,055,55,1536,435,046,010,97,356,65 BBBABABAAA 173,526,0 BA Mediana m=35,7 n=12, n a =6, n b =6 Liczba serii k=8 Przykład (seria 12 pomiarów) E(k)=2*6*6/12+1=7, s 2 (k)=2*6*6*(2*6*6-1)/[12*12*(12-1)]=3.23 Dla a=5% (ok. 3s odchylenia) przedział ufności rozciąga się od k=3 do k=10. Próba jest zatem losowa.

26 Test Wilcoxona (par wiązanych) W tabeli ustawiamy w pary odpowiadające wielkości i obliczamy różnice. Sortujemy pary według różnic. Każdej parze przyporządkowujemy rangę, która jest równa numerowi porządkowemu pary (po sortowaniu), przy czym uśredniamy rangi, którym odpowiadają te same różnice. Osobno sumujemy rangi dodatnie i ujemne. Mniejsza z tych sum stanowi statystykę W Wilcoxona. Porównujemy W z wartością krytyczną i odrzucamy hipotezę o identyczności wyników w parach jeżeli W>W tab.

27 WJdrangaznak 3,23,50,35+ 2,73,00,35+ 3,13,80,710+ 2,93,20,35+ 3,43,80,48,5+ 2,83,20,48,5+ 3,43,70,35+ 3,43,60,21,5+ 3,23,40,21,5+ 3,33,60,36+ suma 31,434,83,455 Przykład: ocena różnic wysokości drzew wiosną i jesienią

28 Dla dużych prób liczba znaków + spełnia rozkład normalny z wartością średnią E(W + ) i wariancją s 2 (W + ):


Pobierz ppt "Nierówność informacyjna Informacja zawarta w próbie Zależność między wariancją estymatora S parametru a informacją Jeżeli obciążenie estymatora (B) jest."

Podobne prezentacje


Reklamy Google