Statystyka w doświadczalnictwie

Slides:



Advertisements
Podobne prezentacje
Test zgodności c2.
Advertisements

Statystyka w doświadczalnictwie
Rangowy test zgodności rozkładów
Wykład 9 Analiza wariancji (ANOVA)
Wykład 7: Moc Moc testu to prawdopodobieństwo odrzucenia H0, gdy prawdziwa jest HA Moc=czułość testu Moc = 1 – Pr (nie odrzucamy H0, gdy prawdziwa jest.
Porównywanie średnich dwóch prób niezależnych o rozkładach normalnych (test t-studenta)
Analiza wariancji jednoczynnikowa
Zmienne losowe i ich rozkłady
Badania marketingowe na rynkach produktów sektora wysokich technologii Wybrane metody analizy danych.
Analiza wariancji Marcin Zajenkowski. Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna.
Skale pomiarowe – BARDZO WAŻNE
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
BUDOWA MODELU EKONOMETRYCZNEGO
Test zgodności Joanna Tomanek i Piotr Nowak.
Wnioskowanie statystyczne CZEŚĆ III
Statystyka w doświadczalnictwie
Wykład 11 Analiza wariancji (ANOVA)
Nierówność informacyjna
Próby niezależne versus próby zależne
Próby niezależne versus próby zależne
Porównywanie średnich dwóch prób zależnych
Wykład 4. Rozkłady teoretyczne
Testy nieparametryczne
Średnie i miary zmienności
Jednoczynnikowa analiza wariancji (ANOVA)
Rozkład t.
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Testy nieparametryczne
Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną zależność.
Konstrukcja, estymacja parametrów
Hipotezy statystyczne
Testy nieparametryczne
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Podstawy statystyki, cz. II
Statystyka - to „nie boli”
Planowanie badań i analiza wyników
Porównywanie średnich 2 i więcej prób o rozkładach innych niż normalny
Seminarium licencjackie Beata Kapuścińska
Testowanie hipotez statystycznych
Dopasowanie rozkładów
STATYSTYKA Pochodzenie nazwy:
Statystyka medyczna Piotr Kozłowski
Estymatory punktowe i przedziałowe
Weryfikacja hipotez statystycznych dr hab. Mieczysław Kowerski
Statystyczna analiza danych w praktyce
Testowanie hipotez Jacek Szanduła.
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Statystyka medyczna Piotr Kozłowski www: 1.
STATYSTYKA – kurs podstawowy wykład 11
TABELE WIELODZELCZE TESTY NIEPARAMETRYCZNE
Testy nieparametryczne
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Analiza współzależności zjawisk
Korelacja i regresja liniowa
Zapis prezentacji:

Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia

Metody nieparametryczne Do tej pory omawialiśmy metody odpowiednie do opracowywania danych ilościowych, mierzalnych W każdym przypadku zakładaliśmy m.in. normalność rozkładów zmiennej Nie zawsze jednak rzeczywistość jest taka łaskawa

Metody nieparametryczne Co zrobić, jeżeli: mamy do czynienia z danymi niemierzalnymi, jakościowymi? analizowany zbiór danych jest niejednorodny i cecha nie ma rozkładu normalnego? próba jest mała i nie można zweryfikować założenia o rozkładzie? Zastosować metody (testy) nieparametryczne

Skale pomiarowe Zmienne jakościowe Zmienne ilościowe Nominalna (nazwa, relacja różności)‏ Porządkowa (rangowa; relacja porządku)‏ Zmienne ilościowe Przedziałowa (interwałowa; stała jednostka, umowne zero, nie dzielić)‏ Ilorazowa (stosunkowa; zero absolutne, wartości można dzielić)‏

Metody nieparametryczne Stosować wtedy, gdy nie możemy posłużyć się metodą parametryczną / testem parametrycznym Co prawda gdy założenia testów parametrycznych (zwłaszcza o normalności rozkładu) nie są spełnione, będą one dalej działać, ale w wielu wypadkach wyniki nie będą wiarygodne

Testy nieparametryczne Niedotrzymanie założenia o normalności cechy = zmniejszenie błędu I rodzaju (alfa), ale... .. wówczas siła (moc) testów nieparametrycznych jest mniejsza, niż parametrycznych moc testu = zdolność do unikania błędu II rodzaju

Testy nieparametryczne Testy nieparametryczne nie wymagają założenia o normalności rozkładu cech(y) (ang. ditribution free tests)‏ Mimo mniejszej mocy (ogółem) dają lepsze wyniki (większą moc) gdy rozkład cechy jest silnie asymetryczny

Testy nieparametryczne Testy te nazywają się nieparametrycznymi gdyż w zasadzie nie badają hipotez dotyczących parametrów (mimo, że na pierwszy rzut oka tak się nam wydaje)‏

Testy nieparametryczne Zalety można stosować do różnych populacji łatwiejsze do zastosowania Wady mniejsza moc bardziej chaotyczne trudniejsze do zastosowania do bardziej skomplikowanych hipotez / modeli

Testy nieparametryczne Najłatwiej będzie prześledzić podstawowe testy nieparametryczne przez ich porównanie do metod parametrycznych w różnych sytuacjach

Pojedyncza próba

Pojedyncza próba Test serii Walda-Wolfowitza Stosowany do badania losowości zjawisk Test bierze pod uwagę zarówno różnice od średniej, jak i rozkład próby

Pojedyncza próba Np. testujemy termin kiełkowania nasion dwóch podgatunków modrzewia (E i P)‏ Notujemy czas kiełkowania każdego nasienia W efekcie uzyskać możemy następujące przykładowe rozkłady terminu kiełkowania

Pojedyncza próba E P E P E P E P E P E P E P E P E P E P E E E E E E E E E E P P P P P P P P P P E E E E E E P E E P E E P P P P P P P P E E P P E P E P P E E E P P E P E E P P E E E E E P P P P P P P P P P E E E E E

Próby niezależne

Próby niezależne Zastosowanie mediany

Miary położenia

Miary położenia

Miąższości [m3]: 0.45, 0.39, 0.35, 0.51, 0.41, 0.38, 0.42, 0.4, 0.3, 0.6 Średnia miąższość [m3]: 0.421 Miąższości [m3]: 0.45, 0.39, 0.35, 0.51, 0.41, 0.38, 0.42, 0.4, 0.3, 7.1 Średnia miąższość [m3]: 1.07 Mediana [m3]: 0.3, 0.35, 0.38, 0.39, 0.4, 0.41, 0.42, 0.45, 0.51, 7.1

Próby niezależne Zastosowanie mediany Test median Ho: mediany w badanych populacjach są takie same H1: mediany w badanych populacjach są różne

Próby niezależne Np. badamy dwie metody ścinki pod kątem uszkodzeń drzew

Próby niezależne Np. badamy dwie metody ścinki pod kątem uszkodzeń drzew

Próby niezależne Np. badamy dwie metody ścinki pod kątem uszkodzeń drzew Czy metoda A jest lepsza?

Próby niezależne Np. badamy dwie metody ścinki pod kątem uszkodzeń drzew Czy metoda A jest lepsza? Liczymy ogólną medianę (Me=16)‏

Próby niezależne Metoda A: 5 wartości < mediany, czyli PA=5/12 Metoda B: 5 wartości < mediany, czyli PB=5/9 Ho: nie ma różnicy między PA i PB (PA-PB=0)‏ Obliczamy

Próby niezależne Test sumy rang Manna-Whitneya Stosowany zamiast testu t w sytuacji, gdy rozkłady cechy nie są normalne

Próby niezależne Test sumy rang Manna-Whitneya Stosowany zamiast testu t w sytuacji, gdy rozkłady cechy nie są normalne Łączymy próby ze sobą, sortujemy i przydzielamy rangi (gdy wartości takie same – używamy rang wiązanych)‏

Próby niezależne Obliczamy sumę rang dla każdej z prób przed połączeniem Jeżeli populacje mają takie same rozkłady badanej cechy, sumy rang powinny być takie same (lub przynajmniej do siebie zbliżone)‏

Próby niezależne Np. analizujemy termin kiełkowania nasion dwóch podgatunków modrzewia (E i P)‏

Próby niezależne Np. analizujemy termin kiełkowania nasion dwóch podgatunków modrzewia (E i P)‏

Próby niezależne Np. analizujemy termin kiełkowania nasion dwóch podgatunków modrzewia (E i P)‏ Czy jest różnica w terminach kiełkowania tych podgatunków?

Próby niezależne Analizujemy rangi dla E i P E: 2, 7, 8, 9, 11 (suma = 37)‏ P: 1, 3, 4, 5, 6, 10 (suma = 29)‏

Próby niezależne Analizujemy rangi dla E i P Testujemy hipotezy E: 2, 7, 8, 9, 11 (suma = 37)‏ P: 1, 3, 4, 5, 6, 10 (suma = 29)‏ Testujemy hipotezy Ho: nie ma różnicy w terminie kiełkowania nasion E i P H1: jest różnica w terminie kiełkowania nasion E i P

Próby zależne

Próby zależne Podobnie, jak w przypadku testów parametrycznych, test dotyczy nie wartości cechy w populacjach, ale różnicy cech dla par spostrzeżeń Ho: mediana różnic między wartościami sparowanymi = 0 Statystyka testowa: liczba różnic + Jeżeli Ho jest prawdziwa, liczba różnic na + i – powinna być równa

Próby zależne Test znaków dla prób zależnych Np. Badamy liczbę nasion w strąkach robinii. Interesuje nas, czy liczba zdrowych nasion w strąkach z górnej części korony jest inna, niż w dolnej części korony. Badaniu podlegają straki pobrane z 10 drzew

Próby zależne Na podstawie tych danych obliczamy statystykę testu (z) i porównujemy ją z wartością krytyczną dla rozkładu normalnego

Próby zależne Test Wilcoxona Testowi również podlega mediana różnic między parami obserwacji Ale do testu wykorzystuje się rangi okreslone na podstawie wartości absolutnych różnic między parami obserwacji

Próby zależne Suma R+ = 47 Suma R- = 8 Statystyka testu = min(R+, R-) = 8 Porównanie z wartością krytyczną i decyzja (tu 8 < 10)

Próby zależne Test Wilcoxona jest podobny do testu znaków dla prób zależnych Można je stosować w tych samych sytuacjach Test Wilcoxona uwzględnia więcej informacji (znak i wielkość różnic), dlatego jest lepszy

Rozkłady

Rozkłady W tej grupie testów omówimy test chi-kwadrat test Kołmogorowa test Kołmogorowa-Smirnova test Shapiro-Wilka

Rozkłady – 1 próba Testowana jest zgodność rozkładu empirycznego z rozkładem teoretycznym test chi-kwadrat test Kołmogorowa test Shapiro-Wilka

Rozkłady – 1 próba Test chi-kwadrat testuje różnice między częstościami klas w rozkładzie teoretycznym i empirycznym Czuły na liczbę i liczebność klas Przeznaczony do testowania hipotez dotyczących rozkładów zmiennych skokowych (dla zmiennych ciągłych statystyka daje tylko przybliżenie)

Rozkłady – 1 próba Test Kołmogorowa testuje różnice między skumulowanymi liczebnościami klas (dystrybuantami) rozkładu teoretycznego i empirycznego Przeznaczony do testowania hipotez dotyczących rozkładów zmiennych ciągłych Modyfikacja: normalizacja statystyki wielkością próby

Rozkłady – 1 próba Test Shapiro-Wilka testuje hipotezę, że rozkład empirycznyc jest zgodny z rozkładem normalnym

Rozkłady – 2 próby Test Kołmogorowa-Smirnova testuje hipotezę, że dwie próby zostały pobrane z tej samej populacji lub z populacji o takich samych rozkładach Wykorzystuje (standaryzowaną) różnicę między skumulowanymi liczebnościami (dystrybuantami) rozkładów

ANOVA

ANOVA? Ze względu na założenia nie zawsze możemy wykonać analizę wariancji Nieparametryczny odpowiednik ANOVA - test Kruskala-Wallisa Zamiast średnich testowane są mediany Rozwinięcie testu Wilcoxona dla prób niezależnych (wykorzystuje rangi)

Test Kruskala-Wallisa Każdej obserwacji przypisuje się rangę (dla całości doświadczenia) Warianty doświadczenia / poziomy czynnika Oblicza się statystykę testową

Test Kruskala-Wallisa Np. Czy branża, w której absolwent wyższej uczelni znajduje pierwszą pracę, decyduje o wielkości wynagrodzenia?

Test Kruskala-Wallisa Ho: początkowe wynagrodzenia w poszczególnych branżach są takie same

Test Kruskala-Wallisa Hobl = 4,13 Krytyczna wartość chi2 = 7,81 Brak podstaw do odrzucenia Ho o równości wynagrodzeń

Siła związku

Siła związku Współczynnik korelacji rang Spearmana (1904) Wykorzystuje rangi do badania siły związku między cechami Można również wykorzystać do testowania hipotezy, że nie ma związku między badanymi populacjami

Dziekuje za uwagę!