Analiza wariancji (ANOVA)

Slides:



Advertisements
Podobne prezentacje
Opracowali: Patryk Klemczak Tomasz Klemczak ODSIECZ WIEDEŃSKA.
Advertisements

Kształtowanie się granic II Rzeczypospolitej
Wykład 4: Systemy nawigacji satelitarnej
WNIOSEK O PRZYZNANIE POMOCY
POGŁĘBIONA OCENA SYTUACJI FINANSOWEJ NA PODSTAWIE ANALIZY WSKAŹNIKOWEJ
Machine learning Lecture 3
Identyfikacja dansylowanych aminokwasów metodą cienkowarstwowej chromatografii na płytkach poliamidowych Gawahir Hassan.
Mechanika kwantowa dla niefizyków
Program Rozwoju Obszarów Wiejskich
Przyszłe zmiany sposobu finansowania zadań oświatowych
Wybrane bloki i magistrale komputerów osobistych (PC)
HELIOTECHNIKA W chwili obecnej jest niekonkurencyjna w porównaniu ze źródłami konwencjonalnymi, ale jest to „czysta energia” dlatego wiąże się z nią wiele.
Tolerancje i pasowania
B R Y Ł Y P L A T O Ń S K I E.
Bankowość Pieniądz Podstawowe informacje o bankach
Weryfikacja hipotez statystycznych
Krakowskie Sympozjum Naukowo-Techniczne
Zasilacze prądu stałego Czyli rzeczywiste źródła napięcia
Prof. nadzw. dr hab. inż. Jarosław Bartoszewicz
Mechanika kwantowa dla niefizyków
Grzegorz Karasiewicz Katedra Marketingu Wydział Zarządzania UW
1 czerwca w zerówce.
„ Mały Miś i polskie tradycje Bożego Narodzenia”
Box Behnken Design w optymalizacji procesu biosyntezy β-karotenu w hodowlach drożdży Rhodotorula rubra Ludmiła Bogacz-Radomska(1), Joanna Harasym(1,2,3),
Projekt z dnia 30 maja 2017 r. Ustawa z dnia …. ……………
Prof. dr hab. Roman Sobiecki Rachunki makroekonomiczne
CAPS LOCK - CERTYFIKOWANE SZKOLENIA JĘZYKOWE I KOMPUTEROWE
Prezentacje wykonali: Marcin Łukasik Wiktor Kołek
GOSPODAROWANIE ZASOBAMI W ORGANIZACJI
Co to jest SSC Master… SSC Master to platforma elektronicznego obiegu, dekretacji i akceptacji dokumentów w organizacji. Dzięki szerokiemu i elastycznemu.
Podstawy pomagania SPPiIK, 2016 Anna Gromińska.
Chemia biopierwiastków
Sedymentacja.
Współczesne kierunki polityki społecznej
Hiszpania,Portugalia,Litwa,Polska,Turcja,Włochy,Chorwacja Desery.
Prawo pracy – ćwiczenia (IX)
Dotarcie do specyficznej grupy docelowej
Sprawozdanie roczne z realizacji Planu działania Krajowej Sieci Obszarów Wiejskich na lata za rok 2016 Warszawa, 26 czerwca 2017 r. Materiał.
Srebrna Małopolska regionalne inicjatywy na rzecz seniorów
Stan Wojenny.
O UTWORZENIE ZWIĄZKU METROPOLITALNEGO W WOJEWÓDZTWIE ŚLĄSKIM
Wojewódzki Inspektorat Ochrony Środowiska w Białymstoku
ZAWODOZNAWSTWO Materiały zrealizowane w ramach projektu
Wykład 8: Złożone problemy przetwarzania mobilnego
Realizacja sprzężenia od siły w układzie sterowania robotem do zastosowań neurochirurgicznych Dorota Marszalik Wieliczka,
Funkcje generujące w kombinatoryce
Ruch turystyczny w Krakowie w 2015 roku
© dr hab. Inż. Paweł Jabłoński
Adsorpcja faza stała/ gazowa lub ciekła faza ciekła/ gazowa lub ciekła
MODELE EPIDEMIOLOGICZNE
Dowody matematyczne - zadania podstawowe
Zagadnienie prawdy Andrzej Łukasik Zakład Ontologii i Teorii Poznania
Ewolucja gwiazd.
Potencjał chemiczny Potencjał chemiczny ma charakter siły uogólnionej,
STAŁE RÓWNOWAGI REAKCJI PROTOLITYCZNYCH
Optymalizacja sieci drogowej propozycja algorytmu
Nie ma innego – Tylko Jezus Mariusz Śmiałek
W ramach stypendium Ministerstwa Kultury i Dziedzictwa Narodowego
R- Punkt referencyjny (wyjściowy) obrabiarki
Parki krajobrazowe na Podlasiu
Publicznej Szkole Podstawowej nr 4 im. Tadeusza Kościuszki
Materiały pochodzą z Platformy Edukacyjnej Portalu
Zasady poprawnej komunikacji – jak uniknąć konfliktów ?
Gimnazjum nr 3 im. J. Chełmońskiego w Zielonej Górze
Moje dziecko i jego potrzeby.
Edukacja psychologiczna
GMINA RUDZINIEC.
Czym jest mowa nienawiści?
Wykład 7 Prawo urzędnicze.
Zapis prezentacji:

Analiza wariancji (ANOVA) Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie Analiza wariancji (ANOVA) dr Marta Marszałek e-mail: marta.marszalek@sgh.waw.pl

Analiza wariancji (Analysis of variance = ANOVA) jest statystyczną metodą rozstrzygania o: - istnieniu różnic między średnimi w kilku grupach (subpopulacjach), (lub inaczej o:) - istnieniu wpływu wyodrębnionego czynnika na rozkład cechy w grupach. Przedmiotem badania jest r grup (subpopulacji) wyodrębnionych w związku z działaniem pewnego czynnika (treatment).

ANOVA Wpływ każdego czynnika rozpatrywany jest: o d r ę b n i e modele jednoczynnikowe (jednoczynnikowa analiza wariancji) łącznie  modele wieloczynnikowe (wieloczynnikowa analiza wariancji)

Analiza wariancji - przykłady Czy średnie plony na czterech poletkach doświadczalnych są istotnie zróżnicowane w wyniku zasilania pól różnymi nawozami? Czy wykształcenie kobiet jest czynnikiem istotnie różnicującym przeciętną liczbę dzieci w gospodarstwie domowym? Czy lojalność klientów wobec konkretnej stacji paliw (X,Y,Z) i tankowanie tylko na jednej z nich wpływa na przeciętne zużycie paliwa przez samochód?

Analiza wariancji - hipotezy Założenie: Zmienne Yi (i=1…r) mają: rozkład normalny o średniej mi oraz jednakową we wszystkich populacjach wariancji σ2. H0: m1 = m2 =…. = mr (wyodrębniony czynnik nie ma wpływu na rozkład badanej cechy) H1: mi ≠ mj dla co najmniej jednej pary i , j (wyodrębniony czynnik ma wpływ na rozkład badanej cechy, gdyż średnie w co najmniej dwóch populacjach różnią się)

Analiza wariancji - założenia cd. 1. Próby pobrane zostały w sposób niezależny z każdej z r populacji, 2. Badana cecha w każdej z populacji ma rozkład N o jednakowej wariancji σ2. Populacje o rozkładzie normalnym z różnymi średnimi, ale o tej samej wariancji

Z każdej grupy pobieramy niezależną próbę losową o liczebności ni i rozpatrujemy zmienne objaśniane Yi. Nr obserwacji (k) Numer grupy ( i ) 1 2 ……. r 3 . ni [yki] Liczebność grupy n1 n2 nr Średnie grupowe ȳ1 ȳ2 ȳr Czy te średnie różnią się na tyle znacząco, żeby uznać za istotny wpływ badanego czynnika?

Równość wariancyjna SST = SSE + SSB Całkowita suma kwadratów odchyleń od średniej ogólnej SST = SSE + SSB SST Całkowita zmienność zmiennej 𝒀 SSE (sum of squares for error) Zmienność wewnątrzgrupowa (zmienność niewyjaśniona) SSB (sum of squares between groups) Zmienność międzygrupowa (zmienność wyjaśniona)

Zróżnicowanie całkowite SST (Sum of Squares Total) obserwacja 𝑘 w 𝑖−𝑡𝑒𝑗 grupie średnia ogólna średnia dla 𝑖−𝑡𝑒𝑗 grupy

Zróżnicowanie międzygrupowe (suma kwadratów odchyleń międzygrupowych) SSB (Sum of Squares for Treatment – Between groups) wynika z oddziaływania wyodrębnionego czynnika średnia ogólna średnia dla 𝑖−𝑡𝑒𝑗 grupy

Zróżnicowanie wewnątrzgrupowe (suma kwadr. odchyleń wewnątrzgrupowych) SSE (Sum of Squares for Error) wynika z różnic występujących wewnątrz każdej grupy średnia dla i-tej grupy obserwacja 𝑘 w 𝑖−𝑡𝑒𝑗 grupie

Podział odchylenia całkowitego danej obserwacji yki od średniej ogólnej ȳ jako suma odchylenia wyjaśnionego i błędu losowego Całkowite odchylenie (SST) Odch.wewnątrzgrup. ( błąd losowy) (SSE) Odchylenie międzygrupowe („czynnikowe”,wyjaśnione) (SSB) ȳ ȳi yki

Analiza wariancji + = SSB r-1 MSB SSE n-r MSE SST n-1 - Źródło zmienności Suma kwadratów odchyleń Stopnie swobody Średni kwadrat odchyleń Zróżnicowanie międzygrupowe – czynnik SSB r-1 MSB Zróżnicowanie wewnątrzgrupowe – błąd losowy SSE n-r MSE Zróżnicowanie całkowite SST n-1 - + =

Statystyka (test Fishera): 𝐹= 𝑀𝑆𝐵 𝑀𝑆𝐸 = 𝑆𝑆𝐵 𝑟−1 : 𝑆𝑆𝐸 𝑛−𝑟 suma kwadratów odchyleń międzygrupowych suma kwadratów odchyleń wewnątrzgrupowych gdzie: 𝑟 - liczba badanych populacji (grup) 𝑛 - ogólna liczba jednostek we wszystkich próbach

Statystyka (test Fishera): Przy założeniu prawdziwości H0 statystyka F ma rozkład F-Snedecora o stopniach swobody licznika i mianownika odpowiednio 𝑠 1 =𝑟−1 oraz 𝑠 2 =𝑛−𝑟. Obszar krytyczny: 𝑃(𝐹≥ 𝐹 𝛼, 𝑠 1 , 𝑠 2 )=𝛼

Brak podstaw do odrzucenia H0 Krok po kroku - decyzja ANOVA Brak podstaw do odrzucenia H0 Stop Odrzucenie H0 Dalsza analiza

Porównania wielokrotne. Porównywanie średnich w populacji parami Metoda najmniejszej istotnej różnicy Fishera (LSD - least significant difference) polega na porównaniu różnic między parami średnich z próby z pewną wielkością, tzw. najmniejszą istotną różnicą (LSD). tα - wartość z rozkładu t-Studenta dla n-r stopni swobody. Jeśli dla dwóch średnich zachodzi: to różnica między tymi średnimi jest statystycznie istotna.

Dziękuję dr Marta Marszałek e-mail: marta.marszalek@sgh.waw.pl