Zofia Hanusz i Joanna Tarasińska Uniwersytet Przyrodniczy w Lublinie Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym Zofia Hanusz i Joanna Tarasińska Uniwersytet Przyrodniczy w Lublinie WISŁA 2010
Testy do badania p - wymiarowej normalności p=2 (T. Ledwina, T. Inglot, M. Bogdan) p2 Metody analityczne: - uogólniające test Shapiro-Wilka (Srivastava, Royston, Srivastava & Hui), uogólniające testy oparte na kurtozie i skośności (Mardia, Small, Malkovich, Afifi) oparte na funkcji charakterystycznej (Arcones) Metody graficzne: Q-Q P-P
Tematyka badań Propozycja testu do badania wielowymiarowej normalności, opartego na teście Shapiro-Wilka Rozważenie wielowymiarowego liniowego modelu obserwacji Porównanie testu z dwoma innymi testami także opartymi na teście Shapiro-Wilka zaproponowanymi przez Srivastavę i Hui Porównanie poziomu istotności i mocy powyższych testów z testem Henze-Zirklera
Model H0: reszty Poziom istotności Moc MPII(0) – jednostajny na elipsie MPVII(2) – wielowymiarowy t Mieszanina rozkładów normalnych
Test Shapiro-Wilka - niezależne zmienne losowe o tym samym rozkładzie Statystyka Shapiro-Wilka (Shapiro, Wilk, 1965) : Wartości z tablic - wartości uporządkowane
Shapiro i Wilk (1968) zaproponowali przekształcenie g, d, e – stałe z tablic zależne od n. Małe wartości statystyki wskazują brak normalności zmiennych.
Adaptacja statystyki G(W) do zmiennych wielowymiarowych Srivastava i Hui (1987) zaproponowali uogólnienie testu Shapiro – Wilka, wykorzystując składowe główne.
W(i) są asymptotycznie niezależne Niech W(i) są asymptotycznie niezależne Srivastava i Hui (1987) do testowania H0 zaproponowali Duże wartości M1 świadczą o braku normalności.
Srivastava i Hui (1987) zaproponowali także statystykę która przy prawdziwości hipotezy H0 ma przybliżony rozkład: Test odrzuca normalność dla małych M2 .
Nasza propozycja: Gi są asymptotycznie niezależne Lewy „ogon” rozkładu normalnego standardowego wskazuje na brak normalności.
Rozbieżności 20 10 10 10 20 10 10 10 20 20 10 10 10 20 10 10 10 20
ai z Tablicy Shapiro-Wilka 20 10 10 10 20 10 10 10 20 20 10 10 10 20 10 10 10 20 ai według Roystona
MPII(0) – jednostajny na elipsie ai według Roystona 20 10 10 10 20 10 10 10 20 ai z Tablicy Shapiro-Wilka 20 10 10 10 20 10 10 10 20
ai z Tablicy Shapiro-Wilka ai według Roystona 20 10 10 10 20 10 10 10 20 ai z Tablicy Shapiro-Wilka
MPVII – wielowymiarowy t ai według Roystona 20 10 10 10 20 10 10 10 20 ai z Tablicy Shapiro-Wilka 20 10 10 10 20 10 10 10 20
ai z Tablicy Shapiro-Wilka ai według Roystona 20 10 10 10 20 10 10 10 20 ai z Tablicy Shapiro-Wilka
Mieszanina rozkładów normalnych ai według Roystona 20 10 10 10 20 10 10 10 20 ai z Tablicy Shapiro-Wilka 20 10 10 10 20 10 10 10 20
ai z Tablicy Shapiro-Wilka ai według Roystona 20 10 10 10 20 10 10 10 20 ai z Tablicy Shapiro-Wilka 20 10 10 10 20 10 10 10 20
Empiryczny poziom istotności dla różnych liczebności (a=0,05)
Moc dla różnych liczebności (a=0,05) MPII MPVII Mieszanina
Wnioski − Test Henze-Zirklera najlepiej zachowuje poziom istotności W testach bazujących na wartościach obliczanych według Roystona (1992), test Henze-Zirklera okazał się lepszy od trzech pozostałych dla MPII i MPVII Dla MPII test oparty na średniej statystyk G(W) wykazywał się wyższą mocą niż M1 i M2 Małą moc wszystkich testów uzyskano dla mieszaniny rozkładów normalnym dla danych o niskiej korelacji
Literatura Hanusz Z., Tarasińska J. (2009). Simulation study for a test of multivariate normality based on Shapiro-Wilk’s statistic. Colloquium Biometricum 39, 45-51. Johnson M.E.(1987). Multivariate Statistical Simulation, J. Wiley and Sons. Royston P. (1992). Approximation the Shapiro-Wilk W- test for non-normality, Statistics and Computing 2, 117-119. Shapiro S.S., Wilk M.B. (1965). An analysis of variance test for normality (complete samples). Biometrika 52, 591-611. Shapiro S.S., Wilk M.B. (1968). Approximations for the null distribution of the W statistic. Technometrics 10, 861-866. Srivastava M.S., Hui T.K. (1987). On assessing multivariate normality based on Shapiro-Wilk W statistic. Statistics & Probability Letters 5, 15-18.