Statystyczna analiza danych Wykład 5
Współzależność cech
Współzależność cech Jednostki populacji charakteryzowane są zazwyczaj przez więcej niż jedną cechę Cechy wzajemnie się warunkują, stąd potrzeba ich łącznego badania: rodzaj zależności między cechami?, ich siła?, kształt ? i kierunek ? Wyróżniamy dwa rodzaje zależności: Zależność funkcyjna: określonej wartości jednej zmiennej (X) odpowiada dokładnie jedna wartość drugiej zmiennej (Y), co zapisujemy symbolicznie Y = f(X)
Współzależność cech
Współzależność cech Prezentacje próbki cechy dwuwymiarowej: Wykres rozproszenia = wykres korelacyjny = diagram korelacyjny Tablica korelacyjna = tablica kontyngencyjna, w której na skrzyżowaniu kolumn z wierszami wpisywane są liczebności nij jednostek zbadanych, dla których pierwsza cecha wynosi xi a druga yj
Tablica korelacyjna (kontyngencyjna) dwu zmiennych (cech)
Współzależność cech Zamiast liczebności absolutnych nij można w tablicy korelacyjnej podawać częstości względne nij/n Z tablicy korelacyjnej wyznaczamy dwa rodzaje rozkładów: Rozkład brzegowy jednej zmiennej (X lub Y) - prezentuje strukturę wartości jednej zmiennej bez względu na wartości drugiej zmiennej: rozkład brzegowy X: (xi,ni), i =1,2,…,k rozkład brzegowy Y: (yj,nj), j =1,2,…,r
Niezależność cech
Niezależność cech
Współzależność cech Charakterystyki (wskaźniki) sumaryczne rozkładów brzegowych : średnia arytmetyczna i wariancja (odchylenie standardowe) średnie arytmetyczne rozkładów brzegowych:
Współzależność cech
Współzależność cech średnie arytmetyczne rozkładów warunkowych wariancje warunkowych rozkładów cechy X
Współzależność cech
Współzależność cech Wariancje rozkładów brzegowych cechy Y
Współzależność cech
Współzależność cech
Współzależność cech Cecha X jest „stochastycznie” niezależna od cechy Y, jeśli spełnione są jednocześnie poniższe równości:
Współzależność cech Cecha Y jest „stochastycznie” niezależna od cechy X, jeśli spełnione są jednocześnie poniższe równości:
Współzależność cech Niezależność stochastyczna jest szczególnym przypadkiem niezależności korelacyjnej. Zmienna X jest korelacyjnie niezależna od zmiennej Y, jeśli średnie warunkowe zmiennej X są równe, tzn.
Współzależność cech Niezależność stochastyczna jest szczególnym przypadkiem niezależności korelacyjnej. Zmienna Y jest korelacyjnie niezależna od zmiennej X, jeśli średnie warunkowe zmiennej Y są równe, tzn.
Niezależność stochastyczna
Współzależność cech Opisowe miary siły korelacji dwóch zmiennych Natężenie (siłę) współzależności dwóch cech można wyrazić za pomocą wielu wskaźników (mierników, parametrów, charakterystyk) Wybór miernika zależy od rodzaju cech (mierzalne, niemierzalne, mieszane), kształtu zależności (regresja prostoliniowa, krzywoliniowa), liczby obserwacji (tablica korelacyjna, czy szereg korelacyjny)
Współzależność cech Podstawowe miary siły korelacji dwóch zmiennych Współczynnik zbieżności Czuprowa Stosunki (wskaźniki) korelacyjne Pearsona Współczynnik korelacji liniowej Pearsona Współczynnik korelacji rang (kolejnościowej) Spearmana
Współzależność cech Podstawowe miary siły korelacji dwóch zmiennych Współczynnik zbieżności Czuprowa – miara zależności stochastycznej
Współzależność cech Własności współczynnika zbieżności Czuprowa Im współczynnik T bliższy 0 tym zależność między zmiennymi słabsza
Współzależność cech Stosunki (wskaźniki) korelacyjne Pearsona Konstrukcja oparta na własności wariancji: Wariancje międzygrupowe: Średnie wariancji wewnątrzgrupowych:
Współzależność cech Stosunek (wskaźnik) korelacyjny Pearsona zmiennej Y względem zmiennej X zmiennej X względem zmiennej Y
Własności stosunków korelacyjnych e Współzależność cech Własności stosunków korelacyjnych e Miary niemianowane o wartościach w przedziale [0,1] e = 0 dla cech nieskorelowanych e =1 dla cech o zależności funkcyjnej Im wartość e bliższa jedności tym zależność korelacyjna silniejsza Stosunki korelacyjne nie są miarami symetrycznymi Nie wskazują kierunku korelacji (zawsze nieujemne)
Własności stosunków korelacyjnych e Współzależność cech Własności stosunków korelacyjnych e Współczynnik korelacji liniowej Pearsona jest z reguły mniejszy od stosunków korelacyjnych: Stopień krzywoliniowości regresji Y względem X oraz X względem Y wskazują:
Współzależność cech
Współzależność cech
Współczynnik korelacji rang Spearmana Współzależność cech Współczynnik korelacji rang Spearmana Opisuje siłę korelacji dwóch cech jakościowych, które można uporządkować gdzie różnica między rangami odpowiadających sobie wartości cechy X i Y dla i-tej jednostki zbadanej Interpretacja taka jak współczynnika korelacji
Współzależność cech
Współzależność cech