Analiza współzależności dwóch zjawisk dr inż. Iwona Staniec Zakład Metod Ilościowych w Zarządzaniu Politechniki Łódzkiej
Analiza współzależności Punktem wyjściowym do badania współzależności cech są dane, w których dla każdej jednostki statystycznej określono wartości dwóch cech: X i Y. Mamy więc zbiór n jednostek i przyporządkowane im pary cech (xi, yi), i = 1, 2, ... n.
Szereg szczegółowy dla dwóch obserwowanych cech
Tablica korelacyjna
Przykład
Dane pogrupowane w tabeli korelacyjnej
Współzależność występująca między cechami może być dwojakiego rodzaju: funkcyjna (dokładna) stochastyczna (probabilistyczna). Szczególnym przypadkiem zależności stochastycznej jest zależność korelacyjna (statystyczna).
Przy badaniu współzależności cech przyjmuje się zwykle jedną cechę za niezależną (objaśniającą), której zmienność jest uwarunkowana czynnikami zewnętrznymi, a drugą za zmienną zależną (objaśnianą), tzn. jej wahania próbuje się wyjaśnić (przynajmniej częściowo) zmiennością cechy niezależnej. Zależność korelacyjna może być obustronna lub jednostronna.
Dwie cechy mierzalne 1. Kowariancja dla szeregu szczegółowego dla szeregu w tablicy korelacyjnej
Kowariancja Jest to: miara symetryczna; przyjmuje wartości z przedziału <‑SxSy, SxSy>; informuje o kierunku korelacji między zmiennymi.
Współczynnik korelacji liniowej Pearsona: Jest to: miara symetryczna; przyjmuje wartości z przedziału <‑1,1>; informuje o sile oraz kierunku korelacji liniowej między zmiennymi. Dwie cechy mierzalne
Kierunek zależności rxy= 0 świadczy o braku korelacji liniowej między badanymi cechami (możliwe, że istnieje między nimi korelacja krzywoliniowa!), rxy> 0 informuje nas, że mamy do czynienia z korelacją dodatnią (wraz ze wzrostem wartości jednej cechy wzrasta średnia warunkowa drugiej), rxy< 0 korelacja jest ujemna (wzrostowi wartości jednej cechy towarzyszy spadek średniej warunkowej drugiej). przy rxy= 1 lub -1 mamy liniową zależność funkcyjną.
W analizach statystycznych zwykle przyjmuje się, że jeżeli rxy wynosi: mniej niż 0,2 - praktycznie brak związku liniowego między badanymi cechami, może występować korelacja krzywoliniowa; <0,2-0,4) - zależność liniowa wyraźna, lecz niska; <0,4-0,7) - zależność umiarkowana; <0,7-0,9) - zależność znacząca; <0,9-1> zależność bardzo silna.
Współczynnik determinacji liniowej R2=rxy2 podaje, jaka część zmienności cechy zależnej jest wyjaśniona zmiennością cechy niezależnej. Dwie cechy mierzalne
3. Współczynnik korelacji kolejnościowej (rang) Spearmana Rxy miara korelacji, wygodna i użyteczna dla niezbyt długich szeregów szczegółowych z dwoma cechami mierzalnymi (lub przynajmniej posiadającymi pewien naturalny porządek pozwalający na ustawienie wartości rosnąco lub malejąco) . Wartość Rxy należy do przedziału <-1,1> i mówi o sile oraz kierunku korelacji. Dwie cechy mierzalne
Współczynnik rang Spearmana Rxy gdzie di są różnicami między kolejnymi numerami (rangami) nadawanymi w kolejności niemalejącej (lub nierosnącej) osobno dla każdej cechy od 1 do n. Jeżeli kilka elementów w szeregu ma taką samą wartość jednej cechy, to nadaje im się rangi będące średnią arytmetyczną przypadających na te elementy rang.
Dwie cechy niemierzalne, dwie cechy mierzalne, cecha niemierzalna i cecha mierzalna Współczynnik zbieżności Czuprowa
Współczynnik zbieżności Czuprowa Wymaga ona danych pogrupowanych w tablicy korelacyjnej