Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
1
Analiza współzależności zjawisk
2
Analiza współzależności
Punktem wyjścia do badania współzależności cech są dane, w których dla każdej jednostki statystycznej określono wartości dwóch cech: X i Y. Mamy więc zbiór n jednostek i przyporządkowane im pary cech (xi, yi), i = 1, 2, ... n.
3
Szereg szczegółowy dla dwóch obserwowanych cech
4
Tablica korelacyjna
5
Przykład
6
Zależność – ilość osób y od ilości metrów x
7
Dane pogrupowane w tablicy korelacyjnej
8
Współzależność występująca między cechami może być dwojakiego rodzaju:
funkcyjna (dokładna) stochastyczna (probabilistyczna). Szczególnym przypadkiem zależności stochastycznej jest zależność korelacyjna (statystyczna).
9
Współzależność funkcyjna
Polega na tym, że zmiana wartości jednej zmiennej powoduje ściśle określoną zmianę wartości drugiej zmiennej. Określonej wartości jednej zmiennej X odpowiada jedna i tylko jedna i tylko jedna wartość drugiej zmiennej Y.
10
Tablica korelacyjna W tablicy korelacyjnej zawarte są dwa rodzaje rozkładów: brzegowe i warunkowe. Rozkład brzegowy prezentuje strukturę wartości jednej zmiennej (X lub Y) bez względu na kształtowanie się wartości drugiej zmiennej. Rozkład brzegowy zmiennej X tworzy pierwsza i ostatnia kolumna tablicy, natomiast rozkład brzegowy zmiennej Y - pierwszy i ostatni wiersz.
11
Rozkład brzegowy zmiennej X - powierzchnia użytkowa mieszkań (m2)
12
Rozkład brzegowy zmiennej Y - liczba mieszkańców
13
Cechy mierzalne 1. Kowariancja
dla szeregu szczegółowego
14
dla szeregu w tablicy korelacyjnej
15
Kowariancja Jest to: miara symetryczna;
przyjmuje wartości z przedziału <‑SxSy, SxSy>; informuje o kierunku korelacji między zmiennymi.
16
Współczynnik korelacji liniowej Pearsona:
Jest to: miara symetryczna; przyjmuje wartości z przedziału <‑1,1>; informuje o sile oraz kierunku korelacji liniowej między zmiennymi.
17
Testowanie współczynnika korelacji
18
Kierunek zależności rxy= 0 świadczy o braku korelacji liniowej między badanymi cechami (możliwe, że istnieje między nimi korelacja krzywoliniowa!), rxy> 0 informuje nas, że mamy do czynienia z korelacją dodatnią (wraz ze wzrostem wartości jednej cechy wzrasta średnia warunkowa drugiej), rxy< 0 korelacja jest ujemna (wzrostowi wartości jednej cechy towarzyszy spadek średniej warunkowej drugiej). przy rxy= 1 lub -1 mamy liniową zależność funkcyjną.
19
W analizach statystycznych zwykle przyjmuje się, że jeżeli rxy wynosi:
mniej niż 0,2 - praktycznie brak związku liniowego między badanymi cechami, może występować korelacja krzywoliniowa; <0,2-0,4) - zależność liniowa wyraźna, lecz niska; <0,4-0,7) - zależność umiarkowana; <0,7-0,9) - zależność znacząca; <0,9-1> zależność bardzo silna.
20
3. Współczynnik korelacji kolejnościowej (rang) Spearmana Rxy
miara korelacji, wygodna i użyteczna dla niezbyt długich szeregów szczegółowych z dwoma cechami mierzalnymi (lub przynajmniej posiadającymi pewien naturalny porządek pozwalający na ustawienie wartości rosnąco lub malejąco) . Wartość Rxy należy do przedziału <-1,1> i mówi o sile oraz kierunku korelacji.
21
Współczynnik rang Spearmana Rxy
gdzie di są różnicami między kolejnymi numerami (rangami) nadawanymi w kolejności niemalejącej (lub nierosnącej) osobno dla każdej cechy od 1 do n. Jeżeli kilka elementów w szeregu ma taką samą wartość jednej cechy, to nadaje im się rangi będące średnią arytmetyczną przypadających na te elementy rang.
22
Test niezależności chi-kwadrat
Stawiamy hipotezę zerową o braku zależności między cechami, hipotezą alternatywną jest istnienie zależności miedzy cechami. Cechy mogą być zarówno mierzalne lub niemierzalne. Tworzymy tablicę korelacyjną. Na podstawie tej tablicy obliczamy wartość statystyki:
23
Statystyka ta ma rozkład chi-kwadrat o (k-1)(l-1) stopniach swobody
Statystyka ta ma rozkład chi-kwadrat o (k-1)(l-1) stopniach swobody. Dla ustalonego alfa tworzymy obszar krytyczny
24
Współczynnik zbieżności V Cramera
26
Przykład:W 600-osobowej losowo dobranej grupie ludzi przeprowadzono badanie ankietowe mające na celu uzyskanie odpowiedzi na pytanie: „Czy istnieje zależność między wykształceniem telewidzów a rodzajem programu, który najchętniej oglądają?” Otrzymane dane przedstawiono w empirycznej tablicy korelacyjnej:
28
Wartość statystyki χ2=12,59 Hipotezę o braku zależności odrzucamy na rzecz hipotezy alternatywnej
Współczynnik zbieżności Cramera:
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.