Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

KORELACJA STATYSTYCZNA STATISTICAL CORRELATION

Podobne prezentacje


Prezentacja na temat: "KORELACJA STATYSTYCZNA STATISTICAL CORRELATION"— Zapis prezentacji:

1 KORELACJA STATYSTYCZNA STATISTICAL CORRELATION
10 KORELACJA STATYSTYCZNA STATISTICAL CORRELATION Rok akademicki 2011/2012 Prof. Dr Franciszek Kubiczek

2 Z DIAGNOZY SPOŁECZNEJ 2007 Dochody gospodarstw domowych są tym mniejsze im mniejsza jest miejscowość Im niższy poziom wykształcenia głowy gospodarstwa domowego tym większe ryzyko ubóstwa Największą aktywnością na rynku pracy cechują się osoby pozostające w pełnych rodzinach z dziećmi Udział osób znających języki obce zwiększa się w miarę wzrostu wykształcenia i dochodu na osobę; spada wraz ze zmniejszeniem się klasy miejscowości, Z ochrony ubezpieczeniowej częściej korzystają gospodarstwa domowe, których „głowami” są mężczyźni, zwłaszcza wykształceni Długotrwałe bezrobocie silniej dotyka kobiety niż mężczyzn

3 Z DIAGNOZY SPOŁECZNEJ 2007 Doświadczenie zetknięcia się z bezrobociem i łączny czas pozostawania bez pracy w ciągu ostatnich 5 lat są wyraźnie zależne od poziomu wykształcenia oraz motywacji do znalezienia pracy Osoby z wyższym i policealnym wykształceniem deklarują dochody ponad 2 razy wyższe niż osoby z wykształceniem podstawowym (w 2003 r. 2,7 razy) Posiadaniu (zakupowi) komputera i dostępu do internetu bardzo mocno sprzyja obecność dzieci w gospodarstwie domowym Deklarowanie umiejętności korzystania z komputera bardzo silnie zależy od wieku. Są też wyższe u mężczyzn i osób lepiej wykształconych. Wzrost dochodów osobistych miedzy 2005 i 2007 rokiem był istotnie wyższy wśród użytkowników komputerów niż wśród osób, które z komputerów nie korzystały.

4 Z DIAGNOZY SPOŁECZNEJ 2007 Najważniejszym czynnikiem wyjaśniającym ogólny dobrostan psychiczny (i jego poprawę) Polaków okazuje się wiek życia (im ktoś starszy tym w gorszej jest kondycji psychicznej). Kolejne czynniki: małżeństwo, dochód, liczba przyjaciół, praktyki religijne. Migracje zarobkowe: Niemcy wybierane są przede wszystkim przez osoby z wykształceniem zasadniczym lub niższym, kraje anglosaskie – osoby z wykształceniem wyższym. Wyjazd do pracy zagranicę dwukrotnie częściej deklarują bezrobotni niż zatrudnieni. Wśród 10 największych miast najwyższa jakość życia jest w Gdańsku i Warszawie, najniższa w Kielcach i Lublinie.

5 PRZYKŁADY PKB na 1 mieszkańca a długość życia
Hipoteza: im wyższy PKB na mieszkańca (zmienna x - przyczyna) tym dłuższe trwanie życia (zmienna y - skutek) Ceny a popyt: Hipoteza: cena wzrastają (x) – popyt maleje (y) Dochody a popyt: Hipoteza: dochody rosną (x) – popyt rośnie (y)

6 ISTOTA ANALIZY KORELACJI
Analiza korelacji (the analysis of the correlation) ma sens głównie wtedy, gdy między zmiennymi istnieje (bądź przypuszczamy, że istnieje) związek przyczynowo-skutkowy; Analiza jakościowa (the qualitative analysis): stwierdzenie – na podstawie analizy merytorycznej logicznego związku przyczynowo-skutkowego; korelacja rzeczywista i pozorna (iluzoryczna – ilusoric correlation); analiza jakościowa powinna wyprzedzać analizę ilościową. Analiza ilościowa (the quantitative analysis) określenie siły i kierunku związku; współczynniki korelacji Związki dwustronne (two-sided relationships) - oddziaływanie wzajemne i związki jednostronne (one-sided relationships)- przyczyna-skutek.

7 KORELACJA (ZWIĄZEK STOCHASTYCZNY)
Mimo niewątpliwego wpływu jednej zmiennej x (niezależnej) na drugą zmienną y (zależną), jednej i tej samej wartości x, mogą odpowiadać różne (wiele) wartości zmiennej y Na zmienną y oddziałuje nie tylko zmienna x, ale także inne zmienne (czynniki), często o różnokierunkowych wpływach Korelacja między dwiema zmiennymi x i y jest miarą siły (stopnia) związku miedzy tymi zmiennymi. Siłę tego związku mierzy współczynnik korelacji „STOCHASTIC” - przewidywanie możliwości

8 ANALIZA ZWIĄZKÓW KORELACYJNYCH
Rodzaj cech: ilościowe jakościowe Rodzaj związku: liniowy (linear) nieliniowy (non-linear) – krzywoliniowy (curvilinear) Analizę zwykle rozpoczyna się od opracowania tablicy korelacyjnej (correlation table) oraz sporządzenia korelacyjnego wykresu (correlation diagram) rozrzutu.

9 KORELACJA LINIOWA–LINEAR CORRELATION
Podstawowe pojęcia: Y - zmienna zależna (dependent variable) - objaśniana X – zmienna niezależna (determining variable) - objaśniająca ZALEŻNOŚĆ FUNKCYJNA (functional dependence) y = f(x) – rzadko występuje w sferze społecznej i gospodarczej i częściowo w naukach przyrodniczych; jej istota polega na tym, że zmiana wartości zmiennej niezależnej (x) powoduje ściśle określoną (jednoznaczną) zmianę wartości zmiennej zależnej (y) ZALEŻNOŚĆ KORELACYJNA (correlation dependence) - stochastyczna, statystyczna y = f(x,e), gdzie e = czynnik losowy - często występuje w sferze społeczno-gospodarczej

10 RODZAJE KORELACJI Korelacja całkowita (total correlation) - brutto, tj. współzależność tylko między dwiema zmiennymi, bez wnikania w ich powiązania z innymi cechami Korelacja cząstkowa (partial correlation) - częściowa, tj. współzależność między dwiema zmiennymi z wyłączeniem wpływu cech pozostałych poprzez ustalenie tychże jako stałych Korelacja wieloraka (multiple correlation) - wielokrotna, tj współzależność wybranej cechy ze wszystkimi pozostałymi łącznie. Nowy

11 WYKRESY KORELACYJNE KORELACJA LINIOWA DODATNIA
KORELACJA LINIOWA UJEMNA KORELACJA KRZYWOLINIOWA BRAK KORELACJI

12 MIERNIKI SIŁY KORELACJI DWÓCH ZMIENNYCH
Współczynnik korelacji liniowej Pearsona (linear coefficient of correlation) Stosunek korelacji Pearsona (the relation of the correlation) Współczynnik zbieżności Czuprowa (the coefficient of the convergence) Współczynnik korelacji rang Spearmana (the coefficient of rank correlation) Wybór mierników zależy od: a) rodzaju cech między którymi badana jest zależność (mierzalne, niemierzalne lub mieszane) b) liczby obserwacji (tablice korelacji lub szeregi korelacji) c) kształt zależności prostoliniowy (liniowy) lub krzywoliniowy (nieliniowy) W praktyce najczęściej stosuje się współczynnik korelacji liniowej Pearsona, jako miernik siły związku liniowego między dwiema cechami mierzalnymi. Związkiem prostoliniowym (liniowym) nazywamy taką zależność, w której jednostkowemu przyrostowi jednej zmiennej (przyczyna) towarzyszy, średnio jednakowy przyrost drugiej zmiennej (skutek).

13 WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA
The Pearson linear coefficient of correlation Wzór: Licznik: kowariancja, tj. średnia arytmetyczna iloczynu odchyleń poszczególnych zmiennych od ich średnich arytmetycznych; przyjmuje wartość dodatnią, gdy obydwie zmienne poruszają się w tych samych kierunkach; ujemną, gdy w przeciwnych. Przyjmuje wartość 0, gdy zmienne nie są liniowo zależne. Mianownik: iloczyn odchyleń standardowych obu zmiennych;

14 WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA
Współczynnik przyjmuje wartości od –1 do +1; im większa jego wartość bezwzględna tym większa siła korelacji Wartość współczynnika = 0 nie zawsze oznacza brak zależności a jedynie brak zależności liniowej Wartość współczynnika = 1 oznacza ścisły dodatni związek, gdy -1, ujemny związek Współczynnik jest symetryczny, tzn. wskazuje na korelację wzajemną, x względem y i y względem x

15 INTERPRETACJA WSPÓŁCZYNNIKA KORELACJI
r = 0 brak korelacji liniowej między zmiennymi r = 1 pełna korelacja, związek funkcyjny (-1, +1) r < 0 ujemna korelacja, tzn. że wzrost wartości jednej zmiennej powoduje spadek wartości drugiej r > 0 dodatnia korelacja, tzn. że wzrost wartości jednej zmiennej powoduje także wzrost wartości drugiej (i odwrotnie), r < 0,2 bardzo słaba korelacja, zwykle jej brak 0,2 < r < 0,4 słaba korelacja, lecz wyraźna 0,4 < r < 0,7 umiarkowana, ale istotna 0,7 < r < 0,9 silna korelacja r > 0,9 bardzo silna korelacja liniowa

16 UWAGA Współczynnik korelacji jest określonym wskaźnikiem, a nie pomiarem na skali liniowej o jednakowych jednostkach Dlatego nie można mówić, że np. zależność r = 0,9 jest dwukrotnie silniejsza niż gdy r = 0,45 Związek korelacji nie jest jednoznaczny z występowaniem związku przyczynowo-skutkowego i badanie związku korelacji wymaga dobrego rozeznania merytorycznej strony badanych zjawisk (np. rynkowych)

17 UWAGI Nawet silna zależność statystyczna pomiędzy zjawiskami stwierdzona współczynnikiem korelacji, nie musi świadczyć o występowaniu między nimi zależności przyczynowo-skutkowej (the dependence causal-consecutive); Miedzy zjawiskami mogą bowiem występować różnego rodzaju relacje: Zmienność jednej zmiennej może być spowodowana bezpośrednio przez jedną lub kilka zmiennych Zmienne mogą być powiązane obustronnie, co oznacza, że każda ze zmiennych oddziałuje na każdą Na zmienne może oddziaływać wspólna przyczyna zewnętrzna Zmienne mogą być powiązane ze sobą za pośrednictwem jednej lub kilku innych zmiennych pośrednich (tworząc łańcuch przyczynowy); Współzmienność może być także skutkiem przypadku Związki przyczynowo-skutkowe można stwierdzić tylko na podstawie merytorycznej znajomości badanej problematyki Nowy slajd 18.02

18 WSPÓŁCZYNNIK DETERMINACJI (OKREŚLONOŚCI) (DETERMINATION COEFFICIENT)
Współczynnik determinacji = kwadrat współczynnika korelacji; informuje on jaka część zmienności zmiennej zależnej (y) jest wyjaśniona zmiennością zmiennej niezależnej (x); jest opisową miarą siły związku między zmiennymi. Jeśli zatem współczynnik korelacji wynosi np. 0,7 to 0,72=0,49 i to oznacza, że w 49% zmianę wartości zmiennej zależnej wyjaśnia zmiana zmiennej niezależnej Dopełnienie współczynnika determinacji do jedności – to współczynnik indeterminacji, określa tę część zmienności zmiennej zależnej (y), która nie została wyjaśniona zmiennością zmiennej niezależnej (x), a więc wynika z innych przyczyn niż określa to zmienna x; Jeśli zatem (przykład jak wyżej) współczynnik determinacji wynosi 0,49, to współczynnik indeterminacji wynosi 0,51 i oznacza, że w 51% odgrywają inne czynniki niż przyjęta zmienna niezależna

19 TABLICA (MACIERZ) KORELACYJNA
DWIE ZMIENNE ROZKŁAD BRZEGOWY ZMIENNEJ X Xi – zmienna niezależna yj - zmienna zależna n j – liczba jednostek mających wariant Xi ni - liczba jednostek mających wariant yj yj xi y1 y2 ..... yj yr Σ x1 n11 n12 n1j n1r n1 x2 n21 n22 n2j n2r n2 xi ni1 ni2 nij nir ni xk nk1 nk2 nkj nkr nk n 1 n 2 n j n r n j ROZKŁAD BRZEGOWY ZMIENNEJ y i UWAGA: zamiast liczebności absolutnej n ij - można stosować częstości: n ij : n

20 PRZYKŁAD – DIAGRAM KORELACJI
ILOŚCI 1400 1200 1000 800 600 400 200 200 400 600 800 1 000 1 200 1 400 1 600 CENY Ilości sprzedane

21 PRZYKŁAD – TABLICA KORELACYJNA
KORELACJA RYNEK CENY w zł/szt. xi ILOŚCI SPRZEDANE w szt. yi 1 2 3 1995 1 050 1 200 1996 1 250 1999 1 100 1993 1 150 2000 1998 2001 950 1992 1 000 1994 1 300 900 1997 1 350 800 RAZEM 11 800 10 700 Uporządkowana wg rosnącej zmiennej niezależnej xi, tj. wg rosnącej ceny

22 OBLICZENIA WSPÓŁCZYNNIKÓW
Współczynnik korelacji r = Współczynnik determinacji r 2= (-0,93)2 = 0,87 Wnioski: - korelacja jest silna gdyż współczynnik przekracza 0,9; - jest ujemna gdyż wzrost ceny powoduje spadek popytu - poziom cen w 87% objaśnia zmienność popytu, w 13% zmiana popytu wynika z innych przyczyn KOWARIANCJA ODCHYLENIE STANDARDOWE

23 PRZYKŁAD – TABLICA KORELACYJNA
NAZWA KRAJU NR OBSZARU i PKB Xi ŻYCIE yi SIERRA LEONE 1. 414 36 ETIOPIA 5. 599 42 NIGERIA 11. 744 52 KENIA 18. 975 50 SENEGAL 25. 1 341 51 INDONEZJA 49. 2 439 64 DOMINIKANA 71. 4 653 69 BIAŁORUŚ 89. 6 518 63 CHORWACJA 90. 6 915 MEKSYK 91. 7 719 POLSKA 93. 7 894 HISZPANIA 107. 16 730 75 WŁOCHY 109. 20 751 SZWECJA 110. 20 824 77 W. BRYTANIA 111. 20 883 FRANCJA 114. 21 897 NIEMCY 115. 22 404 74 KANADA 118. 23 725 76 AUSTRIA 119. 23 808 JAPONIA 120. 24 041 BELGIA 121. 24 200 NORWEGIA 123. 26 522 SZWAJCARIA 125. 27 486 USA 126. 30 600 Uporządkowanie wg rosnącej zmiennej niezależnej xi (PKB na 1 mieszkańca) $ lat

24 PRZYKŁAD – DIAGRAM KORELACJI
Przeciętne dalsze trwanie życia (w latach ) w relacji do PKB na 1 mieszkańca (w USD) LATA 90 80 70 60 50 40 30 20 10 PKB 2 000 4 000 6 000 8 000 10 000 12 000 14 000 16 000 18 000 20 000 22 000 24 000 26 000 28 000 30 000 32 000 34 000

25 r = OBLICZENIA WSPÓŁCZYNNIKÓW Współczynnik korelacji
Współczynnik determinacji r2 = (0,68)2 = 0,47 Wnioski: - korelacja jest umiarkowana , ale istotna gdyż znajduje się w przedziale od 0,4 do 0,7 - jest dodatnia, tzn. wzrost wartości cechy x (PKB na 1 mieszkańca) „powoduje” wzrost cechy y (przeciętne trwanie życia) - poziom PKB na 1 mieszk. w 47% wyjaśnia wzrost przeciętnego trwania życia, a 53% tego wzrostu zależy od pozostałych czynników KOWARIANCJA ODCHYLENIE STANDARDOWE

26 ŚWIAT: Korelacja miedzy długością życia i PKB na mieszkańca 2005

27 ŚWIAT: Korelacja miedzy długością życia i poziomem skolaryzacji 2005

28 WSPÓŁCZYNNIKI KORELACJI W DIAGNOZIE SPOŁECZNEJ 2007 W PRZEKROJU MIĘDZYNARODOWYM
Korelacja między zaufaniem interpersonalnym a zadowoleniem z życia: 0,76 Korelacja między przeciętną organizacji, do których należą a zadowoleniem z życia: 0,74 Korelacja między zadowoleniem z demokracji a poczuciem szczęścia: 0,62 Korelacja między zaufaniem interpersonalnym a PKB (wg PPS) na mieszkańca: 0,69 Korelacja między przeciętną liczbą organizacji, do których należą a PKB (wg PPS) na mieszkańca: 0,67 Korelacja między zadowoleniem z demokracji a PKB na mieszkańca: 0,53

29 WSPÓŁCZYNNIKI KORELACJI ZWIĄZANE Z KAPITAŁEM SPOŁECZNYM
Wg M. Herbsta: „Kapitał ludzki i kapitał społeczny a rozwój regionalny” Współczynnik korelacji liniowej między kapitałem ludzkim a PKB na mieszkańca wynosi 0,8. Poziom kapitału ludzkiego mierzony jest tu odsetkiem ludności z wykształceniem wyższym lub średnim oraz przeciętną długością edukacji szkolnej.

30 ŚWIAT: Korelacja miedzy PKB na mieszkańca i poziomem skolaryzacji

31 ŚWIAT: Korelacja między dostępem do edukacji a PKB na mieszkańca
PKB na mieszkańca (PPP 2000) % dzieci uczęszczających do szkół ponadpodstawowych (2000)

32 ŚWIAT: Korelacja między dostępem do edukacji a PKB na mieszkańca
PKB na mieszkańca (PPP 2000) Przeciętna liczba lat spędzonych w szkole (2000)

33 ŚWIAT: Korelacja między dostępem do edukacji a PKB na mieszkańca
Wzrost wynagrodzenia w związku z przedłużeniem edukacji o rok Przeciętna liczba lat spędzonych w szkole (2000)

34 POLSKA: Korelacja między odsetkiem ludności z wyższym lub średnim wykształceniem a PKB na mieszkańca w podregionach PKB na mieszkańca w 2003 r. % ludności z wykształceniem wyższym lub średnim w 2002 r.

35 POLSKA: Korelacja między odsetkiem ludności z wyższym lub średnim wykształceniem a PKB na mieszkańca w podregionach Przyrost PKB na mieszkańca w % w latach % ludności z wyższym wykształceniem w 1988 r.

36 POLSKA: Korelacja między przeciętną długością edukacji w latach a PKB na mieszkańca w podregionach
Przyrost PKB na mieszkańca w % w latach Przeciętna długość edukacji (w latach) stan na 1988 r.

37 POLSKA: Korelacja między przeciętną długością edukacji w latach a PKB na mieszkańca w podregionach
PKB na mieszkańca w 2003 r. Przeciętna długość edukacji (w latach) stan na2002 r.

38 Wykres korelacyjny: Przedsiębiorczość i PKN na mieszkańca
low income<765$; upper middle $; lower middle $; high income>9.386 # of SMEs vs. Income High-income Lower-middle Upper-middle 10 20 30 40 50 5000 10000 15000 20000 25000 30000 Low income # of SMEs per 1,000 people GNI per capita

39 ŚWIAT: Wykres korelacyjny
Time to start a business vs. # of SMEs 10 20 30 40 50 60 70 80 90 100 120 140 160 Time to start a business (days) # of SMEs per people

40 ŚWIAT: Wykres korelacyjny
Cost to start a business vs. # of SMEs 90 80 70 60 # of SMEs per people 50 40 30 20 10 10 20 30 40 50 60 70 Cost to start a business (% of income per capita)

41 ŚWIAT: Wykres korelacyjny
Private Credit vs. # of SMEs 10 20 30 40 50 60 70 80 90 100 150 200 Private credit as % of GDP # of SMEs per people

42 ŚWIAT: Wykres korelacyjny
Investment Climate vs. # of SMEs 10 20 30 40 50 60 70 80 15 25 35 45 55 65 75 85 Investment Climate Index # of SMEs per people

43 KORELACJA CZĄSTKOWA – (PARTIAL CORRELATION)
Jeśli na pewną zmienną zależną (y) oddziałuje więcej niż jedna zmienna niezależna (x), a interesuje nas siła związku korelacyjnego tylko między zmienną zależną i jedną zmienną niezależną, przy wyłączeniu wpływu innych zmiennych niezależnych – wtedy mamy do czynienia z korelacją cząstkową Wzór: KORELACJA MIĘDZY CECHAMI 1 i 2 PRZY WYELIMINOWANIU 3

44 KORELACJA CZĄSTKOWA – (PARTIAL CORRELATION)
Miara ścisłości: współczynnik korelacji cząstkowej, informuje zarówno o kierunku, jak i sile zależności między badanymi zmiennymi Współczynnik korelacji cząstkowej może być większy lub mniejszy od współczynnika korelacji prostej dla pary badanych cech Załóżmy, że mamy 3 zmienne, których wzajemny związek chcemy zbadać. Naszym zadaniem jest znalezienie współczynnika korelacji mierzącego zależność między 2 cechami, przy wyłączeniu oddziaływania 3-ciej

45 KORELACJA CZĄSTKOWA – PRZYKŁAD
Zmienne: Liczba sklepów Łączna powierzchnia sklepów Liczba gospodarstw domowych Współczynnik korelacji między tymi zmiennymi wynosi: r12 = -0, r23 = 0, r13 = 0,914 Obliczamy współczynniki korelacji cząstkowej: r12.3 = - 0,054 korelacja między zmiennymi 1 i 2 przy wyłączeniu zmiennej 3 r23.1 = 0,057 korelacja między zmiennymi 2 i 3 przy wyłączeniu zmiennej 1 r13.2 = 0,915 korelacja między zmiennymi 1 i 3 przy wyłączeniu zmiennej 2 Współczynniki korelacji cząstkowej informują zarówno o kierunku, jak i o sile zależności między badanymi zmiennymi.

46 Jeżeli np r13 = 0, i r13.2 = 0,915 Korelacja między liczbą sklepów Korelacja między liczbą sklepów a liczbą a liczbą gospodarstw domowych gospodarstw domowych po wyeliminowaniu wpływu łącznej powierzchni sklepów Różnią się nieznacznie, tzn. że czynnik wyeliminowany (łączna powierzchnia sklepów) nie odgrywał istotnej roli w opisie zmienności liczby sklepów.

47 KORELACJA WIELORAKA – MULTIPLE CORRELATION
Jeżeli chcemy zbadać ścisłość związku korelacyjnego pomiędzy wartością jednej cechy (zmienną zależną) a kompleksem innych cech (zmiennych niezależnych), właściwą miarą jest współczynnik korelacji wielorakiej. W praktyce często się zdarza, że zmienna zależna, zależy od więcej niż od jednej zmiennej niezależnej. Wzór: gdzie: r ij - współczynnik korelacji między zmienną i oraz j; wzór dla trzech zmiennych Kwadrat współczynnika korelacji wielorakiej, nazywamy współczynnikiem determinacji

48 KORELACJA WIELORAKA Jeżeli przynajmniej jeden ze współczynników korelacji cząstkowej ma wartość 1, to współczynnik korelacji wielorakiej także wynosi 1, Jeżeli wszystkie współczynniki korelacji cząstkowej są równe 0, to współczynnik korelacji wielorakiej także wynosi 0, Im współczynnik korelacji wielorakiej jest bliższy 1, tym związek między daną zmienną zależną a rozpatrywanymi zmiennymi niezależnymi jest silniejszy i odwrotnie im bliższy zeru tym słabszy Współczynnik korelacji wielorakiej mierzy tylko siłę, a nie wskazuje kierunku korelacji Problem: jak wiele zmiennych niezależnych włączać do obliczeń (badań) korelacji wielorakiej? Jak najwięcej! Oczywiście mających jakiś związek ze zmienną zależną.

49 KORELACJA WIELORAKA - PRZYKŁAD
Dla obliczenia współczynnika korelacji wielorakiej nie są potrzebne współczynniki korelacji cząstkowej; wystarczą zwykłe współczynniki korelacji między poszczególnymi parami zmiennych W przykładzie ze str. 23: liczba sklepów, gospodarstw domowych i łączna powierzchnia tych sklepów: R 1.23 = 0,9142 tzn. łączna powierzchnia sklepów (3) oraz liczba gospodarstw domowych (2) ściśle wiąże się z liczbą sklepów Współczynnik determinacji: R 1.23 = 0,91422 = 0, ,58% wskazuje, że w ok. 84% zmiany liczby sklepów mogą być wyjaśniane zmniejszającą się łączną powierzchnią sklepów oraz zróżnicowaniem liczby gospodarstw domowych 2

50 WSPÓŁCZYNNIK KORELACJI RANG Spearmana (RANK CORRELATION)
Rangi charakteryzują jednostki pod kątem ich relatywnych pozycji w zbiorze analizowanych obiektów. Stosowane są do porządkowania obiektów wielocechowych. Przy używaniu metody rang można w zależności od celu badania, porządkować obiekty tylko na podstawie jednej cechy lub dowolnego podzbioru cech Jeśli porządkuje się obiekty ze względu na kilka cech jednocześnie, należy ustalić rangi dla każdej cechy, a następnie obliczyć średnią rang obiektów

51 WSPÓŁCZYNNIK KORELACJI RANG Spearmana
Rangowanie = uporządkowanie zbioru, ustalenie kolejności Uporządkowanym wartościom zmiennych nadaje się następnie numery kolejnych liczb naturalnych Przyjmuje wartości i ich interpretacje analogiczne jak w przypadku współczynnika korelacji Pearsona (w przedziale od -1 do 1)

52 WSPÓŁCZYNNIK KORELACJI RANG (RANK CORRELATION) Spearmana
Zwany też współczynnikiem korelacji kolejnościowej służy do opisu siły dwuwymiarowego (tzn. dwóch cech) , liniowego związku korelacyjnego w przypadku, gdy: a. cechy są mierzalne i zbiorowość mała b. cechy mają charakter jakościowy i istnieje możliwość ich uporządkowania

53 WSPÓŁCZYNNIK KORELACJI RANG (RANK CORRELATION) Spearmana
Służy do opisu siły korelacji-współzależności dwóch cech zwłaszcza wtedy gdy mają one charakter jakościowy i istnieje możliwość ich uporządkowania w określonej kolejności, służy także do zbadania siły korelacji gdy cechy mają charakter ilościowy i w przypadku niewielkiej liczby obserwacji Wzór: gdzie: di = (yi – xi) i - numer obserwacji di - różnice między rangami (kolejnymi numerami obserwacji) odpowiadających sobie wartości zmiennej x uporządkowanych wg kolejności niemalejącej wartości zmiennej y n – liczebność zbiorowości

54 TESTOWANIE ISTOTNOŚCI STATYSTYCZNEJ WSPÓŁCZYNNIKA KORELACJI RANG
Przed interpretacją wartości współczynnika należy sprawdzić jego istotność statystyczną, co jest równoznaczne z weryfikacją hipotezy o braku korelacji między zmiennymi wobec hipotezy alternatywnej, że taka korelacja występuje. Jeżeli liczba obserwacji nie przekracza 30 to należy się posłużyć wartościami krytycznymi z tablic; Jeżeli liczba ta przekracza 30, to należy obliczyć współczynnik Z wg odpowiedniego wzoru

55 WSPÓŁCZYNNIK KORELACJI RANG Spearmana - PRZYKŁAD
Ocena lojalności klienta oraz wizerunku marek konkurencyjnych na 5 rynkach, na których firma prowadzi działalność Dane: RYNEK OCENA LOJALNOŚCI KLIENTA yi OCENA WIZERUNKU MAREK KONKURENCYJN. Xi 1 4 2 5 3 SKALA OCEN OD 1 (NAJNIŻSZA) DO 5 (NAJWYŻSZA)

56 Rynek yi - xi (yi - xi) 2 1 -3 9 2 4 16 3 5 Σ X 30 Wniosek: ocena lojalności klienta i wizerunku marek konkurencyjnych wykazuje rozbieżności o umiarkowanej sile, wyrażającej się współwystępowaniem opinii o spadku stopnia lojalności klienta wraz z poprawą opinii o wizerunku marek konkurencyjnych

57 INNE WSPÓŁCZYNNIKI KORELACJI RANG
Współczynnik korelacji rang Kendalla – służy badania związków między cechami ilościowymi i jakościowymi, których wartości bądź natężenie zostały przedstawione w skali porządkowej. Kontyngencja (asocjacja, skojarzenia) między dwiema cechami (x i y), z których obie (lub przynajmniej jedna) ma charakter jakościowy. Budujemy wtedy tablice wielodzielne (tablice asocjacji) o określonej liczbie wierszy i kolumn, w których zamieszczamy liczebności poszczególnych wariantów cech, a nie ich wartości Współczynniki kontyngencji: Yule’a-Pearsona, Czuprowa, Pearsona, Cramera, Bykowskiego - Yule’a – służy do badania siły związku dwóch cech jakościowych, z których każda ma tylko dwa warianty - Pearsona – nie ma ograniczeń co do liczby wariantów cech

58 STOSUNEK KORELACYJNY PEARSONA
Jest miarą bardziej uniwersalną od współczynnika korelacji liniowej Pearsona: przydatny do analizy zależności liniowych ale także nieliniowych przydatny także w przypadku, gdy zmienna niezależna (x) jest cechą jakościową. obliczany na podstawie tablicy korelacyjnej po skwantyfikowaniu wartości cechy jakościowej przyjmuje wartości w przedziale 0 - 1

59

60

61

62

63

64

65

66

67

68


Pobierz ppt "KORELACJA STATYSTYCZNA STATISTICAL CORRELATION"

Podobne prezentacje


Reklamy Google