Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

1 KORELACJA STATYSTYCZNA STATISTICAL CORRELATION Prof. Dr Franciszek Kubiczek Rok akademicki 2011/2012 10.

Podobne prezentacje


Prezentacja na temat: "1 KORELACJA STATYSTYCZNA STATISTICAL CORRELATION Prof. Dr Franciszek Kubiczek Rok akademicki 2011/2012 10."— Zapis prezentacji:

1 1 KORELACJA STATYSTYCZNA STATISTICAL CORRELATION Prof. Dr Franciszek Kubiczek Rok akademicki 2011/

2 2 Z DIAGNOZY SPOŁECZNEJ 2007 Dochody gospodarstw domowych są tym mniejsze im mniejsza jest miejscowość Im niższy poziom wykształcenia głowy gospodarstwa domowego tym większe ryzyko ubóstwa Największą aktywnością na rynku pracy cechują się osoby pozostające w pełnych rodzinach z dziećmi Udział osób znających języki obce zwiększa się w miarę wzrostu wykształcenia i dochodu na osobę; spada wraz ze zmniejszeniem się klasy miejscowości, Z ochrony ubezpieczeniowej częściej korzystają gospodarstwa domowe, których głowami są mężczyźni, zwłaszcza wykształceni Długotrwałe bezrobocie silniej dotyka kobiety niż mężczyzn

3 3 Z DIAGNOZY SPOŁECZNEJ 2007 Doświadczenie zetknięcia się z bezrobociem i łączny czas pozostawania bez pracy w ciągu ostatnich 5 lat są wyraźnie zależne od poziomu wykształcenia oraz motywacji do znalezienia pracy Osoby z wyższym i policealnym wykształceniem deklarują dochody ponad 2 razy wyższe niż osoby z wykształceniem podstawowym (w 2003 r. 2,7 razy) Posiadaniu (zakupowi) komputera i dostępu do internetu bardzo mocno sprzyja obecność dzieci w gospodarstwie domowym Deklarowanie umiejętności korzystania z komputera bardzo silnie zależy od wieku. Są też wyższe u mężczyzn i osób lepiej wykształconych. Wzrost dochodów osobistych miedzy 2005 i 2007 rokiem był istotnie wyższy wśród użytkowników komputerów niż wśród osób, które z komputerów nie korzystały.

4 4 Najważniejszym czynnikiem wyjaśniającym ogólny dobrostan psychiczny (i jego poprawę) Polaków okazuje się wiek życia (im ktoś starszy tym w gorszej jest kondycji psychicznej). Kolejne czynniki: małżeństwo, dochód, liczba przyjaciół, praktyki religijne. Migracje zarobkowe: Niemcy wybierane są przede wszystkim przez osoby z wykształceniem zasadniczym lub niższym, kraje anglosaskie – osoby z wykształceniem wyższym. Wyjazd do pracy zagranicę dwukrotnie częściej deklarują bezrobotni niż zatrudnieni. Wśród 10 największych miast najwyższa jakość życia jest w Gdańsku i Warszawie, najniższa w Kielcach i Lublinie. Z DIAGNOZY SPOŁECZNEJ 2007

5 5 PRZYKŁADY PKB na 1 mieszkańca a długość życia Hipoteza: im wyższy PKB na mieszkańca (zmienna x - przyczyna) tym dłuższe trwanie życia (zmienna y - skutek) Ceny a popyt: Hipoteza: cena wzrastają (x) – popyt maleje (y) Dochody a popyt: Hipoteza: dochody rosną (x) – popyt rośnie (y)

6 6 Analiza korelacji (the analysis of the correlation) ma sens głównie wtedy, gdy między zmiennymi istnieje (bądź przypuszczamy, że istnieje) związek przyczynowo- skutkowy; Analiza jakościowa (the qualitative analysis): stwierdzenie – na podstawie analizy merytorycznej logicznego związku przyczynowo-skutkowego; korelacja rzeczywista i pozorna (iluzoryczna – ilusoric correlation ); analiza jakościowa powinna wyprzedzać analizę ilościową. Analiza ilościowa (the quantitative analysis) określenie siły i kierunku związku; współczynniki korelacji Związki dwustronne (two-sided relationships) - oddziaływanie wzajemne i związki jednostronne (one-sided relationships)- przyczyna-skutek. ISTOTA ANALIZY KORELACJI

7 7 Mimo niewątpliwego wpływu jednej zmiennej x (niezależnej) na drugą zmienną y (zależną), jednej i tej samej wartości x, mogą odpowiadać różne (wiele) wartości zmiennej y Na zmienną y oddziałuje nie tylko zmienna x, ale także inne zmienne (czynniki), często o różnokierunkowych wpływach Korelacja między dwiema zmiennymi x i y jest miarą siły (stopnia) związku miedzy tymi zmiennymi. Siłę tego związku mierzy współczynnik korelacji STOCHASTIC - przewidywanie możliwości KORELACJA (ZWIĄZEK STOCHASTYCZNY)

8 8 ANALIZA ZWIĄZKÓW KORELACYJNYCH Rodzaj cech: ilościowe jakościowe Rodzaj związku: liniowy (linear) nieliniowy (non-linear) – krzywoliniowy (curvilinear) Analizę zwykle rozpoczyna się od opracowania tablicy korelacyjnej (correlation table) oraz sporządzenia korelacyjnego wykresu (correlation diagram) rozrzutu.

9 9 Podstawowe pojęcia: Y - zmienna zależna (dependent variable) - objaśniana X – zmienna niezależna (determining variable) - objaśniająca ZALEŻNOŚĆ FUNKCYJNA (functional dependence) y = f(x) – rzadko występuje w sferze społecznej i gospodarczej i częściowo w naukach przyrodniczych; jej istota polega na tym, że zmiana wartości zmiennej niezależnej (x) powoduje ściśle określoną (jednoznaczną) zmianę wartości zmiennej zależnej (y) ZALEŻNOŚĆ KORELACYJNA (correlation dependence) - stochastyczna, statystyczna y = f(x,e), gdzie e = czynnik losowy - często występuje w sferze społeczno-gospodarczej KORELACJA LINIOWA–LINEAR CORRELATION

10 10 Korelacja całkowita (total correlation) - brutto, tj. współzależność tylko między dwiema zmiennymi, bez wnikania w ich powiązania z innymi cechami Korelacja cząstkowa (partial correlation) - częściowa, tj. współzależność między dwiema zmiennymi z wyłączeniem wpływu cech pozostałych poprzez ustalenie tychże jako stałych Korelacja wieloraka (multiple correlation) - wielokrotna, tj współzależność wybranej cechy ze wszystkimi pozostałymi łącznie. RODZAJE KORELACJI

11 11 WYKRESY KORELACYJNE KORELACJA LINIOWA DODATNIAKORELACJA LINIOWA UJEMNA KORELACJA KRZYWOLINIOWABRAK KORELACJI

12 12 MIERNIKI SIŁY KORELACJI DWÓCH ZMIENNYCH 1. Współczynnik korelacji liniowej Pearsona (linear coefficient of correlation) 2. Stosunek korelacji Pearsona (the relation of the correlation) 3. Współczynnik zbieżności Czuprowa (the coefficient of the convergence) 4. Współczynnik korelacji rang Spearmana (the coefficient of rank correlation) Wybór mierników zależy od: a) rodzaju cech między którymi badana jest zależność (mierzalne, niemierzalne lub mieszane) b) liczby obserwacji (tablice korelacji lub szeregi korelacji) c) kształt zależności prostoliniowy (liniowy) lub krzywoliniowy (nieliniowy) W praktyce najczęściej stosuje się współczynnik korelacji liniowej Pearsona, jako miernik siły związku liniowego między dwiema cechami mierzalnymi. Związkiem prostoliniowym (liniowym) nazywamy taką zależność, w której jednostkowemu przyrostowi jednej zmiennej (przyczyna) towarzyszy, średnio jednakowy przyrost drugiej zmiennej (skutek).

13 13 WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA The Pearson linear coefficient of correlation Wzór: Licznik: kowariancja, tj. średnia arytmetyczna iloczynu odchyleń poszczególnych zmiennych od ich średnich arytmetycznych; przyjmuje wartość dodatnią, gdy obydwie zmienne poruszają się w tych samych kierunkach; ujemną, gdy w przeciwnych. Przyjmuje wartość 0, gdy zmienne nie są liniowo zależne. Mianownik: iloczyn odchyleń standardowych obu zmiennych;

14 14 WSPÓŁCZYNNIK KORELACJI LINIOWEJ PEARSONA Współczynnik przyjmuje wartości od –1 do +1; im większa jego wartość bezwzględna tym większa siła korelacji Wartość współczynnika = 0 nie zawsze oznacza brak zależności a jedynie brak zależności liniowej Wartość współczynnika = 1 oznacza ścisły dodatni związek, gdy -1, ujemny związek Współczynnik jest symetryczny, tzn. wskazuje na korelację wzajemną, x względem y i y względem x

15 15 r = 0 brak korelacji liniowej między zmiennymi r = 1 pełna korelacja, związek funkcyjny (-1, +1) r < 0 ujemna korelacja, tzn. że wzrost wartości jednej zmiennej powoduje spadek wartości drugiej r > 0 dodatnia korelacja, tzn. że wzrost wartości jednej zmiennej powoduje także wzrost wartości drugiej (i odwrotnie), r < 0,2 bardzo słaba korelacja, zwykle jej brak 0,2 < r < 0,4 słaba korelacja, lecz wyraźna 0,4 < r < 0,7 umiarkowana, ale istotna 0,7 < r < 0,9 silna korelacja r > 0,9 bardzo silna korelacja liniowa INTERPRETACJA WSPÓŁCZYNNIKA KORELACJI

16 16 UWAGA Współczynnik korelacji jest określonym wskaźnikiem, a nie pomiarem na skali liniowej o jednakowych jednostkach Dlatego nie można mówić, że np. zależność r = 0,9 jest dwukrotnie silniejsza niż gdy r = 0,45 Związek korelacji nie jest jednoznaczny z występowaniem związku przyczynowo- skutkowego i badanie związku korelacji wymaga dobrego rozeznania merytorycznej strony badanych zjawisk (np. rynkowych)

17 17 Nawet silna zależność statystyczna pomiędzy zjawiskami stwierdzona współczynnikiem korelacji, nie musi świadczyć o występowaniu między nimi zależności przyczynowo- skutkowej (the dependence causal-consecutive); Miedzy zjawiskami mogą bowiem występować różnego rodzaju relacje: Zmienność jednej zmiennej może być spowodowana bezpośrednio przez jedną lub kilka zmiennych Zmienne mogą być powiązane obustronnie, co oznacza, że każda ze zmiennych oddziałuje na każdą Na zmienne może oddziaływać wspólna przyczyna zewnętrzna Zmienne mogą być powiązane ze sobą za pośrednictwem jednej lub kilku innych zmiennych pośrednich (tworząc łańcuch przyczynowy); Współzmienność może być także skutkiem przypadku Związki przyczynowo-skutkowe można stwierdzić tylko na podstawie merytorycznej znajomości badanej problematyki UWAGI

18 18 WSPÓŁCZYNNIK DETERMINACJI (OKREŚLONOŚCI) (DETERMINATION COEFFICIENT) Współczynnik determinacji = kwadrat współczynnika korelacji; informuje on jaka część zmienności zmiennej zależnej (y) jest wyjaśniona zmiennością zmiennej niezależnej (x); jest opisową miarą siły związku między zmiennymi. Jeśli zatem współczynnik korelacji wynosi np. 0,7 to 0,7 2 =0,49 i to oznacza, że w 49% zmianę wartości zmiennej zależnej wyjaśnia zmiana zmiennej niezależnej Dopełnienie współczynnika determinacji do jedności – to współczynnik indeterminacji, określa tę część zmienności zmiennej zależnej (y), która nie została wyjaśniona zmiennością zmiennej niezależnej (x), a więc wynika z innych przyczyn niż określa to zmienna x; Jeśli zatem (przykład jak wyżej) współczynnik determinacji wynosi 0,49, to współczynnik indeterminacji wynosi 0,51 i oznacza, że w 51% odgrywają inne czynniki niż przyjęta zmienna niezależna

19 19 TABLICA (MACIERZ) KORELACYJNA DWIE ZMIENNE y j x i y 1 y y j..... y r Σ x1x1 n 11 n n 1j..... n 1r n 1 x2x2 n 21 n n 2j..... n 2r n xixi n i1 n i n ij..... n ir n i..... xkxk n k 1 n k n k j..... n k r n k Σ n 1 n n j..... n r n j i X i – zmienna niezależna y j - zmienna zależna n j – liczba jednostek mających wariant X i n i - liczba jednostek mających wariant y j ROZKŁAD BRZEGOWY ZMIENNEJ X ROZKŁAD BRZEGOWY ZMIENNEJ y UWAGA: zamiast liczebności absolutnej n ij - można stosować częstości : n ij : n

20 Ilości sprzedane PRZYKŁAD – DIAGRAM KORELACJI ILOŚCI CENY

21 21 PRZYKŁAD – TABLICA KORELACYJNA KORELACJA RYNEKCENY w zł/szt. x i ILOŚCI SPRZEDANE w szt. y i RAZEM Uporządkowana wg rosnącej zmiennej niezależnej x i, tj. wg rosnącej ceny

22 22 OBLICZENIA WSPÓŁCZYNNIKÓW Współczynnik korelacji r = Współczynnik determinacji r 2 = (-0,93) 2 = 0,87 Wnioski: - korelacja jest silna gdyż współczynnik przekracza 0,9; - jest ujemna gdyż wzrost ceny powoduje spadek popytu - poziom cen w 87% objaśnia zmienność popytu, w 13% zmiana popytu wynika z innych przyczyn KOWARIANCJA ODCHYLENIE STANDARDOWE

23 23 PRZYKŁAD – TABLICA KORELACYJNA NAZWA KRAJUNR OBSZARU iPKB X i ŻYCIE y i SIERRA LEONE ETIOPIA NIGERIA KENIA SENEGAL INDONEZJA DOMINIKANA BIAŁORUŚ CHORWACJA MEKSYK POLSKA HISZPANIA WŁOCHY SZWECJA W. BRYTANIA FRANCJA NIEMCY KANADA AUSTRIA JAPONIA BELGIA NORWEGIA SZWAJCARIA USA Uporządkowanie wg rosnącej zmiennej niezależnej x i (PKB na 1 mieszkańca) $ lat

24 24 PRZYKŁAD – DIAGRAM KORELACJI Przeciętne dalsze trwanie życia (w latach ) w relacji do PKB na 1 mieszkańca (w USD) PKB LATA

25 25 OBLICZENIA WSPÓŁCZYNNIKÓW Współczynnik korelacji r = Współczynnik determinacji r 2 = (0,68) 2 = 0,47 Wnioski: - korelacja jest umiarkowana, ale istotna gdyż znajduje się w przedziale od 0,4 do 0,7 - jest dodatnia, tzn. wzrost wartości cechy x (PKB na 1 mieszkańca) powoduje wzrost cechy y (przeciętne trwanie życia) - poziom PKB na 1 mieszk. w 47% wyjaśnia wzrost przeciętnego trwania życia, a 53% tego wzrostu zależy od pozostałych czynników KOWARIANCJA ODCHYLENIE STANDARDOWE

26 26 ŚWIAT: Korelacja miedzy długością życia i PKB na mieszkańca 2005

27 27 ŚWIAT: Korelacja miedzy długością życia i poziomem skolaryzacji 2005

28 28 1.Korelacja między zaufaniem interpersonalnym a zadowoleniem z życia: 0,76 2.Korelacja między przeciętną organizacji, do których należą a zadowoleniem z życia: 0,74 3.Korelacja między zadowoleniem z demokracji a poczuciem szczęścia: 0,62 4.Korelacja między zaufaniem interpersonalnym a PKB (wg PPS) na mieszkańca: 0,69 5.Korelacja między przeciętną liczbą organizacji, do których należą a PKB (wg PPS) na mieszkańca: 0,67 6.Korelacja między zadowoleniem z demokracji a PKB na mieszkańca: 0,53 WSPÓŁCZYNNIKI KORELACJI W DIAGNOZIE SPOŁECZNEJ 2007 W PRZEKROJU MIĘDZYNARODOWYM

29 29 Wg M. Herbsta: Kapitał ludzki i kapitał społeczny a rozwój regionalny Współczynnik korelacji liniowej między kapitałem ludzkim a PKB na mieszkańca wynosi 0,8. Poziom kapitału ludzkiego mierzony jest tu odsetkiem ludności z wykształceniem wyższym lub średnim oraz przeciętną długością edukacji szkolnej. WSPÓŁCZYNNIKI KORELACJI ZWIĄZANE Z KAPITAŁEM SPOŁECZNYM

30 30 ŚWIAT: Korelacja miedzy PKB na mieszkańca i poziomem skolaryzacji

31 31 ŚWIAT: Korelacja między dostępem do edukacji a PKB na mieszkańca % dzieci uczęszczających do szkół ponadpodstawowych (2000) PKB na mieszkańca (PPP 2000)

32 32 Przeciętna liczba lat spędzonych w szkole (2000) PKB na mieszkańca (PPP 2000) ŚWIAT: Korelacja między dostępem do edukacji a PKB na mieszkańca

33 33 ŚWIAT: Korelacja między dostępem do edukacji a PKB na mieszkańca Wzrost wynagrodzenia w związku z przedłużeniem edukacji o rok Przeciętna liczba lat spędzonych w szkole (2000)

34 34 POLSKA: Korelacja między odsetkiem ludności z wyższym lub średnim wykształceniem a PKB na mieszkańca w podregionach % ludności z wykształceniem wyższym lub średnim w 2002 r. PKB na mieszkańca w 2003 r.

35 35 POLSKA: Korelacja między odsetkiem ludności z wyższym lub średnim wykształceniem a PKB na mieszkańca w podregionach % ludności z wyższym wykształceniem w 1988 r. Przyrost PKB na mieszkańca w % w latach

36 36 Przeciętna długość edukacji (w latach) stan na 1988 r. Przyrost PKB na mieszkańca w % w latach POLSKA: Korelacja między przeciętną długością edukacji w latach a PKB na mieszkańca w podregionach

37 37 Przeciętna długość edukacji (w latach) stan na2002 r. PKB na mieszkańca w 2003 r. POLSKA: Korelacja między przeciętną długością edukacji w latach a PKB na mieszkańca w podregionach

38 38 l ow income Wykres korelacyjny: Przedsiębiorczość i PKN na mieszkańca # of SMEs vs. Income GNI per capita # of SMEs per 1,000 people High-income Lower-middle Upper-middle Low income

39 39 ŚWIAT: Wykres korelacyjny

40 40 Cost to start a business vs. # of SMEs Cost to start a business (% of income per capita) # of SMEs per people ŚWIAT: Wykres korelacyjny

41 41 ŚWIAT: Wykres korelacyjny

42 42 ŚWIAT: Wykres korelacyjny

43 43 KORELACJA CZĄSTKOWA – (PARTIAL CORRELATION) Jeśli na pewną zmienną zależną (y) oddziałuje więcej niż jedna zmienna niezależna (x), a interesuje nas siła związku korelacyjnego tylko między zmienną zależną i jedną zmienną niezależną, przy wyłączeniu wpływu innych zmiennych niezależnych – wtedy mamy do czynienia z korelacją cząstkową Wzór: KORELACJA MIĘDZY CECHAMI 1 i 2 PRZY WYELIMINOWANIU 3

44 44 KORELACJA CZĄSTKOWA – (PARTIAL CORRELATION) Miara ścisłości: współczynnik korelacji cząstkowej, informuje zarówno o kierunku, jak i sile zależności między badanymi zmiennymi Współczynnik korelacji cząstkowej może być większy lub mniejszy od współczynnika korelacji prostej dla pary badanych cech Załóżmy, że mamy 3 zmienne, których wzajemny związek chcemy zbadać. Naszym zadaniem jest znalezienie współczynnika korelacji mierzącego zależność między 2 cechami, przy wyłączeniu oddziaływania 3-ciej

45 45 KORELACJA CZĄSTKOWA – PRZYKŁAD Zmienne: 1. Liczba sklepów 2. Łączna powierzchnia sklepów 3. Liczba gospodarstw domowych Współczynnik korelacji między tymi zmiennymi wynosi: r 12 = - 0,006 r 23 = 0,018 r 13 = 0,914 Obliczamy współczynniki korelacji cząstkowej: r 12.3 = - 0,054 korelacja między zmiennymi 1 i 2 przy wyłączeniu zmiennej 3 r 23.1 = 0,057 korelacja między zmiennymi 2 i 3 przy wyłączeniu zmiennej 1 r 13.2 = 0,915 korelacja między zmiennymi 1 i 3 przy wyłączeniu zmiennej 2 Współczynniki korelacji cząstkowej informują zarówno o kierunku, jak i o sile zależności między badanymi zmiennymi.

46 46 Jeżeli np. r 13 = 0,914 i r 13.2 = 0,915 Korelacja między liczbą sklepów Korelacja między liczbą sklepów a liczbą a liczbą gospodarstw domowych gospodarstw domowych po wyeliminowaniu wpływu łącznej powierzchni sklepów Różnią się nieznacznie, tzn. że czynnik wyeliminowany (łączna powierzchnia sklepów) nie odgrywał istotnej roli w opisie zmienności liczby sklepów.

47 47 KORELACJA WIELORAKA – MULTIPLE CORRELATION Jeżeli chcemy zbadać ścisłość związku korelacyjnego pomiędzy wartością jednej cechy (zmienną zależną) a kompleksem innych cech (zmiennych niezależnych), właściwą miarą jest współczynnik korelacji wielorakiej. W praktyce często się zdarza, że zmienna zależna, zależy od więcej niż od jednej zmiennej niezależnej. Wzór: gdzie: r ij - współczynnik korelacji między zmienną i oraz j; wzór dla trzech zmiennych Kwadrat współczynnika korelacji wielorakiej, nazywamy współczynnikiem determinacji

48 48 KORELACJA WIELORAKA Jeżeli przynajmniej jeden ze współczynników korelacji cząstkowej ma wartość 1, to współczynnik korelacji wielorakiej także wynosi 1, Jeżeli wszystkie współczynniki korelacji cząstkowej są równe 0, to współczynnik korelacji wielorakiej także wynosi 0, Im współczynnik korelacji wielorakiej jest bliższy 1, tym związek między daną zmienną zależną a rozpatrywanymi zmiennymi niezależnymi jest silniejszy i odwrotnie im bliższy zeru tym słabszy Współczynnik korelacji wielorakiej mierzy tylko siłę, a nie wskazuje kierunku korelacji Problem: jak wiele zmiennych niezależnych włączać do obliczeń (badań) korelacji wielorakiej? Jak najwięcej! Oczywiście mających jakiś związek ze zmienną zależną.

49 49 KORELACJA WIELORAKA - PRZYKŁAD Dla obliczenia współczynnika korelacji wielorakiej nie są potrzebne współczynniki korelacji cząstkowej; wystarczą zwykłe współczynniki korelacji między poszczególnymi parami zmiennych W przykładzie ze str. 23: liczba sklepów, gospodarstw domowych i łączna powierzchnia tych sklepów: R 1.23 = 0,9142 tzn. łączna powierzchnia sklepów (3) oraz liczba gospodarstw domowych (2) ściśle wiąże się z liczbą sklepów Współczynnik determinacji: R 1.23 = 0, = 0, ,58% wskazuje, że w ok. 84% zmiany liczby sklepów mogą być wyjaśniane zmniejszającą się łączną powierzchnią sklepów oraz zróżnicowaniem liczby gospodarstw domowych 2

50 50 WSPÓŁCZYNNIK KORELACJI RANG Spearmana (RANK CORRELATION) Rangi charakteryzują jednostki pod kątem ich relatywnych pozycji w zbiorze analizowanych obiektów. Stosowane są do porządkowania obiektów wielocechowych. Przy używaniu metody rang można w zależności od celu badania, porządkować obiekty tylko na podstawie jednej cechy lub dowolnego podzbioru cech Jeśli porządkuje się obiekty ze względu na kilka cech jednocześnie, należy ustalić rangi dla każdej cechy, a następnie obliczyć średnią rang obiektów

51 51 Rangowanie = uporządkowanie zbioru, ustalenie kolejności Uporządkowanym wartościom zmiennych nadaje się następnie numery kolejnych liczb naturalnych Przyjmuje wartości i ich interpretacje analogiczne jak w przypadku współczynnika korelacji Pearsona (w przedziale od -1 do 1) WSPÓŁCZYNNIK KORELACJI RANG Spearmana

52 52 WSPÓŁCZYNNIK KORELACJI RANG (RANK CORRELATION) Spearmana Zwany też współczynnikiem korelacji kolejnościowej służy do opisu siły dwuwymiarowego (tzn. dwóch cech), liniowego związku korelacyjnego w przypadku, gdy: a. cechy są mierzalne i zbiorowość mała b. cechy mają charakter jakościowy i istnieje możliwość ich uporządkowania

53 53 WSPÓŁCZYNNIK KORELACJI RANG (RANK CORRELATION) Spearmana Służy do opisu siły korelacji-współzależności dwóch cech zwłaszcza wtedy gdy mają one charakter jakościowy i istnieje możliwość ich uporządkowania w określonej kolejności, służy także do zbadania siły korelacji gdy cechy mają charakter ilościowy i w przypadku niewielkiej liczby obserwacji Wzór: gdzie: d i = ( y i – x i ) i - numer obserwacji d i - różnice między rangami (kolejnymi numerami obserwacji) odpowiadających sobie wartości zmiennej x uporządkowanych wg kolejności niemalejącej wartości zmiennej y n – liczebność zbiorowości

54 54 TESTOWANIE ISTOTNOŚCI STATYSTYCZNEJ WSPÓŁCZYNNIKA KORELACJI RANG Przed interpretacją wartości współczynnika należy sprawdzić jego istotność statystyczną, co jest równoznaczne z weryfikacją hipotezy o braku korelacji między zmiennymi wobec hipotezy alternatywnej, że taka korelacja występuje. Jeżeli liczba obserwacji nie przekracza 30 to należy się posłużyć wartościami krytycznymi z tablic; Jeżeli liczba ta przekracza 30, to należy obliczyć współczynnik Z wg odpowiedniego wzoru

55 55 Ocena lojalności klienta oraz wizerunku marek konkurencyjnych na 5 rynkach, na których firma prowadzi działalność Dane: WSPÓŁCZYNNIK KORELACJI RANG Spearmana - PRZYKŁAD RYNEKOCENA LOJALNOŚCI KLIENTA y i OCENA WIZERUNKU MAREK KONKURENCYJN. X i SKALA OCEN OD 1 (NAJNIŻSZA) DO 5 (NAJWYŻSZA)

56 56 Rynek y i - x i (y i - x i ) Σ X30 Wniosek: ocena lojalności klienta i wizerunku marek konkurencyjnych wykazuje rozbieżności o umiarkowanej sile, wyrażającej się współwystępowaniem opinii o spadku stopnia lojalności klienta wraz z poprawą opinii o wizerunku marek konkurencyjnych

57 57 INNE WSPÓŁCZYNNIKI KORELACJI RANG Współczynnik korelacji rang Kendalla – służy badania związków między cechami ilościowymi i jakościowymi, których wartości bądź natężenie zostały przedstawione w skali porządkowej. Kontyngencja (asocjacja, skojarzenia) między dwiema cechami (x i y), z których obie (lub przynajmniej jedna) ma charakter jakościowy. Budujemy wtedy tablice wielodzielne (tablice asocjacji) o określonej liczbie wierszy i kolumn, w których zamieszczamy liczebności poszczególnych wariantów cech, a nie ich wartości Współczynniki kontyngencji: Yulea-Pearsona, Czuprowa, Pearsona, Cramera, Bykowskiego - Yulea – służy do badania siły związku dwóch cech jakościowych, z których każda ma tylko dwa warianty - Pearsona – nie ma ograniczeń co do liczby wariantów cech

58 58 STOSUNEK KORELACYJNY PEARSONA Jest miarą bardziej uniwersalną od współczynnika korelacji liniowej Pearsona: –przydatny do analizy zależności liniowych ale także nieliniowych –przydatny także w przypadku, gdy zmienna niezależna (x) jest cechą jakościową. –obliczany na podstawie tablicy korelacyjnej po skwantyfikowaniu wartości cechy jakościowej –przyjmuje wartości w przedziale 0 - 1

59 59

60 60

61 61

62 62

63 63

64 64

65 65

66 66

67 67

68 68


Pobierz ppt "1 KORELACJA STATYSTYCZNA STATISTICAL CORRELATION Prof. Dr Franciszek Kubiczek Rok akademicki 2011/2012 10."

Podobne prezentacje


Reklamy Google