Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
1
Pojedyńczy element, mała grupa
Małgorzata Podogrodzka, SGH ISiD
2
Małgorzata Podogrodzka, SGH ISiD
Grupa jednostek Małgorzata Podogrodzka, SGH ISiD
3
Małgorzata Podogrodzka, SGH ISiD
CEL – SZUKAMY POWIĄZAŃ (PRAWIDŁOWOŚCI) MIĘDZY CECHAMI OPISUJĄCYMI BADANĄ ZBIOROWOŚĆ Mam katar, mam gorączkę, mam kaszel – czego to są objawy ? Małgorzata Podogrodzka, SGH ISiD
4
Tablica korelacyjna cechy X i Y
xi y y yl x1 x2 . xk n n n1l n n n2l nk nk nkl n1. n2. nk. n n n.l n Małgorzata Podogrodzka, SGH ISiD
5
Małgorzata Podogrodzka, SGH ISiD
Rozkład łączny cechy X,Y jest to dwuwymiarowy rozkład empiryczny cechy X,Y określający liczebności nij (i=1,...,k; j=1,...,l) odpowiadające odpowiednio parom wartości (xi, yj). Rozkłady brzegowe to rozkłady każdej z cech traktowane oddzielnie. Rozkłady warunkowe to rozkłady jednej z cech pod warunkiem, że druga z cech przyjmuje określony wariant. Małgorzata Podogrodzka, SGH ISiD
6
Małgorzata Podogrodzka, SGH ISiD
Dla każdego z tych rozkładów można wyznaczyć miary statystyczne. Dla rozkładu brzegowego i warunkowego np. średnią arytmetyczną, medianę, wariancję, itd. a dla rozkładu łącznego miary zależności, które pokazują, jak zmiany wartości jednej zmiennej wpływają na zmiany wartości drugiej zmiennej. Małgorzata Podogrodzka, SGH ISiD
7
Zależność (współzależności)
przyczynowa - zmiennych X stanowi przyczynę zmian, a zmienna Y jest jej skutkiem (wysokość wynagrodzenia i wydatki na konsumpcję) zależność pozorna - między X a Y wydaje się że istnieje związek, ale jest on wywołany istnieniem wspólnej dla nich przyczyny (waga i poziom cholesterolu - ilość i rodzaj spożywanych produktów) deterministyczna (korelacyjna) – wariantowi X odpowiada wariant Y stochastyczna – odpowiadają różne warianty Y (lub odwrotnie) Małgorzata Podogrodzka, SGH ISiD
8
Małgorzata Podogrodzka, SGH ISiD
jednostronna – zmienna X warunkuje zmiany wartości zmiennej Y dwustronna – zmienna X warunkuje zmiany wartości zmiennej Y ale też zmienna Y warunkuje zmiany wartości zmiennej X Zmienna niezależna to zmienna, która wywołuje zmiany, stanowi ich przyczynę. Zmienna zależna to zmienna, której wartości są kształtowane przez zmienną niezależną (zmienne niezależne). Małgorzata Podogrodzka, SGH ISiD
9
Małgorzata Podogrodzka, SGH ISiD
Zmienne są stochastycznie zależne gdy wartość jednej zmiennej wpływa na rozkład prawdopodobieństwa drugiej zmiennej. Warunki niezależności stochastycznej tj. rozkłady warunkowe zmiennej losowej Y są identyczne (rozkłady warunkowe zmiennej Y mają jednakowe średnie i wariancje) Małgorzata Podogrodzka, SGH ISiD
10
Małgorzata Podogrodzka, SGH ISiD
Zmienne są korelacyjne zależne gdy określonym wartościom jednej zmiennej przyporządkowane są średnie wartości drugiej zmiennej Warunki niezależności korelacyjnej tj. średnie warunkowe zmiennej losowej Y są identyczne (rozkłady warunkowe różnią się między sobą) Małgorzata Podogrodzka, SGH ISiD
11
Małgorzata Podogrodzka, SGH ISiD
1. Kowariancja to miara natężenia współzależności dwóch cech. własności: znak: dodatni to zgodne kierunki zmian, ujemny - kierunki przeciwne siła: -S(X)∙S(Y) < cov(XY) < S(X)∙S(Y) cov (XY) = 0 (brak) zmienne: X i Y mierzalna Małgorzata Podogrodzka, SGH ISiD
12
Małgorzata Podogrodzka, SGH ISiD
2. Współczynnik korelacji liniowej własności: kierunek: dodatni to zgodne kierunki zmian, ujemny - kierunki przeciwne skala: r = <-1, 1> r = 0 (brak)r = 1 (liniowa) zmienne XY mierzalne Małgorzata Podogrodzka, SGH ISiD
13
Małgorzata Podogrodzka, SGH ISiD
Weryfikacja hipotez: o braku zależności liniowej w populacji generalnej zmiennej X od zmiennej Y (współczynnik korelacji) n – liczebność z próby, r - współczynnik korelacji z próby ma rozkład t-Studenta o v = n - 2 stopniach swobody Małgorzata Podogrodzka, SGH ISiD
14
Małgorzata Podogrodzka, SGH ISiD
Sześciu studentom zmierzono czas pisania egzaminu ze statystyki (X) oraz uzyskaną liczbę punktów z egzaminu (Y). Czy czas pisania warunkował wyniki z egzaminu ? Małgorzata Podogrodzka, SGH ISiD
15
Małgorzata Podogrodzka, SGH ISiD
3. Współczynnik korelacji rang Spearmana di = r1i – r2i, r1i – ranga i-tego obiektu w pierwszym uporządkowaniu, r2i – ranga i-tego obiektu w drugim uporządkowaniu, n – liczba badanych obiektów. własności: znak: dodatni to zgodne kierunki zmian, ujemny to kierunki przeciwne siła: r = <-1; 1> r = 0 (brak) r = +/-1 (najsilniejsza) zmienne: zmiennym X i Y nadajemy rangi Małgorzata Podogrodzka, SGH ISiD
16
Małgorzata Podogrodzka, SGH ISiD
17
4. Współczynnik zbieżności
liczebność teoretyczna g=min{k, l} własności: kierunek: brak (wartość miary zawsze dodatnia siła: V=<0; 1> V = 0 (brak) V = 1 (najsilniejsza) zmienne: nie ma znaczenia czy mierzalna czy niemierzalna Małgorzata Podogrodzka, SGH ISiD
18
Małgorzata Podogrodzka, SGH ISiD
Hipoteza o niezależności stochastycznej oceniamy poziom odchyleń liczebności zaobserwowanych w rozkładzie empirycznym otrzymanym w próbie od liczebności teoretycznych występujących przy niezależności zmiennych w oparciu o statystykę o postaci która przy założeniu prawdziwości hipotezy zerowej ma asymptotyczny rozkład o (r-1) (s-1) stopniach swobody Małgorzata Podogrodzka, SGH ISiD
19
Małgorzata Podogrodzka, SGH ISiD
W pewnej firmie spytano pracowników o liczbę zjadanych w ciągu roku czekolady (250g). Czy płeć jest czynnikiem warunkującym ilość zjadanej czekolady w badanej grupie pracowników? yj \ xi liczebności empiryczne nij teoretyczne Σ m k ni. 1 6 4 10 5 -1 0,20 0,40 2 8 14 7 0,14 0,28 3 0,00 n.j 50 x 1,79 W pewnej firmie spytano pracowników o liczbę zjadanych w ciągu roku czekolady (250g). Czy płeć jest czynnikiem warunkującym ilość zjadanej czekolady? Małgorzata Podogrodzka, SGH ISiD
20
Małgorzata Podogrodzka, SGH ISiD
Równość wariancyjna a. miara ogólnego zróżnicowania cechy y b. miara przeciętnego zróżnicowania cechy y wewnątrz rozkładów warunkowych c. miara przeciętnego zróżnicowania cechy y między rozkładami warunkowymi Małgorzata Podogrodzka, SGH ISiD
21
Małgorzata Podogrodzka, SGH ISiD
ZRÓŻNICOWANIE między grupowe yj xi y y yl x1 x2 . xk n n n1l n n n2l nk nk nkl n1. n2. nk. n n n.l n Małgorzata Podogrodzka, SGH ISiD wewnątrz grupowe
22
Małgorzata Podogrodzka, SGH ISiD
HIPOTEZA H0: dla każdego ij mi=mj H1: istnieje takie ij, że mi≠mj Statystyka F=S2m/S2w S2m=SKM/(r-1) S2w=SKW/(n-r) F-Sedecora z v1=(r-1) oraz v2=(n-r) Małgorzata Podogrodzka, SGH ISiD
23
Małgorzata Podogrodzka, SGH ISiD
6. Funkcja regresji służy do określenia kształtu powiązań między zmiennymi, ale dużym problemem jest wybór postaci analitycznej funkcji. Ułatwienie to wykresu rozrzutu wariantów zmiennej X i Y. Małgorzata Podogrodzka, SGH ISiD
24
Małgorzata Podogrodzka, SGH ISiD
y = a + bx y - wartość przewidywana na podstawie wartości x a - parametr a to wyraz wolny (y = a jeżeli x = 0) b - współczynnik kierunkowy funkcja rosnąca czy malejąca szybkość zmiany Do wyznaczenia parametrów strukturalnych funkcji wykorzystuje się metodę najmniejszych kwadratów. Małgorzata Podogrodzka, SGH ISiD
25
Małgorzata Podogrodzka, SGH ISiD
indeterminacji Małgorzata Podogrodzka, SGH ISiD
26
Małgorzata Podogrodzka, SGH ISiD
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.