Pojedyńczy element, mała grupa Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Grupa jednostek Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD CEL – SZUKAMY POWIĄZAŃ (PRAWIDŁOWOŚCI) MIĘDZY CECHAMI OPISUJĄCYMI BADANĄ ZBIOROWOŚĆ Mam katar, mam gorączkę, mam kaszel – czego to są objawy ? Małgorzata Podogrodzka, SGH ISiD
Tablica korelacyjna cechy X i Y xi y1 y2 . . . yl x1 x2 . xk n11 n12 . . . n1l n21 n22 . . . n2l . . . nk1 nk2 . . . nkl n1. n2. nk. n.1 n.2 . . . n.l n Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Rozkład łączny cechy X,Y jest to dwuwymiarowy rozkład empiryczny cechy X,Y określający liczebności nij (i=1,...,k; j=1,...,l) odpowiadające odpowiednio parom wartości (xi, yj). Rozkłady brzegowe to rozkłady każdej z cech traktowane oddzielnie. Rozkłady warunkowe to rozkłady jednej z cech pod warunkiem, że druga z cech przyjmuje określony wariant. Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Dla każdego z tych rozkładów można wyznaczyć miary statystyczne. Dla rozkładu brzegowego i warunkowego np. średnią arytmetyczną, medianę, wariancję, itd. a dla rozkładu łącznego miary zależności, które pokazują, jak zmiany wartości jednej zmiennej wpływają na zmiany wartości drugiej zmiennej. Małgorzata Podogrodzka, SGH ISiD
Zależność (współzależności) przyczynowa - zmiennych X stanowi przyczynę zmian, a zmienna Y jest jej skutkiem (wysokość wynagrodzenia i wydatki na konsumpcję) zależność pozorna - między X a Y wydaje się że istnieje związek, ale jest on wywołany istnieniem wspólnej dla nich przyczyny (waga i poziom cholesterolu - ilość i rodzaj spożywanych produktów) deterministyczna (korelacyjna) – wariantowi X odpowiada wariant Y stochastyczna – odpowiadają różne warianty Y (lub odwrotnie) Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD jednostronna – zmienna X warunkuje zmiany wartości zmiennej Y dwustronna – zmienna X warunkuje zmiany wartości zmiennej Y ale też zmienna Y warunkuje zmiany wartości zmiennej X Zmienna niezależna to zmienna, która wywołuje zmiany, stanowi ich przyczynę. Zmienna zależna to zmienna, której wartości są kształtowane przez zmienną niezależną (zmienne niezależne). Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Zmienne są stochastycznie zależne gdy wartość jednej zmiennej wpływa na rozkład prawdopodobieństwa drugiej zmiennej. Warunki niezależności stochastycznej tj. rozkłady warunkowe zmiennej losowej Y są identyczne (rozkłady warunkowe zmiennej Y mają jednakowe średnie i wariancje) Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Zmienne są korelacyjne zależne gdy określonym wartościom jednej zmiennej przyporządkowane są średnie wartości drugiej zmiennej Warunki niezależności korelacyjnej tj. średnie warunkowe zmiennej losowej Y są identyczne (rozkłady warunkowe różnią się między sobą) Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD 1. Kowariancja to miara natężenia współzależności dwóch cech. własności: znak: dodatni to zgodne kierunki zmian, ujemny - kierunki przeciwne siła: -S(X)∙S(Y) < cov(XY) < S(X)∙S(Y) cov (XY) = 0 (brak) zmienne: X i Y mierzalna Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD 2. Współczynnik korelacji liniowej własności: kierunek: dodatni to zgodne kierunki zmian, ujemny - kierunki przeciwne skala: r = <-1, 1> r = 0 (brak)r = 1 (liniowa) zmienne XY mierzalne Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Weryfikacja hipotez: o braku zależności liniowej w populacji generalnej zmiennej X od zmiennej Y (współczynnik korelacji) n – liczebność z próby, r - współczynnik korelacji z próby ma rozkład t-Studenta o v = n - 2 stopniach swobody Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Sześciu studentom zmierzono czas pisania egzaminu ze statystyki (X) oraz uzyskaną liczbę punktów z egzaminu (Y). Czy czas pisania warunkował wyniki z egzaminu ? Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD 3. Współczynnik korelacji rang Spearmana di = r1i – r2i, r1i – ranga i-tego obiektu w pierwszym uporządkowaniu, r2i – ranga i-tego obiektu w drugim uporządkowaniu, n – liczba badanych obiektów. własności: znak: dodatni to zgodne kierunki zmian, ujemny to kierunki przeciwne siła: r = <-1; 1> r = 0 (brak) r = +/-1 (najsilniejsza) zmienne: zmiennym X i Y nadajemy rangi Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD
4. Współczynnik zbieżności liczebność teoretyczna g=min{k, l} własności: kierunek: brak (wartość miary zawsze dodatnia siła: V=<0; 1> V = 0 (brak) V = 1 (najsilniejsza) zmienne: nie ma znaczenia czy mierzalna czy niemierzalna Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Hipoteza o niezależności stochastycznej oceniamy poziom odchyleń liczebności zaobserwowanych w rozkładzie empirycznym otrzymanym w próbie od liczebności teoretycznych występujących przy niezależności zmiennych w oparciu o statystykę o postaci która przy założeniu prawdziwości hipotezy zerowej ma asymptotyczny rozkład o (r-1) (s-1) stopniach swobody Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD W pewnej firmie spytano pracowników o liczbę zjadanych w ciągu roku czekolady (250g). Czy płeć jest czynnikiem warunkującym ilość zjadanej czekolady w badanej grupie pracowników? yj \ xi liczebności empiryczne nij teoretyczne Σ m k ni. 1 6 4 10 5 -1 0,20 0,40 2 8 14 7 0,14 0,28 3 0,00 n.j 50 x 1,79 W pewnej firmie spytano pracowników o liczbę zjadanych w ciągu roku czekolady (250g). Czy płeć jest czynnikiem warunkującym ilość zjadanej czekolady? Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD Równość wariancyjna a. miara ogólnego zróżnicowania cechy y b. miara przeciętnego zróżnicowania cechy y wewnątrz rozkładów warunkowych c. miara przeciętnego zróżnicowania cechy y między rozkładami warunkowymi Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD ZRÓŻNICOWANIE między grupowe yj xi y1 y2 . . . yl x1 x2 . xk n11 n12 . . . n1l n21 n22 . . . n2l . . . nk1 nk2 . . . nkl n1. n2. nk. n.1 n.2 . . . n.l n Małgorzata Podogrodzka, SGH ISiD wewnątrz grupowe
Małgorzata Podogrodzka, SGH ISiD HIPOTEZA H0: dla każdego ij mi=mj H1: istnieje takie ij, że mi≠mj Statystyka F=S2m/S2w S2m=SKM/(r-1) S2w=SKW/(n-r) F-Sedecora z v1=(r-1) oraz v2=(n-r) Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD 6. Funkcja regresji służy do określenia kształtu powiązań między zmiennymi, ale dużym problemem jest wybór postaci analitycznej funkcji. Ułatwienie to wykresu rozrzutu wariantów zmiennej X i Y. Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD y = a + bx y - wartość przewidywana na podstawie wartości x a - parametr a to wyraz wolny (y = a jeżeli x = 0) b - współczynnik kierunkowy funkcja rosnąca czy malejąca szybkość zmiany Do wyznaczenia parametrów strukturalnych funkcji wykorzystuje się metodę najmniejszych kwadratów. Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD indeterminacji Małgorzata Podogrodzka, SGH ISiD
Małgorzata Podogrodzka, SGH ISiD