Analiza współzależności zjawisk

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Test zgodności c2.
BADANIE KORELACJI ZMIENNYCH
PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
Rangowy test zgodności rozkładów
Analiza współzależności zjawisk
ISTOTA KORELACJI I REGRESJI
Metody analizy współzależności cech (zmiennych)
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
BUDOWA MODELU EKONOMETRYCZNEGO
Badania operacyjne. Wykład 1
Elementy Modelowania Matematycznego
Test zgodności Joanna Tomanek i Piotr Nowak.
Jak mierzyć asymetrię zjawiska?
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Analiza współzależności
Analiza współzależności
Statystyka w doświadczalnictwie
Statystyka w doświadczalnictwie
Analiza korelacji.
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Analiza współzależności dwóch zjawisk
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Korelacja, autokorelacja, kowariancja, trendy
Hipotezy statystyczne
Testy nieparametryczne
Testowanie hipotez statystycznych
Analiza współzależności cech statystycznych
Testy nieparametryczne
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Analiza wariancji jednoczynnikowa.
Testy nieparametryczne
Modelowanie ekonometryczne
Hipotezy statystyczne
Korelacja rang.
Kilka wybranych uzupelnień
Metody badawcze wykorzystywane w analizach – ĆW 2
Podstawy statystyki, cz. II
Planowanie badań i analiza wyników
Regresja wieloraka.
Testowanie hipotez statystycznych
Metody analizy współzależności dwóch cech Mieczysław Kowerski
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Narzędzia.
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Korelacje dwóch zmiennych. Korelacje Kowariancja.
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Grupowanie danych statystycznych „ Człowiek – najlepsza inwestycja”
STATYSTYKA – kurs podstawowy wykład 13 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Treść dzisiejszego wykładu l Szeregi stacjonarne, l Zintegrowanie szeregu, l Kointegracja szeregów.
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
STATYSTYKA – kurs podstawowy wykład 11
Zmienna losowa dwuwymiarowa Dwuwymiarowy rozkład empiryczny Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych.
Wnioskowanie statystyczne. Próbkowanie (sampling)
Testy nieparametryczne
Pojedyńczy element, mała grupa
Jednorównaniowy model regresji liniowej
Korelacja i regresja liniowa
Zapis prezentacji:

Analiza współzależności zjawisk

Analiza współzależności Punktem wyjścia do badania współzależności cech są dane, w których dla każdej jednostki statystycznej określono wartości dwóch cech: X i Y. Mamy więc zbiór n jednostek i przyporządkowane im pary cech (xi, yi), i = 1, 2, ... n.

Szereg szczegółowy dla dwóch obserwowanych cech

Tablica korelacyjna

Przykład

Zależność – ilość osób y od ilości metrów x

Dane pogrupowane w tablicy korelacyjnej

Współzależność występująca między cechami może być dwojakiego rodzaju: funkcyjna (dokładna) stochastyczna (probabilistyczna). Szczególnym przypadkiem zależności stochastycznej jest zależność korelacyjna (statystyczna).

Współzależność funkcyjna Polega na tym, że zmiana wartości jednej zmiennej powoduje ściśle określoną zmianę wartości drugiej zmiennej. Określonej wartości jednej zmiennej X odpowiada jedna i tylko jedna i tylko jedna wartość drugiej zmiennej Y.

Tablica korelacyjna W tablicy korelacyjnej zawarte są dwa rodzaje rozkładów: brzegowe i warunkowe. Rozkład brzegowy prezentuje strukturę wartości jednej zmiennej (X lub Y) bez względu na kształtowanie się wartości drugiej zmiennej. Rozkład brzegowy zmiennej X tworzy pierwsza i ostatnia kolumna tablicy, natomiast rozkład brzegowy zmiennej Y - pierwszy i ostatni wiersz.

Rozkład brzegowy zmiennej X - powierzchnia użytkowa mieszkań (m2)

Rozkład brzegowy zmiennej Y - liczba mieszkańców

Cechy mierzalne 1. Kowariancja dla szeregu szczegółowego

dla szeregu w tablicy korelacyjnej

Kowariancja Jest to: miara symetryczna; przyjmuje wartości z przedziału <‑SxSy, SxSy>; informuje o kierunku korelacji między zmiennymi.

Współczynnik korelacji liniowej Pearsona: Jest to: miara symetryczna; przyjmuje wartości z przedziału <‑1,1>; informuje o sile oraz kierunku korelacji liniowej między zmiennymi.

Testowanie współczynnika korelacji

Kierunek zależności rxy= 0 świadczy o braku korelacji liniowej między badanymi cechami (możliwe, że istnieje między nimi korelacja krzywoliniowa!), rxy> 0 informuje nas, że mamy do czynienia z korelacją dodatnią (wraz ze wzrostem wartości jednej cechy wzrasta średnia warunkowa drugiej), rxy< 0 korelacja jest ujemna (wzrostowi wartości jednej cechy towarzyszy spadek średniej warunkowej drugiej). przy rxy= 1 lub -1 mamy liniową zależność funkcyjną.

W analizach statystycznych zwykle przyjmuje się, że jeżeli rxy wynosi: mniej niż 0,2 - praktycznie brak związku liniowego między badanymi cechami, może występować korelacja krzywoliniowa; <0,2-0,4) - zależność liniowa wyraźna, lecz niska; <0,4-0,7) - zależność umiarkowana; <0,7-0,9) - zależność znacząca; <0,9-1> zależność bardzo silna.

3. Współczynnik korelacji kolejnościowej (rang) Spearmana Rxy miara korelacji, wygodna i użyteczna dla niezbyt długich szeregów szczegółowych z dwoma cechami mierzalnymi (lub przynajmniej posiadającymi pewien naturalny porządek pozwalający na ustawienie wartości rosnąco lub malejąco) . Wartość Rxy należy do przedziału <-1,1> i mówi o sile oraz kierunku korelacji.

Współczynnik rang Spearmana Rxy gdzie di są różnicami między kolejnymi numerami (rangami) nadawanymi w kolejności niemalejącej (lub nierosnącej) osobno dla każdej cechy od 1 do n. Jeżeli kilka elementów w szeregu ma taką samą wartość jednej cechy, to nadaje im się rangi będące średnią arytmetyczną przypadających na te elementy rang.

Test niezależności chi-kwadrat Stawiamy hipotezę zerową o braku zależności między cechami, hipotezą alternatywną jest istnienie zależności miedzy cechami. Cechy mogą być zarówno mierzalne lub niemierzalne. Tworzymy tablicę korelacyjną. Na podstawie tej tablicy obliczamy wartość statystyki:

Statystyka ta ma rozkład chi-kwadrat o (k-1)(l-1) stopniach swobody Statystyka ta ma rozkład chi-kwadrat o (k-1)(l-1) stopniach swobody. Dla ustalonego alfa tworzymy obszar krytyczny

Współczynnik zbieżności V Cramera

Przykład:W 600-osobowej losowo dobranej grupie ludzi przeprowadzono badanie ankietowe mające na celu uzyskanie odpowiedzi na pytanie: „Czy istnieje zależność między wykształceniem telewidzów a rodzajem programu, który najchętniej oglądają?” Otrzymane dane przedstawiono w empirycznej tablicy korelacyjnej:

Wartość statystyki χ2=12,59 Hipotezę o braku zależności odrzucamy na rzecz hipotezy alternatywnej Współczynnik zbieżności Cramera: