Statystyczna analiza danych

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

KORELACJA I REGRESJA WIELOWYMIAROWA
BADANIE KORELACJI ZMIENNYCH
Analiza współzależności zjawisk
ISTOTA KORELACJI I REGRESJI
Metody analizy współzależności cech (zmiennych)
Podsumowanie wykładu 1. Najpełniejszą charakterystyką wybranej zmiennej jest jej rozkład.
Skale pomiarowe – BARDZO WAŻNE
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
BUDOWA MODELU EKONOMETRYCZNEGO
Elementy Modelowania Matematycznego
Jak mierzyć asymetrię zjawiska?
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Analiza współzależności
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyczne parametry akcji
Statystyka w doświadczalnictwie
BIOSTATYSTYKA I METODY DOKUMENTACJI
Mgr Sebastian Mucha Schemat doświadczenia:
Analiza korelacji.
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Korelacje, regresja liniowa
ANALIZA KORELACJI LINIOWEJ PEARSONA / REGRESJA LINIOWA
Analiza współzależności dwóch zjawisk
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Testy nieparametryczne
Konstrukcja, estymacja parametrów
Analiza współzależności cech statystycznych
Zadanka (wybór) bez kalkulatora i arkusza kalkulacyjnego dr Dariusz Chojecki, Instytut Historii i Stosunków Międzynarodowych US.
Współczynnik: Pearsona, Spearmana, Czuprowa
Rozkłady wywodzące się z rozkładu normalnego standardowego
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Statystyka – zadania 4 Janusz Górczyński.
Podstawy statystyki, cz. II
Statystyka - to „nie boli”
Planowanie badań i analiza wyników
Regresja wieloraka.
STATYSTYKA Pochodzenie nazwy:
Statystyczna analiza danych
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczne parametry akcji Średnie Miary rozproszenia Miary współzależności.
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna Analiza Danych SAD2 Wykład 4 i 5. Test dla proporcji (wskaźnika struktury) 2.
Statystyczna analiza danych SAD2 Wykład 5. Testy o różnicy wartości średnich dwóch rozkładów normalnych (znane wariancje) Statystyczna analiza danych.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
STATYSTYKA – kurs podstawowy wykład 11
Zmienna losowa dwuwymiarowa Dwuwymiarowy rozkład empiryczny Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych.
Treść dzisiejszego wykładu l Metoda Najmniejszych Kwadratów (MNK) l Współczynnik determinacji l Koincydencja l Kataliza l Współliniowość zmiennych.
Jak mierzyć zróżnicowanie zjawiska?
KORELACJA I REGRESJA WIELOWYMIAROWA
Małgorzata Podogrodzka, SGH ISiD
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
Analiza współzależności zjawisk
MIARY STATYSTYCZNE Warunki egzaminu.
Korelacja i regresja liniowa
statystyka podstawowe pojęcia
Zapis prezentacji:

Statystyczna analiza danych Wykład 5

Współzależność cech

Współzależność cech Jednostki populacji charakteryzowane są zazwyczaj przez więcej niż jedną cechę Cechy wzajemnie się warunkują, stąd potrzeba ich łącznego badania: rodzaj zależności między cechami?, ich siła?, kształt ? i kierunek ? Wyróżniamy dwa rodzaje zależności: Zależność funkcyjna: określonej wartości jednej zmiennej (X) odpowiada dokładnie jedna wartość drugiej zmiennej (Y), co zapisujemy symbolicznie Y = f(X)

Współzależność cech

Współzależność cech Prezentacje próbki cechy dwuwymiarowej: Wykres rozproszenia = wykres korelacyjny = diagram korelacyjny Tablica korelacyjna = tablica kontyngencyjna, w której na skrzyżowaniu kolumn z wierszami wpisywane są liczebności nij jednostek zbadanych, dla których pierwsza cecha wynosi xi a druga yj

Tablica korelacyjna (kontyngencyjna) dwu zmiennych (cech)

Współzależność cech Zamiast liczebności absolutnych nij można w tablicy korelacyjnej podawać częstości względne nij/n Z tablicy korelacyjnej wyznaczamy dwa rodzaje rozkładów: Rozkład brzegowy jednej zmiennej (X lub Y) - prezentuje strukturę wartości jednej zmiennej bez względu na wartości drugiej zmiennej: rozkład brzegowy X: (xi,ni), i =1,2,…,k rozkład brzegowy Y: (yj,nj), j =1,2,…,r

Niezależność cech

Niezależność cech

Współzależność cech Charakterystyki (wskaźniki) sumaryczne rozkładów brzegowych : średnia arytmetyczna i wariancja (odchylenie standardowe) średnie arytmetyczne rozkładów brzegowych:

Współzależność cech

Współzależność cech średnie arytmetyczne rozkładów warunkowych wariancje warunkowych rozkładów cechy X

Współzależność cech

Współzależność cech Wariancje rozkładów brzegowych cechy Y  

Współzależność cech

Współzależność cech

Współzależność cech Cecha X jest „stochastycznie” niezależna od cechy Y, jeśli spełnione są jednocześnie poniższe równości:

Współzależność cech Cecha Y jest „stochastycznie” niezależna od cechy X, jeśli spełnione są jednocześnie poniższe równości:

Współzależność cech Niezależność stochastyczna jest szczególnym przypadkiem niezależności korelacyjnej. Zmienna X jest korelacyjnie niezależna od zmiennej Y, jeśli średnie warunkowe zmiennej X są równe, tzn.

Współzależność cech Niezależność stochastyczna jest szczególnym przypadkiem niezależności korelacyjnej. Zmienna Y jest korelacyjnie niezależna od zmiennej X, jeśli średnie warunkowe zmiennej Y są równe, tzn.

Niezależność stochastyczna

Współzależność cech Opisowe miary siły korelacji dwóch zmiennych Natężenie (siłę) współzależności dwóch cech można wyrazić za pomocą wielu wskaźników (mierników, parametrów, charakterystyk) Wybór miernika zależy od rodzaju cech (mierzalne, niemierzalne, mieszane), kształtu zależności (regresja prostoliniowa, krzywoliniowa), liczby obserwacji (tablica korelacyjna, czy szereg korelacyjny)

Współzależność cech Podstawowe miary siły korelacji dwóch zmiennych Współczynnik zbieżności Czuprowa Stosunki (wskaźniki) korelacyjne Pearsona Współczynnik korelacji liniowej Pearsona Współczynnik korelacji rang (kolejnościowej) Spearmana

Współzależność cech Podstawowe miary siły korelacji dwóch zmiennych Współczynnik zbieżności Czuprowa – miara zależności stochastycznej

Współzależność cech Własności współczynnika zbieżności Czuprowa Im współczynnik T bliższy 0 tym zależność między zmiennymi słabsza

Współzależność cech Stosunki (wskaźniki) korelacyjne Pearsona Konstrukcja oparta na własności wariancji: Wariancje międzygrupowe: Średnie wariancji wewnątrzgrupowych:

Współzależność cech Stosunek (wskaźnik) korelacyjny Pearsona zmiennej Y względem zmiennej X zmiennej X względem zmiennej Y

Własności stosunków korelacyjnych e Współzależność cech Własności stosunków korelacyjnych e Miary niemianowane o wartościach w przedziale [0,1] e = 0 dla cech nieskorelowanych e =1 dla cech o zależności funkcyjnej Im wartość e bliższa jedności tym zależność korelacyjna silniejsza Stosunki korelacyjne nie są miarami symetrycznymi Nie wskazują kierunku korelacji (zawsze nieujemne)

Własności stosunków korelacyjnych e Współzależność cech Własności stosunków korelacyjnych e Współczynnik korelacji liniowej Pearsona jest z reguły mniejszy od stosunków korelacyjnych: Stopień krzywoliniowości regresji Y względem X oraz X względem Y wskazują:

Współzależność cech

Współzależność cech

Współczynnik korelacji rang Spearmana Współzależność cech Współczynnik korelacji rang Spearmana Opisuje siłę korelacji dwóch cech jakościowych, które można uporządkować gdzie różnica między rangami odpowiadających sobie wartości cechy X i Y dla i-tej jednostki zbadanej Interpretacja taka jak współczynnika korelacji

Współzależność cech

Współzależność cech