Korelacja i regresja liniowa

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Badania statystyczne Wykłady 1-2 © Leszek Smolarek.
Excel Narzędzia do analizy regresji
KORELACJA I REGRESJA WIELOWYMIAROWA
Analiza współzależności zjawisk
BUDOWA MODELU EKONOMETRYCZNEGO
Elementy Modelowania Matematycznego
Jak mierzyć asymetrię zjawiska?
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
Analiza współzależności
Dane dotyczące sprzedaży wody mineralnej
Analiza współzależności
Wartość empiryczna (obserwowana) zmiennej
1 Dane dotyczące sprzedaży wody mineralnej Tygodnie Ilość sprzedanej wody mineralnej Y (litrów) Cena jednego litra X (płn.) 1101,3 262,0 351,7 4121,5 5101,6.
Ekonometria prognozowanie.
Metody ekonometryczne
Statystyka w doświadczalnictwie
Dzisiaj na wykładzie Regresja wieloraka – podstawy i założenia
Mgr Sebastian Mucha Schemat doświadczenia:
Analiza korelacji.
Wykład 14 Liniowa regresja
Korelacje, regresja liniowa
ANALIZA KORELACJI LINIOWEJ PEARSONA / REGRESJA LINIOWA
Analiza współzależności dwóch zjawisk
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Korelacja, autokorelacja, kowariancja, trendy
Metoda najmniejszych kwadratów dla jednej zmiennej objaśniającej
Testowanie hipotez statystycznych
Analiza współzależności cech statystycznych
dr hab. Ryszard Walkowiak prof. nadzw.
i jak odczytywać prognozę?
Jak mierzyć i od czego zależy?
Ekonometria. Co wynika z podejścia stochastycznego?
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Prognozowanie z wykorzystaniem modeli ekonometrycznych
Modelowanie ekonometryczne
Badania Operacyjne i Ekonometria. Literatura podstawowa 1.M.Anholcer, H.Gaspars, A.Owczrkowski Przykłady i zadania z badań operacyjnych i ekonometrii.
Zagadnienia regresji i korelacji
Planowanie badań i analiza wyników
Regresja wieloraka.
Konwergencja gospodarcza
Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów
Statystyka medyczna Piotr Kozłowski
D. Ciołek EKONOMETRIA – wykład 3
Analiza wariancji ANOVA czynnikowa ANOVA
Ekonometria Metody estymacji parametrów strukturalnych modelu i ich interpretacja dr hab. Mieczysław Kowerski.
Regresja liniowa. Dlaczego regresja? Regresja zastosowanie Dopasowanie modelu do danych Na podstawie modelu, przewidujemy wartość zmiennej zależnej na.
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Model ekonometryczny Jacek Szanduła.
Korelacje dwóch zmiennych. Korelacje Kowariancja.
STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Treść dzisiejszego wykładu l Metoda Najmniejszych Kwadratów (MNK) l Współczynnik determinacji l Koincydencja l Kataliza l Współliniowość zmiennych.
Statystyka Powtorzenie
„Gospodarka i Społeczeństwo”   Zielone miejsca pracy w krajach Unii Europejskiej – studium empiryczne z zastosowaniem analizy regresji Barbara.
Wstęp do regresji logistycznej
Jak mierzyć zróżnicowanie zjawiska?
Małgorzata Podogrodzka, SGH ISiD
Statystyka matematyczna
Regresja wieloraka – służy do ilościowego ujęcia związków między wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą) Regresja.
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
MNK – podejście algebraiczne
Analiza współzależności zjawisk
MIARY STATYSTYCZNE Warunki egzaminu.
Analiza kanoniczna - stanowi uogólnienie liniowej regresji wielorakiej na dwa zbiory zmiennych tzn. dla zmiennych zależnych i niezależnych. Pozwala badać.
Zapis prezentacji:

Korelacja i regresja liniowa mgr Anna Sobieraj

Analiza korelacji Współczynnik korelacji liniowej Pearson’a To NIE JEST badanie związku przyczynowo-skutkowego, Badanie współwystępowania (zależności) cech gdy związek badanych cech jest liniowy Określa kierunek i siłę zależności -1 ≤ r ≤ 1 covX,Y – kowariancja cech X i Y (miara łącznego zróżnicowania obu cech) Sx – odchylenie standardowe cechy X Sy – odchylenie standardowe cechy Y

Analiza korelacji liniowej Kwartet Anscombe’a Współczynnik korelacji na każdym wykresie wynosi 0.816

Modele liniowe Jedna z najstarszych i najpopularniejszych metod modelowania Zależność między zbiorem zmiennych objaśniających, a zmienną ilościową nazywaną zmienną objaśnianą Zmienne są mierzone na skali ilościowej Cel modelowania: Punktowe lub przedziałowe szacowanie wartości cechy objaśnianej na podstawie zmiennych objaśniających Zrozumienie zależności między obserwowanymi zmiennymi Które zmienne objaśniające, i w jaki sposób, są zależne od zmiennej objaśnianej?

Analiza regresji Regresją nazywamy funkcję, w której wartość cechy zależnej, objaśnianej (y) wyrażona jest za pomocą wartości cech niezależnych, objaśniających (x) Funkcja liniowa: Gdzie: byx – współczynnik regresji (w terminologii matematycznej: współczynnik kierunkowy prostej) ayx – wyraz wolny funkcji regresji (punkt przecięcia linii prostej z osią Y)

Współczynnik regresji prostej Stała regresji (wyraz wolny funkcji) Interpretacja: o ile zmieni się wartość zmiennej zależnej (Y) jeżeli wartość zmiennej niezależnej (X) zmieni się o jednostkę. b>0 – wzrost zmiennej X → wzrost zmiennej Y b<0 – wzrost wartości zmiennej X → spadek wartości zmiennej Y Punkt przecięcia linii prostej z osią Y Nie interpretujemy

Metoda najmniejszych kwadratów Metoda najmniejszych kwadratów – minimalizowana jest suma reszt czyli kwadratów odchyleń wartości rzeczywistych (Y) od wartości szacowanych cechy (Ŷ) Reszta (e) – różnica między wartością obserwowaną, a szacowaną

Regresja liniowa Predykcja Wartość obserwowana cechy Y Średnia

Regresja liniowa Założenia i ocena dopasowania liniowej funkcji regresji Zależność jest liniowa Brak znaczących obserwacji odstających Homoscedastyczność – wariancja reszt, składnika losowego jest taka sama dla wszystkich obserwacji Reszty mają rozkład zbliżony do rozkładu normalnego

Założenia modelu Zależność jest liniowa Żródło: https://statistics.laerd.com/spss-tutorials/linear-regression-using-spss-statistics.php Sposób weryfikacji: Inspekcja wykresów punktowych, estymacja krzywej Jeżeli założenie nie jest spełnione: transformacja zmiennej zależnej dopasować model nieliniowy

Założenia modelu Brak znaczących obserwacji odstających Sposób weryfikacji: Inspekcja wykresów punktowych, statystyka opisowa Żródło: https://statistics.laerd.com/spss-tutorials/linear-regression-using-spss-statistics.php

Korelacja– SPSS Wykresy >>> Wykresy tradycyjne >>> Rozrzut punktowy >>> Prosty Analiza >>> Korelacje >>> Parami >>> Pearson’a

Analiza korelacji liniowej

Kroki analizy regresji – SPSS Analiza >>> Regresja >>> Liniowa

Kroki analizy regresji – SPSS Czy stworzony model wyjaśnia więcej zmienności niż średnia arytmetyczna? Czy model jest istotny? H0:Funkcja regresji jest nieistotna P – value < 0,05 – model jest dobrze dopasowany, wyjaśnia więcej zmienności zmiennej niż średnia arytmetyczna

Kroki analizy regresji – SPSS Czy współczynniki modelu są istotne, różne od 0? H0: Współczynnik jest nieistotny H0: Bconst. = 0 H0: BZ = 0 Y = 0,789X -0,007

Kroki analizy regresji – SPSS Model podsumowanie – współczynnik determinacji Model wyjaśnia 67,5% zmienności cechy objaśnianej

Ocena dopasowania modelu SST = SSR + SSE SST – Suma kwadratów odchyleń całkowitych SSE – suma kwadratów odchyleń nie wyjaśnionych regresją (reszt) SSR – suma kwadratów odchyleń wyjaśnionych regresją Współczynnik determinacji

Założenia modelu Reszty Rozkład zakłócenia losowego przekłada się na spodziewany rozkład reszt Weryfikujemy: Normalność rozkładu reszt – zgodność z rozkładem normalnym Homoscedastyczność – jednorodność wariancji Analiza jakości dopasowania modelu oraz jego diagnostyka opiera się na analizie reszt

Założenia modelu Reszty Normalność reszt – diagnostyka Histogram oraz wykres kwantyl-kwantyl Testy statystyczne (np. Shapiro-Wilka)

Normalność reszt Asymetria lewostronna Asymetria prawostronna

Możliwości ekstrapolacji Model regresji nie powinien być ekstrapolowany na dane spoza zakresu na których został opracowany! https://www.pinterest.com/pin/18929260905651518/

Czy zależność na pewno jest liniowa?

Estymacja krzywej Analiza >>> Regresja >>> Estymacja krzywej

Który model jest lepszy? Model liniowy wyjaśnia 75,1% zmienności Wprowadzenie elementu krzywoliniowego - model wyjaśnia 86% zmienności Mniejszy błąd standardowy oszacowania Zmiana istotna statystycznie

Reszty Należy sprawdzić rozkład reszt z obu modeli Czy średnia wartość reszt jest większa w modelu liniowym czy krzywoliniowym? Mniejsza średnia z reszt – lepszy model