Wykład 16 Inne zagadnienia z prostej regresji liniowej.

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Excel Narzędzia do analizy regresji
ESTYMACJA PRZEDZIAŁOWA
Funkcje tworzące są wygodnym narzędziem przy badaniu zmiennych losowych o wartościach całkowitych nieujemnych. Funkcje tworzące pierwszy raz badał de.
Estymacja. Przedziały ufności.
Wykład 5 Standardowy błąd a odchylenie standardowe
Wykład 13 Estymacja wartości oczekiwanej zmiennej zależnej.
Wykład 11 Przykład z muszkami (krzyżówka wsteczna CcNn z ccnn)
Ile rozwiązań może mieć układ równań?
Rachunek prawdopodobieństwa 2
Zmienne losowe i ich rozkłady
BUDOWA MODELU EKONOMETRYCZNEGO
Badania operacyjne. Wykład 2
Elementy Modelowania Matematycznego
Estymacja przedziałowa
Metody wnioskowania na podstawie podprób
WYKŁAD 3. Kliki i zbiory niezależne
Statystyka w doświadczalnictwie
Podstawowe pojęcia prognozowania i symulacji na podstawie modeli ekonometrycznych Przewidywaniem nazywać będziemy wnioskowanie o zdarzeniach nieznanych.
Uogólniony model liniowy
Analiza korelacji.
Wykład 7 Przedział ufności dla 1 – 2
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Wykład 4 Przedziały ufności
Prognozowanie na podstawie modelu ekonometrycznego
Metody Przetwarzania Danych Meteorologicznych Wykład 4
Linear Methods of Classification
ANALIZA KORELACJI LINIOWEJ PEARSONA / REGRESJA LINIOWA
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Analiza wariancji.
Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych
Metody ilościowe w biznesie Wykład 1
MECHANIKA NIEBA WYKŁAD r.
Podstawy programowania
i jak odczytywać prognozę?
Ekonometria. Co wynika z podejścia stochastycznego?
Rozkłady wywodzące się z rozkładu normalnego standardowego
1 Kilka wybranych uzupełnień do zagadnień regresji Janusz Górczyński.
Wykład 2. Pojęcie regularnego odwzorowania powierzchni w powierzchnię i odwzorowania kartograficznego Wykład 2. Pojęcie regularnego odwzorowania powierzchni.
Hipotezy statystyczne
II. Matematyczne podstawy MK
Kilka wybranych uzupelnień
Działania na zbiorach ©M.
Planowanie badań i analiza wyników
Testowanie hipotez statystycznych
FUNKCJE Pojęcie funkcji
Ekonometryczne modele nieliniowe
Wnioskowanie statystyczne
Zagadnienia AI wykład 2.
Wykład 5 Przedziały ufności
Rozkład wariancji z próby (rozkład  2 ) Pobieramy próbę x 1,x 2,...,x n z rozkładu normalnego o a=0 i  =1. Dystrybuanta rozkładu zmiennej x 2 =x 1 2.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Figury płaskie.
Rozkład z próby Jacek Szanduła.
Czworokąty i ich własności
CZWOROKĄTY i ich własności
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Zapis prezentacji:

Wykład 16 Inne zagadnienia z prostej regresji liniowej

Łączna estymacja β0 i β1 Dla jednego parametru konstruujemy przedziały ufności, dla kilku obszary ufności Obszar ufności dla (β0, β1) określa zbiór prostych regresji (patrz ``pasmo’’ ufności dla prostej regresji). Ponieważ wektor (b0 , b1) ma rozkład dwuwymiarowy normalny, naturalnym obszarem ufności jest elipsa. My nauczymy się jak skonstruować prostokątny obszar ufności.

Korekta Bonferroniego Chcemy aby prawdopodobieństwo, że oba przedziały pokrywają odpowiednie parametry było co najmniej .95 Nasz ``zapas błędu’’ wynosi więc (α =.05) Połowę zużywamy na β0 (.025) a połowę na β1 (.025) Konstruujemy 97.5% PU dla β0 i 97.5% PU dla β1

Korekta Bonferoniego (2) b1 ± tcs(b1) b0 ± tcs(b0) gdzie tc = t(.0125, n-2) .0125 = (.05)/(2*2)

Nierówność Bonferroniego Niech A oznacza zdarzenie, że przedział dla β0 pokrywa β0 a B niech oznacza zdarzenie, że przedział dla β1 pokrywa β1 A’ i B’ oznaczają dopełnienia zdarzeń A i B Chcemy aby P(A i B) ≥ 0.95.

Nierówność Bonferoniego (2) P(A i B)=1-P(A’ lub B’) P(A’ lub B’) = P(A’)+ P(B’)-P(A’ i B’) ≤ P(A’)+P(B’) Tak więc P(A i B) ≥ 1 – (P(A’)+P(B’))

Nierówność Bonferroniego (3) P(A i B) ≥ 1-(P(A’)+ P(B’)) Tak więc jeżeli P(A’)=P(B’)= 05/2, wtedy 1-(P(A’)+ P(B’)) = 1 – .05 =.95 Tak więc P(A i B) ≥ 0 .95

.025 .025 <.025 .025

Przedziały ufności dla wartości oczekiwanej Y Równoczesna estymacja dla wszystkich Xh, stosujemy ``pasmo’’ ufności Workinga-Hotellinga ± Ws( ) gdzie W2=2F(α; 2, n-2) Gdy estymujemy tylko w kilku (g) punktach, można stosować korektę Bonferroniego ± Bs( ) gdzie B=t(α/(2g), n-2)

data a1; alpha= 0.05;n=50; W2=2*finv(1-alpha,2,n-2); W=sqrt(W2); do g=1 to 15 by 1; B=tinv(1-alpha/2/g,n-2); output; end; proc print data=a1; run;

Obs alpha n g W2 W B 1 0.05 50 1 6.38145 2.52615 2.01063 2 0.05 50 2 6.38145 2.52615 2.31390 3 0.05 50 3 6.38145 2.52615 2.48078 4 0.05 50 4 6.38145 2.52615 2.59532

Obs alpha n g W2 W B 1 0.05 20 1 7.10911 2.66629 2.10092 2 0.05 20 2 7.10911 2.66629 2.44501 3 0.05 20 3 7.10911 2.66629 2.63914 4 0.05 20 4 7.10911 2.66629 2.77453

Równoczesne przedziały predykcyjne Równoczesna predykcja dla kilku (g) punktów Xh, Można stosować korektę Bonferroniego ± Bs(pred) gdzie B=t(α/(2g), n-2)

Regresja przez początek układu współrzędnych Yi = β1Xi + ξi Opcja NOINT w PROC REG Ogólnie niezbyt dobry pomysł Problemy z R2 i innymi statystykami

Błędy pomiarów Błędy pomiarów dla Y na ogół nie stanowią problemu (wliczają się w zakłócenie losowe), Błędy pomiarów dla X mogą powodować obciążenie estymatora nachylenia

Wybór wartości X W mianownikach wzorów na wariancję większości estymatorów występuje Σ(Xi – )2 Tak, więc staramy się możliwie ``rozrzucić’’ wartości X

Model w formie n równań Yi = β0 + β1Xi + ξi ξi są niezależnymi zmiennymi losowymi z rozkładu normalnego o wartości oczekiwanej 0 i wariancji σ2

Model w postaci macierzowej

Model w postaci macierzowej (2)

Macierz eksperymentu

Wektor parametrów

Losowy wektor zakłóceń

Losowy wektor zmiennej zależnej

Model w postaci macierzowej Y = Xβ + ξ Y = X β + ξ nx1 nx2 2x1 nx1

Macierz kowariancji

Macierz kowariancji dla wektora ξ

Macierz kowariancji dla Y

Założenia w postaci macierzowej (rozkład wielowymiarowy normalny)

Równania normalne w postaci macierzowej XY = (XX)β Estymator najmniejszych kwadratów b = (b0, b1) gdzie b = (XX)–1(XY) Te same wzory są prawdziwe w przypadku regresji wielorakiej (więcej zmiennych objaśniających).

Wartości przewidywane

Macierz H

Użyteczne twierdzenie U ~ N(μ, Σ), wektor wielowymiarowy normalny V = c + DU, liniowe przekształcenie U c jest wektorem, D jest macierzą V ~ N(c+Dμ, DΣD)

Zastosowanie do wektora b b = (XX)–1(XY) = ((XX)–1X)(Y) Y ~ N(Xβ, σ2I) So b ~ N( (XX)–1X(Xβ), σ2 ((XX)–1X) I ((XX)–1X) b ~ N(β, σ2 (XX)–1)