Regresja. Termin regresja oznacza badanie wpływu jednej lub kilku zmiennych tzw. objaśniających na zmienną, której kształtowanie się najbardziej nas interesuje,

Slides:



Advertisements
Podobne prezentacje
Proces doboru próby. Badana populacja – (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje.
Advertisements

Ekonometria stosowana WYKŁAD 4 Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Rozliczanie kosztów działalności pomocniczej
Ekonometria stosowana Slajdy pomocnicze Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
STATYSTYKA MATEMATYCZNA wykład 1 - wprowadzenie Dr Aldona Migała-Warchoł.
Ekonometria stosowana Autokorelacja Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Niepewności pomiarowe. Pomiary fizyczne. Pomiar fizyczny polega na porównywaniu wielkości mierzonej z przyjętym wzorcem, czyli jednostką. Rodzaje pomiarów.
Ćwiczenia Zarządzanie Ryzykiem Renata Karkowska, ćwiczenia „Zarządzanie ryzykiem” 1.
Ekonometria Wykład 1 Uwarunkowania modelowania ekonometrycznego. Uogólniona metoda najmniejszych kwadratów dr hab. Mieczysław Kowerski.
Cel analizy statystycznej. „Człowiek –najlepsza inwestycja”
Ryzyko a stopa zwrotu. Standardowe narzędzia inwestowania Analiza fundamentalna – ocena kondycji i perspektyw rozwoju podmiotu emitującego papiery wartościowe.
Klasyczny model regresji liniowej (KMRL) Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa.
Bezpieczeństwo i zdrowie w pracy dotyczy każdego. Jest dobre dla ciebie. Dobre dla firmy. Partnerstwo dla prewencji Co badanie ESENER może nam powiedzieć.
Analiza wariancji (ANOVA) Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie.
Zmienne losowe Zmienne losowe oznacza się dużymi literami alfabetu łacińskiego, na przykład X, Y, Z. Natomiast wartości jakie one przyjmują odpowiednio.
… przemy ś lenia pedagogiczne. „Najważniejszym okresem w życiu nie są lata studiowania na wyższej uczelni, ale te najwcześniejsze, czyli okres od narodzenia.
Analiza tendencji centralnej „Człowiek – najlepsza inwestycja”
© Prof. Antoni Kozioł, Wydział Chemiczny Politechniki Wrocławskiej MATEMATYCZNE MODELOWANIE PROCESÓW BIOTECHNOLOGICZNYCH Prezentacja – 4 Matematyczne opracowywanie.
STATYSTYKA – kurs podstawowy wykład 10 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Metody Analizy Danych Doświadczalnych Wykład 9 ”Estymacja parametryczna”
Optymalna wielkość produkcji przedsiębiorstwa działającego w doskonałej konkurencji (analiza krótkookresowa) Przypomnijmy założenia modelu doskonałej.
Metoda zmiennych instrumentalnych i uogólniona metoda momentów
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Perceptrony proste nieliniowe i wielowarstwowe © Kazimierz Duzinkiewicz, dr hab.
Definiowanie i planowanie zadań typu P 1.  Planowanie zadań typu P  Zadania typu P to zadania unikalne służące zwykle dokonaniu jednorazowej, konkretnej.
Zmienna losowa dwuwymiarowa Dwuwymiarowy rozkład empiryczny Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych.
 Przedziałem otwartym ( a;b ) nazywamy zbiór liczb rzeczywistych x spełniających układ nierówności x a, co krócej zapisujemy a
Budżetowanie kapitałowe cz. III. NIEPEWNOŚĆ senesu lago NIEPEWNOŚĆ NIEMIERZALNA senesu strice RYZYKO (niepewność mierzalna)
O PARADOKSIE BRAESSA Zbigniew Świtalski Paweł Skałecki Wydział Matematyki, Informatyki i Ekonometrii Uniwersytet Zielonogórski Zakopane 2016.
STATYSTYKA OPISOWA WYKŁADY.
Test analizy wariancji dla wielu średnich – klasyfikacja pojedyncza
Kluczowe elementy skutecznej strategii analizy danych internetowych
wspomaganej systemem komputerowym NABÓR 2017
Katedra Międzynarodowych Studiów Porównawczych
DEFINICJA I ZASTOSOWANIE W JĘZYKU HASKELL
System wspomagania decyzji DSS do wyznaczania matematycznego modelu zmiennej nieobserwowalnej dr inż. Tomasz Janiczek.
terminologia, skale pomiarowe, przykłady
On-the-Fly Garbage Collection
MATEMATYCZNE MODELOWANIE PROCESÓW BIOTECHNOLOGICZNYCH
Przywiązanie partnerów a ich kompetencje społeczne
Modele SEM założenia formalne
Podstawy automatyki I Wykład /2016
Pojedyńczy element, mała grupa
Elementy fizyki kwantowej i budowy materii
Selekcja zmiennych w trybie zaawansowanym -
Ekonometria stosowana
Eksploracja Danych ____________________ Repetytorium ze statystyki
Selekcja zmiennych w trybie zaawansowanym -
Metody Eksploracji Danych (2)
Własności statystyczne regresji liniowej
Repetytorium z probabilistyki i statystyki cz.2
Weryfikacja hipotez statystycznych
wspomaganej systemem komputerowym NABÓR 2018
Porównywanie średnich prób o rozkładach normalnych (testy t-studenta)
Selekcja danych Analiza widmowa FFT.
FORMUŁOWANIE HIPOTEZ STATYSTYCZNYCH
Znajdowanie liczb pierwszych w zbiorze
REGRESJA WIELORAKA.
Wyrównanie sieci swobodnych
Analiza zależności pomiędzy zmiennymi losowymi (danymi empirycznymi)
ROZKŁADY STATYSTYCZNE ZMIENNYCH MIERZALNYCH
Statystyka i Demografia wykład 9
Prawa ruchu ośrodków ciągłych c. d.
EKONOMETRIA I PROGNOZOWANIE PROCESÓW EKONOMOICZNYCH
Program na dziś Wprowadzenie Logika prezentacji i artykułu
WYBRANE ZAGADNIENIA PROBABILISTYKI
Prognoza ryzyka ING w skali miesiąca Symulacja historyczna
Wybrane testy w MZI i UMM
Wiesław Niebudek 7 grudnia 2017r.
Własności asymptotyczne metody najmniejszych kwadratów
Zapis prezentacji:

Regresja

Termin regresja oznacza badanie wpływu jednej lub kilku zmiennych tzw. objaśniających na zmienną, której kształtowanie się najbardziej nas interesuje, a więc na zmienną objaśnianą. Metody regresji używane są zazwyczaj do opisu kształtowania się poziomu pewnego zjawiska w czasie, jak i na podstawie pobieranych z populacji generalnej prób losowych. Mówiąc o występowaniu zależności pomiędzy wieloma zmiennymi, regresję tego rodzaju nazywamy; wieloraką lub wielowymiarową.

Ogólnym celem regresji wielorakiej (termin ten został po raz pierwszy użyty przez Pearsona w 1908 roku) jest ilościowe ujęcie związków pomiędzy wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą). Analiza regresji polega na estymacji parametrów równania teoretycznego, które w sposób jak najbardziej dokładny odwzorowuje zależność, czego ilustracją jest wykreślenie wykresu wartości rzeczywistych i teoretycznych zmiennej objaśnianej. Podstawowe modele regresji zakładają występowanie zależności liniowych istniejących pomiędzy zmienną objaśnianą, a zmiennymi ją objaśniającymi.

W modelu regresji wielorakiej wyróżniamy zmienne: objaśniające (zwane też opisującymi lub niezależnymi) - zmienne te nie są wyjaśniane przez model, objaśniane (zwane opisywanymi lub zależnymi) - zmienne te są wyjaśniane przez model. W liniowym modelu regresji wielorakiej zmienne objaśniające powinny odznaczać się następującymi właściwościami: 1. powinny być silnie skorelowane ze zmienną objaśnianą, 2. powinny być słabo skorelowane między sobą, 3. powinny wykazywać odpowiednio dużą zmienność.

Proces doboru zmiennych można przedstawić w kilku etapach: 1.Na podstawie wiedzy merytorycznej ustala się listę potencjalnych zmiennych objaśniających. Na tym etapie lepiej jest zgromadzić wiele zmiennych, które będzie można eliminować w toku dalszej analizy. 2.Zbiera się dane statystyczne, będące realizacjami zmiennej objaśnianej i zmiennych objaśniających. 3.Eliminuje się zmienne objaśniające o zbyt niskim poziomie zmienności. 4.Oblicza się współczynniki korelacji między zmiennymi. 5.Przeprowadza się redukcję zbioru zmiennych za pomocą wybranej metody

Metoda Najmniejszych Kwadratów (MNK) Rozpatrując postać modelu regresji wielorakiej należy przyjąć, iż relacje pomiędzy zmiennymi mają charakter liniowy, a ich rozkłady mają kształt zbliżony do normalnego. Aby jednak mówić o dobrze skonstruowanym modelu regresji wielorakiej musi zostać spełnionych kilka ważnych warunków. Warunki te stawiane są zarówno zmiennym objaśniającym, jak i zmiennej objaśnianej. Najważniejszymi, wstępnymi warunkami poprawnej konstrukcji równania modelu są:

 Zmienne objaśniające muszą wykazywać związek ze zmienną, którą będą objaśniały.  Zmienne objaśniające powinny cechować się odpowiednim wskaźnikiem własnej zmienności.  Zmienne objaśniające nie mogą być współzależne. Znaczy to tyle, że ich wzajemne wskaźniki korelacji muszą wykazywać wartości mniejsze niż korelacji ze zmienną objaśnioną.  Ilość szacowanych parametrów (k + 1) równania nie może przekroczyć liczby okresów (T). Czyli zmiennych w modelu winno być mniej (lub taka sama ilość), co okresów, jakie uwzględniają - jeśli chodzi o modelowanie na podstawie szeregów czasowych.

Ogólna postać liniowego modelu regresji wielorakiej:

Na podstawie zebranych danych tworzymy następującą realizację

W postaci macierzowej : y – wektor zaobserwowanch wartości zmiennej objaśnianej X – macierz zaobserwowanych wartości zmiennych objaśniających, pierwsza kolumna dotyczy wyrazu wolnego β – wektor parametrów modelu e – składnik losowy

Oceny parametrów strukturalnych wyznacza się Metodą Najmniejszych Kwadratów (MNK), co polega na wyznaczeniu takich wartości parametrów strukturalnych, zwanych dalej estymatorami, dla których funkcja straty osiąga minimum. Postać estymatora MNK:

Podstawowym założeniem w MNK jest założenie o normalnym rozkładzie szeregu reszt. Reszta jest to różnica między rzeczywistą wartością zmiennej objaśnianej a jej wartością teoretyczną, oszacowaną na podstawie modelu. Reszta jest więc realizacją nieobserwowalnego składnika losowego e. Reszty obliczane są zgodnie ze wzorem: - wartości wyliczone na podstawie modelu

S YNTETYCZNE MIARY DOPASOWANIA Bardzo ważną częścią analizy regresji, po oszacowaniu ocen numerycznych parametrów modelu jest ocena zmienności zmiennej objaśnianej Y spowodowanej zmiennością zmiennych objaśniających X. Do oceny takiej służą syntetyczne miary dopasowania: wariancja resztowa, współczynnik zmienności losowej, nieskorygowane i skorygowane współczynniki determinacji i indeterminacji, współczynnik korelacji wielorakiej.

Wariancja resztowa obliczana jest zgodnie ze wzorem: średni błąd resztowy (odchylenie standardowe składnika resztowego):

Wariancja resztowa wykorzystywana jest do obliczania średnich błędów szacunku parametrów strukturalnych. Obliczane są one jako pierwiastki kwadratowe elementów znajdujących się na głównej przekątnej macierzy wariancji i kowariancji parametrów strukturalnych. Ma ona postać:

Nieskorygowany współczynnik determinacji określa jaka część rzeczywistej zmienności zmiennej objaśnianej jest wyjaśniona przez oszacowany model.

Nieskorygowany współczynnik indeterminacji określa jaka część rzeczywistej zmienności zmiennej objaśnianej nie jest wyjaśniona przez oszacowany model. Jeżeli w modelu występuje wyraz wolny wówczas oba współczynniki należą do przedziału [0, 1] a ponadto zachodzi:

Współczynnik korelacji wielorakiej:

BADANIE ISTOTNOŚCI PARAMETRÓW STRUKTURALNYCH Aby móc w sposób możliwie najbardziej wiarygodny wnioskować z oszacowanego równania modelu należy sprawdzić istotność statystyczną parametrów tego równania. Najbardziej popularne sprawdzanie wiarygodności statystycznej parametrów regresji liniowej, a mianowicie za pomocą statystyki t - Studenta opartej na rozkładzie t - Studenta.

Test t-Studenta Obliczamy statystykę następnie porównujemy otrzymaną wartość statystyki z wartością krytyczną odczytaną z rozkładu t-Studenta dla (T-k-1) stopni swobody i ustalonego poziomu istotności α.