STATYSTYKA – kurs podstawowy wykład 11

Slides:

Advertisements

Podobne prezentacje

Regresja i korelacja materiały dydaktyczne.

Advertisements

Excel Narzędzia do analizy regresji

KORELACJA I REGRESJA WIELOWYMIAROWA

Ocena dokładności i trafności prognoz

Analiza współzależności zjawisk

BUDOWA MODELU EKONOMETRYCZNEGO

Regresja w EXCELU.

Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.

Analiza współzależności

Dane dotyczące sprzedaży wody mineralnej

Analiza współzależności

Wartość empiryczna (obserwowana) zmiennej

Podstawowe pojęcia prognozowania i symulacji na podstawie modeli ekonometrycznych Przewidywaniem nazywać będziemy wnioskowanie o zdarzeniach nieznanych.

Jakość sieci geodezyjnych. Pomiary wykonane z największą starannością, nie dostarczają nam prawdziwej wartości mierzonej wielkości, lecz są zwykle obarczone.

Analiza korelacji.

Niepewności przypadkowe

Wykład 14 Liniowa regresja

Wprowadzenie do statystycznej analizy danych (SPSS)

Korelacje, regresja liniowa

Analiza współzależności dwóch zjawisk

Wykład 4. Rozkłady teoretyczne

Średnie i miary zmienności

Metoda najmniejszych kwadratów dla jednej zmiennej objaśniającej

Analiza współzależności cech statystycznych

i jak odczytywać prognozę?

Ekonometria. Co wynika z podejścia stochastycznego?

Rozkłady wywodzące się z rozkładu normalnego standardowego

Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2

Badania Operacyjne i Ekonometria. Literatura podstawowa 1.M.Anholcer, H.Gaspars, A.Owczrkowski Przykłady i zadania z badań operacyjnych i ekonometrii.

Statystyka – zadania 4 Janusz Górczyński.

1 Kilka wybranych uzupełnień do zagadnień regresji Janusz Górczyński.

Zagadnienia regresji i korelacji

Finanse 2009/2010 dr Grzegorz Szafrański pokój B106 Termin konsultacji poniedziałek:

Metody badawcze wykorzystywane w analizach – ĆW 2

Błędy i niepewności pomiarowe II

Planowanie badań i analiza wyników

Regresja wieloraka.

Seminarium licencjackie Beata Kapuścińska

Przedmiot: Ekonometria Temat: Szeregi czasowe. Dekompozycja szeregów

Ekonometryczne modele nieliniowe

Wnioskowanie statystyczne

D. Ciołek EKONOMETRIA – wykład 6

D. Ciołek EKONOMETRIA – wykład 3

Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.

Regresja liniowa. Dlaczego regresja? Regresja zastosowanie Dopasowanie modelu do danych Na podstawie modelu, przewidujemy wartość zmiennej zależnej na.

Statystyczna analiza danych

Model ekonometryczny Jacek Szanduła.

Model trendu liniowego

STATYSTYKA – kurs podstawowy wykład 9 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Treść dzisiejszego wykładu l Weryfikacja statystyczna modelu ekonometrycznego –błędy szacunku parametrów, –istotność zmiennych objaśniających, –autokorelacja,

STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

ze statystyki opisowej

Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.

STATYSTYKA – kurs podstawowy wykład 13 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

STATYSTYKA – kurs podstawowy wykład 10 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Treść dzisiejszego wykładu l Szeregi stacjonarne, l Zintegrowanie szeregu, l Kointegracja szeregów.

STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Modele nieliniowe sprowadzane do liniowych

Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.

Treść dzisiejszego wykładu l Metoda Najmniejszych Kwadratów (MNK) l Współczynnik determinacji l Koincydencja l Kataliza l Współliniowość zmiennych.

Jak mierzyć zróżnicowanie zjawiska?

Statystyka matematyczna

Statystyka matematyczna

Regresja wieloraka – służy do ilościowego ujęcia związków między wieloma zmiennymi niezależnymi (objaśniającymi) a zmienną zależną (objaśnianą) Regresja.

Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)

Jednorównaniowy model regresji liniowej

Model ekonometryczny z dwiema zmiennymi

MNK – podejście algebraiczne

MIARY STATYSTYCZNE Warunki egzaminu.

Korelacja i regresja liniowa

Zapis prezentacji:

STATYSTYKA – kurs podstawowy wykład 11 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii

KLASYCZNY MODEL REGRESJI LINIOWEJ Empiryczna krzywa regresji wyznaczana na podstawie dwuwymiarowego rozkładu empirycznego (z próby) jest przybliżeniem nieznanej krzywej regresji I rodzaju Krzywa regresji I rodzaju – funkcja przypisująca wartościom zmiennej losowej niezależnej X średnie warunkowe zmiennej losowej zależnej Y Regresja II rodzaju – przybliżenie za pomocą funkcji matematycznej związku występującego między cechami statystycznymi

KLASYCZNY MODEL REGRESJI LINIOWEJ [0,051] [1,83] [1,533]

Dokładność dopasowania

DOKŁADNOŚĆ DOPASOWANIA PROSTEJ REGRESJI DO DANYCH EMPIRYCZNYCH Wariant I Wariant II W obu wariantach mamy te same całkowite zakresy zmienności cechy Y Ale reszty są dużo większe w wariancie I  SI(e) > SII(e)

DOKŁADNOŚĆ DOPASOWANIA PROSTEJ REGRESJI DO DANYCH EMPIRYCZNYCH Wariant I Wariant II Porównywanie odchyleń standardowych reszt SI(e) oraz SII(e) jest uprawnione tylko wtedy, gdy zakres zmienności cechy Y jest w obu przypadkach taki sam Zwykle tak się nie zdarza i co robić w takich przypadkach?

DOKŁADNOŚĆ DOPASOWANIA PROSTEJ REGRESJI DO DANYCH EMPIRYCZNYCH Podział całkowitego odchylenia yi od średniej na dwa składniki Odchylenie nie wyjaśnione regresją (reszta ei = ) Odchylenie całkowite Odchylenie wyjaśnione regresją

DOKŁADNOŚĆ DOPASOWANIA PROSTEJ REGRESJI DO DANYCH EMPIRYCZNYCH Analogiczna równość zachodzi także dla sum kwadratów odpowiednich odchyleń Część całkowitego odchylenia yi od średniej , która została wyjaśniona regresją Y względem X; Całkowite odchylenie yi od średniej Część całkowitego odchylenia yi od średniej , która nie została wyjaśniona regresją Y względem X; jest to zatem reszta ei

DOKŁADNOŚĆ DOPASOWANIA PROSTEJ REGRESJI DO DANYCH EMPIRYCZNYCH Całkowita suma kwadratów odchyleń zaobserwowanych wartości zmiennej Y od ich średniej = całkowite zróżnicowanie wartości zmiennej Y Suma kwadratów odchyleń wyjaśnionych regresją Y względem X; Suma kwadratów odchyleń nie wyjaśnionych regresją Y względem X

DOKŁADNOŚĆ DOPASOWANIA PROSTEJ REGRESJI DO DANYCH EMPIRYCZNYCH Miarą dokładności dopasowania prostej regresji do danych empirycznych jest WSPÓŁCZYNNIK DETERMINACJI R2 Suma kwadratów odchyleń wyjaśnionych regresją Y względem X Suma kwadratów odchyleń nie wyjaśnionych regresją Y względem X <0; 1> Informuje, jaka część obserwowanej w próbie zmienności cechy Y została wyjaśniona regresją liniową Y względem X Całkowita suma kwadratów odchyleń zaobserwowanych wartości zmiennej Y od ich średniej

WSPÓŁCZYNNIK DETERMINACJI <0; 1> WSPÓŁCZYNNIK DETERMINACJI 1 – doskonałe dopasowanie: jeśli między zmiennymi zachodzi funkcyjna zależność liniowa i wszystkie punkty empiryczne leżą na prostej regresji = wszystkie reszty są równe 0 0 – znajomość zróżnicowania wartości cechy niezależnej X nie dostarcza żadnych informacji o wartościach cechy zależnej Y

DOKŁADNOŚĆ DOPASOWANIA PROSTEJ REGRESJI DO DANYCH EMPIRYCZNYCH Współczynnik indeterminacji Suma kwadratów odchyleń nie wyjaśnionych regresją Y względem X Całkowita suma kwadratów odchyleń zaobserwowanych wartości zmiennej Y od ich średniej

DOKŁADNOŚĆ DOPASOWANIA PROSTEJ REGRESJI DO DANYCH EMPIRYCZNYCH Pierwiastek kwadratowy ze współczynnika determinacji R2 opatrzony znakiem + lub - jest równy współczynnikowi korelacji liniowej Pearsona r Znak pierwiastka powinien być zgodny ze znakiem obliczonego współczynnika regresji

Liczba odwiedzających PRZYKŁAD Dane na temat liczby odwiedzających punkt sprzedaży oraz realizowanych w tym punkcie dziennych obrotów zestawiono w tabeli. Wyznaczyliśmy już równanie regresji wielkości dziennych obrotów względem liczby odwiedzających oraz zinterpretowaliśmy parametry (strukturalne i stochastyczne) równania regresji. Teraz należy ocenić dokładność dopasowania równania do danych empirycznych Liczba odwiedzających Wielkość obrotów (tys. zł) 20 2,5 25 3,1 32 4,5 21 5,3 35 6,4 36 7,8 42 8,9 39 9,5 38 10,3 41 11,5 51 12,1 Liczba odwiedzających – X (zmienna niezależna) Wielkość obrotów – Y (zmienna zależna) [0,051] [1,83] [1,533]

PRZYKŁAD n = 11 xi yi 20 2,5 25 3,1 32 4,5 21 5,3 35 6,4 36 7,8 42 8,9 39 9,5 38 10,3 41 11,5 51 12,1 24,46 18,88 8,68 4,60 1,09 0,13 2,12 4,22 8,15 16,44 21,66 2,851 4,430 6,641 3,167 7,589 7,905 9,800 8,853 8,537 9,484 12,643 -0,351 -1,330 -2,141 2,133 -1,189 -0,105 -0,900 0,647 1,763 2,016 -0,543 0,123 1,770 4,586 4,551 1,414 0,011 0,810 0,419 3,109 4,063 0,295

PRZYKŁAD Około 80,85% obserwowanego w próbie zróżnicowania wielkości obrotów (cecha Y) zostało wyjaśnione regresją liniową wielkości obrotów (cecha Y) względem liczby odwiedzających (cecha X). Pozostałe 19,15% zróżnicowania wielkości obrotów jest wynikiem oddziaływania innych, nie kontrolowanych w trakcie badania czynników. R2 = 80,85% [0,051] [1,83] [1,533]

PREDYKCJA

PREDYKCJA NA PODSTAWIE MODELU REGRESJI LINIOWEJ Celem analizy regresji jest predykcja, czyli przewidywanie, jaką wartość przyjmie zmienna zależna przy ustalonych wartościach zmiennej uznanej za niezależną Predykcja – estymacja pojedynczej realizacji zmiennej losowej Y przy ustalonej wartości X = x Najlepszym nieobciążonym estymatorem pojedynczej realizacji zmiennej losowej Y jest: Do predykcji można przystąpić dopiero wtedy, gdy oszacowany model regresji liniowej posiada dobre własności m.in. istotne parametry i odpowiednio wysokie R2

PREDYKCJA NA PODSTAWIE MODELU REGRESJI LINIOWEJ Dla każdej predykcji oblicza się standardowy błąd predykcji Standardowy błąd predykcji pozwala ocenić wielkość błędów losowych, jakie popełnialibyśmy szacując zgodnie z wyrażeniem na podstawie powtarzanych prób

PREDYKCJA NA PODSTAWIE MODELU REGRESJI LINIOWEJ Zamiast określenia „predykcja” stosuje się również określenie „prognoza” W klasycznym podejściu określenie „prognoza” odnosi się do przewidywania, jaką wartość przyjmie zmienna zależna przy ustalonych wartościach zmiennej uznanej za niezależną, wtedy gdy w modelu regresji uwzględnia się element czasu Przykładowo zmienna niezależna może mierzyć upływ czasu

PRZYKŁAD Wykorzystując zbudowany model regresji R2 = 80,85% dokonaj predykcji wielkości obrotów dla liczby zwiedzających równej 55. Określ wielkość standardowego błędu tej predykcji. Predykcja: xp = 55 R2 = 80,85% [0,051] [1,83] [1,533] xi yi 20 2,5 25 3,1 32 4,5 21 5,3 35 6,4 36 7,8 42 8,9 39 9,5 38 10,3 41 11,5 51 12,1 Punktowa ocena przewidywanej wielkości obrotów przy liczbie odwiedzających równej 55 wynosi 13,91 tys. zł

PRZYKŁAD Standardowy błąd predykcji: n = 11 [0,051] [1,83] [1,533] n = 11 xi yi 20 2,5 25 3,1 32 4,5 21 5,3 35 6,4 36 7,8 42 8,9 39 9,5 38 10,3 41 11,5 51 12,1 Przyjmując, że punktowa ocena przewidywanej wielkości obrotów przy liczbie odwiedzających równej 55 wynosi 13,91 tys. zł, musimy liczyć się z tym, że przeciętnie mylimy się o 1,91 tys. zł

EGZAMIN Egzamin ze statystyki odbędzie się 14 czerwca 2011 o godzinie 12:30 Egzamin trwa 120 minut