Koło Naukowe Metod Ilościowych

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
Wprowadzenie do budowy usług informacyjnych
Analiza współzależności zjawisk
Analiza wariancji jednoczynnikowa
Analiza wariancji Marcin Zajenkowski. Badania eksperymentalne ANOVA najczęściej do eksperymentów Porównanie wyników z 2 grup lub więcej Zmienna niezależna.
BUDOWA MODELU EKONOMETRYCZNEGO
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
Gospodarka światowa.
Podstawy analizy makroekonomicznej – główne kontrowersje i kierunki
Dzisiaj na wykładzie Regresja wieloraka – podstawy i założenia
Grupowanie Wprowadzanie Definicja problemu
Linear Methods of Classification
Analiza współzależności dwóch zjawisk
Średnie i miary zmienności
Biura Uznawalności Wykształcenia i Wymiany Międzynarodowej (BUWiWM)‏
Kurs specjalistyczny dla pielęgniarek, mgr Adam Dudek, PWSZ Nysa 2007
Dlaczego trzeba podnosić wiek emerytalny?
Analiza wariancji jednoczynnikowa.
IV KRAJOWE SYMPOZJUM NAUKOWE na temat: „ROLA INFORMACJI W PROCESIE ZARZĄDZANIA ZMIANAMI” AE-KRAKÓW, TNOiK, KRAKÓW 2003 Dr inż. Jerzy Wąchol, Zakład Podstaw.
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Segmenty rynku prasowego
Elementy Rachunku Prawdopodobieństwa i Statystyki
GŁOSOWA ŁĄCZNOŚĆ Z KOMPUTEREM
Prognozowanie z wykorzystaniem modeli ekonometrycznych
Koło Naukowe Metod Ilościowych
Zróżnicowanie społeczno – gospodarcze państw świata
Statystyka ©M.
Podstawy statystyki, cz. II
VII EKSPLORACJA DANYCH
Regresja wieloraka.
Seminarium licencjackie Beata Kapuścińska
Segmenty operacyjne MSSF 8.
Ekonomika ochrony zdrowia (I)
D. Ciołek EKONOMETRIA – wykład 5
D. Ciołek EKONOMETRIA – wykład 4
Dynamika zjawisk. Analiza sezonowości dr hab. Mieczysław Kowerski
Kto handluje z kim?.
Bilans płatniczy: zestawianie i analiza
ALGERIA AUSTRALIAAUSTRALIA AUSTRIA CHILE CHINYCHINY.
Dynamika zjawisk. Tendencja rozwojowa dr hab. Mieczysław Kowerski
Dr Ewelina Sokołowska, UG prof. dr hab. Jerzy Witold Wiśniewski, UMK
UE i USA w gospodarce światowej*
KRÓTKOOKRESOWE REAKCJE ZATRUDNIENIA NA ZMIANY KONIUNKTURY GOSPODARCZEJ W KRAJACH EUROPY ŚRODKOWO-WSCHODNIEJ Mariusz Zieliński Maciej Wolny Politechnika.
Statystyczna analiza danych
Model ekonometryczny Jacek Szanduła.
Globalizacja mierniki
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Grupowanie danych statystycznych „ Człowiek – najlepsza inwestycja”
Człowiek – najlepsza inwestycja
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
STATYSTYKA – kurs podstawowy wykład 11
Dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii Metody klasyfikacji obiektów 1.
Treść dzisiejszego wykładu l Metoda Najmniejszych Kwadratów (MNK) l Współczynnik determinacji l Koincydencja l Kataliza l Współliniowość zmiennych.
GOSPODARCZE ASPEKTY WSPÓŁPRACY PODLASKICH PRZEDSIĘBIORSTW Z KAZACHSTANEM I UZBEKISTANEM Białystok, dn r. Projekt jest finansowany ze środków.
STRUKTURA GEOGRAFICZNA POLSKA I JEJ SĄSIEDZI Wyk. xxx Ekonomia 3, grupa 4.
Małgorzata Podogrodzka, SGH ISiD
Co do tej pory robiliśmy:
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
Metody klasyfikacyjne
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
Dr Dorota Rozmus Katedra Analiz Gospodarczych i Finansowych
Analiza współzależności zjawisk
Problem: Agent ubezpieczeniowy postanowił dowiedzieć się, jakimi cechami odznacza się potencjalny nabywca polisy na życie. 1. Sprawdza, jakie charakterystyki.
MIARY STATYSTYCZNE Warunki egzaminu.
Analiza kanoniczna - stanowi uogólnienie liniowej regresji wielorakiej na dwa zbiory zmiennych tzn. dla zmiennych zależnych i niezależnych. Pozwala badać.
Korelacja i regresja liniowa
Analiza głównych składowych PCA
Zapis prezentacji:

Koło Naukowe Metod Ilościowych „Analiza wielowymiarowa sytuacji ekonomicznej Polski oraz krajów Azji i Europy Wschodniej” Anna Żemojtel Leszek Boguszewski Koło Naukowe Metod Ilościowych Katedra Statystyki Wydział Zarządzania Uniwersytet Gdański Praca napisana pod opieką naukową dr hab. Andrzeja Balickiego, prof. UG oraz dr Kamili Migdał Najman i dr Krzysztofa Najman.

Cele badań pogrupowanie państw w jednorodne podzbiory ze względu na kondycję ekonomiczną, wskazanie państwa o najlepszej i najgorszej kondycji ekonomicznej, przedstawienie statystycznych metod analizy wielowymiarowej służących obiektywnej ocenie kondycji ekonomicznej.

Wybór cech diagnostycznych X1 - Import- cif (ceny bieżące) na 1 mieszkańca w $ USA, X2 - Eksport- fob (ceny bieżące) na 1 mieszkańca w $ USA, X3 - Wydatki w % PKB, X4 - Rezerwy dewizowe w mln $ USA, X5 - Długi zagraniczne na 1 mieszkańca w $ USA, kraje powyżej 10 mld $ USA, X6 - Zagraniczne inwestycje bezpośrednie w kraju w mln $ USA, X7 - Krajowe inwestycje bezpośrednie za granicą w mln $ USA, X8 - PKB na 1 mieszkańca w $ USA, X9 - Procent bezrobotnych mających wykształcenie wyższe, X10 - Pracujący w pośrednictwie finansowym i innych usługach (w tys.) /ogół pracujących.

Analiza Głównych Składowych wskazanie istotnych zależności, jakie zachodzą między zmiennymi opisującymi zjawiska wielowymiarowe, redukcja wymiaru przestrzeni cech, podział cech na podgrupy (główne składowe), interpretacja relacji między składowymi.

Etapy Analizy Głównych Składowych standaryzacja danych macierzy obserwacji, utworzenie macierzy korelacji, wyznaczenie wektorów wartości własnych, wyznaczenie ładunków składowych, obliczenie współczynników korelacji j-tej zmiennej z l-tą składową główną.

Pozostawione główne składowe łącznie wyjaśniają ponad 82 % całkowitej zmienności porównywanych cech, co prezentuje poniższa tablica. Tablica 1. Wartości własne. Zmienne Wartość własna % ogółu wyjaśnionej wariancji Skumulowana wartość własna Skumulowany % ogółu wyjaśnionej wariancji X1 3,9925 39,9249 X2 1,8687 18,6873 5,8612 58,6121 X3 1,2818 12,8177 7,1430 71,4299 X4 1,0970 10,9701 8,2400 82,3999 X5 0,8568 8,5680 9,0968 90,9679 X6 0,3882 3,8816 9,4850 94,8495 X7 0,2707 2,7072 9,7557 97,5567 X8 0,2031 2,0311 9,9588 99,5878 X9 0,0375 0,3748 9,9963 99,9625 X10 0,0038 10,0000 100,0000 Źródło: Opracowanie własne- Statistica 6.0

Etapy Analizy Głównych Składowych Pozostawiono 4 główne składowe, gdyż celem tej analizy jest wyjaśnienie jak największej części zmienności przez jak najmniejszą liczbę składowych. Ilustracją istotności głównych składowych jest wykres osypiska.

Wykres 1. Wykres osypiska Źródło: Opracowanie własne - Statistica 6.0.

Kolejne etapy Analizy Głównych Składowych: wyznaczenie ładunków składowych, obliczenie współczynników korelacji j-tej zmiennej z l-tą składową główną. Powyższe działania przedstawione są w tablicy.

KORELACJE MIĘDZY ZMIENNYMI A SKŁADOWYMI Tablica 2. Wyniki analizy głównych składowych po dokonaniu normalizacji. ZMIENNE ŁADUNKI SKŁADOWE KORELACJE MIĘDZY ZMIENNYMI A SKŁADOWYMI w1 w2 w3 w4 X1 0,4830 -0,0649 0,0383 -0,0229 0,9652 -0,0887 0,0434 -0,0240 X2 0,4779 0,0516 0,0444 0,1749 0,9549 0,0706 0,0503 0,1832 X3 0,2179 -0,1314 -0,4276 -0,4725 0,4354 -0,1796 -0,4841 -0,4949 X4 0,1085 0,6348 -0,0809 0,0683 0,2167 0,8677 -0,0916 0,0716 X5 0,0467 -0,1821 -0,4051 0,7768 0,0932 -0,2489 -0,4587 0,8136 X6 0,1963 -0,4344 0,1990 -0,2251 0,3922 -0,5938 0,2253 -0,2358 X7 0,4054 -0,1985 0,2152 0,2351 0,8100 -0,2713 0,2436 0,2463 X8 0,3230 0,5283 -0,1344 -0,0987 0,6453 0,7221 -0,1521 -0,1034 X9 0,0802 0,1481 0,7193 0,1075 0,1603 0,2024 0,8144 0,1126 X10 0,4040 -0,1035 -0,1472 -0,1017 0,8073 -0,1415 -0,1667 -0,1065 Źródło: Obliczenia własne.

Analiza skupień Celem analizy skupień jest organizowanie obserwowanych danych w sensowne grupy poprzez analizę podobieństw w obszarach poddanych badaniu.

Analiza skupień c.d. Kryteria postępowania: Elementy wewnątrz grup powinny być maksymalnie podobne, Elementy różnych grup powinny być maksymalnie zróżnicowane.

Metody Grupowania Najczęściej stosuje się dwie metody: Hierarchiczne - sekwencyjne łączenie obiektów w jednorodne grupy, Podziałowe (k-średnich) - podział obiektów na, z góry określoną, ilość skupisk .

Metody Grupowania Ilustracją wyników grupowania hierarchicznego jest diagram drzewka połączeń, tzw. dendrogram.

Dendrogram Źródło: Opracowanie własne - Statistica 6.0.

Powstałe podgrupy: Malezja i Republika Korei, Estonia i Izrael, Litwa, Łotwa, Turcja, oraz Polska, Indonezja, Pakistan, Rosja, Białoruś, Indie, Chiny oraz Tajlandia, Japonia (outlier).

Wykres Średnich W wyniku grupowania metodą k-średnich na pięć podgrup otrzymano identyczne, w porównaniu z metodą hierarchiczną, skupiska. Ciekawych informacji na temat wartości zmiennych w podgrupach dostarcza wykres średnich.

Metoda k-średnich Malezja i Republika Korei Japonia Estonia i Izrael Litwa, Łotwa, Turcja i Polska Indonezja, Pakistan, Rosja, Białoruś, Indie, Chiny i Tajlandia, Źródło: Opracowanie własne - Statistica 6.0

Porządkowanie liniowe Celem porządkowania liniowego jest zhierarchizowanie państw ze względu na poziom rozpatrywanych cech oraz odnalezienie obiektu pierwszego i ostatniego.

Porządkowanie liniowe Tablica 3. Wyniki porządkowania liniowego. Pozycja Kraj Miara rozwoju 1 Japonia 0.5231 2 Izrael 0.5133 3 Estonia 0.4306 4 Malezja 0.3878 5 Republika Korei 0.3512 6 Łotwa 0.3357 7 Polska 0.3232 8 Litwa 0.3125 9 Turcja 0.2525 10 Chiny 0.2434 11 Tajlandia 0.2028 12 Rosja 0.1897 13 Pakistan 0.1711 14 Indonezja 0.1576 15 Białoruś 0.1469 16 Indie 0.1290 Porządkowanie liniowe Metoda wzorca rozwoju

Dziękujemy za uwagę http://knmi.wzr.pl