Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałHalina Sadowska Został zmieniony 5 lat temu
1
Dr Dorota Rozmus Katedra Analiz Gospodarczych i Finansowych
SEMINARIUM DYPLOMOWE Dr Dorota Rozmus Katedra Analiz Gospodarczych i Finansowych
2
PRZEGLĄD WYBRANYCH METOD
3
Podział metod WAS metody badania współwystępowania (interdependence methods), gdy podziału cech na zależne i niezależne nie można przeprowadzić. Za pomocą tych metod analizuje się określone wewnętrzne relacje między zmiennymi w zbiorze zmiennych (jeśli przedmiotem badania jest zmienna) lub relacje zachodzące pomiędzy obiektami opisanymi tymi zmiennymi (gdy przedmiotem badania jest obiekt).
5
Proponowane przeze mnie metody
zmienna zależna (objaśniana) Y jest nie ma metryczna (ilościowa) niemetryczna (jakościowa) zm. objaśniające (Xi) metryczne niemetryczne regresja analiza wariancji (ANOVA) dyskryminacja taksonomia analiza czynnikowa analiza korespondencji
6
Taksonomia Taksonomia – taksonometria – analiza skupień – grupowanie – podział – klasyfikacja bezwzorcowa (ang. cluster analysis) Odkrycie struktury zbioru, czyli skupisk obiektów o podobnych własnościach
7
Taksonomia Głównym celem taksonomii jest badanie podobieństwa lub odrębności obiektów, a także zbiorów obiektów oraz ich podział na grupy (klasy) zawierające obserwacje podobne do siebie ze względu na zmienne opisujące te obiekty. Ponadto obserwacje należące do różnych klas powinny być jak najmniej do siebie podobne.
8
Taksonomia nie znamy struktury klas i dopiero staramy się ją odkryć (nie ma zbioru uczącego); dzielimy zbiór obserwacji S na klasy (grupy, skupienia, klastry), przy czym na ogół nie znamy liczby klas; najczęściej podstawą grupowania jest podobieństwo miedzy obiektami (zatem opieramy się na macierzy podobieństwa lub odległości między obiektami).
9
Taksonomia Klasyczne metody taksonomiczne:
hierarchiczne (np. Warda, najbliższego sąsiedztwa, najdalszego sąsiedztwa, mediany, średniej odległości między skupieniami,…) iteracyjno–optymalizacyjne (np. k-średnich, k-medoidów)
10
Taksonomia Zastosowania: do segmentacji rynku
do grupowania krajów ze względu na wybrane charakterystyki demograficzne, ekonomiczne, społeczne, itd. do grupowania powiatów pod względem rozwoju społeczno–ekonomicznego do grupowania firm pod względem profilu działalności i podobnych wyników finansowych
11
Przykład (metoda hierarchiczna)
Grupowanie województw Polski ze względu na poziom inteligentnego rozwoju; Dane zebrane z GUS; Zmienne to zaproponowane przez GUS wskaźniki służące pomiarowi poziomu inteligentnego rozwoju, np.: nakłady na B+R, współczynnik skolaryzacji, liczba absolwentów na poziomie magisterskim, czytelnicy bibliotek publicznych, liczba osób zwiedzających muzea i oddziały muzealne na 10 tys. mieszkańców liczba nowo zarejestrowanych podmiotów gospodarczych w rejestrze REGON (…) Przykład (metoda hierarchiczna)
12
Przykład (metoda k-średnich)
Grupowanie funduszy emerytalnych zmiennych charakteryzujące te fundusze to: wzrost zysku netto (w %) rentowność brutto (w %) stopa zwrotu z kapitału (w %) zwrot z aktywów (w %) fundusze własne (w mln) Przykład (metoda k-średnich)
13
Dyskryminacja Analiza dyskryminacyjna – klasyfikacja wzorcowa – uczenie z nauczycielem Znalezienie reguł klasyfikacji
14
Dyskryminacja Opis zagadnienia:
znamy podział na klasy, ponieważ mamy już poprawnie sklasyfikowany zbiór obiektów, tzw. zbiór uczący; na tej podstawie chcemy znaleźć opis klas, czyli reguły klasyfikacji poznane charakterystyki klas są wykorzystywane do klasyfikacji „nowych” obiektów ze zbioru rozpoznawanego (których przynależność do klas nie jest znana)
15
Dyskryminacja Wymagana postać zbioru danych:
zmienna zależna (objaśniana) Y jest zmienną niemetryczną (nominalna lub porządkowa), która wskazuje przynależność do klasy zmienne objaśniające Xj mierzone są zarówno na skalach metrycznych, jak i niemetrycznych
16
Dyskryminacja Zbiór uczący Dyskryminacja Model
Proces klasyfikacji w ramach analizy dyskryminacyjnej odbywa się w dwóch etapach: 1. Dyskryminacji, gdy na podstawie posiadanego zbioru uczącego, zawierającego poprawnie sklasyfikowane obiekty, znajdowane są charakterystyki klas. Zbiór uczący Dyskryminacja Model
17
Dyskryminacja Zbiór danych Model Klasyfikacja
2. Klasyfikacji, gdy obiekty, których przynależność nie jest znana (należące do tzw. zbioru rozpoznawanego), są przydzielane do odpowiednich, znanych już, klas. Zbiór danych Model Klasyfikacja
18
Dyskryminacja Budowa modelu na odstawie zbioru uczącego
y (klasa) To zbiór obiektów już uprzednio sklasyfikowanych, przy czym „klasa” może oznaczać wartości pewnej zmiennej nominalnej (np. pozytywne bądź negatywne rozpatrzenie wniosku o kredyt). Klasyfikacja obiektu ze zbioru rozpoznawanego na podstawie modelu: OCENA WNIOSKU 1
19
Dyskryminacja Metody: klasyczna analiza dyskryminacyjna Fishera (LDA)
metoda K–najbliższych sąsiadów drzewa klasyfikacyjne sieci neuronowe metoda wektorów nośnych (SVM)
20
Przykład Dane: ocena wniosków kredytowych:
„dobry” (spłacany bez problemów) lub „zły” Zmienne: wiek, stanowisko (praca), wynagrodzenie, karta kredytowa Źródło: Blake i inni, 1998 Obserwacje: 323 osoby
21
Przykład (drzewo klasyfikacyjne)
22
Analiza korespondencji
Metoda służąca analizie relacji między kategoriami dwóch zmiennych nominalnych. Pozwala na graficzną prezentację zależności pomiędzy kategoriami badanych cech i wnioskować o związkach zachodzących między tymi kategoriami.
23
Analiza korespondencji
Wymagania co do danych: dane o charakterze niemetrycznym.
24
Przykład Zmienna wysokość oszczędności – kategorie:
1m: oszczędności do wysokości miesięcznych dochodów 1-3m: oszczędności powyżej miesięcznych do 3–miesięcznych dochodów 3-6m:oszczędności powyżej 3-miesięcznych do 6–miesięcznych dochodów (…) >3 lat:oszczędności powyżej 3-letnich dochodów tp: trudno powiedzieć Analiza relacji między klasą miejscowości a wysokością oszczędności gospodarstw domowych Zmienna klasa miejscowości – kategorie: wieś, miasto poniżej 20 tys. mieszkańców miasto tys. mieszkańców miasto tys. mieszkańców miasto tys. mieszkańców miasto powyżej 500 tys. mieszkańców
25
Zastosowania Taksonomia: segmentacja rynku, określanie struktury rynku, identyfikacja względnie jednorodnych grup nabywców. Analiza dyskryminacyjna: segmentacja rynku, identyfikacja cech produktu, które najsilniej wpływają na postawy klientów, kontrola jakości. Analiza korelacji: określenie siły i kierunku związku między cechami lub grupami cech, Analiza regresji: analiza popytu, analiza sprzedaży, prognozowanie. Analiza rzetelności: weryfikacja poprawności konstrukcji narzędzi badawczych (ankiet),
26
Zastosowania Skalowanie wielowymiarowe: określenie pozycji produktu na rynku, identyfikacja „luki” na rynku, Analiza czynnikowa: identyfikacja ukrytych czynników charakteryzujących np. produkt z punktu widzenia konsumenta Analiza łącznego oddziaływania zmiennych (conjoint analysis): pomiar preferencji nabywców Analiza wariancji (ANOVA) i kowariancji (ANCOVA): identyfikacja źródeł zróżnicowania wartości cech, np. wydatków. Analiza korespondencji: pozycjonowanie produktu na rynku i badanie percepcji marki.
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.