Dr Dorota Rozmus Katedra Analiz Gospodarczych i Finansowych SEMINARIUM DYPLOMOWE Dr Dorota Rozmus Katedra Analiz Gospodarczych i Finansowych
PODSTAWOWE POJĘCIA
Obserwacja Obserwacja (wielowymiarowa) jest wektorem wartości zmiennych dla danego obiektu:
Macierz danych Analizując wszystkie obiekty uzyskujemy macierz: gdzie xij to wartość j-tej zmiennej dla j-tej obserwacji (j = 1, 2,…, m; i = 1, 2,…, n).
Przykład Wielowymiarowy szereg przekrojowy – wartości m = 4 zmiennych dla n = 7 obiektów w jednym momencie czasu obiekt X1 – praca X2 – płaca X3 – wiek X4 - karta 1 2 3,5 34 5 4,2 45 3 4 7,1 5,8 56 4,3 29 6 3,9 33 7 2,9 42
Pomiar Pomiar to przyporządkowanie liczb charakterystykom obiektów zgodnie z określonymi regułami w taki sposób, aby liczby odzwierciedlały relacje zachodzące między tymi obiektami.
Podział zmiennych Zmienne można podzielić na: metryczne (mierzalne, ilościowe), których wartości są liczbami rzeczywistymi, naturalnymi uzyskanymi w wyniku pomiaru niemetryczne (niemierzalne, jakościowe, opisowe), których wartościami są różnego rodzaju symbole Podział ten jest nieprecyzyjny i wywołuje spory, wiec lepiej dzielić zmienne ze względu na skale pomiaru wartości cech
Rodzaje skal Nominalna (skala nazw), gdy pomiędzy wartościami cechy „x” dla dwóch obiektów zachodzi jedna z relacji: Wartości mierzone na skali nominalnej można zapisać za pomocą pewnych symboli, słów, a nawet liczb, ale nie ma fizycznej interpretacji dla kolejności tych wartości, różnic, czy ilorazów Przykłady: płeć, kod pocztowy, PESEL
Rodzaje skal Porządkowa, gdy można określić znak różnicy pomiędzy wartościami cechy „x”, tj. zachodzi jedna z relacji: Możliwe jest określenie ”porządku”. Dla wartości mierzonych na skali porządkowej można określić kolejność, ale nie ma sensu obliczanie różnic, czy ilorazów Przykłady: poziom wykształcenia, oceny w szkole
Rodzaje skal Przedziałowa, gdy można określić o ile jednostek wartość xA jest większa od wartości xB Dla wartości mierzonych na tej skali można obliczać różnice (ma to sens, ponieważ można interpretować te różnice). Nie można obliczać ilorazów. Na wartościach cechy X dopuszczalne są operacje: >, <,=,+,−. Wartości przybierane są ze zbioru R. Przykłady: daty, temp. w stopniach Celsjusza
Rodzaje skal Ilorazowa, gdy można określić o ile razy wartość xA jest większa od wartości xB Dla wartości mierzonych na skali ilorazowej sens ma obliczanie zarówno różnic, jak i ilorazów. Na wartościach cechy X dopuszczalne są operacje: >, <,=,+,−, ·, : Wartości przybierane są ze zbioru R+ (zero lewostronnie ogranicza zakres skali). Przykład: temperatura w stopniach Kelvina, płaca, cena produktu, wielkość produkcji
Dopuszczalne miary statystyczne
Podział ze względu na preferencje Gdy celem analizy jest uporządkowanie obiektów (metoda porządkowania liniowego), cechy dzielimy na 3 grupy ze względu na preferencje: stymulanty, gdy wyższe wartości tej cechy pozwalają zakwalifikować obiekt jako „lepszy”, tj. xA > xB => A > B destymulanty, gdy wyższe wartości tej cechy pozwalają zakwalifikować obiekt jako „gorszy”, tj. xA > xB => A < B
Podział ze względu na preferencje nominanty, których normalny poziom daje „wyższą” pozycje obiektowi, zaś odchylenia od tego poziomu - „niższą”. Nominanty są zwykle pomijane w badaniach, ponieważ trudno określić ich nominalny poziom.
Zwykle w badaniach wymaga się, by wszystkie cechy miały charakter stymulant. Destymulanty można wtedy przekształcić w stymulanty za pomocą jednego ze wzorów:
Normalizacja Zmienne należy doprowadzić do porównywalności poprzez ujednolicenie rzędów wielkości oraz pozbawienie różnych mian. W tym celu stosuje się transformacje normalizacyjne: Standaryzacja (średnia = 0, wariancja = 1) gdzie - średnia wartość j-tej cechy sj – odchylenie standardowe j-tej cechy
Normalizacja 2. Unitaryzacja (wartości w [0,1] z zachowaniem różnic): gdzie: rj - rozstęp dla j-tej zmiennej 3. Normalizacja (zachowanie zróżnicowania i proporcji, na <-1,1>):
Skala pomiaru zmiennych Formuła przed normalizacją po normalizacji standaryzacja ilorazowa i (lub) przedziałowa przedziałowa unitayzacja normalizacja ilorazowa
Podział metod WAS W zależności od tego, czy w zbiorze badanych zmiennych występuje zmienna zależna (zmienne zależne) czy też nie, metody WAS podzielić na: metody badania zależności (dependence methods), gdy zmiany jednej (lub więcej) zmiennej zależnej zależą od zmian innych zmiennych (zwanych objaśniającymi),
Podział metod WAS metody badania współwystępowania (interdependence methods), gdy podziału cech na zależne i niezależne nie można przeprowadzić. Za pomocą tych metod analizuje się określone wewnętrzne relacje między zmiennymi w zbiorze zmiennych (jeśli przedmiotem badania jest zmienna) lub relacje zachodzące pomiędzy obiektami opisanymi tymi zmiennymi (gdy przedmiotem badania jest obiekt).
Proponowane przeze mnie metody zmienna zależna (objaśniana) Y jest nie ma metryczna (ilościowa) niemetryczna (jakościowa) zm. objaśniające (Xi) metryczne niemetryczne regresja analiza wariancji (ANOVA) dyskryminacja taksonomia analiza czynnikowa analiza korespondencji
Zastosowania Taksonomia: segmentacja rynku, określanie struktury rynku, identyfikacja względnie jednorodnych grup nabywców. Analiza dyskryminacyjna: segmentacja rynku, identyfikacja cech produktu, które najsilniej wpływają na postawy klientów, kontrola jakości. Analiza korelacji: określenie siły i kierunku związku między cechami lub grupami cech, Analiza regresji: analiza popytu, analiza sprzedaży, prognozowanie. Analiza rzetelności: weryfikacja poprawności konstrukcji narzędzi badawczych (ankiet),
Zastosowania Skalowanie wielowymiarowe: określenie pozycji produktu na rynku, identyfikacja “luki” na rynku, Analiza czynnikowa: identyfikacja ukrytych czynników charakteryzujących np. produkt z punktu widzenia konsumenta Analiza łącznego oddziaływania zmiennych (conjoint analysis): pomiar preferencji nabywców Analiza wariancji (ANOVA) i kowariancji (ANCOVA): identyfikacja źródeł zróżnicowania wartości cech, np. wydatków. Analiza korespondencji: pozycjonowanie produktu na rynku i badanie percepcji marki.