Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Co do tej pory robiliśmy:

Podobne prezentacje


Prezentacja na temat: "Co do tej pory robiliśmy:"— Zapis prezentacji:

1 Co do tej pory robiliśmy:
Chcemy pozyskać wiedzę o jakimś zjawisku Wybieramy elementy, które opisują to zjawisko Wybieramy zmienne, które mogą opisywać to zjawisko Badamy, czy wybrane przez nas zmienne rzeczywiście wpływają na nasze zjawiska Oceniamy, w jakim stopniu wybrane przez nas zmiennych determinują opisywane zjawisko

2 6. TERAZ: Zastanawiamy się, czy jakieś elementy wchodzące w skład badania z podobnym natężeniem opisują nasze zjawisko.

3 Przykład 1 Analizujemy jakość życia w małych miastach Polski (360 elementów). Do opisu jakości wybrano takie zmienne jak: czystość powietrza, liczbę sklepów na 1 mieszkańca, liczbę lekarzy na 1 mieszkańca, liczbę przestępstw w roku. Czy można wyróżnić grupę miast, gdzie poziom życia mieszkańców, opisany tymi zmiennymi, jest podobny?

4 Syntetyczny wskaźnik jakości życia:
Zmienna stymulana/destymulana/nominanta Standaryzacja (miana) Wagi Zmienna syntetyczna (suma rang zmiennych) 5. Lista rankingowa dla zmiennej syntetycznej 6. Podział według kryterium np. udziału, relacji średnia +/odchylenie standardowe

5 miasta powietrze sklepy lekarze przestępstwa a 11 3 2 b 12 c 15 d 19 1 e 21 4 27 f 38 5 g h 39 i 6 j 7 k 41 l 45 8 o q 48 9 r 49 t 57 u 59 w 16 y 18

6 Metody taksonomiczne – grupowanie obiektów (zmiennych) w taki sposób, aby stopień powiązania między obiektami (zmiennymi) z danej grupy był jak największy i jednocześnie jak najmniejszy z obiektami (zmiennymi) z pozostałych grup.

7

8 Miary odległości - podobieństwa (lub niepodobieństwa) między obiektami
1. Odległość euklidesowa (x,y) = {Ʃi (xi - yi)2 }½ Na odległości wyliczane w oparciu o surowe dane (nie standaryzowanych) duży wpływ mają różnice w jednostkach między zmiennymi. 2. Kwadrat odległości euklidesowej ( x,y) =Ʃi(xi - yi)2 Odległość euklidesowa podniesiona do kwadratu, aby przypisać większą wagę obiektom, które są bardziej oddalone. 3. Odległość miejska (x,y) =Ʃi|xi - yi| Wyniki podobne do odległości euklidesowej, wpływ przypadków odstających jest niewielki 4. Odległość Czebyszewa.(x,y) = Maksimum|xi - yi| stosowna wtedy, gdy chcemy zdefiniować dwa obiekty jako "inne", gdy różnią się one w jednym dowolnym wymiarze. 5. Odległość potęgowa. (x,y) = (Ʃixi - yi|p)1/r gdzie r i p są parametrami zdefiniowanymi przez użytkownika. Jeżeli chcemy zwiększyć lub zmniejszyć wagę przypadków.

9 Metody łączenia grup obiektów:
1. Metoda pojedynczego wiązania (najbliższego sąsiedztwa). Odległość między dwoma skupieniami jest określona przez odległość między dwoma najbliższymi obiektami należącymi do różnych skupień. 2. Metoda pełnego wiązania (najdalszego sąsiedztwa). Odległość między skupieniami jest określana przez największą z odległości między dwoma obiektami należącymi do różnych skupień. Stosowana kiedy obiekty układają się w naturalne oddzielone grupki, a nie wzdłuż linii.

10 3. Metoda średnich połączeń
3. Metoda średnich połączeń. Odległość między dwoma skupieniami oblicza się jako średnią odległość między wszystkimi parami obiektów należących do dwóch różnych skupień. Metoda efektywna, jeżeli obiekty formują naturalnie oddzielone skupiska, a nie charakter linii. 4. Metoda średnich połączeń ważonych. Identyczna jak metoda średnich połączeń z tym, że uwzględnia się liczbę obiektów zawartych w grupie. Liczności skupień są wyraźnie nierówne.

11 5. Metoda środków ciężkości
5. Metoda środków ciężkości. Środek ciężkości skupienia jest średnim punktem w przestrzeni wielowymiarowej zdefiniowanej przez te wymiary. Odległość między dwoma skupieniami jest określona jako różnica między środkami ciężkości. 6. Metoda ważonych środków ciężkości (mediany). Identyczna jak poprzednia z tym, że w obliczeniach wprowadza się ważenie grup, aby uwzględnić różnice między liczebnościami obiektów w skupieniu. Znaczne różnice w liczbie obiektów w skupieniu. 7. Metoda Warda. Do wyznaczenia odległości między skupieniami wykorzystuje podejście analizy wariancji. tj. zmierza do minimalizacji sumy kwadratów odchyleń dowolnych dwóch skupień, które mogą zostać uformowane na każdym etapie. Metoda najbardziej efektywna, chociaż zmierza do tworzenia skupień o małej liczebności obiektów.

12 Analiza skupień – grupowanie obiektów podobnych Statystyka/Wielowymiarowe/Analiza skupień

13 Aglomeracyjna (Hierarchiczne drzewo powiązań) - każde kolejne powiązanie między grupą obiektów a kolejnym obiektem jest coraz słabsze

14 2. Grupowanie metodą k-średnich Zadajemy liczbę k skupień, które są jak najbardziej różne, a następnie dodajemy kolejne obiekty do tych skupień tak, aby zmienność wewnątrz skupień była jak najmniejsza i jak największa między skupieniami.

15 3. Jednoczesne grupowanie obiektów i cech. Struktury skupień
3. Jednoczesne grupowanie obiektów i cech. Struktury skupień. Trudność w interpretacji - podobieństwa między różnymi skupieniami mogą wynikać z nieco innych podzbiorów zmiennych. Struktura wynikowa nie jest homogeniczna.


Pobierz ppt "Co do tej pory robiliśmy:"

Podobne prezentacje


Reklamy Google