Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Małgorzata Podogrodzka, SGH ISiD

Podobne prezentacje


Prezentacja na temat: "Małgorzata Podogrodzka, SGH ISiD"— Zapis prezentacji:

1 Małgorzata Podogrodzka, SGH ISiD
STATYSTYKA to nauka o: 1. metodach pozyskiwania, 2. prezentacji, 3. analizy danych opisujących zjawiska masowe Małgorzata Podogrodzka, SGH ISiD

2 Co to są zjawiska masowe ?
Małgorzata Podogrodzka, SGH ISiD

3 Małgorzata Podogrodzka, SGH ISiD
Interesuje mnie liczba mieszkańców w wybranych miastach Polski – co wiem ? 3639 3548 2081 4419 6380 4863 5710 2364 4741 6661 1840 3011 16648 7813 16498 5262 2476 39991 8777 1095 3924 14800 2591 9442 2796 2637 1778 1234 4152 6709 4068 5764 6162 9219 3411 3705 62280 5021 1094 9291 3199 30162 3986 3702 3925 5691 1774 2737 3896 1574 4279 1431 5168 2166 2897 2815 1322 4580 5905 6421 2077 5367 6887 2813 3864 1356 14505 9170 3895 1823 3506 3002 4910 3193 6009 2295 8510 2383 4908 7234 1008 4868 1870 1465 4534 8511 5093 4229 2439 2074 5629 1254 1304 1227 6623 2953 5127 2142 9839 17639 6091 14630 6899 4717 1771 1197 252126 93982 3129 3565 4899 1290 1628 3922 4030 8738 7910 1164 5355 2539 9181 3860 9304 2797 4571 3192 2655 7546 6136 2747 10251 5377 1345 1961 4221 5104 5375 7130 2246 2994 2245 8195 2818 3480 8928 2304 4551 2572 13848 6433 3766 5312 3176 1934 2192 6700 7020 20007 15010 5152 Małgorzata Podogrodzka, SGH ISiD

4 Małgorzata Podogrodzka, SGH ISiD
Procesy masowe to zjawiska, które rozpatrywane w masie (w grupie elementów o tej samej własności) charakteryzują się prawidłowością niedającą się zaobserwować na podstawie pojedyńczej obserwacji. Przyczyny główne - działają we wszystkich przypadkach. Składnik systematyczny to część procesu masowego, która jest wynikiem działania zespołu przyczyn głównych. Przyczyny uboczne - działają tylko w poszczególnych (indywidualnych) przypadkach. Składnik przypadkowy to część, która jest wynikiem działania przyczyn ubocznych. Małgorzata Podogrodzka, SGH ISiD

5 Rodzaje praw (zależności):
Prawidłowość statystyczna to splot przyczyn głównych (prawidłowość absolutna) i ubocznych (prawidłowość przybliżona). Rodzaje praw (zależności): przyczynowe współwystępowanie funkcyjne po pewnym określonym zdarzeniu stale następuje inne określone zdarzenie stale łączne występowanie dwóch lub więcej zdarzeń związek między ilościowo wyrażonymi zdarzeniami, które można przedstawić za pomocą funkcji matematycznej Małgorzata Podogrodzka, SGH ISiD

6 Małgorzata Podogrodzka, SGH ISiD
Zbiorowość statystyczna to zbiór elementów (np. osób, przedmiotów, zdarzeń) podobnych, lecz nie identycznych, poddanych badaniom statystycznym. skończona - ma skończoną liczbę elementów nieskończona - ma nieskończona lub niemożliwą do ustalenia liczbę elementów jednowymiarowa - badana ze względu na jedną cechę wielowymiarowa - badana jednocześnie ze względu na kilka cech Małgorzata Podogrodzka, SGH ISiD

7 Małgorzata Podogrodzka, SGH ISiD
względnie jednorodna - jej podzbiorowości mało różnią się wartościami własności niejednorodna - jej podzbiorowości wyraźnie różnią się wartościami własnościami statyczna - wszystkie elementy badania pochodzą z tego samego punktu/okresu czasu dynamiczna – te same elementy badania pochodzą z różnych punktów/okresów czasu Małgorzata Podogrodzka, SGH ISiD

8 Małgorzata Podogrodzka, SGH ISiD
Element zbiorowości statystycznej to jednostka statystyczna (badnia). Liczba jednostek statystycznych (elementów zbiorowości) to liczebność zbiorowości. Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w zbiorowości. Cecha statystyczna (zmienna) to właściwość elementów zbiorowości statystycznej, które są przedmiotem badania statystycznego. Małgorzata Podogrodzka, SGH ISiD

9 Etapy badania statystycznego
1. planowanie i organizacja badania 2. obserwacja statystyczna 3. opracowanie zebranego materiału 4. analiza wyników badania Małgorzata Podogrodzka, SGH ISiD

10 1. planowanie i organizacja badania
cel badania: przedmiot badania: cecha (cechy) opisujące badaną zbiorowość: diagnostyczny praktyczny merytoryczny terytorialny czasowy jakościowa (niemierzalna) ilościowa skokowa (przyjmuje skończoną lub przeliczalną liczbę wartości) ciągła (może przyjąć każdą wartość z określonego przedziału liczbowego Małgorzata Podogrodzka, SGH ISiD

11 Małgorzata Podogrodzka, SGH ISiD
źródło informacji (danych): określenie czasu trwania badania: zakres badania: pierwotne wtórne ciągłe okresowe doraźne pełne częściowe losowe celowe Małgorzata Podogrodzka, SGH ISiD

12 2. obserwacja statystyczna badanie pilotażowe badanie podstawowe
metody obserwacji: badanie pilotażowe badanie podstawowe Małgorzata Podogrodzka, SGH ISiD

13 3. opracowanie zebranego materiału
kontrola materiału: możliwe błędy: formalna merytoryczna bezpośredni pośredni (wzór matematyczny) pomiar: systematyczne (daje się przewidzieć) przypadkowe Małgorzata Podogrodzka, SGH ISiD

14 Małgorzata Podogrodzka, SGH ISiD
Pomiar błędu systematycznego niepewność maksymalna – rodzaj niepewności systematycznej, podaje największe maksymalne odchylenie pomiaru x od wartości rzeczywistej xr xmax= x-xp  niepewność względna B to stosunek niepewności systematycznej do wyniku pomiaru B=x/x niepewność procentowa – wyrażona w procentach niepewność względna Bp=B100 % gdy wykonano bezpośrednio kilkakrotnie niezależne pomiary cechy X z różnymi dokładnościami, to otrzymując x1x1, x2x2, ..., xnxn, należy wprowadzić pojęcie wagi wi średnią arytmetyczną ważoną niepewność systematyczna średniej ważonej to średnią ważoną niepewności poszczególnych pomiarów Małgorzata Podogrodzka, SGH ISiD

15 Małgorzata Podogrodzka, SGH ISiD
w przypadku pomiarów pośrednich bezpośrednio mierzymy kilka innych wartości, otrzymując wyniki x1x1, x2x2, ..., xnxn, a wynik końcowy obliczmy ze wzoru z=f(x1, x2, ..., xn) niepewność maksymalną zmax obliczamy ze wzoru Małgorzata Podogrodzka, SGH ISiD

16 4. analiza wyników badania
interpretacja miar statystycznych wnioski końcowe Małgorzata Podogrodzka, SGH ISiD

17 Małgorzata Podogrodzka, SGH ISiD
STATYSTYKA OPISOWA X – cecha (zmienna) statystyczna xi - warianty zmiennej N – liczebność badanej zbiorowości ni - liczebność odpowiadająca danemu wariantowi cechy wi - częstość względna odpowiadająca danemu wariantowi cechy ns - skumulowana liczebność ws - skumulowana częstość ws dystrybuanta empiryczna F(X= xi) = w(X < ws ) Małgorzata Podogrodzka, SGH ISiD

18 Małgorzata Podogrodzka, SGH ISiD
Wyróżniamy 3 główne skale pomiarowe: Skala interwałowa gdy: można ją uporządkować, można obliczyć o ile jeden element jest większy od drugiego i różnica tych elementów ma interpretację w świecie rzeczywistym (masa obiektu [kg], powierzchnia obiektu [m], czas [lata], prędkość [km/h]). Skala porządkowa gdy: można ją uporządkować, czyli ma znaczenie kolejność występowania elementów, nie da się w sensowny sposób określić różnicy ani ilorazu między dwiema wartościami (wykształcenie, kolejność zawodników na podium). Skala nominalna gdy: nie można jej uporządkować, czyli nie istnieje wynikające z natury danego zjawiska uporządkowanie, nie da się w sensowny sposób określić różnicy ani ilorazu między dwiema wartościami (płeć, kraj zamieszkania). Małgorzata Podogrodzka, SGH ISiD

19 Małgorzata Podogrodzka, SGH ISiD
Rozkład empiryczny to przyporządkowanie kolejnym (uporządkowanym według pewnego kryterium) wartościom zmiennej odpowiadającej im liczebności lub częstości ich występowania w ogólnej liczebności. Opis statystyczny badanej zbiorowości = analiza struktury zjawiska = opis rozkładu empirycznego cechy = charakterystyka rozkładu cechy Małgorzata Podogrodzka, SGH ISiD

20 Forma zapisu danych statystycznych
zapis tabelaryczny - tablice statystyczne mogą się składać z k-szeregów rozdzielczych (k - liczba naturalna). Rozkład jednowymiarowy: Małgorzata Podogrodzka, SGH ISiD

21 Małgorzata Podogrodzka, SGH ISiD
Rozkład dwuwymiarowy (tablica korelacyjna): Rozkład łączny cechy X i Y jest to dwuwymiarowy rozkład empiryczny cechy X i Y, określający liczebności (częstości) nij (wij) (i=1,...,k; j=1,...,l) odpowiadające odpowiednio parom wartości odpowiednim wariantom cechy (xi, yj) Rozkład brzegowy to rozkład każdej z analizowanych cech oddzielnie. Rozkład warunkowy to rozkład jednej z cech pod warunkiem, że druga cecha przyjmuje określony wariant. Małgorzata Podogrodzka, SGH ISiD

22 Zasady budowy szeregu rozdzielczego przedziałowego:
wskazane jest, aby rozpiętość przedziałów była jednakowa przedziały nie mogą mieć zerowej liczebności (częstości) wskazane jest, aby pierwszy i ostatni przedział w szeregu rozdzielczym był domknięty rozpiętość klas nie może być zbyt szeroka, aby zbytnio nie uogólnić posiadanych informacji, ani zbyt wąska, aby zbytnio ich nie uszczegółowiać pomocne k5 lg(n) Małgorzata Podogrodzka, SGH ISiD

23 Małgorzata Podogrodzka, SGH ISiD
B. graficzna: histogram, diagram, krzywa, pudełko z wąsami itp. Małgorzata Podogrodzka, SGH ISiD

24 Małgorzata Podogrodzka, SGH ISiD
Zmiana skali na osiach układu współrzędnych powoduje drastyczne zmiany w wizualnej ocenie przebiegu krzywej !!!! Małgorzata Podogrodzka, SGH ISiD

25 Małgorzata Podogrodzka, SGH ISiD
Miary statystyczne 1. położenia 2. rozproszenia 3. skośności 4. skupienia klasyczne pozycyjne momentem zwykłym ml rzędu l momentem centralnym Ml rzędu l Małgorzata Podogrodzka, SGH ISiD

26 Małgorzata Podogrodzka, SGH ISiD
I. Miary położenia służą do określania takiej wartości zmiennej, wokół której skupiają się pozostałe wartości tejże zmiennej. Małgorzata Podogrodzka, SGH ISiD

27 Małgorzata Podogrodzka, SGH ISiD
I.1 średnia arytmetyczna Badamy grupę 10 osób i interesuje nas, jaką łączną oraz średnią liczbę książek przeczytali oni w ciągu ostatniego roku kalendarzowego oraz ile złotych (w setkach) wydali na ich zakup liczba książek: 2; 4; 6; 2; 4; 5; 5; 2; 5; 5 wydatki: ,56; 1,28; 1,11; 2,54; 3,67; 4,10; 4,99; 5,78, 5,12; 7,03 średnia arytmetyczna nieważona: dane niepogrupowane: Małgorzata Podogrodzka, SGH ISiD

28 średnia arytmetyczna ważona:
dane punktowe pogrupowane xi 2 4 5 6 ni 3 1 10 dane przedziałowe (0-2> 2-4 4-6 6-8 1 3 5 7 x ni 2 4 10 Małgorzata Podogrodzka, SGH ISiD

29 własności średniej arytmetycznej:
czy zawsze można (należy) wyznaczyć średnią arytmetyczną (postać rozkładu i sposób przedstawienia danych) ? xi (0-2> 2-4 4-6 6 i więcej ni 3 2 4 1 10 Małgorzata Podogrodzka, SGH ISiD

30 Małgorzata Podogrodzka, SGH ISiD
Średnia geometryczna Średnia harmoniczna Małgorzata Podogrodzka, SGH ISiD

31 Małgorzata Podogrodzka, SGH ISiD
I.2 kwantyl rzędu p (0 < p < n) Kwartyle Qp - miary (wartości cechy), które dzielą badaną zbiorowość na cztery równe części dane punktowe: Fn (Q1 )  0,25; Fn (Q2 ) =me 0,50; Fn (Q3 )  0,75 dane pierwotne : 2; 4; 6; 2; 4; 5; 5; 2; 5; 5 dane uporządkowane: 2; 2; 2; 4; 4; 5; 5; 5; 5; 6 (8) Jeżeli n = 10 (l. parzysta) to mediana (wartość środkowa) liczona jest jako średnia arytmetyczna z dwóch środkowych wyrazów w uporządkowanym szeregu me = (4 + 5) / 2 = 4,5 Jeżeli n = 11 (l. nieparzysta) to mediana przyjmuje wartość wyrazu środkowego w uporządkowanym szeregu (8) me = 5 Małgorzata Podogrodzka, SGH ISiD

32 Małgorzata Podogrodzka, SGH ISiD
N=10 Miara ta zawsze wyznacza rozłączne zbiory !!!! N=11 mediana mediana Małgorzata Podogrodzka, SGH ISiD

33 Małgorzata Podogrodzka, SGH ISiD
szereg rozdzielczy punktowy szukamy wiersza, gdzie po raz pierwszy przekroczona (dokładna) zostanie wartość częstości skumulowanej odpowiadająca podziałowi zbiorowości na odpowiednie części xi ni wi ws 2 4 5 6 3 1 0,30 0,20 0,40 0,10 0,50 0,90 1,00    Q1 = 2  Q2 = 4    Q3 = 5 10 X Małgorzata Podogrodzka, SGH ISiD

34 Małgorzata Podogrodzka, SGH ISiD
dane przedziałowe: x0Q - dolna granica przedziału, w którym znajduje się wartość kwartyla n(x0Q-1) / Fn(x0Q-1) – skumulowana liczebność / częstość w przedziale poprzedzającym klasę kwartyla, hQ / nQ, / wQ - rozpiętość / liczebność / częstość przedziału, w którym znajduje się kwartyl Małgorzata Podogrodzka, SGH ISiD

35 Małgorzata Podogrodzka, SGH ISiD
szukamy wiersza, gdzie po raz pierwszy przekroczona (dokładna) zostanie wartość częstości skumulowanej odpowiadająca podziałowi zbiorowości na odpowiednie części, a następnie podstawiamy do odpowiedniego wzoru (x0i – x1i> ni Wi ws 0-2 2-4 4-6 6-8 3 2 4 1 0,30 0,20 0,40 0,10 0,50 0,90 1,00  Q1 = ?   Q2 = 4  Q3 = ? 10 x Q1=0+(0,25-0,00)*2/0,30=1,67 Q3=……… Małgorzata Podogrodzka, SGH ISiD

36 Małgorzata Podogrodzka, SGH ISiD
czy zawsze można (należy) wyznaczyć medianę? z jakiej postaci wykresu możemy odczytać kwartyle ? Małgorzata Podogrodzka, SGH ISiD

37 Małgorzata Podogrodzka, SGH ISiD
I.3 dominanta (moda) (do)   dane punktowe: do = xk dla której nk = max { ni } lub wk = max { wi } szereg rozdzielczy punktowy xi ni wi 2 4 5 6 3 1 0,30 0,20 0,40 0,10    do = 5 10 1,00 Małgorzata Podogrodzka, SGH ISiD

38 Małgorzata Podogrodzka, SGH ISiD
dane przedziałowe: x0d - dolna granica przedziału, w którym występuje dominanta, hd - rozpiętość tego przedziału, nd / wd / nd-1 / wd-1 / nd+1 / wd+1 - liczebność / częstość przedziału w którym występuje dominanta, przedziału poprzedniego i następnego po klasie, w której występuje dominanta. (x0i – x1i> ni wi 0-2 2-4 4-6 6-8 3 2 4 1 0,30 0,20 0,40 0,10   do = ? 10 1,00 do=4+(4-2)/(2∙4-2-1) ∙2=4,80 Małgorzata Podogrodzka, SGH ISiD

39 Małgorzata Podogrodzka, SGH ISiD
czy zawsze można wyznaczyć dominantę? z jakiej postaci wykresu możemy odczytać dominantę ? r. dwumodalny r. dwuwierzchołkowy antymoda Małgorzata Podogrodzka, SGH ISiD

40 Małgorzata Podogrodzka, SGH ISiD
2. Miary zmienności (zróżnicowania, dyspersji) służą do oceny stopnia rozproszenia wartości cechy. zróżnicowanie wartości cechy ogółem, w części zbiorowości, wokół przeciętnej ? Małgorzata Podogrodzka, SGH ISiD

41 II.1 Wariancja (odchylenie standardowe) S(X)
dane niepogrupowane: 2; 4; 6; 2; 4; 5; 5; 2; 5; 5 średnia dane pogrupowane punktowe: xi 2 4 5 6 ni 3 1 10 pojedńcze odchylenia od średniej Małgorzata Podogrodzka, SGH ISiD

42 dane pogrupowane przedziałowe:
2 4 5 6 wi 0,3 0,2 0,4 0,1 1,0 Małgorzata Podogrodzka, SGH ISiD

43 Małgorzata Podogrodzka, SGH ISiD
czy zawsze można (należy) wyznaczyć odchylenie standardowe ? Małgorzata Podogrodzka, SGH ISiD

44 Odchylenie przeciętne d1 od wartości średniej
Odchylenie przeciętne d2 od mediany Małgorzata Podogrodzka, SGH ISiD

45 II.2a klasyczny współczynnik zmienności V(X)=<0; 1>
II.2b pozycyjny współczynnik zmienności II.3a rozstęp II.3b rozstęp ćwiartkowy Małgorzata Podogrodzka, SGH ISiD

46 Małgorzata Podogrodzka, SGH ISiD
II.4 współczynnik nierównomierności II. odchylenie ćwiartkowe Która z badanych cech (liczba książek czy wydatki na nie) charakteryzuje się większym zróżnicowaniem (rozproszeniem, dyspersją) ? Małgorzata Podogrodzka, SGH ISiD

47 Małgorzata Podogrodzka, SGH ISiD
III. Miary asymetrii służą do oceny stopnia skośności wartości zmiennej. r.prawostronny do<me<średnia r.lewostronny do>me>średnia r.symetryczny średnia=me=do Małgorzata Podogrodzka, SGH ISiD

48 Małgorzata Podogrodzka, SGH ISiD
reguła 3 odchyleń standardowych cecha ciągła, rozkład symetryczny w( S(X) < X < S(X) ) = 0,68 w(2 ∙ S(X) < X < 2 ∙ S(X) = 0,95 w(3 ∙ S(X) < X < 3 ∙ S(X) = 0,99 Małgorzata Podogrodzka, SGH ISiD

49 Małgorzata Podogrodzka, SGH ISiD
III.1 współczynnik skośności III.2 współczynnik asymetrii klasyczny A  (-2; +2) pozycyjny A  (-1; +1) klasyczno-pozycyjny A  (-1; +1) A Małgorzata Podogrodzka, SGH ISiD


Pobierz ppt "Małgorzata Podogrodzka, SGH ISiD"

Podobne prezentacje


Reklamy Google