Wnioskowanie statystyczne

Slides:

Advertisements

Podobne prezentacje

ESTYMACJA PRZEDZIAŁOWA

Advertisements

Wnioskowanie statystyczne

Testy sekwencyjne Jan Acedański.

Statystyka Wojciech Jawień

Wykład 5 Standardowy błąd a odchylenie standardowe

Rachunek prawdopodobieństwa 2

Zmienne losowe i ich rozkłady

Analiza wariancji jednoczynnikowa

Zmienne losowe i ich rozkłady

BUDOWA MODELU EKONOMETRYCZNEGO

Symulacja zysku Sprzedaż pocztówek.

Statystyczne parametry akcji

Statystyka w doświadczalnictwie

Rachunek prawdopodobieństwa 1

Niepewności przypadkowe

Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego

Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.

Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego

Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.

Wykład 4 Przedziały ufności

Elementy Rachunku Prawdopodobieństwa c.d.

Elementy Rachunku Prawdopodobieństwa c.d.

Metody Przetwarzania Danych Meteorologicznych Wykład 4

Wzory ułatwiające obliczenia

Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.

Wykład 4. Rozkłady teoretyczne

Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych Dr inż. Halina Tarasiuk

Średnie i miary zmienności

Analiza wariancji.

Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych

Co to są rozkłady normalne?

Co to są rozkłady normalne?

Hipotezy statystyczne

Podstawy statystyki Dr Janusz Górczyński.

Elementy Rachunku Prawdopodobieństwa i Statystyki

Konstrukcja, estymacja parametrów

Elementy Rachunku Prawdopodobieństwa i Statystyki

i jak odczytywać prognozę?

Ekonometria. Co wynika z podejścia stochastycznego?

Elementy Rachunku Prawdopodobieństwa i Statystyki

Rozkłady wywodzące się z rozkładu normalnego standardowego

Hipotezy statystyczne

Projekt wykonany przez studentów I roku ARI Politechniki Wrocławskiej:

DOŚWIADCZENIA LOSOWE.

Elementy Rachunku Prawdopodobieństwa i Statystyki

Co to jest dystrybuanta?

Dopasowanie rozkładów

Wnioskowanie statystyczne

Zagadnienia AI wykład 2.

STATYSTYKA Pochodzenie nazwy:

Metody Matematyczne w Inżynierii Chemicznej Podstawy obliczeń statystycznych.

Modele zmienności aktywów

Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.

MODELOWANIE ZMIENNOŚCI CEN AKCJI

Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.

STATYSTYKA – kurs podstawowy wykład 3 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.

Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.

STATYSTYKA – kurs podstawowy wykład 4 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

STATYSTYKA – kurs podstawowy wykład 2 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.

Rozkład z próby Jacek Szanduła.

Statystyka matematyczna

Statystyka matematyczna

Statystyka matematyczna

Jednorównaniowy model regresji liniowej

Zmienna losowa. Wybrane rozkłady zmiennej. Przedział ufności.

Analiza niepewności pomiarów Zagadnienia statystyki matematycznej

Zapis prezentacji:

Wnioskowanie statystyczne dr Ewa Putek-Szeląg Katedra Ekonometrii i Statystyki e-mail: wicheru@wneiz.pl Tel. (91) 444 19 63 Konsultacje: czwartek godz. 1000–1200, pok. 212

Wnioskowanie statystyczne Literatura: Hozer J., Kolanko E., Korol M., Lasota B., Witek M., Statystyka. Część II. Wnioskowanie statystyczne, Wydawnictwo Naukowe Uniwersytetu Szczecińskiego, Szczecin 1994. Jóźwiak J., Podgórski J., Statystyka od podstaw, PWE, Warszawa 2006, Aczel A. D., Statystyka w zarządzaniu, PWN, Warszawa 2000 . Greń J., Statystyka matematyczna, modele i zadania, PWN, Warszawa 1987 Balicki A., Makać W., Metody wnioskowania statystycznego, Wydawnictwo Uniwersytetu Gdańskiego, Gdańsk 2007. Luszniewicz A., Statystyka nie jest trudna. Metody wnioskowania statystycznego, PWE, Warszawa 1999. Domański C.,Testy statystyczne, PWE, Warszawa 1990. Fisz M., Rachunek prawdopodobieństwa i statystyka matematyczna, PWN, Warszawa 1976. Domański C., Pruska K., Nieklasyczne metody statystyczne, PWE, Warszawa 2000. Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K., Statystyka w zadaniach. Cz. II, Wydawnictwo Naukowo-Techniczne, Warszawa 2001. Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M., Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach. Część 2. Statystyka matematyczna, Wydawnictwo Naukowe PWN, Warszawa 2002. Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K., Wzory i tablice statystyczne, Katedra Ekonometrii i Statystyki US, Stowarzyszenie Pomoc i Rozwój, Szczecin 1997.

Wnioskowanie statystyczne Właściwości prawdopodobieństwa: (c) (b) (a) A lub B (A+B) A A A i B A*B B ~A A+(~A)=W (d) (e) W A B Zdarzenie pewne W (suma wszystkich zdarzeń możliwych) Zdarzenia rozłączne A, B Jeśli A, B, .. są zdarzeniami rozłącznymi (wykluczają się wzajemnie) to P(A  B  …) = P(A) + P(B) + ... (patrz rysunek d) Jeśli W jest zdarzeniem pewnym to P(W) = 1 (patrz rysunek e) Stąd wynika, że dla dowolnego zdarzenia A 0  P(A)  1 P(A’) = 1 - P(A) (patrz rysunek a) Dla dowolnych zdarzeń A i B P(A  B) = P(A) + P(B) – P(A  B) (patrz rysunki b, c)

Wnioskowanie statystyczne Przykład 1. W sklepie znajdują się magnetowidy trzech firm: I, II, III: 3 razy tyle magnetowidów firmy I co magnetowidów firmy II, a 5 razy tyle magnetowidów firmy I co magnetowidów firmy III. Jakie jest prawdopodobieństwo, że wybierając losowo magnetowid, trafimy na magnetowid firmy II? Niech A oznacza zdarzenie polegające na tym, że trafimy na magnetowid firmy II. Oznaczmy ilość magnetowidów firmy II przez x. Wtedy magnetowidów firmy I będzie 3x, a firmy III będzie 3/5x magnetowidów. Stąd szukane prawdopodobieństwo jest równe: 2. Rzucamy kostką do gry. Jakie jest prawdopodobieństwo, że wypadnie parzysta liczba oczek? – {1, 2, 3, 4, 5, 6} A – {2, 4, 6}

Wnioskowanie statystyczne Przykład Żarówki są produkowane w 3 fabrykach. Z fabryki pierwszej pochodzi 25% produkcji, z fabryki drugiej 35% produkcji a z trzeciej 40%. Produkcja wadliwa wynosi odpowiednio: dla fabryki I – 5%, dla fabryki II – 4%, dla fabryki III – 2%. Wybrana żarówka okazała się wadliwa – jakie jest prawdopodobieństwo, ze pochodzi ona z fabryki pierwszej? Zakładamy: B1 – wybrana żarówka pochodzi z fabryki I, B2 – wybrana żarówka pochodzi z fabryki II, B3 – wybrana żarówka pochodzi z fabryki III, A – wybrana żarówka jest wadliwa. Szukamy P(B1A). Mamy: P(B1) = 0,25; P(B2) = 0,35; P(B3) = 0,40; P(AB1) = 0,05; P(AB2) = 0:04; P(AB3) = 0:02

Wnioskowanie statystyczne Przykład W pudełku jest 10 losów ponumerowanych od 1 do 10. Na los z numerem 1 pada główna wygrana 10 zł, na losy z numerami 2 i 3 wygrana pocieszenia w wysokości 1 zł, a za wyciągnięcie pozostałych płacimy 2 zł. Załóżmy, że wyciągnięcie każdego z losów jest jednakowo prawdopodobne. Doświadczenie polega na wyciągnięciu jednego losu. Przestrzeń zdarzeń elementarnych  = {1, 2, ..., 10} i jest skończona. Określmy funkcję X będzie zmienną losową skokową oznaczającą wygraną, gdzie A = {-2, 1, 10}. Zauważmy, że X(1) = 10, X(2) = X(3) = 1, X(4) = X(5) = ... = X(10) = -2. Rozkład prawdopodobieństwa zmiennej losowej X wartość zmiennej losowej -2 1 10 prawdopodobieństwo 0,7 0,2 0,1 Dystrybuanta zmiennej losowej X

Wnioskowanie statystyczne Przykład Dana jest dystrybuanta zmiennej losowej X x (– ∞, 0] (0, 1] (1, 3] (3, 6] (6, +∞) F(x) 1/3 1/2 5/6 1 Znaleźć rozkład prawdopodobieństwa zmiennej losowej X. xi 1 3 6 pi 1/3 1/6

Wnioskowanie statystyczne Przykład W loterii wypuszczono 500 losów, w tym jeden los z wygraną 1000 zł, pięć losów z wygraną po 200 zł i dwadzieścia losów – po 50 zł. Określić rozkład zmiennej losowej X, będącej wielkością możliwej wygranej osoby, która kupiła jeden los. Obliczyć wartość oczekiwaną i odchylenie standardowe tak określonej zmiennej losowej. Jeżeli zmienna losowa X jest wielkością wygranej właściciela jednego losu to przyjmie wartości 0, 50, 200 lub 1000. Prawdopodobieństwo przyjęcia przez X wartości 1000 jest równe 1/500, wartości 200 wynosi 5/500, wartości 50 jest równe 20/500 a wartości 0, czyli bez wygranej 474/500. Rozkład zmiennej losowej można przedstawić w tabeli: xi 50 200 1000 pi 0,948 0,040 0,010 0,002 Wartość oczekiwana oznacza, że średnia wygrana właściciela jednego losu wynosi 6 zł. Odchylenie standardowe równe około 49,6 zł oznacza, że wygrana właściciela jednego losu przeciętnie odchyla się od średniej o prawie 50 zł.

Wybrane rozkłady zmiennej losowej skokowej Wnioskowanie statystyczne Wybrane rozkłady zmiennej losowej skokowej

Wnioskowanie statystyczne Prawdopodobieństwa odpowiadające poszczególnym wartościom (realizacjom zmiennej losowej X) są następujące: P(X > 2) = P(X = 3) + P(X = 4) + P(X = 5) = 0,0081 + 0,00045 + 0,00001 = 0,00856 Możliwe jest również wyznaczenie prawdopodobieństwa w oparciu o dystrybuantę P(X > 2) = 1 – P(X  2) = 1 – F(2)

Wnioskowanie statystyczne Przykład Obliczyć prawdopodobieństwo wylosowania co najwyżej trzech osób leworęcznych w 200 losowaniach, jeśli wiadomo, że prawdopodobieństwo spotkania osoby leworęcznej w pewnej populacji ludzi wynosi 0,05. Ponieważ spełnione są warunki: p = 0,05 < 0,1 oraz N = 200 > 50, zatem mamy do czynienia z rozkładem Poissona. Wówczas Prawdopodobieństwo wylosowania co najwyżej trzech osób leworęcznych wynosi 0,011.

Wybrane rozkłady zmiennej losowej ciągłej Wnioskowanie statystyczne Wybrane rozkłady zmiennej losowej ciągłej

Wnioskowanie statystyczne Rozkład równomierny (prostokątny, jednostajny) jest najprostszym rozkładem zmiennej losowej typu ciągłego. Rozkład ten bywa czasem stosowany w sytuacji, gdy można przypuszczać, że każda wartość zmiennej w pewnym przedziale liczbowym jest jednakowo możliwa. Rozkład wykładniczy jest jedynym rozkładem ciągłym, który ma własność zwaną brakiem pamięci. Własność tę można interpretować następująco: jeżeli zmienna losowa X jest czasem bezawaryjnej pracy pewnego elementu o rozkładzie wykładniczym, to niezależnie od dotychczasowego czasu pracy elementu, dalszy czas pracy nie zależy od „przeszłości” i ma taki sam rozkład, co całkowity czas pracy elementu.

Wnioskowanie statystyczne Zmienna losowa X ma rozkład normalny o parametrach m oraz , co w skrócie zapisuje się jako X: N(m, s), jeżeli jej funkcja gęstości wyraża się wzorem: Dystrybuantą zmiennej losowej X mającej rozkład normalny jest funkcją F(x) określona na zbiorze liczb rzeczywistych o postaci:

Wnioskowanie statystyczne Funkcja gęstości w rozkładzie normalnym: – jest symetryczna względem prostej x =  (osią symetrii jest prosta pionowa przechodząca przez punkt x = μ), jest rosnąca dla x < μ, a malejąca dla x > μ – w punkcie x =  osiąga wartość maksymalną – ramiona funkcji mają punkty przegięcia dla x =  - σ oraz x =  + σ – kształt funkcji gęstości zależy od wartości parametrów:  i σ. Parametr  decyduje o przesunięciu krzywej, natomiast parametr σ decyduje o „smukłości” krzywej (im mniejsza jest wariancja/odchylenie standardowe, tym wykres gęstości prawdopodobieństwa jest bardziej wysmukły)

Wnioskowanie statystyczne Wartość oczekiwana i wariancja dla rozkładu normalnego wyrażane są następującymi wzorami: Wartość m jest to taka wartość zmiennej losowej X, wokół której skupiają się wyniki wielokrotnych realizacji tej zmiennej. Innymi słowy, oczekuje się (ma się nadzieję), że wielokrotne realizacje zmiennej losowej X będą skupiały się wokół liczby m.

Wnioskowanie statystyczne Reguła trzech sigm Funkcja gęstości rozkładu normalnego ma zastosowanie do reguły „trzech sigma”, którą następnie rozwinięto na regułę „sześć sigma” – stosowaną w kontroli jakości, przede wszystkim w USA (np. General Electric, General Motors Company) Reguła trzech sigma – jeżeli zmienna losowa ma rozkład normalny to: – 68,3 % populacji mieści się w przedziale ( - σ;  + σ) – 95,5 % populacji mieści się w przedziale ( - 2σ;  + 2σ) – 99,7 % populacji mieści się w przedziale ( - 3σ;  + 3σ) Reguła ta ma duże znaczenie w teorii błędów obserwacji, bowiem błędy przypadkowe pomiarów tej samej wielkości fizycznej zwykle tak się rozkładają, że wyniki tych pomiarów mają rozkład normalny. Rozkład ten nie wystąpi, gdy popełniony zostanie tendencyjny błąd systematyczny.

Wnioskowanie statystyczne Tablica dystrybuanty rozkładu normalnego N(0, 1) → dla u =1,64  F(u = 1,64) = Fu = 1,64 = 0,949497

Wnioskowanie statystyczne W celu obliczenia prawdopodobieństwa P(a < X  b) należy skorzystać ze standaryzacji. Jeśli zmienna losowa X ma rozkład N(m, s) to zmienna standaryzowana u ma rozkład N(0,1), czyli: Wartości oraz należy odczytać w tablicach dystrybuanty standaryzowanego rozkładu normalnego. Przykład Dany jest rozkład zmiennej losowej X o parametrach N(15; 5). Obliczyć: a) P(X<12) b) P(X>14) c) P{12 < X < 14} a) P{X < 12} = b) P{X > 14} = 1 – P{X < 14}= 1 – c) P{12 < X < 14} =

Wnioskowanie statystyczne Przykład Wzrost kobiet w pewnej populacji ma rozkład normalny N(165,15). Oznacza to, iż zmienna losowa jaką jest wzrost kobiet ma rozkład normalny ze średnią równą 165 cm i odchyleniem standardowym równym 15 cm. Jaki jest udział w populacji kobiet o wzroście: a) do 160 cm, b) w przedziale 165-170 cm, c) powyżej 175 cm.

Wnioskowanie statystyczne Przykład Zmienna losowa X ma rozkład N(20; 5). Obliczyć ki, wiedząc, że

Wnioskowanie statystyczne

Wnioskowanie statystyczne

Wnioskowanie statystyczne Przykłady 1. W grupie studentów przeprowadzono test ze statystyki , gdzie zmienna losowa Xk oznaczała liczbę zdobytych punktów (od 0 do 100, gdzie k – jest liczbą studentów). Rozkład zmiennej Xk jest identyczny dla wszystkich studentów – E(Xk) = 70; D(Xk) = 20. Obliczyć prawdopodobieństwo tego, że: a) suma punktów uzyskanych przez 100 studentów będzie wyższa od 7500 punktów, b) przeciętna liczba zdobytych punktów w 100–osobowej grupie studentów będzie w przedziale 65–70 pkt. Korzystamy z twierdzenia Lindeberga–Levy’ego a) Niech zmienna Z będzie sumą zmiennych X1, X2, …, X100 → Z100 = X1 + X2 +…+ X100, wówczas ma ona rozkład zbliżony do normalnego o parametrach Prawdopodobieństwo tego, że suma punktów uzyskanych przez 100–osobową grupę studentów będzie wyższa od 7500 p. wynosi 0,621 %. b) Niech zmienna V będzie średnią ze zmiennych X1, X2, …, X100, wówczas ma ona rozkład zbliżony do normalnego o parametrach Prawdopodobieństwo tego, że średnia liczba punktów uzyskanych przez 100–osobową grupę studentów będzie w przedziale 65–70 p. wynosi 49,379 %.

Wnioskowanie statystyczne 2. Pewien towar produkowany jest w 2 gatunkach. 40 % produkcji stanowi gatunek 1, natomiast 60 % – drugi. Jakie jest prawdopodobieństwo, że w niezależnie pobranej partii towaru liczącej 50 sztuk, liczba sztuk 1–go gatunku będzie większa od 24. Jeżeli Yn jest liczbą sukcesów (mamy do czynienia z rozkładem dwumianowym), to jej rozkład dąży do rozkładu normalnego o parametrach 3. Prawdopodobieństwo wylosowania wyrobu 1–go gatunku wynosi 0,25. Obliczyć prawdopodobieństwo tego, że częstość wystąpienia sztuk I gatunku wśród 400 wylosowanych wyrobów wyniesie nie więcej niż 30 %. Przy dużej liczbie obserwacji częstość wystąpienia sukcesu w rozkładzie dwumianowym Yn na rozkład normalny o parametrach