Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
1
Zmienne losowe i ich rozkłady
Biostatystyka inż. Jacek Jamiołkowski Wykład 4 Zmienne losowe i ich rozkłady
2
Definicja zmiennej losowej
Zmienną losową nazywamy funkcję określoną na przestrzeni zdarzeń elementarnych, przyporządkowującą każdemu zdarzeniu elementarnemu liczbę rzeczywistą z określonym prawdopodobieństwem. Wartości jej nie możemy więc z góry przewidzieć, bowiem zależy ona od przyczyn losowych. Przykładowo, jeśli zmienną losową X zdefiniujemy sobie jako „sumę oczek dwoma kostkami”, to jasne jest, że wartości funkcji nie można z góry przewidzieć. Wartościami funkcji mogą być liczby rzeczywiste (2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12), z określonymi prawdopodobieństwami (najmniejsze jest prawdopodobieństwo wyrzucenia sumy oczek 2 i 12, a największe 7, ze względu na liczbę sprzyjających zdarzeń elementarnych).
3
Rodzaje zmiennych losowych
Jeżeli zbiór wartości zmiennej losowej jest zbiorem przeliczalnym lub skończonym, wówczas zmienną losową nazywamy dyskretną. Jeśli natomiast zmienna losowa przyjmuje dowolne wartości z pewnego przedziału liczbowego, to nazywamy ją zmienną losową ciągłą.
4
Definicja dystrybuanty
Niezależnie od typu, każdą zmienną losową X można jednoznacznie określić za pomocą teoretycznej dystrybuanty. Dodatkowo, oprócz dystrybuanty zmienna losowa dyskretna charakteryzowana jest za pomocą funkcji prawdopodobieństwa, a zmienna losowa ciągła za pomocą funkcji gęstości rozkładu. Dystrybuantą zmiennej losowej X nazywamy funkcję F(x), określonej na całym zbiorze liczb rzeczywistych (xR), zdefiniowanej następująco: F(x) = P(X < x) Czyli innymi słowy wartość dystrybuanty zmiennej losowej X w punkcie x, jest prawdopodobieństwem, że zmienna losowa X przyjmie wartość mniejszą niż x.
5
Własności dystrybuanty
Dystrybuanta: F(x) = P(X < x) 0 ≤ F(x) ≤ 1 F(x) jest funkcją niemalejącą F(x) jest funkcją przynajmniej lewostronnie ciągłą
6
Parametry rozkładów zmiennych losowych
Z rozkładem każdej zmiennej losowej związane są pewne charakteryzujące go wielkości liczbowe. Charakterystyki te nazywa się parametrami rozkładu zmiennej losowej. Do najważniejszych parametrów zmiennych losowych należą wartość oczekiwana i wariancja zmiennej losowej. Wartość oczekiwana E(x) = m jest wartością, wokół której skupiają się wartości zmiennej losowej przy wielokrotnym powtarzaniu eksperymentu. Wariancja V(x) = σ2 zmiennej losowej to miara rozproszenia wartości zmiennej wokół wartości oczekiwanej, którą oblicza się ze wzoru: V(x) = E(X – E(X))2
7
Zmienne losowe i ich rozkłady
Rozkład zmiennej losowej dyskretnej
8
Zmienna losowa dyskretna
Zmienna losowa X jest typu dyskretnego, jeżeli istnieje skończony, albo przeliczalny zbiór jej wartości x1, x2, …, xn, … przyjmowanych przez zmienną z prawdopodobieństwami odpowiednio p1, p2, …, pn, … Funkcja prawdopodobieństwa zmiennej losowej X jest wówczas określona następująco: przy czym: jeśli zbiór wartości zmiennej losowej jest skończony jeśli zbiór wartości zmiennej losowej jest przeliczalny
9
Funkcja prawdopodobieństwa
Funkcję prawdopodobieństwa zmiennej losowej dyskretnej X można przedstawiać w postaci tabeli par (xi, pi) – jeśli jest to zbiór skończony: Wartości zmiennej dyskretnej (xi) x1 x2 … xn Prawdopodobieństwa poszczególnych wartości (pi) p1 p2 pn
10
Funkcja prawdopodobieństwa
Przykład: Określ funkcję prawdopodobieństwa zmiennej losowej X, zdefiniowanej jako liczbę reszek, wyrzuconych podczas rzutu 3 monetami.
11
Funkcja prawdopodobieństwa
Przestrzeń zdarzeń elementarnych doświadczenia losowego jest następująca: Ω = {(O, O, O), (O, O, R), (O, R, O), (O, R, R), (R, O, O), (R, O, R), (R, R, O), (R, R, R)} W doświadczeniu można wyrzucić 0, 1, 2 lub 3 reszki, zatem: x1 = 0, x2 = 1, x3 = 2, x4 = 3, a p1 = 1/8, p2 = 3/8, p3 = 3/8, p4 = 1/8 Funkcja prawdopodobieństwa zmiennej losowej będącej liczbą reszek wyrzuconych w wyniku rzutu 3 monetami jest następująca: xi 1 2 3 pi 0,125 0,375
12
Funkcja prawdopodobieństwa
Funkcję prawdopodobieństwa zmiennej losowej dyskretnej można przedstawić również w postaci wykresu:
13
Dystrybuanta zmiennej losowej dyskretnej
Dystrybuanta zmiennej losowej dyskretnej spełnia ogólną definicję: F(x) = P(X < x) i przyjmuje postać: Np. F(x1) = 0 F(x2) = p1 F(x3) = p1 + p2 F(x4) = p1 + p2 + p3 … F(xn) = p1 + p2 + p3 + … + pn = 1
14
Dystrybuanta zmiennej losowej dyskretnej
Przykład: Określić dystrybuantę zmiennej losowej X zdefiniowanej jako liczba reszek wyrzuconych za pomocą 3 monet.
15
Dystrybuanta zmiennej losowej dyskretnej
Funkcja prawdopodobieństwa dla tej zmiennej losowej została już określona: xi 1 2 3 pi 0,125 0,375 Należy pamiętać, że dystrybuanta przyjmuje wartości dla każdej liczby rzeczywistej, a nie tylko dla wartości przyjmowanych przez zmienną losową, dlatego w przypadku dyskretnej zmiennej losowej wartości dystrybuanty najwygodniej określić za pomocą przedziałów: x (-∞; 0 (0; 1 (1; 2 (2; 3 (3; +∞ F(x) p1 = 0,125 p1 + p2 = 0,5 p1 + p2 + p3 = 0,875 p1 + p2 + p3 + p4 = 1
16
Dystrybuanta zmiennej losowej dyskretnej
Dystrybuantę zmiennej losowej dyskretnej można przedstawić również w postaci wykresu:
17
Wartość oczekiwana i wariancja
Wartość oczekiwana dyskretnej zmiennej losowej określona jest wzorem: Wariancję dyskretnej zmiennej losowej wyraża wzór:
18
Wartość oczekiwana i wariancja
Przykład: Wyznacz wartość oczekiwaną i wariancję zmiennej losowej X określonej jako liczbę wyrzuconych reszek w rzucie 3 monetami.
19
Wartość oczekiwana i wariancja
Funkcja prawdopodobieństwa dla tej zmiennej losowej została już określona: xi 1 2 3 pi 0,125 0,375 E(X) = x1 · p1 + x2 · p2 + x3 · p3 + x4 · p4 = = 0 · 0, · 0, · 0, · 0,125 = = 0, ,75 + 0,375 = 1,5 V(X) = (x1 – E(X))2 · p1 + (x2 – E(X))2 · p2 + (x3 – E(X))2 · p3 + + (x4 – E(X))2 · p4 = = (0 – 1,5)2 · 0,125 + (1 – 1,5)2 · 0,375 + (2 – 1,5)2 · 0,375 + + (3 – 1,5)2 · 0,125 = = 2,25 · 0, ,5 · 0, ,5 · 0, ,25 · 0,125 = = 0, , , ,28124 = 0,75
20
Zmienne losowe i ich rozkłady
Wybrane rozkłady dyskretne
21
Rozkład równomierny Z rozkładem równomiernym (inaczej zwany jednostajnym), mamy do czynienia gdy zmienna losowa może przyjmować wszystkie wartości z jednakowym prawdopodobieństwem: Przykładem zmiennej losowej o równomiernym rozkładzie jest zmienna X zdefiniowana jako „liczba oczek uzyskana w wyniku rzutu jedną kostką”. xi x1 x2 … xn pi 1/n
22
Rozkład zero-jedynkowy
Rozkład zero-jedynkowy występuje w sytuacji, gdy rezultatem doświadczenia losowego są dwa wykluczające się zdarzenia. Zmienna losowa X ma rozkład zero-jedynkowy, jeśli przyjmuje wartość 1 z prawdopodobieństwem p, a wartość 0 z prawdopodobieństwem q = 1 – p. Funkcja prawdopodobieństwa ma postać: Przykładem zmiennej losowej o rozkładzie zero-jedynkowym jest zmienna zdefiniowana następująco „wynikowi rzutu monetą przypisujemy 1 w przypadku wyrzucenia orła, a 0 w przypadku reszki”. xi 1 pi q p
23
Rozkład dwumianowy (Bernoulliego)
Jeśli mamy do czynienia z doświadczeniem Bernoulliego, tzn. gdy wielokrotnie (n ≥ 2) powtarzane jest doświadczenie losowe, którego wynikiem może być jeden z dwóch stanów: „sukces” z prawdopodobieństwem p lub „porażka” z prawdopodobieństwm q = 1 – p, to zmienna losowa określona jako „liczba sukcesów w n próbach” ma rozkład dwumianowy z parametrami n i p, przy czym zmienna losowa może przyjąć wartości k = 0, 1, 2, …, n. Prawdopodobieństwo wystąpienia tych wartości określa wzór: Przykładem zmiennej losowej o rozkładzie dwumianowym jest zmienna określona jako „liczba orłów wyrzuconych w 100 rzutach monetą”. Zmienna ma rozkład dwumianowy o parametrach n = 100 i p = 0,5.
24
Rozkład dwumianowy (Bernoulliego)
Wartość oczekiwana i wariancja zmiennej losowej o takim rozkładzie zależy od parametrów rozkładu i dana jest wzorami: E(X) = n · p V(X) = n · p · q Np. dla przytoczonego przykładu: E(X) = 100 · 0,5 = 50 V(X) = 100 · 0,5 · 0,5 = 25 czyli najbardziej prawdopodobne jest, że w 100 rzutach monetą wypadnie 50 razy orzeł.
25
Rozkład Poissona Zmienna losowa X, przyjmująca wartości k = 0, 1, 2, … z prawdopodobieństwami określonymi wzorem: ma rozkład Poissona o parametrze λ. Przedstawia on liczbę wystąpień jakiegoś zjawiska w określonej liczbie prób, jeśli te zdarzenia są niezależne od siebie. Rozkład Poissona jest używany do obliczenia przybliżonych wartości prawdopodobieństwa rozkładzie dwumianowego w przypadku dużej liczby prób (n ≥ 50) i niskim prawdopodobieństwie sukcesu (p ≤ 0,1), przy czym parametr rozkładu Poissona jest wyrażony zależnością: λ = n · p. Można to w skrócie zapisać:
26
Rozkład Poissona Dystrybuanta zmiennej losowej X o rozkładzie Poissona dana jest wzorem: Wartość oczekiwana i wariancja zmiennej losowej o rozkładzie Poissona równe są parametrowi λ tego rozkładu, tzn.: E(X) = λ V(X) = λ Przykładem zmiennej losowej o rozkładzie zbliżonym do rozkładu Poissona jest zmienna „liczba wypadków w ciągu roku, przy prawdopodobieństwie dziennym wynoszącym 0,001”
27
P(X = k) = p · qk – 1, gdzie q = 1 – p
Rozkład geometryczny Rozkład geometryczny opisuje prawdopodobieństwo zdarzenia, że pierwszy „sukces” w doświadczeniu Bernoulliego wystąpi dokładnie w k-tej próbie. Zmienna losowa X ma rozkład geometrycznym jeśli przyjmuje wartości k = 1, 2, 3, …, a jej funkcja prawdopodobieństwa dana jest wzorem: P(X = k) = p · qk – 1, gdzie q = 1 – p Przykładem zmiennej losowej o rozkładzie geometrycznym jest zmienna „w którym rzucie monetą wypadnie pierwszy orzeł”. Dystrybuantę rozkładu geometrycznego opisuje wzór:
28
Rozkład geometryczny Wartość oczekiwana i wariancja rozkładu geometrycznego wyrażone są wzorami: Np. W którym rzucie kostką można oczekiwać, że wypadnie czwórka? p = 1/6 E(X) = 6
29
Rozkład hipergeometryczny
Rozkład hipergeometryczny jest związany z tzw. schematem urnowym. Jest to doświadczenie polegające na losowaniu bez zwracania n elementów spośród populacji zawierającej M elementów typu pierwszego i N elementów typu drugiego. Rozkład hipergeometryczny określa liczbę wylosowanych w takim doświadczeniu elementów typu pierwszego. Należy zwrócić uwagę, że prawdopodobieństwo sukcesu zmienia się po każdym wylosowanym elemencie, ponieważ losowanie przebiega bez zwracania (odmiennie niż w rozkładzie dwumianowym).
30
Rozkład hipergeometryczny
Funkcja prawdopodobieństwa rozkładu hipergeometrycznego opisana jest wzorem: gdzie M jest liczbą interesujących nas elementów, N liczbą pozostałych elementów, n liczbą losowanych elementów, a k liczbą wylosowanych interesujących nas elementów. Wartość oczekiwana i wariancja wyrażone są wzorami: gdzie:
31
Zmienne losowe i ich rozkłady
Rozkład zmiennej losowej ciągłej
32
Zmienna losowa ciągła Zmienną losową ciągłą nazywamy taką funkcję X, która przyjmuje dowolne wartości z pewnego przedziału liczbowego (lub przedziałów). Z powyższej definicji wynika, że liczba wszystkich możliwych i wzajemnie się wykluczających zdarzeń elementarnych jest nieskończona i dlatego prawdopodobieństwo w punkcie odpowiadającym xi równa się zero. Innymi słowy zdarzenie, że wzrost losowo wybranej osoby wynosi dokładnie 175, … (nieskończenie wiele 0 po przecinku) jest niemożliwe. Z tego względu opis rozkładu zmiennej losowej ciągłej musi być inny niż dla zmiennej losowej dyskretnej. Do opisania rozkładu zmiennej losowej ciągłej służy funkcja gęstości prawdopodobieństwa.
33
Funkcja gęstości prawdopodobieństwa
Funkcja gęstości prawdopodobieństwa ciągłej zmiennej losowej X to dowolna funkcja nieujemna f (x) ≥ 0 określona na zbiorze liczb rzeczywistych o własności: To znaczy pole pod krzywą funkcji gęstości prawdopodobieństwa w przedziale (a, b) jest równe prawdopodobieństwu, że zmienna X przyjmie wartość z tego przedziału. Z powyższego wynika, że funkcja gęstości prawdopodobieństwa musi spełniać warunek: (prawdopodobieństwo zdarzenia pewnego jest równe 1)
34
Funkcja gęstości prawdopodobieństwa
f (x) P(a<X<b)
35
Dystrybuanta zmiennej losowej ciągłej
Dystrybuanta zmiennej losowej ciągłej musi spełniać ogólną definicję: F(x) = P(X < x) i przyjmuje postać:
36
Dystrybuanta zmiennej losowej ciągłej
Dystrybuanta zmiennej losowej ciągłej posiada następujące własności: przy czym a < b
37
Dystrybuanta zmiennej losowej ciągłej
Dystrybuantę zmiennej losowej ciągłej można przedstawić w postaci wykresu: P(X<3)=0,5
38
Charakterystyki liczbowe zmiennej losowej
Wartość oczekiwana ciągłej zmiennej losowej określona jest wzorem: Wariancję ciągłej zmiennej losowej wyraża wzór: Medianą ciągłej zmiennej losowej jest taka wartość x, dla której spełniona jest równość:
39
Zmienne losowe i ich rozkłady
Wybrane rozkłady ciągłe
40
Rozkład jednostajny Zmienna losowa X ma rozkład jednostajny w przedziale (a, b), jeśli jej funkcja gęstości i dystrybuanta określone są wzorami: a b a b
41
Rozkład jednostajny Jeśli zmienna losowa ma rozkład jednostajny, to wystąpienie dowolnej wartości z określonego przedziału jest jednakowo prawdopodobne, a wartości spoza tego przedziału nie występują wcale. Parametry rozkładu jednostajnego – wartość oczekiwaną, wariancję i medianę opisują wzory:
42
Rozkład jednostajny Przykład:
Autobusy komunikacji miejskiej przyjeżdżają na przystanek dokładnie co 10 minut. Pasażer przychodzi na przystanek w przypadkowym momencie czasu. Zmienna X oznacza czas oczekiwania na przyjazd autobusu. Określić rozkład zmiennej losowej X, jej gęstość, dystrybuantę oraz obliczyć prawdopodobieństwo, że pasażer będzie oczekiwał na autobus krócej niż 8 minut. Jaka będzie wartość oczekiwana, wariancja, odchylenie standardowe i mediana zmiennej losowej X?
43
Rozkład jednostajny Z warunków zadania wynika, że najkrótszy czas oczekiwania wynosić może 0 minut, a najdłuższy 10 minut. Wszystkie wartości pośrednie są jednakowo prawdopodobne, zatem mamy do czynienia z rozkładem jednostajnym. Wartość funkcji gęstości prawdopodobieństwa zmiennej X, zgodnie ze wzorem ma postać:
44
Rozkład jednostajny Dystrybuanta zmiennej X na podstawie przedstawionego wzoru to: Prawdopodobieństwo, że pasażer będzie oczekiwał na autobus krócej niż 8 minut, czyli P(X<8) można obliczyć korzystając z wyznaczonej dystrybuanty rozkładu:
45
Rozkład jednostajny Parametry rozkładu zmiennej X, zgodnie z przedstawionymi wzorami wynoszą:
46
Rozkład wykładniczy Zmienna losowa X ma rozkład wykładniczy z parametrem λ (gdzie λ > 1), jeżeli funkcja gęstości i dystrybuanta określone są wzorami:
47
Rozkład wykładniczy Jeśli zmienna losowa ma rozkład wykładniczy, to nie może przyjąć wartości ujemnej, a prawdopodobieństwo wartości dodatniej zmniejsza się wykładniczo ze wzrostem jej wartości. Rozkład taki opisuje często czas trwania różnych zdarzeń, np. czas bezawaryjnej pracy jakiegoś urządzenia, czas wykonywania jakiejś czynności, itp. Parametry rozkładu wykładniczego – wartość oczekiwaną, wariancję i medianę opisują wzory:
48
Rozkład wykładniczy Przykład:
Zaobserwowano, że czas rozmowy w pewnym automacie telefonicznym można opisać rozkładem wykładniczym, przy czym średni czas trwania rozmowy wynosi 50 sekund. Jaka jest funkcja gęstości i dystrybuanta tego rozkładu? Jakie jest prawdopodobieństwo, że losowo wybrana osoba będzie rozmawiać krócej niż pół minuty? A jakie, że rozmowa potrwa dłużej niż 2 minuty?
49
Rozkład wykładniczy Wiadomo, że zmienna losowa X, wyrażająca czas rozmowy losowo wybranej osoby ma rozkład wykładniczy, oraz że E(X)=50. Aby wyznaczyć funkcję gęstości zmiennej X, należy znaleźć parametr λ rozkładu: E(X) = λ λ = 50 Zatem funkcja gęstości prawdopodobieństwa zdefiniowana jest następująco:
50
Rozkład wykładniczy Dystrybuanta zmiennej losowej X:
P(X < 30) = F(30) = 1 – e-30/50 = 1 – e-0,6 = 1 – 0,549 = 0,451 P(X > 120) = 1 – P(X < 120) = 1 – F(120) = 1 – 1 + e-120/50 = = e-2,4 = 0,091
51
Rozkład normalny Rozkład normalny, nazywany także rozkładem Gaussa spełnia bardzo ważną rolę, zarówno w statystyce matematycznej jak i naukach przyrodniczych. Bardzo wiele metod statystycznych opiera się na zastosowaniu tego rozkładu. Obserwacja wielu zjawisk przyrodniczych pozwoliła stwierdzić, że odbywają się one zgodnie z rozkładem normalnym, lub bardzo zbliżonym do niego. Wynika to z centralnego twierdzenia granicznego, zgodnie z którym suma dużej liczby zmiennych losowych o dowolnym, takim samym rozkładzie zbliża się do rozkładu normalnego. Np. strumień światła, składa się z fotonów, których emitowana energia odpowiada rozkładowi Poissona, jednak obserwowany strumień w skali makro, złożony z ogromnej liczby pojedynczych fotonów ma rozkład normalny.
52
Rozkład normalny Zmienna losowa X ma rozkład normalny z parametrami μ i σ, jeżeli funkcja gęstości i dystrybuanta określone są wzorami:
53
Rozkład normalny Niemożliwe jest przedstawienie dystrybuanty rozkładu normalnego w prostszej postaci, ponieważ nie da się wyrazić całki zawarta we wzorze w postaci funkcji elementarnych. Z tego względu obliczenie wartości dystrybuanty rozkładu normalnego w punkcie x jest bardzo złożone. W sytuacji, gdy konieczna jest znajomość wartości dystrybuanty, można skorzystać z tablic matematycznych. Można także obliczyć wartość dystrybuanty korzystając z komputera. Np. w arkuszu kalkulacyjnym Microsoft Excel można to zrobić za pomocą funkcji: =ROZKŁAD.NORMALNY(x;μ;σ;1)
54
Rozkład normalny W tablicach matematycznych, podane są wartości dystrybuanty dla różnych wartości x dla rozkładu standaryzowanego. Rozkład standaryzowany, to rozkład normalny o parametrach: μ = 0 i σ = 1, co zapisuje się: N(0, 1). Aby odczytać z tablicy wartość dystrybuanty dla zmiennej losowej X o rozkładzie normalnym z innymi parametrami μ i σ, należy dokonać jej standaryzacji, to znaczy należy zdefiniować pomocniczą zmienną losową Z, poprzez przekształcenie zmiennej X, która będzie miała rozkład N(0, 1): A zatem:
55
Rozkład normalny Na przykład wartość dystrybuanty rozkładu normalnego o parametrach N(5,2) w punkcie 7, odpowiada wartości dystrybuanty rozkładu standaryzowanego N(0,1) w punkcie: (7 – 5) / 2 = 1
56
Rozkład normalny Charakterystyki liczbowe rozkładu wykładniczego – wartość oczekiwaną, wariancję, medianę i wartość modalną opisują wzory: Jak łatwo zauważyć, wartość oczekiwana, mediana i wartość modalna dla rozkładu normalnego o parametrach μ i σ znajdują się w tym samym punkcie μ, co wynika z symetrii rozkładu.
57
Rozkład normalny Przykład:
Wydajność produkcyjna pewnego zakładu jest zmienną losową o rozkładzie normalnym, z wartością oczekiwaną 12 ton/h i odchyleniem standardowym 2 tony/h. Jakie jest prawdopodobieństwo, że wydajność będzie: - mniejsza niż 15 ton/h, - mniejsza niż 7 ton/h, - większa niż 14 ton/h, - mieści się w przedziale od 8 do 12 ton/h?
58
Rozkład normalny Zmienna losowa ma rozkład X ~ N(12,2), zatem:
P(X < 15) = F(15) = FN(0,1)((15 – 12) / 2) = FN(0,1)(1,5) = 0,933 P(X < 7) = F(7) = FN(0,1)((7 – 12) / 2) = FN(0,1)(-2,5) = 0,006 P(X > 14) = 1 – F(14) = 1 – FN(0,1)((14 – 12) / 2) = = 1 – FN(0,1)(1) = 1 – 0,841 = 0,159 P(8 < X < 12) = F(12) – F(8) = = FN(0,1)((12 – 12) / 2) – FN(0,1)((8 – 12) / 2) = = FN(0,1)(0) – FN(0,1)(-2) = 0,500 – 0,023 = 0,477
59
Inne rozkłady ciągłe Istnieje wiele innych ważnych rozkładów ciągłych, których wartości można odnaleźć w tablicach: 1. Rozkład t-Studenta z jednym parametrem ν nazywanym liczbą stopni swobody. 2. Rozkład χ-kwadrat (chi-kwadrat) również z jednym parametrem n lub df nazywanym liczbą stopni swobody. 3. Rozkład Fishera- Snedecora. 4. Rozkład Gamma i wiele innych.
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.