Elementy Rachunku Prawdopodobieństwa i Statystyki Wykład 3 Zmienna losowa – rozważania ogólne ZM dyskretna ZM ciągła Interpretacja geometryczna Tomasz Szumlak, WFiIS, 15/03/2013
Zestaw skrótów Zdarzenie elementarne -> Z.E. Przestrzeń zdarzeń elementarnych -> P.Z.E. Funkcja prawdopodobieństwa (prawdopodobieństwo) -> prob. Zmienna losowa (zmienna stochastyczna, funkcja losowa) -> Z.L. Rozkład gęstości prawdopodobieństwa (funkcja prawdopodobieństwa) -> R.G.P. Lub - rozkład gęstości prawdopodobieństwa -> P.D.F. (to ostatnie szczególnie popularne w problemach dopasowania modelu do kolekcji ‘punktów’ pomiarowych)
Obiektywne czy subiektywne Zmienna losowa Prob. - P: A P(A) [0, 1] P 1 A Prob. wprowadzone formalnie jako funkcja przypisująca każdemu Z.E. liczbę rzeczywistą – zawsze większą od 0 i mniejszą od 1 Aksjomaty nie precyzują w jaki sposób przypisywać Z.E. wartości prob. Dla konkretnego przypadku sami musimy zadecydować jak to zrobić Np. rzut kostką: P(i) = 1/6, rzut monetą P(i) = ½, … i: liczba oczek na danej ścianie kostki, orzeł lub reszka, … 3
Zmienna losowa X + xi i - X: xi X(xi) Np. rzut kostką: P(i) = 1/6, rzut monetą P(i) = ½, … W obu przypadkach mamy jakieś ‘i’ – szansa na uogólnienie…? X + xi i - Zdefiniujmy nową funkcję - X (zmienna losowa, funkcja losowa): X: xi X(xi)
Zmienna losowa Rozważmy dwa poniższe przykłady: podwójny rzut monetą (symetryczną) = {OO, OR, RO, RR} (O – orzeł, R – reszka) niech X reprezentuje liczbę wyrzuconych orłów: pojedynczy rzut kostką = {1, 2, 3, 4, 5, 6} (liczba wyrzuconych oczek) mamy: X(1) = 1, X(2) = 2, … X(6) = 6; X(i) = i Ogólnie: Z.L. jest funkcją, zdefiniowaną na Z.Z.E, która każdemu Z.E. przypisuje liczbę X nie wprowadzamy żadnych ograniczeń co do wartości Z.L. w zasadzie dowolne przyporządkowanie np. dla kostki równie dobre będzie: X(1) = -1000, X(2) = , X(3) = log10(223), … zawsze kierujemy się względami praktycznymi Z.E OO RO OR RR
Zmienna losowa Rozróżniamy dwa rodzaje Z.L. (związane z typem P.Z.E.) dyskretna – przeliczalna (skończona lub nie) liczba Z.E. ciągła – nieprzeliczalna liczba Z.E. Np. skończona liczba rzutów kostką do gry, 10 rzutów trzema monetami, itp. Np. wartość chwilowa napięcia zmierzona w gniazdku, wysokość studenta AGH, itp.
Funkcja zmiennej losowej (dyskretnej) Niech Z.L. przyjmuje wartości X = {x1, x2, … xn} Wiemy, że x1 odpowiada pewnemu Z.E., więc możemy przypisać jej prob.: P(X = x1) = f(x1) lub ogólnie: P(X = xj) = f(xj), j = 1, 2, …, n Funkcję f(xj) nazywamy rozkładem prawdopodobieństwa (R.P), lub rozkładem gęstości prawdopodobieństwa (P.D.F.) Formalnie: funkcję f(x) nazywamy funkcją prawdopodobieństwa (R.P.) jeżeli: 1) 2) suma w 2) rozciąga się po wszystkich możliwych wartościach x, dla zmiennej dyskretnej są to oczywiście wszystkie X = xj, dla wszystkich pozostałych mamy: f(x) = 0
Funkcja zmiennej losowej (dyskretnej) Przykład – rozważmy rzut parą kostek do gry, niech zmienną losową będzie suma oczek na obu kostkach X = (suma oczek na K1 + suma oczek na K2) Z.Z.E. składa się z 36 ‘dwójek’ (oczka na K1, oczka na K2) = {(1,1), (1,2),…, (5,6), (6,6)} każde Z.E. tak samo prawdopodobne: P(j) = 1/36 czyli X = 2 odpowiada (1,1), P(X = 2) = f(2) = 1/36, itd.
Funkcja zmiennej losowej (dyskretnej) X + 1 xi i - Z.L. jest jednym z najważniejszych pojęć statystyki R.G.P. jest podstawowym narzędziem stosowanym do opisu cech zjawiska losowego, które badamy – statystyka opisowa (pojęcie histogramu Wykład 4)
Dystrybuanta zmiennej losowej Dystrybuantą (funkcja rozkładu prawdopodobieństwa całkowitego) zmiennej losowej X, posiadającej F.G.P. f(x) nazywamy funkcję: F(x) = P(X x) Dystrybuanta posiada następujące własności: 1) 2) 3) 4) Z.L. przyjmuje dowolne wartości Dystrybuanta jest funkcją niemalejącą Zachowanie asymptotyczne – całkowite prawdopodobieństwo Dystrybuanta jest funkcją prawostronnie ciągłą
Dystrybuanta zmiennej losowej dyskretnej F(x) = P(X x) = u x f(u) Dystrybuantę dla Z.L. dyskretnej, X, wyznaczamy używając jej R.G.P. F(x) = P(X x) = u x f(u) W tym przypadku pamiętamy, że: zmienna losowa przyjmuje wartości ze zbioru: X = {x1, x2, … xn} f(u) = 0, gdy u {x1, x2, … xn} Dla Z.L. dyskretnej mamy więc:
Dystrybuanta zmiennej losowej dyskretnej Wróćmy do naszego przykładu z kostkami i wyznaczmy dystrybuantę Z.L. X Z definicji: + -
Dystrybuanta zmiennej losowej dyskretnej + - Ogólne cechy dystrybuanty: ‘skokowy’ wzrost funkcji F(x) związany z odpowiednimi prob. wartość dystrybuanty dla danej xj określamy pamiętając o ciągłości z prawej strony dla przykładu powyżej F(7) = 21/36 F(x) jest monotonicznie rosnąca F(x) jednoznacznie definiuje też f(x) – F.G.P. dla zmiennej dyskretnej:
Funkcja zmiennej losowej ciągłej Pamiętając już o tym co wiemy o R.G.P. i dystrybuancie dla Z.L. dyskretnej możemy zdefiniować te same pojęcia dla Z.L. ciągłej Na przykład – Z.L. jest ciągła, jeżeli prawdziwe jest równanie: Przy czym, funkcja f(x) spełnia poniższe warunki: 1) 2) - warunek normalizacji R.G.P. (ZAPISAĆ!) Z powyższych własności wynikają dwa niezmiernie ważne wnioski: P(X = a) = 0! – prob. zdarzenia ‘punktowego’ np. jakie jest prob., że wybrany losowo student ma wzrost 181.5 cm? jakie jest prob., że wzrost losowo wybranego studenta zawiera się w przedziale (180.0, 185.0) cm
Funkcja zmiennej losowej ciągłej Przykład – czy poniższa funkcja może reprezentować R.G.P. ciągłej Z.L.? Funkcja jest nieujemna na podanym przedziale zmienności Warunek normalizacji daje nam: Powyższa funkcja reprezentuje R.G.P. gdy: Mając R.G.P. możemy np. zapytać: jakie jest prob., że Z.L. X2 zawiera się pomiędzy 1/3 i 1?
Dystrybuanta zmiennej losowej ciągłej Przykład – dla funkcji z poprzedniego slajdu znajdziemy dystrybuantę Możemy zauważyć następujący związek: z definicji Z.L. ciągłej: wiemy również, że: Możemy więc zapisać: P(a < X < b) = F(b) – F(a) Wniosek, znając dystrybuantę pewnej Z.L. możemy wyznaczyć jej R.G.P.:
Interpretacja graficzna P(a < X < b) = F(b) – F(a)