Zmienna losowa jednowymiarowa

Slides:

Advertisements

Podobne prezentacje

Opracowali: Patryk Klemczak Tomasz Klemczak ODSIECZ WIEDEŃSKA.

Advertisements

Kształtowanie się granic II Rzeczypospolitej

Wykład 4: Systemy nawigacji satelitarnej

WNIOSEK O PRZYZNANIE POMOCY

POGŁĘBIONA OCENA SYTUACJI FINANSOWEJ NA PODSTAWIE ANALIZY WSKAŹNIKOWEJ

Machine learning Lecture 3

Identyfikacja dansylowanych aminokwasów metodą cienkowarstwowej chromatografii na płytkach poliamidowych Gawahir Hassan.

Mechanika kwantowa dla niefizyków

Program Rozwoju Obszarów Wiejskich

Przyszłe zmiany sposobu finansowania zadań oświatowych

Wybrane bloki i magistrale komputerów osobistych (PC)

HELIOTECHNIKA W chwili obecnej jest niekonkurencyjna w porównaniu ze źródłami konwencjonalnymi, ale jest to „czysta energia” dlatego wiąże się z nią wiele.

Tolerancje i pasowania

B R Y Ł Y P L A T O Ń S K I E.

Bankowość Pieniądz Podstawowe informacje o bankach

Weryfikacja hipotez statystycznych

Krakowskie Sympozjum Naukowo-Techniczne

Zasilacze prądu stałego Czyli rzeczywiste źródła napięcia

Prof. nadzw. dr hab. inż. Jarosław Bartoszewicz

Mechanika kwantowa dla niefizyków

Grzegorz Karasiewicz Katedra Marketingu Wydział Zarządzania UW

1 czerwca w zerówce.

„ Mały Miś i polskie tradycje Bożego Narodzenia”

Box Behnken Design w optymalizacji procesu biosyntezy β-karotenu w hodowlach drożdży Rhodotorula rubra Ludmiła Bogacz-Radomska(1), Joanna Harasym(1,2,3),

Projekt z dnia 30 maja 2017 r. Ustawa z dnia …. ……………

Prof. dr hab. Roman Sobiecki Rachunki makroekonomiczne

CAPS LOCK - CERTYFIKOWANE SZKOLENIA JĘZYKOWE I KOMPUTEROWE

Prezentacje wykonali: Marcin Łukasik Wiktor Kołek

GOSPODAROWANIE ZASOBAMI W ORGANIZACJI

Co to jest SSC Master… SSC Master to platforma elektronicznego obiegu, dekretacji i akceptacji dokumentów w organizacji. Dzięki szerokiemu i elastycznemu.

Podstawy pomagania SPPiIK, 2016 Anna Gromińska.

Chemia biopierwiastków

Współczesne kierunki polityki społecznej

Hiszpania,Portugalia,Litwa,Polska,Turcja,Włochy,Chorwacja Desery.

Prawo pracy – ćwiczenia (IX)

Dotarcie do specyficznej grupy docelowej

Sprawozdanie roczne z realizacji Planu działania Krajowej Sieci Obszarów Wiejskich na lata za rok 2016 Warszawa, 26 czerwca 2017 r. Materiał.

Srebrna Małopolska regionalne inicjatywy na rzecz seniorów

O UTWORZENIE ZWIĄZKU METROPOLITALNEGO W WOJEWÓDZTWIE ŚLĄSKIM

Wojewódzki Inspektorat Ochrony Środowiska w Białymstoku

ZAWODOZNAWSTWO Materiały zrealizowane w ramach projektu

Wykład 8: Złożone problemy przetwarzania mobilnego

Realizacja sprzężenia od siły w układzie sterowania robotem do zastosowań neurochirurgicznych Dorota Marszalik Wieliczka,

Funkcje generujące w kombinatoryce

Ruch turystyczny w Krakowie w 2015 roku

© dr hab. Inż. Paweł Jabłoński

Adsorpcja faza stała/ gazowa lub ciekła faza ciekła/ gazowa lub ciekła

MODELE EPIDEMIOLOGICZNE

Dowody matematyczne - zadania podstawowe

Zagadnienie prawdy Andrzej Łukasik Zakład Ontologii i Teorii Poznania

Ewolucja gwiazd.

Potencjał chemiczny Potencjał chemiczny ma charakter siły uogólnionej,

STAŁE RÓWNOWAGI REAKCJI PROTOLITYCZNYCH

Optymalizacja sieci drogowej propozycja algorytmu

Nie ma innego – Tylko Jezus Mariusz Śmiałek

W ramach stypendium Ministerstwa Kultury i Dziedzictwa Narodowego

R- Punkt referencyjny (wyjściowy) obrabiarki

Parki krajobrazowe na Podlasiu

Publicznej Szkole Podstawowej nr 4 im. Tadeusza Kościuszki

Materiały pochodzą z Platformy Edukacyjnej Portalu

Zasady poprawnej komunikacji – jak uniknąć konfliktów ?

Gimnazjum nr 3 im. J. Chełmońskiego w Zielonej Górze

Moje dziecko i jego potrzeby.

Edukacja psychologiczna

GMINA RUDZINIEC.

Czym jest mowa nienawiści?

Wykład 7 Prawo urzędnicze.

Zapis prezentacji:

Zmienna losowa jednowymiarowa Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie Zmienna losowa jednowymiarowa dr Marta Marszałek e-mail: marta.marszalek@sgh.waw.pl

Pojęcie zmiennej losowej i jej rodzajów (skokowa, ciągła) Plan wykładu Pojęcie zmiennej losowej i jej rodzajów (skokowa, ciągła) Parametry rozkładu zmiennej losowej (wartość oczekiwana, wariancja) Ważne rozkłady zmiennej losowej: skokowej (0-1; dwumianowy) ciągłej (normalny) 4. Twierdzenia graniczne

Definicja Zmienna losowa X – funkcja przyporządkowująca każdemu zdarzeniu elementarnemu jedną i tylko jedną liczbę x. Przykład: rzut monetą Zdarzenie elementarne: Oznaczenie: Orzeł 0 Reszka 1 Przykład: ocena z egzaminu wstępnego Jan Kowalski 3.5 Maria Nowak 4.0

Zmienna losowa Zmienne losowe oznaczamy wielkimi literami, np. 𝑋, 𝑌, 𝑍 natomiast wartości, które ta zmienna przyjmuje – małymi, tzn. x ( x1, x2…, xn), y(x1, y2…, yn) Typy zmiennych losowych: skokowa: przyjmuje skończoną lub nieskończoną, ale przeliczalną liczbę wartości. ciągła: przyjmuje wartości ze zbioru liczb rzeczywistych.

Zmienna losowa SKOKOWA CIĄGŁA 1. Funkcja prawdopodobieństwa 2. Dystrybuanta np. liczba strzelonych goli w meczu, liczba błędów wykonanych podczas przepisywania tekstu 1. Funkcja gęstości 2. Dystrybuanta np. zużycie paliwa w samochodzie, tygodniowe wydatki gospodarstw domowych na żywność

Zmienna losowa skokowa

Zmienna losowa skokowa 1. Funkcja prawdopodobieństwa zmiennej los. skokowej 𝑋 to zbiór prawdopodobieństw: 𝑃(𝑋= 𝑥 𝑖 )= 𝑝 𝑖 spełniających równość: 𝑖=1 𝑛 𝑝 𝑖 =1 . 𝑥𝑖 – wartości zmiennej losowej skokowej 𝑋 , 𝑝𝑖 – prawdopodobieństwo, z jakimi wartości 𝑥𝑖 są realizowane xi x1 x2 ... xn pi p1 p2 … pn

Przykład 1. – zmienna losowa skokowa Zawodnik oddaje 3 strzały do tarczy. Prawdopodobieństwo trafienia wynosi 0,5. (TCC), (TTC), (TTT), (CTC), (CCT), (CCC), (TCT), (CTT) Rozkład prawdopodobieństwa (𝒑) 𝑋 – liczba trafień (cecha skokowa) 𝑿=𝒙𝒊 1 2 3 𝒑𝒊 1/8 3/8

Zmienna losowa skokowa 2. Dystrybuanta Wzór: 𝐹 𝑥 = 0, 𝑑𝑙𝑎 𝑥< 𝑥 1 𝑝 1 , 𝑑𝑙𝑎 𝑥 1 ≤𝑥< 𝑥 2 𝑝 1 +𝑝 2 , 𝑑𝑙𝑎 𝑥 2 ≤𝑥< 𝑥 3 … 𝑝 1 + 𝑝 2 +…+ 𝑝 𝑛−1 𝑑𝑙𝑎 𝑥 𝑛−1 ≤𝑥< 𝑥 𝑛 &1, 𝑥≥ 𝑥 𝑛 Przykład: 𝐹 𝑛 𝑥 = 0 𝑑𝑙𝑎 𝑥<0 1 8 𝑑𝑙𝑎 0≤𝑥<1 1 2 𝑑𝑙𝑎 1≤𝑥<2 7 8 𝑑𝑙𝑎 2≤𝑥<3 1 𝑑𝑙𝑎 𝑥≥3

Zmienna losowa skokowa 1. Funkcja prawdopodobieństwa 2. Dystrybuanta

Podstawowe własności dystrybuanty zmiennej losowej skokowej 0 ≤ 𝐹(𝑥) ≤ 1 oraz 𝐹(𝑥) jest funkcją niemalejącą i przedziałami stałą 𝐹(𝑥) jest funkcją prawostronnie ciągłą

Zmienna losowa ciągła

Zmienna losowa ciągła • x0 p • x0 Uwaga: Zmienna losowa może przyjąć wartość x0 , wówczas prawdopodobieństwo wystąpienia tego zdarzenia jest równe 0. P(X=x0)=0 x

Zmienna losowa ciągła 1. Funkcja gęstości prawdopodobieństwa zmiennej losowej ciągłej – funkcja 𝑓(𝑥), określona na zbiorze liczb rzeczywistych o następujących własnościach: 𝑓(𝑥)≥0 jest nieujemna dla dowolnych a < b pole powierzchni pod f. gęstości jest równe 1

2. Dystrybuanta zmiennej losowej ciągłej 𝑋: gdzie 𝑓(𝑡) funkcja gęstości. Dystrybuanta zmiennej losowej ciagłej to skumulowana funkcja rozkładu prawdopodobieństwa zmiennej losowej ciągłej *: 𝐹 𝑥 =𝑃(𝑋≤𝑥) miara pod wykresem funkcji 𝑓 𝑥 między najmniejszą możliwą wartością 𝑋 a punktem 𝑥. Dystrybuanta 𝐹 𝑥 jest gładką niemalejącą funkcją wzrastającą od 0 do 1. 0 ≤ 𝐹(𝑥) ≤ 1 * Aczel A. D., Statystyka w zarządzaniu. Pełny wykład., PWN, Warszawa 2000, s. 147.

Zmienna losowa ciągła Funkcja gęstości p Funkcja gęstości x F(x) 2. Dystrybuanta zmiennej losowej ciągłej x a b

Własności dystrybuanty 𝑭(𝒙) zm. los. ciągłej 0≤𝐹(𝑥)≤1 dla −∞<𝑥<+∞ 𝐹(𝑥) jest funkcją niemalejącą i ciągłą.

Parametry rozkładu zmiennej losowej 1. Wartość oczekiwana 2. Wariancja

Estymatory vs. parametry Próba (wiele wartości z różnych prób lub przedziały) Populacja (jedna wartość liczbowa) ESTYMATORY PARAMETRY 𝑥 𝐸 𝑋 =𝑚 𝑆 𝑥 2 𝐷 𝑋 2 = 𝜎 2 𝑆 𝑥 𝐷 𝑋 =𝜎 𝜔 𝑖 𝑝

Przykład – wyniki egzaminu Zadanie: W badaniu analizowano wyniki z egzaminu ze statystyki. Piątkę otrzymało 15% studentów, czwórkę 45%, trójkę 35%, zaś 5% nie zdało. Pytanie: Proszę wyznaczyć parametry tego rozkładu. Co należy zrobić: sprawdzić jaka była przeciętna liczba punktów uzyskanych z egzaminu oraz odchylenie standardowe. Dane: 𝑝 1 =0,05 𝑝 2 =0,35 𝑝 3 =0,45 𝑝 4 =0,15 Szukane: 𝐸 𝑋 =𝑚=? 𝐷 2 𝑋 =𝜎=? 𝑿=𝒙𝒊 2 3 4 5 𝒑𝒊 0,05 0,35 0,45 0,15

Parametry rozkładu zmiennej losowej Wartość oczekiwana zmiennej losowej X: dla zm. los. skokowej E(X)= dla zm. los. ciągłej gdzie 𝑝𝑖 – funkcja prawdopodobieństwa 𝑓(𝑥) – funkcja gęstości

Przykład – wyniki egzaminu 𝑾𝒂𝒓𝒕𝒐ść 𝒐𝒄𝒛𝒆𝒌𝒊𝒘𝒂𝒏𝒂 𝐸𝑋= 𝑥 𝑖 𝑝 𝑖 =2∗0,05+3∗0,35+4∗0,45+5∗0,15=3,7 Wariancja 𝐷 2 𝑋 = 𝑥 𝑖 −𝐸𝑋 2 𝑝 𝑖 = 𝑥 𝑖 2 𝑝 𝑖 − 𝐸 𝑋 2 𝐷 2 𝑋 = 2−3,7 2 ∗0,05+ 3−3,7 2 ∗0,35+ 4−3,7 2 ∗0,45+ 5−3,7 2 ∗0,15=0,61 Odchylenie standardowe 𝐷 𝑋 = 0,61 =0,78 𝑿=𝒙𝒊 2 3 4 5 𝒑𝒊 0,05 0,35 0,45 0,15

Własności wartości oczekiwanej E(a)=a a-stała E(aX+b)=aE(X)+b E[(aX)k]=akE(Xk) E(X+Y)=E(X)+E(Y) E[X-E(X)]=E(X)-E(X)=0 Przykład: Niech 𝐸(𝑋)=2; 𝐸(𝑌)=4 E(3)=3 E(3X+5)=3 E(X) + 5 =11 E[(3X)2] = 32 E(X2) E(X+Y)=E(X)+E(Y)=2+4=6

2. Wariancja zmiennej losowej X skok. D2(X)=E[X-E(X)]2=E(X2)-[E(X)]2= ciąg. Wariancja = Moment centralny rzędu drugiego Moment zwykły rzędu drugiego Moment zwykły rzędu pierwszego

Własności wariancji D2(a)=0 D2(X+b)=D2(X) D2(aX)=a2D2(X) D2(aX+b)=a2D2(X) Przykład: Niech D2(X)=4 D2(3)=0 D2(X+1)=D2(X)=4 D2(3X)=32D2(X)=36 D2(aX+b)=32D2(X)=36

Przykład – zmienna losowa skokowa (cd.) Zawodnik oddaje 3 strzały do tarczy. Prawdopodobieństwo trafienia wynosi 0,5. Rozkład prawdopodobieństwa (p) X – liczba trafień (cecha skokowa) 𝑿=𝒙𝒊 1 2 3 𝒑𝒊 1/8 3/8

Przykład: Zmienna losowa skokowa – obliczanie parametrów 𝑾𝒂𝒓𝒕𝒐ść 𝒐𝒄𝒛𝒆𝒌𝒊𝒘𝒂𝒏𝒂 𝐸𝑋= 𝑥 𝑖 𝑝 𝑖 =0∗ 1 8 +1∗ 3 8 +2∗ 3 8 +3∗ 1 8 =1,5 Wariancja 𝐷 2 𝑋 = 𝑥 𝑖 −𝐸𝑋 2 𝑝 𝑖 = 𝑥 𝑖 2 𝑝 𝑖 − 𝐸 𝑋 2 𝐷 2 𝑋 = 0−1,5 2 ∗ 1 8 + 1−1,5 2 ∗ 3 8 + 2−1,5 2 ∗ 3 8 + 3−1,5 2 ∗ 1 8 =0,75 Odchylenie standardowe 𝐷 2 𝑋 =𝐷𝑋≈0,87

ROZKŁADY zmiennej losowej jednowymiarowej

Wybrane rozkłady zmiennej losowej jednowymiarowej Zmienna skokowa zero-jedynkowy (0-1) dwumianowy Zmienna ciągła Rozkład normalny (N)

I Rozkład zero-jedynkowy (0-1) (szczególna odmiana rozkładu dwumianowego). W pojedynczym doświadczeniu może zaistnieć sukces (ozn. 1) albo porażka (ozn. 0). Zmienna losowa X ma rozkład zero-jedynkowy, jeśli 𝑃 𝑋=1 = 𝑝 0<𝑝<1 𝑃(𝑋=0)= 1−𝑝 1. Funkcja prawdopodobieństwa: 2. Dystrybuanta: 0 dla x<0 F(x)= 1-p dla 0≤x<1 1 dla x≥1 xi 1 pi 1-p p

I Rozkład zero-jedynkowy - parametry 1. Wartość oczekiwana: 𝐸𝑋= 𝑥 𝑖 𝑝 𝑖 = 0∗ 1−𝑝 +1∗𝑝=𝑝 2. Wariancja: 𝐷 2 𝑋 = 𝑥 𝑖 −𝐸𝑋 2 𝑝 𝑖 = 0−𝑝 2 1−𝑝 + 1−𝑝 2 𝑝=𝑝(1−𝑝) Przykład: 6 osób na 100 ma jest praworęcznych. Wylosowanie takiej osoby przyjmujemy za sukces. Pytanie: Obliczyć i skomentować parametry tego rozkładu. 𝐸 𝑋 =? + interpretacja 𝐷 2 𝑋 =? + interpretacja xi 1 pi 0,94 0,06

II Rozkład dwumianowy Wykonujemy doświadczenie: zdarzenie 𝐴 ( sukces) z prawdopodobieństwem p zdarzenie 𝐴 (porażka) z prawdopodobieństwem q = 1-p por. jak w rozkładzie 0-1 Doświadczenie powtarzamy n-krotnie w sposób niezależny Interesuje nas liczba k sukcesów w n doświadczeniach. 𝐴,𝐴,…,𝐴 𝐴 , 𝐴 , ..., 𝐴 k n-k

II Parametry w rozkładzie dwumianowym Wartość oczekiwana 𝐸(𝑋) = 𝐸(∑𝑋𝑖) = ∑𝐸(𝑋𝑖) = 𝑛𝑝 Wariancja 𝐷2(𝑋) = 𝐷2(∑𝑋𝑖) = ∑𝐷2(𝑋𝑖) = 𝑛𝑝(1−𝑝)= 𝑛𝑝𝑞 gdzie 𝑋𝑖 − zmienna zero-jedynkowa

II Rozkład dwumianowy - rozkład prawdopodobieństwa liczby k sukcesów w n doświadczeniach Zmienna losowa 𝑋 ma rozkład dwumianowy, jeśli przyjmuje wartości 𝑘= 0,1,2……𝑛 z prawdopodobieństwem: 𝑛 – liczba doświadczeń parametry 𝑝 – prawdopodobieństwo sukcesu rozkładu

Rozkład dwumianowy – przykłady Kontrola jakości zbadała jakość 8 partii świetlówek. Wiadomo, że na każde 100 zbadanych kontrola odrzuci średnio 10 partii z powodu wadliwości produktu. Jakie jest prawdopodobieństwo, że z pobranych 8 partii kontrola odrzuci 1 partię świetlówek? Dane: 𝑛=8 𝑝= 10 100 =0,1 𝑘=1 𝑃 𝑋=𝑘 = 𝑛 𝑘 𝑝 𝑘 1−𝑝 𝑛−𝑘 𝑃 𝑋=1 = 8 1 0,1 1 0,9 7 =8∗0,1∗ 0,9 7 =0,38 Odpowiedź: Prawdopodobieństwo, że z pobranych 8 partii kontrola jakości odrzuci 1 partię świetlówek wynosi 0,38.

II Rozkład dwumianowy - przykłady Rzucamy 100 razy monetą. 𝑿 jest liczbą wyrzuconych orłów. Nowy lek jest skuteczny w 40% przypadków. Niech 𝒀 będzie liczbą osób, których wyniki badań poprawiły się w próbie 30 losowo wybranych osób stosujących ten lek. Firma badawcza na zlecenie działu marketingu pewnej międzynarodowej korporacji z branży FMCG przeprowadziła pomiar skuteczności reklamy telewizyjnej produktu. 𝒁 oznacza liczbę sztuk zakupionych produktów po emisji reklamy w 3 największych stacjach telewizyjnych emitujących reklamę produktu po głównym serwisie informacyjnym.

Wykresy rozkładu dwumianowego dla 𝑝=0,5 i 𝑝=0,2 (𝑛=10) 𝑝𝑖 𝑥𝑖 𝑥𝑖

Założenie: 𝑋 ma rozkład dwumianowy z parametrami 𝑛 i 𝑝 II Rozkład dwumianowy - rozkład prawdopodobieństwa częstości względnej pojawienia się sukcesu Założenie: 𝑋 ma rozkład dwumianowy z parametrami 𝑛 i 𝑝 Definiujemy: 𝑊 – częstość względną pojawienia się sukcesu Zmienne losowe 𝑿 (liczba sukcesów) i 𝑾 (częstość sukcesów) mają identyczne rozkłady prawdopodobieństwa.

Parametry w rozkładzie dwumianowym - częstości względnej Wartość oczekiwana częstości sukcesów w n doświadcze-niach jest równa prawdopodobieństwu realizacji sukcesu w pojedynczym doświadczeniu.

III Rozkład t-Studenta

III Rozkład t-Studenta Zmienna losowa ciągła ma rozkład t-Studenta, jeśli jej funkcja gęstości dana jest wzorem: rozkład ten obliczany jest dla małych prób jest stablicowany – tablice „Rozkładu t-Studenta” ma kształt zbliżony do rozkładu normalnego w przypadku prób dużych (𝑛>30,𝑙𝑢𝑏 120) rozkład t−Studenta → rozkład normalny (tablice „Rozkładu normalnego”)

Parametry rozkładu t-Studenta Wartość oczekiwana: 𝐸 𝑡 =0 Wariancja: 𝐷 2 𝑡 = 𝜐 𝜐−2 = 𝑛−1 𝑛−3 f(u) u

IV Rozkład normalny

IV Rozkład normalny to graniczna postać rozkładu dwumianowego teoria: A. de Moivre’a, P.S. Laplace’a, K.F. Gaussa nazywany też rozkładem Gaussa Zmienna losowa 𝑿 ma rozkład normalny: 𝑿~ 𝑵(𝒎,𝝈) o wartości oczekiwanej 𝑚 i odchyleniu standardowym 𝜎, jeśli jej funkcja gęstości dana jest wzorem: −∞< 𝑥 <+∞ 𝑚= 𝐸(𝑋) – wartość oczekiwana 𝜎 = 𝐷(𝑋) – odchylenie standardowe

Własności krzywej gęstości rozkładu normalnego Symetria względem prostej: 𝑥=𝑚 Maksimum dla: 𝑥=𝑚 równe Punkty przegięcia: 𝑥= 𝑚−𝜎 oraz 𝑥= 𝑚+𝜎

Reguła trzech sigm m-3σ m-2σ m-σ m m+σ m+2σ m+3σ 0,6828 0,9546 0,9973

Reguła trzech sigm

Przykłady rozkładu normalnego

Rozkład normalny N(0;1), N(2;1) f(u) u Rozkłady różniące się wartością 𝑚

Rozkład normalny N(0;1) i N(0;0,5) f(u) u Rozkłady różniące się wartością σ

Dystrybuanta rozkładu normalnego F(X) x

Standaryzacja Rozkład normalny (0;1)

Rozkład normalny standardowy N(0;1) Jeśli: 𝑚=0 standardowy rozkład normalny 𝜎=1 𝑈~𝑁(0;1) Wzór: f(u) u

Standaryzacja Aby dowolną zmienną 𝑋 o rozkładzie normalnym 𝑁(𝑚,𝜎) przekształcić do postaci zmiennej standardowej 𝑁(0,1) należy wykorzystać formułę:

Standaryzacja w uproszczeniu Wynik wystandaryzowany wskazuje: o ile odchyleń standardowych uzyskany wynik położony jest powyżej (u>0) lub poniżej średniej (u<0). Inaczej: Jak daleko w jednostkach odchylenia standardowego znajduje się wynik od średniej. Jeżeli X = m, to u=0.

Przykład 1. – standaryzacja zmiennej losowej 𝑋 Jan i Piotr pisali egz. u różnych osób prowadzących statystykę. Jan otrzymał 12 pkt, Piotr 18 pkt. Który otrzymał lepszy wynik? Wyjaśnienia: Nie możemy odp. na pyt. jeśli nie znamy wartości rozkładów obu testów. Załóżmy, że średni pierwszego testu, który napisał Jan wynosiła 10 pkt., Piotr – 20 pkt. Odchylenia standardowe odpowiednio 3 i 2. Wniosek: Rozkłady nie są identyczne. Rozwiązanie: Przekształcanie wyniku surowego (nieprzekształconego) w wystandaryzowany. 𝑋 𝐽𝑎𝑛 ~𝑁(10;3) 𝑋 𝑃𝑖𝑜𝑡𝑟 ~𝑁(20;2) Obliczenia: Odpowiedź: 𝑢 𝐽𝑎𝑛𝑎 > 𝑢 𝑃𝑖𝑜𝑡𝑟𝑎 tzn., że lepszy wynik uzyskał Jan. 𝑈= 𝑋−𝑚 σ 𝑢 𝐽𝑎𝑛𝑎 = 𝑋−𝑚 𝜎 = 12−10 3 = 2 3 𝑢 𝑃𝑖𝑜𝑡𝑟𝑎 = 𝑋−𝑚 𝜎 = 18−20 2 =−1

Przykład 2. – standaryzacja zmiennej losowej 𝑋 Zadanie: Sprawdzamy wzrost przedszkolaków. Wiedząc, że przeciętny wzrost przedszkolaka w populacji ma rozkład normalny z parametrami 𝑚=110 𝑐𝑚 oraz odchyleniem standardowym σ=16 𝑐𝑚 proszę wskazać, Pytanie: jakie jest prawdopodobieństwo, że na spacerze spotkamy przedszkolaka, który będzie miał nie więcej niż 130 𝑐𝑚 wzrostu? Dane: Szukane: Zmienna losowa X – wzrost przedszkolaków 𝑃 𝑋≤130 =? 𝑚=110 σ=16 , 𝑧𝑎𝑡𝑒𝑚: 𝑋~𝑁(110;16) 𝑈= 𝑋−𝑚 σ 𝑃 𝑋≤130 =𝑃 𝑋−𝑚 𝜎 ≤ 130−110 16 =𝑃 𝑢≤ 20 16 =𝑃 𝑢≤1,25 =𝜑 1,25 =0,8944. Odpowiedź: Prawdopodobieństwo, że na spacerze spotkamy przedszkolaka o wzroście nie większym niż 130 cm wynosi 0,8944.

Rozkład zmiennej losowej X przed standaryzacją Rozkład zmiennej losowej po standaryzacji 𝑿~𝑵[𝟎;𝟏] funkcja gęstości dystrybuanta

Standaryzacja w rozkładzie normalnym

Rozkład normalny 𝑵(𝟎;𝟏) Funkcja gęstości f(u) Dystrybuanta φ(u) f(u) Dystrybuanta 𝜑 𝑢 jest „stablicowana” tzn. można ją odczytać z tablic statystycznych pt. „dystrybuanta rozkładu normalnego”

Dystrybuanta rozkładu normalnego 𝑃(𝑈<1)=𝜑(1)= 0,8413

Dystrybuanta rozkładu normalnego - przykłady Należy odczytać z tablic dystrybuanty rozkładu normalnego: P U<1,5 Odp: 𝜑 1,5 =0,93319 oraz =1−𝜑 −1,5 P U<2,64 Odp: 𝜑 2,64 =0,995844 oraz =1−𝜑 −2,64 P U<−1,33 Odp: 𝜑 −1,33 =1−𝜑 1,33 =0,09176 P U>1,5 Odp.: 1−𝑃 𝑈≤1,5 =1−𝜑 1,5 =𝜑 −1,5 =0,06681 P U=1 Odp: 0.

Twierdzenia graniczne

W twierdzeniach granicznych rozpatruje się ciągi zmiennych losowych {𝑋𝑛}, których rozkłady, przy 𝑛→∞ mogą być zbieżne do pewnego rozkładu, zwanego rozkładem granicznym (asymptotycznym). Lokalne twierdzenia dot. zbieżności ciągu funkcji graniczne prawdopodobieństwa lub funkcji gęstości. Integralne twierdzenia dot. zbieżności ciągu graniczne dystrybuant.

Twierdzenie de Moivre’a-Laplace’a Przypomnienie: Rozkład dwumianowy określa prawdopodobieństwo wystąpienia wszystkich możliwych k sukcesów w n próbach. 𝐸(𝑋)=𝑛𝑝 𝐷2(𝑋)=𝑛𝑝𝑞 (𝑝 – prawdopod. sukcesu, 𝑞 – prawdopod. porażki) Rozkład dwumianowy można zdefiniować również jako: rozkład częstości W wystąpienia sukcesów. Parametry W: 𝐸(𝑊)=𝑝 𝐷 2 𝑊 = 𝑝𝑞 𝑛

Twierdzenie de Moivre’a-Laplace’a Twierdzenie o zbieżności rozkładu dwumianowego do rozkładu normalnego. Ciąg dystrybuant zmiennych standaryzowanych o rozkładzie dwumianowym jest zbieżny do dystrybuanty rozkładu normalnego N(0,1). 𝑿 𝒏 𝒏→∞ N (0;1)

Twierdzenie de Moivre’a-Laplace’a Wniosek 1. Ciąg zmiennych losowych {Xn} o rozkładzie dwumianowym z parametrami n i p (niestandaryzowanych) jest zbieżny do rozkładu 𝑁(𝑛𝑝, 𝑛𝑝𝑞 ). parametry w rozkładzie dwumianowym Uwaga: Jeśli liczba doświadczeń jest DUŻA (np. 120), to prawdopodobieństwo dla rozkładu dwumianowego można wyliczać korzystając z rozkładu normalnego.

Twierdzenie de Moivre’a-Laplace’a częstość sukcesów Wniosek 2. Ciąg zmiennych ma dla dużych 𝑛 asymptotyczny rozkład normalny parametry rozkładu częstości sukcesów w rozkładzie dwumianowym

Centralne twierdzenie graniczne Lindeberga-Lévy’ego Jeżeli pobieramy kolejno próby losowe o liczebności N z populacji o dowolnym rozkładzie ze średnią 𝜇 i wariancją 𝜎 2 , to dla dostatecznie dużych prób rozkład średnich (statystyki M) będzie rozkładem normalnym o średniej 𝜇 i wariancji 𝜎 2 𝑁 . Gdy zmienna ma w populacji rozkład normalny, to rozkład średnich jest normalny także dla małych prób. 𝜎 𝑀 = 𝜎 2 𝑁 𝜇 𝑀 =𝜇

Centralne twierdzenie graniczne Lindeberga-Lévy’ego dotyczy zbieżności sumy niezależnych zmiennych losowych do rozkładu normalnego. Założenia:{Xk} ciąg niezależnych zm. losowych o identycznych rozkładach z parametrami 𝐸(𝑋) i 𝐷2(𝑋) gdzie 𝐸(𝑍𝑛)=𝑛𝐸(𝑋) 𝐷2(𝑍𝑛)=𝑛𝐷2(𝑋) Zn po standaryzacji: Twierdzenie: Ciąg zmiennych losowych {𝑇𝑛} jest zbieżny do rozkładu 𝑁(0,1).

Wnioski z centralnego twierdzenia granicznego Wniosek 1. Zmienna losowa , czyli suma zmiennych losowych niezależnych i o identycznych rozkładach ma asymptotyczny (graniczny) rozkład normalny o parametrach: nie jest ważne jakie to są rozkłady, muszą być identyczne

Wnioski z centralnego twierdzenia granicznego Wniosek 2. Ciąg zmiennych {Vn}, gdzie o parametrach: średnia ze zmiennych losowych niezależnych i o identycznych rozkładach jest zbieżna do rozkładu: nie jest ważne jakie to są rozkłady

Podsumowanie Wzory do ćwiczeń

Rozkłady graniczne (wnioski z twierdzeń granicznych) Wystandaryzowana postać statystyki z próby (u): 1. Częstość: 2. Różnica częstości:

3. Średnia: 4. Różnica średnich: Wystandaryzowana postać statystyki z próby (u): 3. Średnia: 4. Różnica średnich:

Dziękuję dr Marta Marszałek e-mail: marta.marszalek@sgh.waw.pl