Podstawowe definicje i twierdzenia Rachunku Prawdopodobieństwa

Slides:



Advertisements
Podobne prezentacje
Proces doboru próby. Badana populacja – (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje.
Advertisements

Analiza rozkładu empirycznego dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Cel analizy statystycznej. „Człowiek –najlepsza inwestycja”
Analiza wariancji (ANOVA) Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie.
Zmienne losowe Zmienne losowe oznacza się dużymi literami alfabetu łacińskiego, na przykład X, Y, Z. Natomiast wartości jakie one przyjmują odpowiednio.
Analiza tendencji centralnej „Człowiek – najlepsza inwestycja”
Funkcja liniowa Przygotował: Kajetan Leszczyński Niepubliczne Gimnazjum Przy Młodzieżowym Ośrodku Wychowawczym Księży Orionistów W Warszawie Ul. Barska.
© Prof. Antoni Kozioł, Wydział Chemiczny Politechniki Wrocławskiej MATEMATYCZNE MODELOWANIE PROCESÓW BIOTECHNOLOGICZNYCH Prezentacja – 4 Matematyczne opracowywanie.
STATYSTYKA – kurs podstawowy wykład 10 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
W KRAINIE TRAPEZÓW. W "Szkole Myślenia" stawiamy na umiejętność rozumowania, zadawania pytań badawczych, rozwiązywania problemów oraz wykorzystania wiedzy.
KOMBINATORYKA.
Metody Analizy Danych Doświadczalnych Wykład 9 ”Estymacja parametryczna”
Matematyka przed egzaminem czyli samouczek dla gimnazjalisty Przygotowała Beata Czerniak FUNKCJE.
Teoria masowej obsługi Michał Suchanek Katedra Ekonomiki i Funkcjonowania Przedsiębiorstw Transportowych.
Menu Jednomiany Wyrażenia algebraiczne -definicja Mnożenie i dzielenie sum algebraicznych przez jednomian Mnożenie sum algebraicznych Wzory skróconego.
Optymalna wielkość produkcji przedsiębiorstwa działającego w doskonałej konkurencji (analiza krótkookresowa) Przypomnijmy założenia modelu doskonałej.
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Perceptrony proste nieliniowe i wielowarstwowe © Kazimierz Duzinkiewicz, dr hab.
Zmienna losowa dwuwymiarowa Dwuwymiarowy rozkład empiryczny Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych.
POP i SIR POK1 i POK2.
 Przedziałem otwartym ( a;b ) nazywamy zbiór liczb rzeczywistych x spełniających układ nierówności x a, co krócej zapisujemy a
Regresja. Termin regresja oznacza badanie wpływu jednej lub kilku zmiennych tzw. objaśniających na zmienną, której kształtowanie się najbardziej nas interesuje,
Budżetowanie kapitałowe cz. III. NIEPEWNOŚĆ senesu lago NIEPEWNOŚĆ NIEMIERZALNA senesu strice RYZYKO (niepewność mierzalna)
O PARADOKSIE BRAESSA Zbigniew Świtalski Paweł Skałecki Wydział Matematyki, Informatyki i Ekonometrii Uniwersytet Zielonogórski Zakopane 2016.
Statystyka Wykłady dla II rok Geoinformacji rok akademicki 2012/2013
Test analizy wariancji dla wielu średnich – klasyfikacja pojedyncza
Logika dla prawników Podział logiczny.
mutacyjnego algorytmu ewolucyjnego
SYSTEM KWALIFIKACJI, AWANSÓW I SPADKÓW
System wspomagania decyzji DSS do wyznaczania matematycznego modelu zmiennej nieobserwowalnej dr inż. Tomasz Janiczek.
terminologia, skale pomiarowe, przykłady
MATEMATYCZNE MODELOWANIE PROCESÓW BIOTECHNOLOGICZNYCH
Rachunki zdań Tautologiczność funkcji
WAE Jarosław Arabas Algorytm ewolucyjny
Liczby pierwsze.
Rachunek prawdopodobieństwa i statystyka
FIGURY.
Modele SEM założenia formalne
Podstawy automatyki I Wykład /2016
Funkcja – definicja i przykłady
Wstęp do Informatyki - Wykład 3
Elementy analizy matematycznej
Opracowała: Monika Grudzińska - Czerniecka
Materiały pochodzą z Platformy Edukacyjnej Portalu
Elementy fizyki kwantowej i budowy materii
Wnioskowanie statystyczne. Estymacja i estymatory.
Produkt i dochód narodowy
Zmienne losowe wielowymiarowe
Własności statystyczne regresji liniowej
Weryfikacja hipotez statystycznych
Quantitative Methods for Historians
Porównywanie średnich prób o rozkładach normalnych (testy t-studenta)
Statystyka i Demografia
MATEMATYKAAKYTAMETAM
FORMUŁOWANIE HIPOTEZ STATYSTYCZNYCH
Implementacja rekurencji w języku Haskell
Znajdowanie liczb pierwszych w zbiorze
Doskonalenie rachunku pamięciowego u uczniów
REGRESJA WIELORAKA.
ROZKŁADY STATYSTYCZNE ZMIENNYCH MIERZALNYCH
Prawa ruchu ośrodków ciągłych c. d.
…rozkłady, kowariancja, korelacja, estymacja i weryfikacja hipotez…
Probabilistyczne modele danych
Zadania POP i SIR.
WYBRANE ZAGADNIENIA PROBABILISTYKI
Elipsy błędów.
Grazyna Mirkowska Matematyka Dyskretna PJWSTK 2001
Własności asymptotyczne metody najmniejszych kwadratów
Zapis prezentacji:

Podstawowe definicje i twierdzenia Rachunku Prawdopodobieństwa Krzysztof Regulski, WIMiIP, KISiM, regulski@agh.edu.pl B5, pok. 408

Szereg rozdzielczy prosty – analiza struktury wiekowej pacjentów

Wykresy

Przykład zastosowania pakietu Statistica do analizy zapotrzebowania na energię

Doświadczenie - zdarzenia – definiowanie przestrzeni zdarzeń– tworzenie modelu Przykład formalizacji opisu doświadczenia i zdarzenia: doświadczenie : egzamin zdarzenie: ocena z egzaminu Opis zbioru zdarzeń elementarnych (wszystkich możliwych wyników pojedynczego doświadczenia)  = {2, 3, 3.5, 4, 4.5, 5} ; #  = 6 Opis dowolnego „zdarzenia losowego”, jakie może mieć miejsce w danym doświadczeniu : A : oblany egzamin : A={2} B: zdany egzamin = uzyskanie oceny co najmniej 3: B={3, 3,5, 4, 4,5, 5} C: wynik egzaminu satysfakcjonujący np. uzyskanie oceny co najmniej dobry: C={4, 4,5, 5} Każde zdarzenie losowe jest podzbiorem zbioru zdarzeń 

Zdarzenia, przestrzeń zdarzeń – formalizacja opisu Niech i oznacza jeden z możliwych wyników prowadzonego doświadczenia (eksperymentu) i   , i jest elementem zbioru  = { 1 , 2 ...... n }, # = n Zbiór zdarzeń elementarnych, zawiera wszystkie możliwe wyniki danego doświadczenia (eksperymentu)  może być zbiorem skończonym albo zbiorem nieskończonym, to zależy od doświadczenia i liczby możliwych wyników

Zdarzenia losowe, Przestrzeń zdarzeń losowych Przestrzeń zdarzeń losowych stanowi zbiór wszystkich możliwych podzbiorów zbioru zdarzeń elementarnych Każde zdarzenie losowe A jest dowolnym podzbiorem zbioru  A   A’ jest zdarzeniem przeciwnym do zdarzenia A, i jest zdarzeniem losowym, bo zawiera te elementy przestrzeni  , które nie należą do zbioru A A’=  -A   Każde zdarzenie elementarne jest zdarzeniem losowym {1}   Zdarzenie pewne to cała przestrzeń, jest zdarzeniem losowym, bo zawiera się w sobie,    Zdarzenie niemożliwe  jest zdarzeniem losowym, bo jest przeciwne do zdarzenia pewnego  =  - 

Działania w przestrzeni zdarzeń losowych A  B – iloczyn zdarzeń, zawiera te zdarzenia elementarne, które sprzyjają zajściu obu zdarzeń A i B A   =  A   =A A  A’ =  Jeśli A  B , to A  B =A Jeśli A  B = , wtedy zdarzenia A i B są rozłączne Jeśli A  B  , wtedy zdarzenia A i B nie są rozłączne A  B suma zdarzeń, zawiera te zdarzenia elementarne, które są elementami zdarzenia losowego A lub są elementami zdarzenia B A  =A A =  A A’ =  Jeśli A  B to A  B = B

Działania w przestrzeni zdarzeń losowych A\ B różnica zdarzeń A i B, zawiera te zdarzenia elementarne, które należą do zbioru A i nie należą do zbioru B Zdarzenie A  B, nazywane różnicą symetryczną zdarzeń A i B, zachodzi wtedy i tylko wtedy gdy zachodzi jedno i tylko jedno ze zdarzeń A lub B Zadania: Udowodnić, że: (A  B)’ = A’  B’ (A  B)’= A’  B’

Wizualizacja relacji i wyników działań na zbiorach - Diagramy Venna

Przykład definiowania zdarzeń Wybieramy jednego studenta spośród przybyłych na wykład. Niech A oznacza zdarzenie, że wylosowano mężczyznę B nie pali papierosów C mieszka w akademiku Opisać zdarzenia: A  B  C’ Przy jakich warunkach zachodzi równość A  B  C =A Przy jakich warunkach zachodzi C’  B Czy równość A’= B jest spełniona gdy wszyscy mężczyźni palą

Przykład określania przestrzeni  dla różnych zadań np Przykład określania przestrzeni  dla różnych zadań np. w kontroli jakości wyrobów Losuję jeden egzemplarz i oceniam według wybranego kryterium i stwierdzam, że kontrolowany wyrób np. Jest dobry albo jest wadliwy Jest I klasy, jest II klasy, jest wybrakiem Jest czerwony, zielony, żółty, czarny...... Jest duży, średni, mały..... Jak określić przestrzeń , gdy kontrolujemy wymiary, ciężar, temperaturę, czas Losuję dwa/ trzy/ pięć egzemplarzy i otrzymuję......

W zaciekłej walce co najmniej Zadanie W zaciekłej walce co najmniej 70 % walczących straciło jedno oko 75 % straciło jedno ucho 80 % straciło jedną rękę 85 % straciło jedną nogę Jaka jest, co najmniej, ilość tych, którzy stracili jednocześnie ucho, oko, rękę i nogę ( Lewis Carol, A Tangled Tale, 1881r)

Aksjomatyczna definicja prawdopodobieństwa Zakładamy, że: A jest zdarzeniem losowym: tzn. A   Prawdopodobieństwo P jest funkcją : P: A  P (A) spełniającą następujące aksjomaty: P(A)  [0,1] P() = 1 P()=0 P(AB)= P(A)+P(B) jeśli AB=  albo 3’ P(AB)= P(A) +P(B) –P(AB)

Definicje prawdopodobieństwa (rachunkowe) Definicja klasyczna  jest zbiorem wszystkich zdarzeń elementarnych, (rozłącznych i jednakowo możliwych) A  , A jest zdarzeniem losowym Klasyczna definicja - wzór Laplace’a Sprawdzić, czy wzór Laplace’a spełnia wszystkie aksjomaty prawdopodobieństwa

Definicja geometryczna Przykład Obliczyć prawdopodobieństwo tego, że wybrany w sposób losowy punkt kwadratu: x <1, y<1 jest punktem wewnętrznym okręgu x2 +y2=1.

Definicja statystyczna Przykład. W ciągu 1000 dni prowadzono obserwacje meteorologiczne dotyczące siły wiatru i ciśnienia atmosferycznego. Założono, ze A oznacza zdarzenie : siła wiatru < 5 m/s , A’ =? B oznacza zdarzenie : ciśnienie < 1020 milibarów, B’ = ? Otrzymano następujące wyniki: Prawdopodobieństwa jakich zdarzeń można obliczać z tabelki   A A' Razem B 400 100 500 B' 200 300 600 1000

Podstawowe twierdzenia o prawdopodobieństwie P(A’) = 1- P(A), gdy A’ = -A P(AB) = P(A)+P(B)-P(AB) P(A/B) = P(AB)/P(B) P(AB) = P(A)*P(B)  A i B są niezależne

Zadania Obliczyć prawdopodobieństwo tego, że przypadkowo wzięta liczba naturalna jest podzielna przez 6 podzielna przez 2 lub 3 W pewnym przedsiębiorstwie 96% wyrobów jest dobrych. Na 100 dobrych wyrobów 75 jest pierwszego gatunku. Jakie jest prawdopodobieństwo zdarzenia, że losowo wybrany wyrób okaże się wyrobem I gatunku?

Zadanie Na egzaminie jest 10 zestawów pytań, kartka z numerem k zawiera najtrudniejszy zestaw pytań. Jakie jest prawdopodobieństwo, że żaden z pięciu zdających studentów nie wylosuje kartki z numerem k jeśli Losowanie jest bez zwracania (wylosowane kartki są odkładane) Losowanie jest ze zwracaniem -(kartka wylosowana przez jednego studenta wraca do puli i może być wylosowana przez innego zdającego) Który sposób losowania jest bardziej korzystny dla studentów?

Zdarzenia wzajemnie wykluczające się Definicja: Zdarzenia A1, A2, A3,…. wzajemnie się wykluczają, jeśli żadne dwa z nich nie mają wspólnych elementów, czyli Ai  Aj =  i j : i,j =1,2,3,… Uwaga. Sumę dowolnych dwóch zdarzeń można przedstawić jako sumę zdarzeń wzajemnie wykluczających się A  B = I  II  III

Twierdzenie o prawdopodobieństwie całkowitym Z: A1 A2 ….  An=  , Ai  Aj =  i j : i,j =1,2,…,n Teza: P(B) = P(B/A1)*P(A1)+…..+ P(B/An)*P(An) Twierdzenie Bayesa: Teza: P(Ai/B) = [P(B/Ai)*P(Ai)]/P(B)

Praktyczne zastosowanie twierdzeń W magazynie znajdują się pewne elementy do komputera pochodzące z dwóch fabryk, przy czym 40% z nich pochodzi z fabryki I, a 60% z fabryki II. Niezawodność (w czasie T) elementów z fabryki I wynosi 0,95 a z fabryki II 0,7. obliczyć prawdopodobieństwo, że losowo wzięty z magazynu element był wyprodukowany w fabryce I będzie poprawnie pracował przez czas T pochodzi z fabryki I jeśli stwierdzono, że poprawnie pracował przez czas T pochodzi z fabryki II jeśli stwierdzono, że poprawnie pracował przez czas T.

Probabilistyczne modele danych Zmienne losowe Rozkład prawdopodobieństwa i dystrybuanta Wartość oczekiwana i wariancja zmiennej losowej

Zmienne losowe Zmienna losowa jest to funkcja rzeczywista X, określona na zbiorze zdarzeń elementarnych  X: W Zmienne losowe zwykle oznacza się dużymi literami z końca alfabetu : X, Y, Z. Wartości zmiennych losowych zwykle oznacza się małymi literami z końca alfabetu: x,y,z.

Rodzaje zmiennych losowych Ze względu na zbiór wartości badanej cechy (zastosowaną skalę pomiarową) rozróżnia się dwa podstawowe typy zmiennych losowych: jakościowe – zbiory wartości lingwistycznych opisujących np kolor, wielkość, dzień tygodnia... ilościowe – zbiory liczbowe, zawierające wartości cech mierzalnych.... Zmienne losowe ilościowe mogą przyjmować wartości: dyskretne (skokowe) ze zbioru skończonego (np. ocena) lub dowolnego podzbioru liczb całkowitych, np liczba sztuk wadliwych, ciągłe z przedziału liczb rzeczywistych, np. czas działania urządzenia, temperatura, ciężar...

Definiowanie zmiennej losowej Z partii wyrobów zawierającej wyroby dobre i wyroby wadliwe losuję jeden wyrób, wtedy  = {d , w } gdzie d- oznacza wylosowanie wyrobu dobrego w- oznacza wylosowanie wyrobu wadliwego Określam zmienną losową X w następujący sposób: X(d)=1 X(w )=0 Definiowanie zmiennej losowej polega na przypisaniu poszczególnym zdarzeniom elementarnym konkretnych wartości (liczbowych)

Rozkład prawdopodobieństwa zmiennej losowej dyskretnej Jeżeli w przedstawionym przykładzie, dotyczącym kontroli jakości wyrobów, 90% wyrobów było dobrych, natomiast 10% stanowiły wybraki, to możemy mówić o prawdopodobieństwie zdarzeń: P({ : X()=0}) = 0,1 P({ : X()=1}) = 0,9 (jest to tzw. „dwupunktowy” rozkład prawdopodobieństwa) Tablicowy zapis rozkładu prawdopodobieństwa zmiennej losowej X Xi 1 pi 0,1 0,9

Rozkład prawdopodobieństwa dyskretnej zmiennej losowej Rozkład prawdopodobieństwa dyskretnej zmiennej losowej X jest zbiorem par {xi, p(xi)}, gdzie xi jest wartością zmiennej X dla zdarzenia i, X(i)= xi ; p- prawdopodobieństwem wystąpienia wartości x. Twierdzenie Założenie: Jeśli x1 , x2 , x3…….. oznaczają wszystkie różne wartości dyskretnej zmiennej losowej, to Teza

Dystrybuanta zmiennej losowej Dystrybuantą, FX(x0), zmiennej losowej X jest funkcja F określona na zbiorze liczb rzeczywistych, jako prawdopodobieństwo zdarzenia, polegającego na tym, że zmienna ta przyjmie wartości mniejsze od x0. FX(x0) = P(X< x0) Dystrybuanta jest funkcją: określoną na zbierze liczb rzeczywistych; o wartościach z przedziału [0-1]; niemalejącą prawostronnie ciągłą Dystrybuantę zmiennej losowej X oznaczamy zwykle jako FX FX(x0) = PX((-,x0)) = P(X<x0) P ([a,b]) = P(a  X< b) = FX(b) - FX(a)

Zastosowanie teorii w praktyce – wyznaczanie rozkładu zmiennej losowej Z partii wyrobów losujemy 3 sztuki. Na rysunku pokazano : przestrzeń możliwych zdarzeń sposób określania zmiennej losowej Zmienna=Liczba sztuk wadliwych www 3 dww wdw 2 dwd wwd 1 ddw wdd ddd   Przestrzeń zdarzeń

Rozkład i dystrybuanta zmiennej losowej p1=P( X=0)=1/8, p2=P( X=1)=3/8, ....... Rozkład prawdopodobieństwa zmiennej losowej X i 1 2 3 4 xi pi 1/8 3/8 F(x) 1/2 7/8 Dystrybuanta FX(0) = PX((-,0)) = P(X<0) = 0 FX(1) = PX((-,1)) = P(X<1) = P(X=0) =1/8 FX(2) = PX((-,2)) = P(X<2) = 1/8+3/8 = 4/8 FX(3) = PX((-,3)) = P(X<3) = 1/8+3/8 +3/8 = 7/8 FX(4) = PX((-,4)) = P(X<4) = 1

Wykresy rozkładu prawdopodobieństwa i dystrybuanty zmiennej losowej dyskretnej (skokowej) Wykres dystrybuanty Wykres rozkładu

Parametry rozkładu zmiennej losowej -Wartość oczekiwana Wartość oczekiwaną [nadzieję matematyczną / wartość przeciętną], zmiennej losowej X oznacza się E(X) i określa w następujący sposób Dla zmiennej losowej dyskretnej Dla zmiennej losowej ciągłej

Twierdzenia o wartości oczekiwanej Założenia : X, Y są zmiennymi losowymi  jest liczbą rzeczywistą, c oznacza stałą wartość Tezy: E (c) = c E ( X) =  E (X) E (X +Y) = E (X) + E (Y)

Parametry rozkładu zmiennej losowej – Wariancja D2(X) i odchylenie standardowe D(X) Wariancją zmiennej losowej X nazywamy wyrażenie Wariancja jest /parametrem/charakterystyką określającą stopień rozrzutu (rozproszenia, zróżnicowania, dyspersji). Ze względu na łatwość interpretacji geometrycznej, za miarę rozrzutu przyjmuje się pierwiastek kwadratowy z wariancji, czyli Odchylenie standardowe: Stosunek odchylenia standardowego do wartości oczekiwanej nazywamy współczynnikiem zmienności : V = D(X)/E(X)

Obliczanie Wariancji D2(X) Wariancja zmiennej losowej skokowej Wariancja zmiennej losowej ciągłej

Twierdzenia o wariancji Założenia: X, Y : zmienne losowe, a: liczba; Tezy: D2(X)=E (X2) – (E(X))2 D2(const)= 0 D2(a*X)= a2 *D2(X) D2(aX +b)= a2 *D2(X) D2(X +Y) = D2(X) + D2(Y)