Co to jest dystrybuanta?

Slides:



Advertisements
Podobne prezentacje
Przykład liczbowy Rozpatrzmy dwuwymiarową zmienną losową (X,Y), gdzie X jest liczbą osób w rodzinie, a Y liczbą izb w mieszkaniu. Niech f.r.p. tej zmiennej.
Advertisements

Test zgodności c2.
Funkcje tworzące są wygodnym narzędziem przy badaniu zmiennych losowych o wartościach całkowitych nieujemnych. Funkcje tworzące pierwszy raz badał de.
PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
Statystyka Wojciech Jawień
Obserwowalność System ciągły System dyskretny
Rachunek prawdopodobieństwa 2
Zmienne losowe i ich rozkłady
Zmienne losowe i ich rozkłady
Test zgodności Joanna Tomanek i Piotr Nowak.
Graficzna prezentacja danych Wykład 2 dr Małgorzata Radziukiewicz
Właściwości średniej arytmetycznej
Statystyka w doświadczalnictwie
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
BIOSTATYSTYKA I METODY DOKUMENTACJI
Niepewności przypadkowe
Jan Iwanik Metody inżynierii finansowej w ubezpieczeniach
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Elementy Rachunku Prawdopodobieństwa c.d.
I T P W ZPT 1 Jak smakuje Espresso I T P W ZPT 2.
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Wzory ułatwiające obliczenia
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 4: Generowanie zdarzeń  Dr inż. Halina Tarasiuk p. 337, tnt.tele.pw.edu.pl.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Co to są rozkłady normalne?
Matematyczne techniki zarządzania - 31
Opracowanie wyników pomiarów
Hipotezy statystyczne
Podstawy statystyki Dr Janusz Górczyński.
Konstrukcja, estymacja parametrów
Elementy Rachunku Prawdopodobieństwa i Statystyki
Analiza współzależności cech statystycznych
dr hab. Ryszard Walkowiak prof. nadzw.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Własności funkcji liniowej.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Rozkłady wywodzące się z rozkładu normalnego standardowego
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
Podstawy analizy matematycznej II
Projekt wykonany przez studentów I roku ARI Politechniki Wrocławskiej:
DOŚWIADCZENIA LOSOWE.
Zmienne losowe Rozkład prawdopodobieństwa zmiennej losowej
Podstawy statystyki, cz. II
FUNKCJE Pojęcie funkcji
Dopasowanie rozkładów
Ekonometryczne modele nieliniowe
Systemy dynamiczne 2014/2015Obserwowalno ść i odtwarzalno ść  Kazimierz Duzinkiewicz, dr hab. in ż. Katedra In ż ynierii Systemów Sterowania 1 Obserwowalność.
Wnioskowanie statystyczne
Zagadnienia AI wykład 2.
STATYSTYKA Pochodzenie nazwy:
Metody Matematyczne w Inżynierii Chemicznej Podstawy obliczeń statystycznych.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
MODELOWANIE ZMIENNOŚCI CEN AKCJI
Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.
STATYSTYKA – kurs podstawowy wykład 3 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
STATYSTYKA – kurs podstawowy wykład 8 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
STATYSTYKA – kurs podstawowy wykład 2 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Testy nieparametryczne
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Zapis prezentacji:

Co to jest dystrybuanta?

Dystrybuanta empiryczna Dystrybuantą empiryczną nazywamy funkcję określoną na podstawie danych (xi, wi), dla i = 1, 2, ..., k następująco: gdzie xi – to uporządkowane niemalejąco wartości badanej cechy, wi – odpowiadające im częstości względne.

Przykład. Sprawdzono 20 stron maszynopisu znajdując na nich następujące liczby błędów: 0 3 1 1 2 2 0 0 3 5 0 1 2 2 1 1 0 1 1 1 Dla cechy tej tworzymy szereg rozdzielczy. Obliczamy częstości względne, liczebności skumulowane oraz częstości względne skumulowane. Wyniki przedstawia tablica

Częstości względne skumulowane Liczba błędów ni Liczebności skumulowane Częstości względne wi =ni/n Częstości względne skumulowane 5 0,25 1 8 13 0,40 0,65 2 4 17 0,20 0,85 3 19 0,10 0,95 20 0,05

Dystrybuanta empiryczna ma postać

Dystrybuanta empiryczna Dystrybuanta empiryczna jest funkcją niemalejącą, przyjmującą wartości z przedziału [0, 1].

Częstości względne skumulowane Jak należy interpretować dystrybuantę? Podobnie jak interpretuje się częstości względne skumulowane. Fn(2) = 0,85 oznacza, że 85% stron maszynopisu zawiera 2 lub mniej błędów. Liczba błędów ni Liczebności skumulowane Częstości względne wi =ni/n Częstości względne skumulowane 5 0,25 1 8 13 0,40 0,65 2 4 17 0,20 0,85 3 19 0,10 0,95 20 0,05

Kiedy badana cecha jest zmienną losową?. Badana cecha, czyli w tym przypadku liczba błędów na 1 stronie może być zmienną losową, jeśli można obliczyć jakie jest prawdopodobieństwo, że na jednej stronie pojawi się 0, 1, 2, 3, 4 lub 5 błędów.

Zgodnie z prawem wielkich liczb, jeśli liczebność próby dąży do nieskończoności, to prawdopodobieństwo, że badana cecha przyjmie daną wartość jest równe częstości względnej P(X=xi)=wi Jeśli wyznaczymy te prawdopodobieństwa wówczas dla zmiennej losowej dyskretnej zdefiniujemy funkcję prawdopodobieństwa.

Dystrybuanta zmiennej losowej X skokowej Dla zmiennej losowej skokowej – dyskretnej- dystrybuanta jest funkcją, obliczaną na podstawie wartości x1, ..., xn, przyjmowanych z prawdopodobieństwem p1, ..., pn wg wzoru

Dystrybuantą zmiennej losowej X Dystrybuantą nazywamy funkcję F(x) określoną na zbiorze liczb rzeczywistych tak by F(x) = P(X  x)

Własności dystrybuanty zmiennej losowej skokowej 0  F(x)  1 F(x) jest funkcją prawostronnie ciągłą. F(x) jest funkcją niemalejącą i przedziałami stałą

Zmienna losowa dyskretna i ciągła Przykład 1. Przebadano krew 1000 osób pod względem liczby białych krwinek – leukocytów. Ich liczba wahała się od 4-7 tys./ mm³. W tym przypadku badana cecha przyjmuje tylko wartości całkowite, liczba tych wartości jest skończona i wynosi ok. 3 tys. Wprawdzie można obliczyć prawdopodobieństwo, z jakim zmienna losowa przyjmuje każdą z tych wartości, ale wygodniej analizować ją jak zmienną losową ciągłą.

Przykład 2. Przebadano krew 1000 kobiet pod względem liczby czerwonych ciałek krwi – erytrocytów. Stwierdzono, że ich liczba wahała się od 3 mln do 5 mln/ mm³. Badana cecha przyjmuje wartości całkowite, ale wartości tych jest ok. 2mln. W tym przypadku zmienna losowa traktowana musi być jako zmienna losowa ciągła.

Przykład 3. Zbadano stężenie cholesterolu u 2000 osób które przekroczyły 60 lat. Otrzymano wyniki z przedziału od 120 mg/dl do 360 mg/dl. W tym przypadku liczba wartości, które może przyjmować zmienna losowa czyli stężenie cholesterolu jest nieskończenie wiele.

Funkcja gęstości prawdopodobieństwa. Dla zmiennej losowej ciągłej nie można więc obliczyć prawdopodobieństwa, że zmienna losowa przyjmuje konkretną wartość a to oznacza, że nie można wyznaczyć funkcji prawdopodobieństwa tak jak to jest w przypadku zmiennej losowej dyskretnej. Można tylko obliczyć, jakie jest prawdopodobieństwo, że zmienna losowa przyjmie wartość z pewnego przedziału. Funkcja do obliczania tego prawdopodobieństwa nazywana jest funkcją gęstości prawdopodobieństwa.

Histogram częstości

Zmienna losowa ciągła.

Funkcja gęstości rozkładu Jeśli zwiększamy liczbę pomiarów, histogram częstości dąży do wykresu tzw. funkcji gęstości rozkładu prawdopodobieństwa.

Funkcja gęstości – właściwości Funkcja gęstości rozkładu prawdopodobieństwa pozwala obliczać prawdopodobieństwo znalezienia zmiennej losowej w dowolnym przedziale.

Funkcja gęstości

Funkcja gęstości prawdopodobieństwa Zatem funkcja gęstości prawdopodobieństwa zmiennej losowej ciągłej f(x) określona na zbiorze liczb rzeczywistych, ma następujące własności 1. jest dodatnia f(x)  0 2dla dowolnych a<b

Funkcja gęstości prawdopodobieństwa Własności:

Dystrybuanta zmiennej losowej ciągłej Jeśli f(x) jest funkcją gęstości zmiennej losowej X to dystrybuanta F(x) jest równa

Wykres dystrybuanty Dystrybuanta zmiennej losowej ciągłej jest funkcją ciągłą, rosnącą, przyjmującą wartości od 0 do 1.

Wyznaczanie prawdopodobieństwa z dystrybuanty P(a < X  b ) = P(X  b) – P(X  a) = F(b) – F(a)

Dystrybuanta jednoznacznie określa rozkład zmiennej losowej Dystrybuanta jednoznacznie określa rozkład zmiennej losowej. Jeśli dana jest funkcja gęstości można wyznaczyć dystrybuantę i odwrotnie. Jeśli dana jest dystrybuanta można wyznaczyć funkcję gęstości.

Własności Mając dystrybuantę można wyznaczyć funkcję gęstości.

Własności funkcji prawdopodobieństwa dla zmiennej losowej ciągłej