Elementy Rachunku Prawdopodobieństwa i Statystyki

Slides:



Advertisements
Podobne prezentacje
ESTYMACJA PRZEDZIAŁOWA
Advertisements

Statystyka Wojciech Jawień
Estymacja. Przedziały ufności.
Wykład 5 Standardowy błąd a odchylenie standardowe
Rachunek prawdopodobieństwa 2
Zmienne losowe i ich rozkłady
Metody wnioskowania na podstawie podprób
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Dr inż. Bożena Mielczarek
Metody ekonometryczne
Statystyka w doświadczalnictwie
BIOSTATYSTYKA I METODY DOKUMENTACJI
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 3 Wzór Bayesa, cd.: Wpływ rozkładu a priori.
Wykład 4 Przedziały ufności
Elementy Rachunku Prawdopodobieństwa c.d.
Wzory ułatwiające obliczenia
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Konstrukcja, estymacja parametrów
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Analiza wariancji jednoczynnikowa.
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
Statystyka – zadania 4 Janusz Górczyński.
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Błędy i niepewności pomiarowe II
Regresja wieloraka.
Co to jest dystrybuanta?
Dopasowanie rozkładów
Wnioskowanie statystyczne
Metoda reprezentacyjna i statystyka małych obszarów z SAS Instytut Statystyki i Demografii SGH dr Dorota Bartosińska Zajęcia 4 Wnioskowanie statystyczne.
Zagadnienia AI wykład 2.
Statystyka medyczna Piotr Kozłowski
Ekonometria stosowana
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Analiza portfeli dwu- oraz trzy-akcyjnych
Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.
Testowanie hipotez Jacek Szanduła.
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Ekonometria stosowana Heteroskedastyczność składnika losowego Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
STATYSTYKA – kurs podstawowy wykład 4 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Modele nieliniowe sprowadzane do liniowych
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

Elementy Rachunku Prawdopodobieństwa i Statystyki Wykład 9 (Próbkowanie c.d.) Próbkowanie rozkładów proporcji, sum i różnic Z.L. Wariancja próby, rozkład wariancji z prób Rozkłady częstości prob., histogramy Tomasz Szumlak, WFiIS, 12/04/2013

Przypomnienie Jednym z fundamentalnych zastosowań statystyki jest szacowanie parametrów populacji, które opisane są odpowiednimi R.G.P. f(x) Procedura ta rozpoczyna się od pobrania próbki (próbek) losowej, z danego rozkładu, o rozmiarze n Tak wybrana próbka służy do wyznaczenia odpowiedniej statystyki xs Statystyka ta, jest zmienną losową, której wartość jest funkcją pobranej próbki Statystyka posiada więc odpowiedni R.G.P., którego parametry używane są do szacowania parametrów R.G.P. populacji, z której próbka została pobrana Np. jeżeli interesuje nas wartość średnia populacji, wówczas za statystykę przyjmujemy średnią arytmetyczną elementów pobranej próbki, przyjmujemy, że jedna konkretna wartość średnia, wyznaczona dla danej próbki pochodzi z rozkładu średnich Niezwykły fakt – bez względu na rodzaj rozkładu opisującego populację, rozkład średnich z prób charakteryzuje się pewnymi uniwersalnymi cechami (CTG)!!

Popatrzmy na kilka, typowych, przykładów zastosowań Przypomnienie T1: Wartość oczekiwana rozkładu wartości średnich z prób wyraża się jak poniżej: Innymi słowy – wartość oczekiwana dla średniej z próby równa jest wartości oczekiwanej dla badanej populacji T2: Jeżeli badana populacja jest nieskończona, (lub w przypadku skończonej losujemy ze zwracaniem) to wariancja rozkładu wartości oczekiwanych z prób wyraża się: Popatrzmy na kilka, typowych, przykładów zastosowań

Rozkład dwumienny – frakcja sukcesów Załóżmy, że badamy populację zawierającą nieskończoną liczbę elementów, posiadającą rozkład dwumienny. Zakładamy, że p oznacza prob. „sukcesu” a q = 1 – p prob. „porażki” Załóżmy, że możemy pobrać b. dużą liczbę próbek, dla których wyznaczamy statystykę oznaczającą ułamek odniesionych sukcesów, P. W wyniku dostaniemy rozkład statystyki P, której wartość oczekiwana i wariancja wyrażają się następująco:

Przykład Eksperyment polega na 120 krotnym rzucie symetryczną monetą . Jakie jest prob., że reszki będą stanowić od 40% do 60% otrzymanych rezultatów. Metoda korzystająca z wielkości bezwzględnych 40%  120 = 48 (47.5), 60%  120 = 72 (72.5) Gdy n jest dostatecznie duże (w praktyce n ~ 30) oraz p nie jest bliskie 0, mamy: Standardowa zmienna losowa Z podlega rozkładowi normalnemu, mamy więc: Czyli „tłumacząc” na jednostki standardowe dostaniemy:

To samo, tym razem korzystając z wielkości względnych: Jednostki standardowe:

Suma i różnica statystyk Załóżmy, że badamy dwie populacje z których losujemy próbki (dużo!) o licznościach odpowiednio n1 oraz n2 (dla ogólności przyjmiemy dwie różne wartości). Dla każdej z próbek, możemy następnie obliczyć odpowiednie statystyki: Dla odpowiednio dużych wartości i, mamy więc dostęp do odpowiednich rozkładów statystyk z pobranych prób, czyli dysponujemy rozkładami Z.L. S(1) oraz S(2). Znamy więc parametry tych rozkładów: Możemy następnie dla każdej możliwej kombinacji wyznaczyć różnicę mierzonych statystyk: Dostajemy w ten sposób rozkład różnic statystyk S(1) oraz S(2).

Suma i różnica statystyk Ubierzmy to coś bardziej konkretnego – niech powyższe statystyki oznaczają średnie z pobranych prób: Zależności odpowiadające parametrom rozkładu różnic statystyk będą wyglądać jak poniżej: Zmienna standardowa ma przy tym postać: Dalej, łatwo pokazać, że dla statystyk reprezentujących wielkości ułamkowe dostaniemy:

Przykład Badanie różnic statystyk, szczególnie pomocne przy porównywaniu wartości średnich! Mamy np. poniższy problem: Badamy dwa rodzaje żarówek firmy A i B. Producenci podają, że wartość średniego czasu życia wynosi odpowiednio 1400 i 1200 godzin z odchyleniami standardowymi wynoszącymi odpowiednio 200 oraz 100 godzin. Losujemy 125 żarówek firmy A i B. Jakie jest prob., że żarówki firmy A będą mieć średni czas życia dłuższy o przynajmniej 160 godzin od żarówek firmy B? Zakładamy, że Z.L. standardowa posiada rozkład normalny (duża próbka).

Przykład Postępujemy podobnie jak w przypadku poprzedniego przykładu, poszukiwane prob. wyniesie: Jakie jest prob., że żarówki firmy A będą świecić dłużej od żarówek firmy B o 260 godzin? (rozwiązujemy w domu…) Podobne rozważania można przeprowadzić dla sumy statystyk:

Wariancja z próby Niech zmienne losowe: reprezentują losową próbkę o rozmiarze n, pobraną z pewnej populacji. Z.L., która reprezentuje wariancję próbki dana jest jak poniżej: Mamy jednak poważny problem z tak zdefiniowaną statystyką – obciążenie Blisko wariancji populacji dla dużych próbek…, możemy użyć lepszego, nieobciążonego estymatora wariancji w postaci:

Histogramy - wstęp