Elementy Rachunku Prawdopodobieństwa i Statystyki Wykład 10 Estymator wariancji, rozkład wariancji z prób (cd) Rozkłady częstości prob., histogramy Praktyczne zastosowanie – pomiar laboratoryjny Tomasz Szumlak, WFiIS, 12/04/2013
Wariancja z próby Niech zmienne losowe: reprezentują losową próbkę o rozmiarze n, pobraną z pewnej populacji. Z.L., która reprezentuje wariancję próbki dana jest jak poniżej: Mamy jednak poważny problem z tak zdefiniowaną statystyką – obciążenie Blisko wariancji populacji dla dużych próbek…, możemy użyć lepszego, nieobciążonego estymatora wariancji w postaci:
Wariancja z próby Podobnie jak w przypadku estymatora wartości średniej, możemy pobierać próbki i wyznaczyć dla każdej nich wariancję S2 ( ) Jaki jest rozkład takiej zmiennej losowej? Okazuje się, że można uzyskać bardzo ciekawy wynik, badając inną, związaną z wariancją zmienną losową: Prawdziwe jest wówczas, następujące twierdzenie: Jeżeli pobieramy próbki losowe o rozmiarze n z populacji charakteryzującej się rozkładem normalnym, wówczas statystyka zdefiniowana powyżej posiada rozkład „chi-kwadrat” on n-1 stopniach swobody. Rozkład ma szerokie zastosowania przy weryfikacji hipotez statystycznych oraz przy ilościowym testowaniu jakości dopasowania modelu do punktów pomiarowych.
Rozkład Formalnie rozkład ten wprowadzamy w następujący sposób: Rozważmy zmienny losowych o rozkładzie normalnym o wartości oczekiwanej = 0 oraz wariancji = 1, skonstruujmy następującą zmienną losową: Można pokazać, że taka zmienna losowa posiada R.G.P. o postaci: (dla zainteresowanych – jest to szczególna postać tzw. funkcji gamma) Wartość oczekiwana oraz wariancja rozkładu
Rozkład
Odchylenie standardowe estymatora Mała dygresja… Różnica pomiędzy losowaniem ze zwracaniem i bez zwracania nieskończona populacja (lub losowanie ze zwracaniem) skończona populacja w rzeczywistości mamy do czynienia ze skończonymi próbkami, dysponujemy więc estymatorami odchylenia standardowego… Odchylenie standardowe estymatora
Histogramy
Histogramy - wstęp
Formalnie pojęcie histogramu wprowadzone przez Pearson’a Histogramy Formalnie pojęcie histogramu wprowadzone przez Pearson’a Wygodne i proste narzędzie do wizualizacji i kategoryzacji danych Świetny i wydajny estymator R.G.P. dla danego zjawiska losowego (konstruując histogram nie zakładamy z góry nic o rodzaju rozkładu – po prostu zliczamy przypadki i rysujemy…) Wysokość Pigmeja [cm] Liczba Pigmejów Liczba Pigmejów Suma Wysokość Pigmeja [cm]
Trochę praktyki, czyli po co to wszystko…
Podsumujmy co wiemy… (uproszczona wersja, uściślimy podczas dyskusji na temat estymacji) Typowy problem – mierzymy nieznaną wielkość X Wynikiem pomiaru jest pewna wielkość doświadczalna – czyli najlepsza estymata (jeżeli eksperyment przeprowadzony jest dobrze…) Estymata – wartość estymatora Statystyka pozwala na podstawie eksperymentu estymować prawdziwą wartość mierzonej wielkości Jeżeli mierzymy daną wielkość w sposób pośredni (przypadek Z.L. niezależnych):
Kilka typowych przypadków Dla ogólności założymy, że zmienne mogą być skorelowane (ograniczymy się za to do dwóch Z.L.) Zapiszmy więc (por. wykład dotyczący macierzy kowariancji) Zakładamy, że znamy (z pomiarów) parametry rozkładów jakim podlegają zmienne niezależne, znane są więc odchylenia standardowe Interesuje nas odchylenie standardowe zmiennej u: Możemy (zakładając „małe” odchylenia standardowe) rozwinąć powyższą różnicę: Wstawiając do powyższego:
Kilka typowych przypadków… Najczęściej mamy do czynienia z prostymi funkcjami: suma, różnica, iloczyn, iloraz: