Konstrukcja, estymacja parametrów

Slides:



Advertisements
Podobne prezentacje
ESTYMACJA PRZEDZIAŁOWA
Advertisements

Test zgodności c2.
PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
Statystyka Wojciech Jawień
Estymacja. Przedziały ufności.
W dalszej części zajęć wyróżniać będziemy następujące
Zmienne losowe i ich rozkłady
Estymacja przedziałowa
Test zgodności Joanna Tomanek i Piotr Nowak.
Charakterystyki opisowe rozkładu jednej cechy
Jak mierzyć asymetrię zjawiska?
Graficzna prezentacja danych Wykład 2 dr Małgorzata Radziukiewicz
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Właściwości średniej arytmetycznej
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyka w doświadczalnictwie
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
Niepewności przypadkowe
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 5 Przedziały ufności
Wykład 4 Przedziały ufności
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Co to są rozkłady normalne?
Rozkład t.
Hipotezy statystyczne
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Elementy Rachunku Prawdopodobieństwa i Statystyki
BADANIE STATYSTYCZNE Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter:
„Człowiek - najlepsza inwestycja”
Elementy Rachunku Prawdopodobieństwa i Statystyki
Hipotezy statystyczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Podstawy statystyki, cz. II
Statystyka i opracowanie wyników badań
Testowanie hipotez statystycznych
Co to jest dystrybuanta?
Dopasowanie rozkładów
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Wykład 5 Przedziały ufności
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Estymatory punktowe i przedziałowe
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Przeprowadzenie badań niewyczerpujących, (częściowych – prowadzonych na podstawie próby losowej), nie daje podstaw do formułowania stanowczych stwierdzeń.
ze statystyki opisowej
SKALA CIĄGŁA I SKOKOWA.
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Halina Klimczak Katedra Geodezji i Fotogrametrii Akademia Rolnicza we Wrocławiu WYKŁAD 2 ZMIENNE GRAFICZNE SKALA CIĄGŁA I SKOKOWA.
Parametry rozkładów Metodologia badań w naukach behawioralnych II.
Testy nieparametryczne
Rozkład z próby Jacek Szanduła.
Małgorzata Podogrodzka, SGH ISiD
Statystyka matematyczna
Statystyka matematyczna
Statystyka matematyczna
Jednorównaniowy model regresji liniowej
MIARY STATYSTYCZNE Warunki egzaminu.
Zapis prezentacji:

Konstrukcja, estymacja parametrów Szereg rozdzielczy Konstrukcja, estymacja parametrów

Próba mała i duża W praktyce, przy estymowaniu nieznanych parametrów populacji, pobieramy próby losowe o stosunkowo niewielkiej liczebności (rzędu 10-20 obserwacji). W próbach tego typu (tzw. próba mała) dysponowaliśmy wszystkimi elementarnymi wynikami. W badaniach statystycznych stosuje się także próby o znacznie większej liczebności, rzędu 100 i więcej obserwacji (tzw. próby duże).

Próba duża, szereg rozdzielczy W sytuacjach tego typu z reguły oryginalne wyniki są zestawiane w tzw. szereg rozdzielczy lub w ogóle nie dysponujemy dokładnymi pomiarami. W tym ostatnim przypadku jedynie odnotowujemy fakt przynależności konkretnego pomiaru do odpowiedniego przedziału wartości badanej cechy. Zestawienie takie będziemy nazywać szeregiem rozdzielczym.

Konstrukcja szeregu rozdzielczego Przy konstrukcji szeregu rozdzielczego dzielimy spodziewany zbiór wartości badanej cechy na k przedziałów klasowych o krańcach odpowiednio x1i i x2i (dolny i górny kraniec i-tego przedziału klasowego). Ustalenia wymaga także sposób domknięcia przedziału, najczęściej stosuje się przedziały prawostronnie domknięte (wynik “dokładnie” zostanie zapisany w i-tym przedziale klasowym. Różnicę będziemy nazywać rozpiętością i-tego przedziału klasowego, szereg powinien być tak konstruowany, aby rozpiętości przedziałów były jednakowe. Liczba przedziałów klasowych powinna być rzędu 8-15, proporcjonalnie do wielkości próby losowej.

Szereg rozdzielczy - przykład Badając czas obsługi 250 losowo wybranych klientów przy kasach w pewnym markecie uzyskano następujące wyniki zestawione w szereg rozdzielczy (kolejny slajd) W pierwszej kolumnie podano numery poszczególnych przedziałów klasowych, kolumny druga i trzecia zawierają dolne i górne krańce poszczególnych przedziałów. Kolumna czwarta zawiera liczebności obserwowane w poszczególnych przedziałach klasowych.

Szereg rozdzielczy - przykład (cd)

Szereg rozdzielczy - przykład (cd) Proszę zauważyć, że pierwszy przedział jest „otwarty” z dołu aż do minus nieskończoności, podobnie ostatni przedział jest „otwarty” od góry aż do plus nieskończoności. Jest to konieczne, jeżeli chcemy modelować badaną cechę (czas obsługi klientów) zmienną losową normalną. Suma liczebności empirycznych (kolumna 4) daje liczebność całej próby losowej:

Szereg rozdzielczy - przykład (cd) W kolumnie piątej wyznaczono skumulowane liczebności obserwowane , a w kolejnych kolumnach częstości empiryczne wi: i empiryczną dystrybuantę (skumulowane częstości empiryczne) .

Szereg rozdzielczy - przykład (cd) Proszę zauważyć, że częstości empiryczne wi są ocenami prawdopodobieństw przyjęcia przez badaną cechę wartości z poszczególnych przedziałów klasowych, a ich skumulowane wartości są ocenami dystrybuanty (prawdopodobieństwem nieprzekroczenia przez badaną cechę ustalonych wartości). Częstości empiryczne jak i wartości dystrybuanty empirycznej przyjmują oczywiście wartości z przedziału domkniętego <0; 1>.

Szereg rozdzielczy - przykład (cd) Na podstawie szeregu rozdzielczego można wykonać histogram, czyli wykres częstości empirycznych (lub liczebności obserwowanych), który daje nam orientację o rozkładzie badanej cechy. Z pokazanego na kolejnym slajdzie wykresu wynika, że rozkład czasu obsługi klientów przy kasach może być modelowany zmienną losową normalną.

Szereg rozdzielczy - histogram

Szereg rozdzielczy –dystrybuanta empiryczna Skumulowane częstości empiryczne (empiryczną dystrybuantę) można także przedstawić graficznie :

Wykorzystanie histogramu do ustalenia dominanty Histogram może być wykorzystany także do graficznego wyznaczania dominanty.

Szereg rozdzielczy, wykorzystanie wykresu dystrybuanty do wyznaczania kwantyli

Wyznaczanie parametrów - średnia Średnią arytmetyczną w szeregu wyznaczamy wg wzoru: gdzie jest środkiem i-tego przedziału

Wyznaczanie parametrów – średnia (cd) Środki pierwszego i ostatniego przedziału klasowego (otwartych przedziałów) są wyznaczane wg zasady:

Wyznaczanie parametrów – średni kwadrat Średni kwadrat odchyleń w szeregu rozdzielczym znajdziemy z wzoru:

Wyznaczanie parametrów – kwantyl rzędu p W przypadku szeregu rozdzielczego kwantyl rzędu p znajdziemy z wzoru: X1p - jest dolnym krańcem tego przedziału, w którym znajduje się kwantyl rzędu p, F(x2p) - wartość dystrybuanty empirycznej w przedziale o pozycję wcześniej niż przedział zawierający kwantyl kp hp - rozpiętość przedziału zawierającego kwantyl kp wp - częstość empiryczna przedziału zawierającego kwantyl kp

Wyznaczanie parametrów – dominanta W przypadku szeregu rozdzielczego dominantę znajdziemy z następującego wzoru: Gdzie xid oznacza dolny kraniec przedziału dominanty, nd, nd-1, nd+1 liczebności przedziału dominanty i dwóch sąsiednich przedziałów, a hp oznacza rozpiętość przedziału dominanty.