na podstawie materiału – test z użyciem komputerowo generowanych prób

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

Badania statystyczne Wykłady 1-2 © Leszek Smolarek.
ESTYMACJA PRZEDZIAŁOWA
Test zgodności c2.
hasło: student Szymon Drobniak pokój konsultacje: wtorek 13-14
Ilustracja obliczania całek oznaczonych metodą Monte Carlo
Analiza wariancji jednoczynnikowa
Zmienne losowe i ich rozkłady
Skale pomiarowe – BARDZO WAŻNE
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
Estymacja przedziałowa
Test zgodności Joanna Tomanek i Piotr Nowak.
Wnioskowanie Bayesowskie
Metody wnioskowania na podstawie podprób
Jak mierzyć asymetrię zjawiska?
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Właściwości średniej arytmetycznej
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyka w doświadczalnictwie
hasło: student Joanna Rutkowska Aneta Arct
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
Podstawowe pojęcia prognozowania i symulacji na podstawie modeli ekonometrycznych Przewidywaniem nazywać będziemy wnioskowanie o zdarzeniach nieznanych.
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Wykład 4 Przedziały ufności
Alfred Stach Instytut Paleogeografii i Geoekologii
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Doświadczalnictwo.
Średnie i miary zmienności
Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych
Rozkład t.
Metody ilościowe w biznesie Wykład 1
Hipotezy statystyczne
Analiza wariancji jednoczynnikowa
Konstrukcja, estymacja parametrów
Testowanie hipotez statystycznych
Analiza współzależności cech statystycznych
Elementy Rachunku Prawdopodobieństwa i Statystyki
Modelowanie ekonometryczne
Statystyka - to „nie boli”
Seminarium licencjackie Beata Kapuścińska
Dopasowanie rozkładów
Wnioskowanie statystyczne
Metoda reprezentacyjna i statystyka małych obszarów z SAS Instytut Statystyki i Demografii SGH dr Dorota Bartosińska Zajęcia 4 Wnioskowanie statystyczne.
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
ze statystyki opisowej
Testy nieparametryczne – testy zgodności. Nieparametryczne testy istotności dzielimy na trzy zasadnicze grupy: testy zgodności, testy niezależności oraz.
STATYSTYKA – kurs podstawowy wykład 7 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Estymacja parametrów populacji. Estymacja polega na szacowaniu wartości parametrów rozkładu lub postaci samego rozkładu zmiennej losowej, na podstawie.
Weryfikacja hipotez statystycznych „Człowiek – najlepsza inwestycja”
Parametry rozkładów Metodologia badań w naukach behawioralnych II.
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
Statystyka matematyczna
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
MIARY STATYSTYCZNE Warunki egzaminu.
Monte Carlo, bootstrap, jacknife
Zapis prezentacji:

na podstawie materiału – test z użyciem komputerowo generowanych prób Metody wyznaczania dymorfizmu płciowego na podstawie materiału o nieokreślonej płci – – test z użyciem komputerowo generowanych prób Krzysztof Kościński, Sergiusz Pietraszewski Instytut Antropologii UAM

Na podstawie dymorfizmu płciowego (DP) można wnioskować o systemie kojarzeń i strukturze społecznej gatunku (w tym naczelnych). Popularny wzór na DP to iloraz średniej męskiej i żeńskiej: W przypadku gatunków kopalnych ustalenie płci konkretnego okazu często jest niemożliwe lub wątpliwe. W związku z tym powyższy wzór staje się bezużyteczny. Trzeba szukać innych sposobów ...

Gdy dysponujemy próbą złożoną z osobników o nieznanej płci, to oszacowanie DP jest ... ... łatwe, gdy próba ma rozkład dwumodalny – średnie obu płci leżą blisko wierzchołków rozkładu łącznego. ... trudne, gdy rozkład jest jednomodalny.

W literaturze zaproponowano szereg metod szacowania DP na podstawie prób złożonych z osobników o nieznanej płci 1) Metoda średniej (MeanM) Wartość średnia dzieli próbę na dwie części - „żeńską” i „męską”. DP to iloraz średnich tych części. 2) Metoda mediany (MeM) Jak wyżej, ale miejsce podziału wyznacza mediana, a nie średnia. 3) Metoda współczynnika zmienności (CVM) Przy danym wewnątrz-płciowym CV (WPCV), DP silnie koreluje z ogólnym CV (z całej próby). Omawiana metoda zakłada jakąś wartość WPCV u gatunku kopalnego i wnioskuje o jego DP na podstawie CV z próby.

4) Metoda momentów (MoM) Metoda zakłada, że rozkład cechy u każdej płci jest normalny, a następnie określa DP na podstawie odstępstwa od normalności (kurtozy) rozkładu z próby (łącznego dla obu płci). 5) Finite mixture analysis (FMA) Ta metoda również opiera się na analizie rozkładu normalnego i podaje górne oszacowanie DP. 6) Binomial dimorphism index (BDI) Zakłada się, że w próbie samce są większe od samic, ale nie wiadomo ile ich jest. Liczy się DP dla każdej możliwej liczebności, a następnie oblicza ich średnią ważoną. 7) Assigned resampling method (ARM) Z próby losuje się wielokrotnie (1000x) parę okazów i dzieli większą wartość przez mniejszą. Średni iloraz stanowi oszacowanie DP.

Precyzję każdej metody sprawdziliśmy na wirtualnych próbach losowanych z populacji o określonych parametrach Wartości parametrów: - wielkość próby: 10, 20, 50 - proporcja płci: 0,2, 0,5, 0,8 - skośność: –, 0, + - wewnątrz-płciowy CV: 5, 10, 15 % czyli 3  3  3  3 = 81 kombinacji 1 1 2 . . . . . . . . . 81 Dla każdej kombinacji rozważano 6 poziomów DP 2 1,0 1,1 1,2 1,3 1,5 1,8 Dla każdego poziomu DP generowano 1000 prób 3 1 2 . . . . . . . . . 1000 W każdej próbie obliczono DP i oszacowano go każdą metodą. Obliczono obciążenia, SD i SE dla każdej próby i każdej metody. 4 Obciążenia, SD i SE dla wszystkich poziomów DP dają przeciętną prezycję każdej metody przy danej kombinacji parametrów. Porównanie metod przy danej kombinacji opiera się na tych przeciętnych precyzjach. 5 1,0 1,1 1,2 1,3 1,5 1,8

Wyniki 1) Precyzja oszacowania DP jest większa, gdy: - liczebność próby jest duża, - liczebności obu płci są zbliżone, - współczynnik zmienności jest niewielki (CV  5%). 2) Skośność rozkładu nie wpływa na precyzję metod. 3) Wszystkie metody przeszacowują DP, gdy jest on < 1,1. 4) Częste jest niedoszacowanie dla DP > 1,3.

Wnioski 1) Przy realistycznych wartościach parametrów dokładność omawianych metod jest niewielka. 2) Wielkość rzeczywistych prób zwykle jest rzędu 10, przez co: a) błąd losowy jest duży b) duże jest ryzyko dysponowania próbą złożoną z okazów tylko jednej płci. 3) Jeśli wewnątrzpłciowy CV  10%, to precyzja jest jeszcze mniejsza. 4) Przedział ufności dla szacowanego DP zwykle przekracza 0,2, co wyklucza odpowiedź dokładniejszą niż „dymorfizm płciowy jest niski (średni / wysoki)”. 1,0 1,5 1,4 1,3 1,2 1,1 oszacowany DP DP w populacji

Algorytm wyboru metody szacowania DP Stop! Brak precyzyjnej metody Duże ryzyko jedno-płciowej próby Duży błąd losowy TAK TAK TAK TAK PP jest, przypuszczalnie, wysokie ( 0,8)? N < 7-10 ? N  10 i małe PP ( 0,2)? i WPCV  10% ? NIE NIE NIE NIE Najlepsze metody: (1) MoM, (2) CVM, (3) MeanM Jakie jest N? Jaki jest PP? Jakie jest WPCV? 50 0,5 5% 10-20 0,2 nieznane, być może  10% znane,  10% Najlepsze metody: (1) CVM, (2) MeanM Najlepsze metody: CVM i MeanM Najlepsza metoda: CVM Stop! Brak precyzyjnej metody N - liczebność próby, PP - proporcja płci, WPCV - wewnątrzpłciowy CV