Www.eko.uj.edu.pl/stat hasło: student Justyna Kubacka justyna.kubacka@uj.edu.pl.

Slides:



Advertisements
Podobne prezentacje
Regresja i korelacja materiały dydaktyczne.
Advertisements

ESTYMACJA PRZEDZIAŁOWA
hasło: student Szymon Drobniak pokój konsultacje: wtorek 13-14
Wykład 7: Moc Moc testu to prawdopodobieństwo odrzucenia H0, gdy prawdziwa jest HA Moc=czułość testu Moc = 1 – Pr (nie odrzucamy H0, gdy prawdziwa jest.
Porównywanie średnich dwóch prób niezależnych o rozkładach normalnych (test t-studenta)
Analiza wariancji jednoczynnikowa
Analiza przyczynowości
Skale pomiarowe – BARDZO WAŻNE
BUDOWA MODELU EKONOMETRYCZNEGO
Współczynnik beta Modele jedno-, wieloczynnikowe Model jednowskaźnikowy Sharpe’a Linia papierów wartościowych.
Statystyka w doświadczalnictwie
hasło: student Joanna Rutkowska Aneta Arct
Mgr Sebastian Mucha Schemat doświadczenia:
Niepewności przypadkowe
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 14 Liniowa regresja
Wykład 3 Wzór Bayesa – wpływ rozkładu a priori.
Wykład 5 Przedziały ufności
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 11 Analiza wariancji (ANOVA)
Wykład 4 Przedziały ufności
Modele (hipotezy) zagnieżdżone
Test t-studenta dla pojedynczej próby
Próby niezależne versus próby zależne
Porównywanie średnich dwóch prób zależnych
Test t-studenta dla pojedynczej próby
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Wykład 4. Rozkłady teoretyczne
Średnie i miary zmienności
Estymacja przedziałowa i korzystanie z tablic rozkładów statystycznych
Co to są rozkłady normalne?
Co to są rozkłady normalne?
Korelacja, autokorelacja, kowariancja, trendy
Test nieparametryczny
Rozkład t.
Analiza wariancji jednoczynnikowa
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Analiza współzależności cech statystycznych
Testy nieparametryczne
Elementy Rachunku Prawdopodobieństwa i Statystyki
Statystyka - to „nie boli”
Regresja wieloraka.
Testowanie hipotez statystycznych
Porównywanie średnich prób o rozkładach normalnych (testy t-studenta)
Dopasowanie rozkładów
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Statystyka medyczna Piotr Kozłowski
Wykład 5 Przedziały ufności
Weryfikacja hipotez statystycznych
Estymatory punktowe i przedziałowe
Podstawowe pojęcia i terminy stosowane w statystyce
Testowanie hipotez Jacek Szanduła.
Statystyczna Analiza Danych SAD2 Wykład 4 i 5. Test dla proporcji (wskaźnika struktury) 2.
Statystyczna analiza danych SAD2 Wykład 5. Testy o różnicy wartości średnich dwóch rozkładów normalnych (znane wariancje) Statystyczna analiza danych.
Korelacje dwóch zmiennych. Korelacje Kowariancja.
ze statystyki opisowej
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Ożywić pola-rok bażanta. Występowanie bażanta Spotkać go można na całym obszarze niżowym kraju, choć występuje nierównomiernie, rzadko w północnych regionach.
Rozkład z próby Jacek Szanduła.
Statystyka matematyczna
METROLOGIA Statystyczne metody poprawienia dokładności
Regresja wieloraka – bada wpływ wielu zmiennych objaśniających (niezależnych) na jedną zmienną objaśnianą (zależą)
Jednorównaniowy model regresji liniowej
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
Korelacja i regresja liniowa
Test t-studenta dla pojedynczej próby
Zapis prezentacji:

www.eko.uj.edu.pl/stat hasło: student Justyna Kubacka justyna.kubacka@uj.edu.pl

uwagi do testu 2 pary wiązane 2 próby Czy szerokość krawata na piersi samca różni się pomiędzy wiosną a zimą? W obu sezonach złapano te same, oznakowane wcześniej ptaki. Czy ptaki różniły się wielkością lęgu w pomiędzy latami 2004 i 2005? W latach tych udało się złapać te same ptaki. Które z rodziców, samiec czy samica, spędza więcej czasu w gnieździe? Czy ptaki w 2006 roku miały lęgi innej wielkości niż w 2005 r.? Niestety w latach tych nie udało się złapać tych samych ptaków. Czy wielkość lęgu bogatki jest różna w Małopolsce i w Wielkopolsce? Wyjaśnić to za pomocą 2 zbiorów i łączenia punktów między nimi (pary wiązane) lub bez łączenia (2 próby)

uwagi do testu 2 (grupy I i II) KTÓRE Z RODZICÓW, SAMIEC CZY SAMICA, SPĘDZA WIĘCEJ CZASU W GNIEŹDZIE? H0: t samicy = t samca, HA: t samicy ≠ t samca test dla par wiązanych! N=25 => df = N-1 = 24 CZY WIELKOŚĆ LĘGU BOGATKI JEST RÓŻNA W MAŁOPOLSCE I W WIELKOPOLSCE? H0: lęg Mał. = lęg Wielk., HA: lęg Mał. ≠ lęg Wielk. test dla 2 prób niezależnych! brak różnic między wariancjami lęgu => test dla 2 prób, wersja dla równych wariancji N1 = 15, N2 = 15 => df = N1 + N2 – 2 = 28 Wyjaśnić zamieszanie z hipotezami, podkreślić df dla różnych testów, poprosić o podanie tkryt, podjęcie decyzji statystycznej, wnioski biologiczne i błąd I rodzaju (przypomnieć wyznaczanie). Podkreślić, że w drugim przykładzie wariancje były równe, więc należało zast. test dla równych wariancji; test dla różnych też można, ale jest słabszy.

uwagi do testu 2 (grupy III i IV) STANDARYZACJA odnosi pomiar do średniej i odchylenia standardowego w populacji umożliwia bezpośrednie porównanie pomiarów pochodzących z różnych rozkładów (np. rozkład wzrostu kobiet i mężczyzn) Z = (pomiar-średnia)/odchylenie standardowe mówi o tym, ile odchyleń powyżej lub poniżej średniej znajduje się pomiar rozkład normalny standaryzowany to rozkład wartości Z Krótko o standaryzacji (tego nie będzie na teście końcowym). Przypomnieć, że tablica w Łomnickim obejmuje prawą połowę rozkładu (w książce jest błąd!). Przerobić zadanie z testu.

Model I masa ciała zależy od wieku 14 12 10 8 LOG masy ciała [g] 6 4 Różnica między dwoma modelami. Wyobraźmy sobie, ze mamy hodowle zeberek, a w niej piskleta. Jeśli z tej hodowli bedziemy wybierac i wazyc piskleta zeberki w konkretnym, wybranym wieku, to uzyskamy regresje. W modelu I, ktory odpowiada takiemu przykladowi, czynnik na osi X jest jasno okreslony / kontrolowany przez eksperymentatora – tak jak tutaj wiek pisklecia. Dlatego, ze w tym wypadku postanowilismy wazyc piskleta bedace w okreslonym wieku. 2 1 4 8 12 wiek [dni]

Model I długość życia zależy od temperatury 5 10 15 20 25 30 temperatura [oC] długość życia [dni] Tutaj badamy zaleznośc dlugosci zycia nicienia C. Elegans od temperatury. Jak przystalo na organizm zmiennocieplny, tempo metabolizmu zalezy od temperatury i jest szybsze w wyższej. Dlatego nicienie hodowne w wyzszych temperaturach szybciej dojrzewaja, ale tez szybciej koncza zycie. I tutaj też mamy model I ponieważ od nas zalezalo jakie temperatury wykorzystamy w badaniach, a warunki te można odtworzyc – sa powtarzalne.

Model I (prosta regresji) Y Inne właściwości tej prostej: przechodzi ona przez punkt określnoy średnią wartością X i srednia wartościa Y. X

Model I (prosta regresji) Y = a + bX Y Czas dopasowac do punktów prostą. W modelu I mamy zawsze regresję i dopasowujemy prostą regresji. Jakie jest równanie regresji? Wspolczynnik a to punkt przeciecia z osią Y, a przy X stoi współczynnik nachylenia prostej – który mówi o sile związku. Przez jaki punkt przechodzi prosta regresji? Jak ją wyznaczyć? Ta linia ma 2 ważne własności: przechodzi przez punkt określony przez średnie X i Y. Ponadto, suma kwadratów odchyleń poszczególnych punktów od tej prostej, po osi Y jest najmniejsza. WAŻNE: w modelu I prosta pokazuje nam zaleznosc Y od X. Ta prosta jest inna, niz w modelu II. X

Model II: masa ciała samców ma związek z masą ciała samicy? Masa ciała samca Teraz wróćmy do przykładu z masą ciała bocianów – samic i samcow. Wazymy oba ptaki w parze, masy samic zaznaczamy na osi X, a masy ciala samców na osi Y i to sa współrzędne dla poszczególnych punktów. 1 punkt dla kazdej pary Tutaj chcialam zwrocic uwage, ze nie kotrolujey, ani nie dobieramy w żaden sposób masy ciala samic ani samcow. Dlatego mamy tu do czynienia z modelem II – w ktory, czynnik na osi X jest niezalezny od badacza – ‘losowy’. Masa ciała samicy

Model II: szerokość liścia ma związek z jego długością? Inny przykład: badane zwiazku między szerokości a dlugoscia liscia: Na jednej osi odkladamy... 1 lisc- 1 punkt. O ile w wypdku dlugsci zycia nicieni moglismy powiedziec, ze C. Elegans zyje krócej bo jest wyższa temperatura, to nie moglismy odwrcic tej zaleznosci i powedziec, jest wyzsza temperatura, bo nicien zyje krocej. A w obecnym przyadku, ponieważ nie możemy stwierdzic, czy lisc jest dluzszy, dlatego ze jest szeroki, czy tez odwrotnie, możemy dwie osie zamienic... Długość liścia

Model II: szerokość liścia ma związek z jego długością? Y = a + νX a współczynnik nachylenia Długość liścia I teraz na X mamy szerokość, a na Y dlugość liścia. W modelu II na ogol mamy do czynienia z korelacja i wyznaczamy os glowna zredukowana. Szerokość liścia

Model II: szerokość liścia ma związek z jego długością? Y = a + νX r = 0,6 Długość liścia Druga ważna wartość to R albo R2. To jest wpółczynnik korelacji który mowi o sile zwiazku, o tym jak blisko prostej leza punkty. Jeżeli punkty leża dokładnie w lini prostej, to Szerokość liścia

Model II: szerokość liścia ma związek z jego długością? Y = a + νX r = 1 Długość liścia Wspólczynnki korelacji wynosi 1. Jeżeli są zupelnie przypadkowo porozrzucane, to wpsolczynnki wynosi 0. Szerokość liścia

Model II: szerokość liścia ma związek z jego długością? Y = a + νX v<0 r = -1 Długość liścia Jeżeli leżą na prostej, ale zwiazek jest odwrotnie proporcjonalny, to watość wspolczynnika korealcji wynosi –1. Zwracam tu uwage na to, ze często jako miarę siły związku podaje się R do kwadratu. Wtedy wartość ta jest dodatnia niezależnie od znaku plus lub minus stojącego przy R. Szerokość liścia

Model II: szerokość liścia ma związek z jego długością? Y Inne właściwości tej prostej: przechodzi ona przez punkt określnoy średnią wartością X i srednia wartościa Y. X

Model II (oś główna zredukowana) Y = a + vX Y W modelu II na ogol mamy do czynienia z korelacja i wyznaczamy os glowna zredukowana. Ona tez przechodzi przez pare punktow wyznaczona srednimi arytmetycznymi! Ale jest wyznaczana inna metoda. Druga ważna wartość to R albo R2. To jest wpółczynnik korelacji który mowi o sile zwiazku, o tym jak blisko prostej leza punkty. Innymi sowy jak dokladnie w oparciu o wartość X możemy przewidywac wartość Y. Jeżeli punkty leża dokładnie w lini prostej, to X

jaki to model? Zależność między płodnością a masą ciała mierzona dla 20 losowo wybranych samic chrząszcza mącznika Zależność między przeżywalnością nicieni C. elegans a stężeniem ołowiu w podawanej pożywce (12 poziomów stężenia) Zależność między absorbancją a stężeniem roztworu, mierzona podczas kalibracji spektrofotometru przy użyciu roztworów o znanych stężeniach (0, 0.2, 0.5, 1.0, 2.0 mg/l) Zależność między wielkością poroża a stopniem zapasożycenia mierzona u 22 samców jelenia szlachetnego odłowionych w Bieszczadach

jaki to model? Zależność między płodnością a masą ciała mierzona dla 20 losowo wybranych samic chrząszcza mącznika II Zależność między przeżywalnością nicieni C. elegans a stężeniem ołowiu w podawanej pożywce (12 poziomów stężenia) I Zależność między absorbancją a stężeniem roztworu, mierzona podczas kalibracji spektrofotometru przy użyciu roztworów o znanych stężeniach (0, 0.2, 0.5, 1.0, 2.0 mg/l) I Zależność między wielkością poroża a stopniem zapasożycenia mierzona u 22 samców jelenia szlachetnego odłowionych w Bieszczadach II

Istotność korelacji i regresji Y Ale jak to w przyrodzie bywa cechy lisci sa rozne i poszczegolne pomiary odbiegaja od sredniej. Np. ten punkt ma wpolrzedna Y o wiele mniejsza od sredniej wartości Y. Ta różnice można rozbic na dwie składowe. Po pierwsze linia prosta pokazuje jaka powinna być wartość Y dla danego X, gdyby wszystkie punkty były dokladnie na prostej. Czyli czesc odchylenia od sredniej jest wytlumaczona tym, ze dla małych wartości X, male sa tez wartości Y. To jest czesc odchylenia – oznaczona na czerwono - wyjasniona przez prostą. Ten punkt obok lezy dokladnie na prostej, czyli jego doczylenie od wartości średniej Y jest w całości wytłumaczone przez zależność Y od X. Natomiast ten punkt jest jeszcze nizej niż wynikaloby to z zależności Y od X. Pozostala cześć odchylenia – oznaczona na zielono – jest niewyjaśniona przez prosta. X

założenia w regresji i korelacji Odowiedz na pytanie o kształt związku dostajemy obliczając równaie prostej regresji – w wypadku modelu I – czyli gdy kontrolujemy jedna zmienna, a zmienn aprzez nas badana ma rozkład normalny Lub Obliczając równanie osi głównej zredukowanej – gdy żadna ze zmiennych od nas nie zalezy – w wypadku modelu II – a obie maja rozklad normalny. Prosta regresji (model I lub II) Oś główna zredukowana (model II)

korelacja i regresja: podsumowanie prosta regresji model I lub II szukamy zależności Y od X Y=a+bx opisywana przez współczynnik regresji b (i ew. wsp. korelacji r) założenia: rozkład normalny wartości na osi Y korelacja oś główna (zredukowana) model II szukamy związku między dwoma zmiennymi Y=a+vx opisywana przez współczynnik korelacji r założenia: rozkład normalny wartości na osi X i Y Podac przyklady na regresje model I i II (buraki i nawozy) oraz korelacje model II (bociany i urodzenia).

tempo wzrostu [cm/rok] 1. Wykres przedstawia zależność tempa wzrostu człowieka od jego wieku. wiek [lata] tempo wzrostu [cm/rok] Jak należy postąpić z takimi danymi, aby ustalić istotność związku między tymi dwoma cechami?

2. Badano zawartość cynku w organizmie biegacza Pterostichus versicolor przy użyciu spektofotometru. Za pomocą roztworów o znanych stężeniach (cZn) wykalibrowano spektofotometr otrzymując następujące wartości absorbancji (A): cZn [mg/L] 0,2 0,5 1,0 2,0 A 0,002 0,035 0,094 0,161 0,311 Narysuj wykres punktowy zależności absorbancji od stężenia roztworu Zn. Jedno z niżej podanych równań opisuje tą zależność. Które? A = 0,153 – 0,007 cZn A = 0,002 – 0,153 cZn A = 0,007 + 0,153 cZn A = 0,153 + 0,007 cZn Jak nazywa się ta prosta? Nanieś ją na wykres. Jakie jest stężenie cynku w próbce z osobnika nr. 90, jeżeli absorbancja wynosi 0,110? Czy jest to model I czy II szeregu dwucechowego?

3. Badając na przestrzeni 20 lat związek między średnią temperaturą powietrza w marcu, a średnią datą przystąpienia do lęgów sikory modrej uzyskano r = 0,60. Oblicz, czy siła tego związku jest istotna. Podaj błąd I rodzaju, nawet jeżeli go nie popełniasz. Z którym modelem szeregu dwucechowego mamy tu do czynienia?