www.eko.uj.edu.pl/stat hasło: student Justyna Kubacka justyna.kubacka@uj.edu.pl
uwagi do testu 2 pary wiązane 2 próby Czy szerokość krawata na piersi samca różni się pomiędzy wiosną a zimą? W obu sezonach złapano te same, oznakowane wcześniej ptaki. Czy ptaki różniły się wielkością lęgu w pomiędzy latami 2004 i 2005? W latach tych udało się złapać te same ptaki. Które z rodziców, samiec czy samica, spędza więcej czasu w gnieździe? Czy ptaki w 2006 roku miały lęgi innej wielkości niż w 2005 r.? Niestety w latach tych nie udało się złapać tych samych ptaków. Czy wielkość lęgu bogatki jest różna w Małopolsce i w Wielkopolsce? Wyjaśnić to za pomocą 2 zbiorów i łączenia punktów między nimi (pary wiązane) lub bez łączenia (2 próby)
uwagi do testu 2 (grupy I i II) KTÓRE Z RODZICÓW, SAMIEC CZY SAMICA, SPĘDZA WIĘCEJ CZASU W GNIEŹDZIE? H0: t samicy = t samca, HA: t samicy ≠ t samca test dla par wiązanych! N=25 => df = N-1 = 24 CZY WIELKOŚĆ LĘGU BOGATKI JEST RÓŻNA W MAŁOPOLSCE I W WIELKOPOLSCE? H0: lęg Mał. = lęg Wielk., HA: lęg Mał. ≠ lęg Wielk. test dla 2 prób niezależnych! brak różnic między wariancjami lęgu => test dla 2 prób, wersja dla równych wariancji N1 = 15, N2 = 15 => df = N1 + N2 – 2 = 28 Wyjaśnić zamieszanie z hipotezami, podkreślić df dla różnych testów, poprosić o podanie tkryt, podjęcie decyzji statystycznej, wnioski biologiczne i błąd I rodzaju (przypomnieć wyznaczanie). Podkreślić, że w drugim przykładzie wariancje były równe, więc należało zast. test dla równych wariancji; test dla różnych też można, ale jest słabszy.
uwagi do testu 2 (grupy III i IV) STANDARYZACJA odnosi pomiar do średniej i odchylenia standardowego w populacji umożliwia bezpośrednie porównanie pomiarów pochodzących z różnych rozkładów (np. rozkład wzrostu kobiet i mężczyzn) Z = (pomiar-średnia)/odchylenie standardowe mówi o tym, ile odchyleń powyżej lub poniżej średniej znajduje się pomiar rozkład normalny standaryzowany to rozkład wartości Z Krótko o standaryzacji (tego nie będzie na teście końcowym). Przypomnieć, że tablica w Łomnickim obejmuje prawą połowę rozkładu (w książce jest błąd!). Przerobić zadanie z testu.
Model I masa ciała zależy od wieku 14 12 10 8 LOG masy ciała [g] 6 4 Różnica między dwoma modelami. Wyobraźmy sobie, ze mamy hodowle zeberek, a w niej piskleta. Jeśli z tej hodowli bedziemy wybierac i wazyc piskleta zeberki w konkretnym, wybranym wieku, to uzyskamy regresje. W modelu I, ktory odpowiada takiemu przykladowi, czynnik na osi X jest jasno okreslony / kontrolowany przez eksperymentatora – tak jak tutaj wiek pisklecia. Dlatego, ze w tym wypadku postanowilismy wazyc piskleta bedace w okreslonym wieku. 2 1 4 8 12 wiek [dni]
Model I długość życia zależy od temperatury 5 10 15 20 25 30 temperatura [oC] długość życia [dni] Tutaj badamy zaleznośc dlugosci zycia nicienia C. Elegans od temperatury. Jak przystalo na organizm zmiennocieplny, tempo metabolizmu zalezy od temperatury i jest szybsze w wyższej. Dlatego nicienie hodowne w wyzszych temperaturach szybciej dojrzewaja, ale tez szybciej koncza zycie. I tutaj też mamy model I ponieważ od nas zalezalo jakie temperatury wykorzystamy w badaniach, a warunki te można odtworzyc – sa powtarzalne.
Model I (prosta regresji) Y Inne właściwości tej prostej: przechodzi ona przez punkt określnoy średnią wartością X i srednia wartościa Y. X
Model I (prosta regresji) Y = a + bX Y Czas dopasowac do punktów prostą. W modelu I mamy zawsze regresję i dopasowujemy prostą regresji. Jakie jest równanie regresji? Wspolczynnik a to punkt przeciecia z osią Y, a przy X stoi współczynnik nachylenia prostej – który mówi o sile związku. Przez jaki punkt przechodzi prosta regresji? Jak ją wyznaczyć? Ta linia ma 2 ważne własności: przechodzi przez punkt określony przez średnie X i Y. Ponadto, suma kwadratów odchyleń poszczególnych punktów od tej prostej, po osi Y jest najmniejsza. WAŻNE: w modelu I prosta pokazuje nam zaleznosc Y od X. Ta prosta jest inna, niz w modelu II. X
Model II: masa ciała samców ma związek z masą ciała samicy? Masa ciała samca Teraz wróćmy do przykładu z masą ciała bocianów – samic i samcow. Wazymy oba ptaki w parze, masy samic zaznaczamy na osi X, a masy ciala samców na osi Y i to sa współrzędne dla poszczególnych punktów. 1 punkt dla kazdej pary Tutaj chcialam zwrocic uwage, ze nie kotrolujey, ani nie dobieramy w żaden sposób masy ciala samic ani samcow. Dlatego mamy tu do czynienia z modelem II – w ktory, czynnik na osi X jest niezalezny od badacza – ‘losowy’. Masa ciała samicy
Model II: szerokość liścia ma związek z jego długością? Inny przykład: badane zwiazku między szerokości a dlugoscia liscia: Na jednej osi odkladamy... 1 lisc- 1 punkt. O ile w wypdku dlugsci zycia nicieni moglismy powiedziec, ze C. Elegans zyje krócej bo jest wyższa temperatura, to nie moglismy odwrcic tej zaleznosci i powedziec, jest wyzsza temperatura, bo nicien zyje krocej. A w obecnym przyadku, ponieważ nie możemy stwierdzic, czy lisc jest dluzszy, dlatego ze jest szeroki, czy tez odwrotnie, możemy dwie osie zamienic... Długość liścia
Model II: szerokość liścia ma związek z jego długością? Y = a + νX a współczynnik nachylenia Długość liścia I teraz na X mamy szerokość, a na Y dlugość liścia. W modelu II na ogol mamy do czynienia z korelacja i wyznaczamy os glowna zredukowana. Szerokość liścia
Model II: szerokość liścia ma związek z jego długością? Y = a + νX r = 0,6 Długość liścia Druga ważna wartość to R albo R2. To jest wpółczynnik korelacji który mowi o sile zwiazku, o tym jak blisko prostej leza punkty. Jeżeli punkty leża dokładnie w lini prostej, to Szerokość liścia
Model II: szerokość liścia ma związek z jego długością? Y = a + νX r = 1 Długość liścia Wspólczynnki korelacji wynosi 1. Jeżeli są zupelnie przypadkowo porozrzucane, to wpsolczynnki wynosi 0. Szerokość liścia
Model II: szerokość liścia ma związek z jego długością? Y = a + νX v<0 r = -1 Długość liścia Jeżeli leżą na prostej, ale zwiazek jest odwrotnie proporcjonalny, to watość wspolczynnika korealcji wynosi –1. Zwracam tu uwage na to, ze często jako miarę siły związku podaje się R do kwadratu. Wtedy wartość ta jest dodatnia niezależnie od znaku plus lub minus stojącego przy R. Szerokość liścia
Model II: szerokość liścia ma związek z jego długością? Y Inne właściwości tej prostej: przechodzi ona przez punkt określnoy średnią wartością X i srednia wartościa Y. X
Model II (oś główna zredukowana) Y = a + vX Y W modelu II na ogol mamy do czynienia z korelacja i wyznaczamy os glowna zredukowana. Ona tez przechodzi przez pare punktow wyznaczona srednimi arytmetycznymi! Ale jest wyznaczana inna metoda. Druga ważna wartość to R albo R2. To jest wpółczynnik korelacji który mowi o sile zwiazku, o tym jak blisko prostej leza punkty. Innymi sowy jak dokladnie w oparciu o wartość X możemy przewidywac wartość Y. Jeżeli punkty leża dokładnie w lini prostej, to X
jaki to model? Zależność między płodnością a masą ciała mierzona dla 20 losowo wybranych samic chrząszcza mącznika Zależność między przeżywalnością nicieni C. elegans a stężeniem ołowiu w podawanej pożywce (12 poziomów stężenia) Zależność między absorbancją a stężeniem roztworu, mierzona podczas kalibracji spektrofotometru przy użyciu roztworów o znanych stężeniach (0, 0.2, 0.5, 1.0, 2.0 mg/l) Zależność między wielkością poroża a stopniem zapasożycenia mierzona u 22 samców jelenia szlachetnego odłowionych w Bieszczadach
jaki to model? Zależność między płodnością a masą ciała mierzona dla 20 losowo wybranych samic chrząszcza mącznika II Zależność między przeżywalnością nicieni C. elegans a stężeniem ołowiu w podawanej pożywce (12 poziomów stężenia) I Zależność między absorbancją a stężeniem roztworu, mierzona podczas kalibracji spektrofotometru przy użyciu roztworów o znanych stężeniach (0, 0.2, 0.5, 1.0, 2.0 mg/l) I Zależność między wielkością poroża a stopniem zapasożycenia mierzona u 22 samców jelenia szlachetnego odłowionych w Bieszczadach II
Istotność korelacji i regresji Y Ale jak to w przyrodzie bywa cechy lisci sa rozne i poszczegolne pomiary odbiegaja od sredniej. Np. ten punkt ma wpolrzedna Y o wiele mniejsza od sredniej wartości Y. Ta różnice można rozbic na dwie składowe. Po pierwsze linia prosta pokazuje jaka powinna być wartość Y dla danego X, gdyby wszystkie punkty były dokladnie na prostej. Czyli czesc odchylenia od sredniej jest wytlumaczona tym, ze dla małych wartości X, male sa tez wartości Y. To jest czesc odchylenia – oznaczona na czerwono - wyjasniona przez prostą. Ten punkt obok lezy dokladnie na prostej, czyli jego doczylenie od wartości średniej Y jest w całości wytłumaczone przez zależność Y od X. Natomiast ten punkt jest jeszcze nizej niż wynikaloby to z zależności Y od X. Pozostala cześć odchylenia – oznaczona na zielono – jest niewyjaśniona przez prosta. X
założenia w regresji i korelacji Odowiedz na pytanie o kształt związku dostajemy obliczając równaie prostej regresji – w wypadku modelu I – czyli gdy kontrolujemy jedna zmienna, a zmienn aprzez nas badana ma rozkład normalny Lub Obliczając równanie osi głównej zredukowanej – gdy żadna ze zmiennych od nas nie zalezy – w wypadku modelu II – a obie maja rozklad normalny. Prosta regresji (model I lub II) Oś główna zredukowana (model II)
korelacja i regresja: podsumowanie prosta regresji model I lub II szukamy zależności Y od X Y=a+bx opisywana przez współczynnik regresji b (i ew. wsp. korelacji r) założenia: rozkład normalny wartości na osi Y korelacja oś główna (zredukowana) model II szukamy związku między dwoma zmiennymi Y=a+vx opisywana przez współczynnik korelacji r założenia: rozkład normalny wartości na osi X i Y Podac przyklady na regresje model I i II (buraki i nawozy) oraz korelacje model II (bociany i urodzenia).
tempo wzrostu [cm/rok] 1. Wykres przedstawia zależność tempa wzrostu człowieka od jego wieku. wiek [lata] tempo wzrostu [cm/rok] Jak należy postąpić z takimi danymi, aby ustalić istotność związku między tymi dwoma cechami?
2. Badano zawartość cynku w organizmie biegacza Pterostichus versicolor przy użyciu spektofotometru. Za pomocą roztworów o znanych stężeniach (cZn) wykalibrowano spektofotometr otrzymując następujące wartości absorbancji (A): cZn [mg/L] 0,2 0,5 1,0 2,0 A 0,002 0,035 0,094 0,161 0,311 Narysuj wykres punktowy zależności absorbancji od stężenia roztworu Zn. Jedno z niżej podanych równań opisuje tą zależność. Które? A = 0,153 – 0,007 cZn A = 0,002 – 0,153 cZn A = 0,007 + 0,153 cZn A = 0,153 + 0,007 cZn Jak nazywa się ta prosta? Nanieś ją na wykres. Jakie jest stężenie cynku w próbce z osobnika nr. 90, jeżeli absorbancja wynosi 0,110? Czy jest to model I czy II szeregu dwucechowego?
3. Badając na przestrzeni 20 lat związek między średnią temperaturą powietrza w marcu, a średnią datą przystąpienia do lęgów sikory modrej uzyskano r = 0,60. Oblicz, czy siła tego związku jest istotna. Podaj błąd I rodzaju, nawet jeżeli go nie popełniasz. Z którym modelem szeregu dwucechowego mamy tu do czynienia?