Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Wykład 2 Wpływ przekształceń Co się stanie ze średnią i odchyleniem standardowym gdy zmienimy jednostki ? Stopnie Celsiusza  stopnie Fahrenheita dolary.

Podobne prezentacje


Prezentacja na temat: "Wykład 2 Wpływ przekształceń Co się stanie ze średnią i odchyleniem standardowym gdy zmienimy jednostki ? Stopnie Celsiusza  stopnie Fahrenheita dolary."— Zapis prezentacji:

1 Wykład 2 Wpływ przekształceń Co się stanie ze średnią i odchyleniem standardowym gdy zmienimy jednostki ? Stopnie Celsiusza  stopnie Fahrenheita dolary  1,000 dolarów Wartość faktyczna  odległość od minimum cm to mm, in, nm, m, ft, itd.dolary : euro

2 Zmiana jednostek na ogół da się zapisać za pomocą funkcji liniowej y’ = ay + c Np. y’ = 1.8 y + 32 y’ = 1/1000 y ( + 0) y’ = (1)y - y min

3 Czasami a = 1 or c = 0 Współczynnik kierunkowy a Stała c Funkcja liniowa nie zmienia w zasadniczy sposób kształtu histogramu. Może go rozszerzyć (|a| ), ``ścieśnić’’ (|a| ), przesunąć (c ) i ``obrócić’’ (a ).

4 Średnia zmienia się tak jak y tzn.  y’ = a  y + c Odchylenie standardowe Odchylenie standardowe zależy od współczynnika kierunkowego a. Stała c nie ma wpływu na odchylenie standardowe, ponieważ zależy ono jedynie od odchyleń od średniej. s’ = |a| s

5 Wpływ stałej (odejmujemy 20) yDev.y’Dev Mean266

6 Wariancja Wariancję mnożymy przez a 2. s 2 ’ = a 2 *s 2 Przykład Y- temperatura w  F: = 98.6, s = 0.9, s 2 = 0.81 Pytanie 1: Oblicz średnią, odchylenie standardowe i wariancję dla tych samych danych wyrażonych w stopniach Celsiusza.

7 Odpowiedź

8 Standardyzacja Pytanie 2: Jakich wyników należy oczekiwać gdy dane przekształcimy w następujący sposób Y' = (Y- )/s, tzn. Y' = 1/s Y -  y/s = (Y-98.6)/1.8 ? Odpowiedź:

9 Inne statytyski Funkcja liniowa zmienia medianę i kwartyle tak jak średnią, a rozstęp i IQR tak jak odchylenie standardowe.

10 Funkcje nieliniowe (np. logarytm) zmieniają kształt histogramu i na ogół nie ma dla nich prostych formuł umożliwiających obliczenie nowej średniej i nowego odchylenia standardowego. Parametry te liczymy z definicji korzystając z ``nowego’’ zbioru danych. Przykład : Y’=log(Y) średnia z y’≠ log (średnia z y) Czasami używamy funkcji nieliniowych aby przekształcić skośny zbiór danych w zbiór bardziej symetryczny.

11

12

13

14 Próba a populacja : Wnioskowanie statystyczne Co to jest populacja ? –Zbiór z którego losujemy próbę i który chcemy opisać. –Czasami rzeczywista, czasami abstrakcyjna (nieskończenie duża próba). –Próba powinna być reprezentatywna dla populacji. Wnioskowanie statystyczne –Wnioskowanie o populacji w oparciu o próbę.

15 Populacja   Próba  y s Próbkowa nie Wniosko- wanie PróbaPopulacja 10 losowo wybranych studentówGrupa wykładowa 30 pacjentów biorących ProzacWszyscy pacjenci biorący Prozac 25 rzutów kostką``wszystkie’’ rzuty podobnymi kostkami Owocówki złapane na śmietnikuWszystkie owocówki z tego śmietnika, albo Wszystkie owocówki w tej okolicy Parametry : ,  Statystyki

16 μ = średnia w populacji (wartość oczekiwana) σ = odchylenie standardowe w populacji = pierwiastek z wartości oczekiwanej (Y-μ) 2 Statystyki z próby są estymatorami (służą do oceny) parametrów całej populacji.

17 Przykład Grupy krwi u 3696 osób (Anglia) W przybliżeniu 44% ludzi ma grupę krwi A. –Czy nie było systematycznego błędu przy próbkowaniu? –Czy rozmiar próby był dość duży? Grupa krwiCzęstość A1,634 B327 AB119 O1616 suma3696

18 Próba : przyjaciele, pracownicy Ludzie nie są reprezentatywni Grupy krwi mogą być mimo to reprezentatywne Pomiary ciśnienia nie byłyby reprezentatywne (w próbie mało starszych ludzi – ciśnienie na ogół wzrasta z wiekiem)

19 Populacja a próba Średnia z próby na ogół różni się od wartości oczekiwanej (średniej w populacji) ale w miarę wzrostu rozmiaru próby odległość między tymi wielkościami zbiega do zera. Średnia z próby jest estymatorem wartości oczekiwanej. Podobnie próbkowe odchylenie standardowe i wariancja są estymatorami odpowiednich parametrów w populacji. –Przykład (rozmiar populacji=50, średnia w populacji =26.48) dane :  stopniowo powiększamy próbę losową do rozmiarów n=10,20,30,40 średnia z próby : 23.5 (n=10), 27.3 (n=20), 26.7(n=30), 26.4(n=40)

20 Histogram z populacji i histogram próbkowy Dane dyskretne (klasy) p i -frakcja osobników w całej populacji kwalifikujących się do kategorii i Można ustalić p i w oparciu o histogram skonstruowany dla całej populacji. - estymator obliczony w oparciu o histogram z próby.

21 Przykład n Rozmiar populacji = klas o tej samej częstości p= ?.

22 n=10

23

24

25 Histogramy a gęstości rozkładu prawdopodobieństwa Dane ciągłe Więcej danych – więcej klas – gładszy histogram

26

27

28 Prawdopodobieństwo Gdy rozmiar próby dąży do nieskończoności i szerokość klas dąży do zera histogram zbiega do wykresu gęstości rozkładu badanej zmiennej w populacji. Podobnie jak dla histogramu, pole pod wykresem gęstości (całka) jest równe frakcji osobników w całej populacji (prawdopodobieństwu) wpadających do danego przedziału.

29 Gęstość Gęstość rozkładu prawdopodobieństwa spełnia następujące warunki: –f(x)  0 dla wszystkich x –Całkowite pole pod wykresem f(x) wynosi ?

30 Przykłady rozkładów ciągłych Rozkład jednostajny na odcinku [a,b] f(x)= ? Rozkład wykładniczy z parametrem λ f(x)= ?

31 Rozkłady ciągłe cd. Rozkłady ciągłe określają prawdopodobieństwa tego, że obserwacje wpadają do pewnych odcinków Prawdopodobieństwo przyjęcia konkretnej dowolnej wartości przez rozkład ciągły wynosi ? Niech Y ma rozkład jednostajny na odcinku [0,1]. P(Y=0.5)=?

32 Próbkowanie Prosta próba losowa  Każdy osobnik z populacji może być wybrany z tym samym prawdopodobieństwem  Wybory poszczególnych osobników są od siebie niezależne

33 Jak wybrać prostą próbę losową –Przyznajemy numer każdemu osobnikowi –Zapisujemy numery na kulach –Mieszamy kule w urnie –Losujemy próbę Do losowania możemy również użyć komputera lub tablicę liczb losowych. W przypadku gdy rozmiar populacji nie jest ustalony lub nie mamy bezpośredniego dostępu do wszystkich osobników zadanie jest dużo trudniejsze.

34 Przykład 1(Ochotnicy) Dziennikarka Ann Landers spytała swoich czytelników ``Gdybyście mogli zacząć jeszcze raz to czy mielibyście znowu dzieci ? ‘’ Odpisało prawie 10,000 czytelników i 70% powiedziało Nie! Obserwacje: małżeństwa z dziećmi Populacja: wszyscy rodzice w USA

35 Próba: pewna część populacji która odpisała, n=10,000 Ochotnicy: badanie bezwartościowe – bardzo zła reprezentatywność Newsday przeprowadził ``statystycznie zaplanowaną’’ ankietę, w której 91% z 1,373 przepytanych rodziców odpowiedziało Tak!

36 Przykład 2 (U.S. przewidywanie wyników wyborów prezydenckich w USA, 1936) Literary Digest wysłał kwestionariusze do 10 milionów ludzi (25% głosujących) Odpowiedziało 2.4 miliona: –Przewidywanie : Landon 57%, Roosevelt 43% –Wynik : Roosevelt 62%, Landon 38%

37 Złe próbkowanie –Książki telefoniczne, członkostwo klubów, listy zamówień pocztowych, listy właścicieli pojazdów Brak odpowiedzi –Tylko 24% odpowiedziało (więcej Republikanów)

38 Obciążenie w próbkowaniu Obciążenie w próbkowaniu występuje gdy mamy do czynienia z systematycznym błedem faworyzującym pewną część populacji. W przypadku takiego obciążenia nie pomoże duży rozmiar próby. Losowy wybór elementów do próby zwykle eliminuje takie obciążenie.

39 Stratyfikacja Dzielimy populację na podpopulacje podobnych jednostek (warstwy) i oddzielnie próbkujemy w każdej warstwie. –Przykład: studenci & studentki

40 Próbkowanie wielostopniowe Przykład: Badanie w USA dotyczące struktury zatrudnienia. Ankietuje się około gospodarstw domowych co miesiąc. Poziom 1: losowa próba z 3,000 counties (województw?) Poziom 2: losowa próba reprezentująca powiaty w każdym wybranym ``county’’ Poziom 3: losowa próba reprezentująca gminy w każdym wybranym powiacie Poziom 3: losowa próba gospodarstw domowych w każdej wybranej gminie

41 Prawdopodobieństwo- formalizm matematyczny A, B, E – zdarzenia losowe P(E) – prawdopodobieństwo zdarzenia E 0≤P(E)≤1 S – przestrzeń probabilistyczna (zbiór wszystkich możliwych wyników eksperymentu, zawiera wszystkie zdarzenia losowe) P(S)=

42

43 W praktyce prawdopodobieństwa często ustalamy obserwując jaka część populacji posiada interesującą nas własność. Przykład – Z 45 studentów 15 dostało 5 z egzaminu. Jakie jest prawdopodobieństwo, że losując studenta z tej grupy trafimy na takiego, który dostał 5 z egzaminu ?

44 Prawdopodobieństwo klasyczne Założenie – wszystkie możliwe wyniki eksperymentu są jednakowo prawdopodobne (prawdopodobieństwo wylosowania każdego studenta jest takie samo). N – liczba możliwych wyników eksperymentu (N= ?) x – liczba tych wyników które odpowiadają zdarzeniu E (E= 5 z egzaminu, x= ?) P(E)=

45 Interpretacja częstościowa Gdy liczba powtórzeń eksperymentu dąży do nieskończoności to względna częstość występowania zdarzenia E dąży do P(E).

46 Przykłady zdarzeń E = wyrzucenie orła w rzucie symetryczną monetą P(E) = E = wyrzucenie 4 w rzucie symetryczną kostką: P(E) = E = 1 lub 6 w rzucie kostką: P(E) =

47 Ania i Basia both rzucają monetą. E = obie dostaną orła. P(E) = Uzasadnienie  A dostanie 0 i B dostanie 0  A dostanie 0 i B dostanie R  A dostanie R i B dostanie 0  A dostanie R i B dostanie R  Te cztery zdarzenia są jednakowo prawdopodobne (P(E)=P(00)=P(0R)=P(R0)=P(RR)= )  Prawdopodobieństwo, że dostaniemy dokładnie jednego orła (Ania albo Basia) =

48 Krzyżówka dwóch heterozygot Genotyp obu rodziców - Aa Dzieci: P(AA) =, Pr(Aa albo aA) =, P(aa) = Jeżeli liczba dzieci będzie bardzo duża to frakcja heterozygot będzie bliska (frakcja w próbie a frakcja w populacji)

49 Niezależność Zdarzenia E1 i E2 są niezależne wtedy i tylko wtedy gdy Przykład : dwa rzuty monetą P(dwa orły) =

50

51 P-stwo warunkowe P(A|B) – p-stwo zajścia zdarzenia A jeżeli wiemy, że zaszło zdarzenie B

52 Przykład 2% populacji ma wirusa HIV. Test do wykrywania obecności wirusa HIV ma następujące własności. Jeżeli ktoś ma wirusa to p-stwo jego wykrycia wynosi Jeżeli ktoś nie ma wirusa to p-stwo właściwej diagnozy wynosi

53 A – wybrany losowo człowiek jest chory B – test wykazuje obecność wirusa P(A)= P(B|A)= A’- wybrany losowo człowiek jest zdrowy B’-test nie wykazuje obecności wirusa P(B’|A’)=

54

55 Jakie jest p-stwo, że u losowo wybranej osoby test wykaże obecność wirusa ?

56 Jakie jest p-stwo, ze osoba u której test wskazał obecność wirusa jest faktycznie zakażona ?

57 Wzór Bayesa


Pobierz ppt "Wykład 2 Wpływ przekształceń Co się stanie ze średnią i odchyleniem standardowym gdy zmienimy jednostki ? Stopnie Celsiusza  stopnie Fahrenheita dolary."

Podobne prezentacje


Reklamy Google