Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

STATYSTYKA – kurs podstawowy wykład 3 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.

Podobne prezentacje


Prezentacja na temat: "STATYSTYKA – kurs podstawowy wykład 3 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii."— Zapis prezentacji:

1 STATYSTYKA – kurs podstawowy wykład 3 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii

2 Zmienna losowa SKOKOWA (dyskretna) gdy może przyjmować skończoną i przeliczalną liczbę wartości Np.: Liczba orłów w trzykrotnym rzucie monetą OOO ORO OOR ROO RRO ROR ORR RRR CIĄGŁA gdy jej wartości należą do przedziału ze zbioru liczb rzeczywistych Np.: 1.waga urodzeniowa niemowląt 2.wielkość dochodów rozporządzalnych gospodarstw domowych w Polsce

3 ZMIENNA LOSOWA SKOKOWA

4 Rozkład zmiennej losowej skokowej charakteryzują: 1.Funkcja prawdopodobieństwa 2.Dystrybuanta 3.Parametry rozkładu Ad. 1 Funkcją prawdopodobieństwa zmiennej skokowej X jest zbiór prawdopodobieństw postaci: p i = P(X = x i ) dla i = 1, 2, …, k (k nie musi być wartością skończoną) takich że: Przykład: X – liczba orłów w trzykrotnym rzucie monetą

5 Przykład: X – liczba orłów w trzykrotnym rzucie monetą RRR RRO ROR ORR OOR ROO ORO OOO X = x i 0 1 23 P(X = x i )1/83/8 1/8 X p

6 Dystrybuanta zmiennej losowej skokowej Dystrybuanta zmiennej skokowej X to prawdopodobieństwo postaci: P(X ≤ x i ) = F(x i ) Łatwo zauważyć, że oba typy prawdopodobieństw (prawdopodobieństwo i dystrybuantę) łączy związek postaci: F(x k ) = P(X ≤ x k ) = P(X = x 1 ) + P(X = x 2 ) + … + P(X = x k-1 ) + P(X = x k ) = p 1 + p 2 + … + p k-1 + p k

7 dla x < 0 dla 0 ≤ x <1 dla 1 ≤ x < 2 dla 2 ≤ x < 3 dla x ≥ 3 Własności dystrybuanty zmiennej losowej skokowej: 1. 0 ≤ F(x) ≤ 1 2. F (-∞) = 0, F(+ ∞) = 1 3. Funkcja niemalejąca 4. Funkcja prawostronnie ciągła Przykład: X – liczba orłów w trzykrotnym rzucie monetą xixi (-∞, 0)<0, 1) <1, 2) <2, 3)< 3, +∞) F(x i )01/84/87/88/8 X = x i 0 1 23 P(X = x i )1/83/8 1/8 FiFi X

8 Parametry rozkładu prawdopodobieństwa zmiennej losowej liczbowe wielkości stałe charakteryzujące każdy rozkład 1.Wartość oczekiwana 2. Wariancja zmiennej losowej X zmiennej losowej X E(X) D 2 (X) Wartość oczekiwana = średnia = nadzieja matematyczna = moment zwykły rzędu I Moment zwykły k-tego rzędu E(X 2 ) - moment zwykły rzędu II Moment centralny rzędu II Moment centralny k-tego rzędu

9 Własności wartości oczekiwanej Własności 1.Wartość oczekiwana stałej równa jest stałej E(b) = b 2.E(bX) = bE(X) 3.E(aX+b) = aE(X) + b 4.Jeśli E(X 1 ) = a oraz E(X 2 ) = b, to E(X 1 + X 2 ) = = E(X 1 ) + E(X 2 ) = a + b 5.Jeśli X 1 i X 2 są niezależne, to E(X 1 X 2 ) = E(X 1 ) E(X 2 ) Przykład: E(X 1 ) = 3 oraz E(X 2 ) = ½ 1.E(4) = 4 2.Y = 4X 1, E(Y) = E(4X 1 ) = 4 E(X 1 ) = 4 * 3 =12 3.Z = 4X 1 – 3, E(Z) = 4* E(X 1 ) – 3 = 12 – 3 = 9 4.E(X 1 + X 2 ) = E(X 1 ) + E(X 2 ) = 3 + ½ = 3,5 5.E(X 1 X 2 ) = E(X 1 ) E(X 2 ) = 3*1/2 = 1,5

10 Własności wariancji Własności 1.Wariancja stałej równa jest 0 2.Dodanie stałej do zmiennej losowej nie zmienia jej wariancji D 2 (X+b) = D 2 (X) 3.D 2 (Xb) = b 2 D 2 (X) 4.D 2 (Xb+a) = b 2 D 2 (X) Przykład: D 2 (X 1 ) = 2 1.D 2 (5) = 0, bo dla dowolnej stałej nie występuje zróżnicowanie jej wartości względem jej samej 2.Y = X 1 +5 D 2 (Y) = D 2 (X 1 +5) = D 2 (X 1 ) = 2 3.Z = 4X 1 D 2 (Z) = D 2 (4X 1 ) = 4 2 D 2 (X 1 ) = 16 * 2 = 32 4.W = 4X 1 + 5 D 2 (W) = D 2 (4X 1 +5) = 4 2 D 2 (X 1 ) = 16 * 2 = 32

11 Jak policzyć E(X) i D 2 (X)? X – liczba orłów w trzykrotnym rzucie monetą X = x i 0 1 23 P(X = x i )1/83/8 1/8

12 ZMIENNA LOSOWA CIĄGŁA

13 Rozkład zmiennej losowej ciągłej charakteryzują: 1.Funkcja gęstości 2.Dystrybuanta 3.Parametry rozkładu Analogicznie jak w przypadku zmiennej losowej skokowej Dlaczego w przypadku zmiennej losowej skokowej mówimy o funkcji prawdopodobieństwa, a w przypadku zmiennej losowej ciągłej – o funkcji gęstości? Zmienna losowa skokowa przyjmuje wartości przeliczalne – najczęściej całkowite – stąd natomiast zmienna ciągła przyjmuje wartości nieprzeliczalne opisywane za pomocą przedziałów liczbowych pipi f(x) x x Funkcja gęstości

14 Chociaż ciągła zmienna losowa może przyjąć wartość x 0, to prawdopodobieństwo tego zdarzenia wynosi: x 0 = 121 f(x) x

15 Jedyne prawdopodobieństwo, jakie można rozważać w przypadku zmiennej losowej typu ciągłego, to prawdopodobieństwo, że zmienna ta przyjmie wartości z określonego w dowolny sposób przedziału liczbowego x0x0 x1x1 x0x0 x1x1 x X ≤ x 0 X ≤ x 1 Różnica dwóch odcinków WNIOSEK Prawdopodobieństwo w rozkładzie zmiennej losowej typu ciągłego może być wyrażane jedynie za pomocą dystrybuanty f(x) x

16 DYSTRYBUANTA ZMIENNEJ LOSOWEJ CIĄGŁEJ F(x) x Własności dystrybuanty zmiennej losowej ciągłej: 1. 0 ≤ F(x) ≤ 1 2. F (-∞) = 0, F(+ ∞) = 1 3. Funkcja niemalejąca 4. Funkcja ciągła

17 Własności funkcji gęstości zmiennej losowej ciągłej: 1.f(x) ≥ 0 2. Funkcja gęstości przyjmuje wartości ze zbioru liczb rzeczywistych dodatnich i 0 Pole powierzchni pod funkcją gęstości jest równe 1 f(x) x

18 Powierzchnię zakreślonych pół (zielonego i czarnego) obliczyć można wykorzystując rachunek całkowy Jeśli funkcja gęstości ma postać f(x), to czarne pole obliczyć można następująco: GRAFICZNA INTERPRETACJA ZMIENNEJ LOSOWEJ CIĄGŁEJ x2x2 x1x1 f(x) x x3x3

19 ROZKŁADY CECH SKOKOWYCH Rozkład zero-jedynkowy Rozkład dwumianowy

20 ROZKŁAD ZERO–JEDYNKOWY Rozkład ten opisuje zjawisko dwustanowe, w którym jeden ze stanów opisywany jest umownie jako „sukces”, a drugi – jako „porażka”. Sukces umownie symbolizuje cyfra 1, a porażkę – cyfra 0 stąd nazwa – rozkład zero-jedynkowy Funkcja prawdopodobieństwa rozkładu zero-jedynkowego gdzie q + p = 1 Dystrybuanta rozkładu zero-jedynkowego X = x i 0 1 P(X = x i )qp xixi (-∞, 0)<0, 1) <1, +∞) F(x i )0q1 Parametry: E(X) = 0*q + 1*p = p D 2 (X) = (0 – p) 2 *q + (1 – p) 2 *p = = p*q = p * (1 – p)

21 ROZKŁAD ZERO–JEDYNKOWY Przykład 1 Rzucamy jednokrotnie kostką do gry: sukces – gdy wypadnie parzysta liczba oczek; porażka – gdy wypadnie nieparzysta liczba oczek Przykład 2 Odsetek osób z wyższym wykształceniem w Polsce wynosi 15%. Pytając dowolnie wybraną osobę wchodzącą do Złotych Tarasów, czy ma wykształcenie wyższe, musimy liczyć się z dwojaką odpowiedzią: Tak – sukces – 1 Nie – porażka – 0 Dystrybuanta rozkładu zero-jedynkowego X = x i 0 1 P(X = x i )0,850,15 xixi (-∞, 0)<0, 1) <1, +∞) F(x i )00,851 Parametry: E(X) = 0*0,85 + 1*0,15 = 0,15 = p D 2 (X) = p*q = 0,15 * 0,85

22 ROZKŁAD DWUMIANOWY = ROZKŁAD BERNOULLIEGO Rozkład ten opisuje wielokrotne (n-krotne) występowanie tego samego zjawiska dwustanowego. Rezultatem jest pewna liczba k „sukcesów” oraz liczba (n – k) porażek. Każdy „sukces” występuje z prawdopodobieństwem p, a każda „porażka” – z prawdopodobieństwem q = 1 – p. Rozkład prawdopodobieństwa opisujący występowanie wszystkich możliwych liczb „sukcesów” k, nosi nazwę rozkładu dwumianowego lub rozkładu Bernoulliego Prawdopodobieństwo w tym rozkładzie oblicza się za pomocą wzoru: Tak samo jak w rozkładzie zero-jedynkowym Parametry: E(X) = n*p D 2 (X) = n*p * (1 – p) = n*p*q

23 ROZKŁAD DWUMIANOWY = ROZKŁAD BERNOULLIEGO Przykład 2 cd Odsetek osób z wyższym wykształceniem w Polsce wynosi 15%. Pytając 5 wylosowanych osób wchodzących do Złotych Tarasów, czy mają wykształcenie wyższe, musimy liczyć się z tym, że każda z nich może odpowiedzieć: TAK = sukces = 1 lub NIE = porażka = 0 Zmienną losową opisującą odpowiedzi udzielone przez pytanych można zapisać następująco: X = k, gdzie k - liczba sukcesów, czyli liczba odpowiedzi TAK Wiadomo, że k = 0, 1, 2, 3, 4, 5. Tak zdefiniowana zmienna ma rozkład dwumianowy

24 ROZKŁAD DWUMIANOWY = ROZKŁAD BERNOULLIEGO Przykład 2 cd Rozkład ten można opisać m.in. za pomocą funkcji prawdopodobieństwa Parametry: E(X) = n*p = 5 * 0,15 = 0,75 D 2 (X) = n*p*q = 5 * 0,15 * 0,85 =0,6375 X = x i P(X = x i ) 0(0,85) 5 1 2 3 4 5

25 ROZKŁADY CECH CIĄGŁYCH Rozkład normalny Rozkład t-Studenta Rozkład chi-kwadrat Rozkład F

26 ROZKŁAD NORMALNY Jeśli zmienna losowa ciągła X ma funkcję gęstości postaci: dla to mówimy, że zmienna X ma rozkład normalny o parametrach m i σ, co w skrócie zapisujemy X ~ N(m, σ) m = E(X) – średnia, σ = D(X) – odchylenie standardowe Liczby m i σ to wielkości stałe w rozkładzie normalnym. Ich rola jest następująca: - wielkość m wyznacza środek symetrii rozkładu ielkość σ ustala oddalenie punktów przegięcia krzywej od osi symetrii, czyli od m f(x) x m + σmm - σ σσ

27 WŁASNOŚCI ROZKŁADU NORMALNEGO 1.Symetryczny 2.Przy x  ±∞ funkcja gęstości zbiega do 0 3.Dla X = m funkcja gęstości osiąga maksimum, co oznacza, że dominanta rozkładu jest równa średniej (m) i jest równa medianie Aby precyzyjnie określić kształt rozkładu normalnego wystarczyć znać oba jego parametry: m i σ Postaci rozkładu różniące się wartością parametru σ Postaci rozkładu różniące się wartością parametru m σ 1 < σ 2 m 1 > m 2

28 Reguła 3 sigm x f(x)

29 Reguła 3 sigm x f(x)

30 Reguła 3 sigm x f(x)

31 ROZKŁAD STANDARDOWY NORMALNY Jeśli m = 0 a σ = 1, to funkcja gęstości rozkładu normalnego przyjmuje postać: zaś sam rozkład nosi nazwę rozkładu standardowego normalnego Zwyczajowo zmienną o rozkładzie standardowym normalnym zapisuje się za pomocą litery U, stąd U ~ N(0, 1) f(x) 1

32 Każdą zmienną X o rozkładzie normalnym z dowolnymi parametrami można przekształcić do takiej postaci, aby nowoutworzona zmienna miała rozkład standardowy normalny (czyli rozkład z parametrami m = 0 i σ = 1) Przekształcenie to nosi nazwę standaryzacji

33 STANDARYZACJA Przekształcenie to definiuje wzór: Ponadto wystandaryzowanie zmiennych pozwala na ich porównywania nawet wtedy, gdy mierzone są w różnych jednostkach

34 STANDARYZACJA Przykład: Pewien dziesięcioboista w konkursie olimpijskim rzucił oszczepem 60m i i skoczył wzwyż 2,10m. W czym był lepszy: w rzucie oszczepem, czy w skoku wzwyż? jeśli w całej swojej karierze rzucał średnio na odległość 58m z odchyleniem standardowym 5m, a skakał średnio na wysokość 2,05m z odchyleniem standardowym 0,1m RZUTSKOK Dziesięcioboista wyżej skoczył, bo w czasie 0,5 odchylenia standardowego, natomiast rzucił na odległość 0,4 odchylenie standardowego

35 DYSTRYBUANTA ROZKŁADU NORMALNEGO f(x) x 2 = m 2 = 10 x = 2 x = 10 F(x) Funkcje gęstości Dystrybuanty x 1 = m 1 = 2

36 DYSTRYBUANTA ROZKŁADU STANDARDOWEGO NORMALNEGO f(x) 1 F(x) UWAGA Zarówno wartości funkcji gęstości jak i dystrybuanty rozkładu standardowego normalnego zostały policzone – zawarte są w tablicach statystycznych Dzięki temu obliczanie prawdopodobieństw w rozkładzie normalnym o dowolnych parametrach możliwe jest bez wykorzystania rachunku całkowego x x

37 ROZKŁAD NORMALNY – PRZYKŁAD Zmienna losowa X ma rozkład normalny o parametrach m = 4 i σ = 1,5. Ile wynosi prawdopodobieństwo, że |X| ≤ 2? X ~ N(4; 1,5) P(|X| ≤ 2) = ? P(|X| ≤ 2) = P(-2 ≤ X ≤ 2) = f(x) x Z formuły na standaryzację Przekształciliśmy zmienną X o rozkładzie N(4; 1,5) w nową zmienną U o rozkładzie N(0, 1) Jeśli argument funkcji dystrybuanty jest ujemny, to stosujemy wzór

38

39 PRZYKŁAD – prezentacja graficzna Zmienna losowa X ma rozkład normalny o parametrach m = 4 i σ = 1,5. Ile wynosi prawdopodobieństwo, że |X| ≤ 2? P(|X| ≤ 2) = P(-2 ≤ X ≤ 2) = f(x) x Z formuły na standaryzację f(u) u - 1,33 -4-4 F(u) 1,33 4 0,0917 u X ~ N(4; 1,5) U ~ N(0; 1)

40 ROZKŁAD t-Studenta Jeśli zmienna losowa ciągła t ma funkcję gęstości postaci: dla gdzie: to zmienna losowa t ma rozkład t-Studenta Kształt funkcji gęstości rozkładu t-Studenta przypomina kształt funkcji gęstości rozkładu normalnego (krzywą Gaussa) Jest to rozkład symetryczny zawsze względem wartości 0 Przy t  ±∞ wartości funkcji f(t) zbiegają do 0 t f(t)

41 ROZKŁAD t-Studenta W tym rozkładzie jedynym parametrem (jedyną stałą) jest „liczba stopni swobody” v Oznacza to, że kształt wykresu funkcji f(t) zależy tylko od wartości v Dla v > 30 rozkład t-Studenta jest zbieżny z rozkładem standardowym normalnym N(0,1) Parametry w tym rozkładzie: 1.Wartość oczekiwana E(t) = 0 2.Wariancja v = 2v = 15 v = 30

42 ROZKŁAD t-Studenta Wartości prawdopodobieństw w rozkładzie t-Studenta zostały policzone i zawierają je tablice statystyczne – wartości krytyczne rozkładu t-Studenta. Są to wartości obliczone dla warunku: t α,v -t α,v α/2 1-α

43 Dla v = 6

44 ROZKŁAD chi-kwadrat Jeśli zmienna losowa ciągła χ 2 ma funkcję gęstości postaci: dla to zmienna losowa χ 2 ma rozkład chi-kwadrat W tym rozkładzie jedynym parametrem (jedyną stałą) jest „liczba stopni swobody” v Oznacza to, że kształt wykresu funkcji f(χ 2 ) zależy tylko od wartości v Tak samo jak w przypadku rozkładu t-Studenta v = 5v = 10v = 15 Wraz ze wzrostem liczby stopni swobody v rozkład chi-kwadrat, choć z natury asymetryczny, zatraca swoją skośność Rozkładem granicznym dla rozkładu chi-kwadrat jest rozkład normalny

45 ROZKŁAD chi-kwadrat Parametry w tym rozkładzie: 1.Wartość oczekiwana E(χ 2 ) = v 2.Wariancja D 2 (χ 2 ) = 2v Wartości prawdopodobieństw w rozkładzie chi-kwadrat zostały policzone i zawierają je tablice statystyczne (wartości krytyczne rozkładu chi-kwadrat) Są to wartości obliczone dla warunku α 1-α

46 Dla v = 10

47 ROZKŁAD F-Snedecora Jeśli zmienna losowa ciągła F ma funkcję gęstości postaci: dla F < 0 dla F ≤ 0 to zmienna losowa F ma rozkład F-Snedecora (lub krótko rozkład F) W tym rozkładzie jedynymi parametrami (stałymi) są „liczby stopni swobody” v 1 i v 2. Oznacza to, że kształt wykresu funkcji f(F) zależy tylko od wartości v 1 i v 2 v 1 = 3, v 2 = 3

48 ROZKŁAD F-Snedecora Parametry w tym rozkładzie: 1.Wartość oczekiwana 2.Wariancja Wartości prawdopodobieństw w rozkładzie F zostały policzone i zawierają je tablice statystyczne (wartości krytyczne rozkładu F). Są to wartości obliczone dla warunku α 1-α

49 Dla v 1 = 10 i v 2 = 15

50 TWIERDZENIA GRANICZNE

51 Twierdzenie de Moivre’a – Laplace’a

52 Twierdzenie o zbieżności rozkładu dwumianowego do rozkładu normalnego Co to znaczy?

53 Twierdzenie de Moivre’a – Laplace’a Przypomnijmy sobie czego dotyczył rozkład dwumianowy Rozkład dwumianowy opisuje wielokrotne (n-krotne) występowanie tego samego zjawiska dwustanowego Wystąpienie stanu 1 – określamy mianem sukcesu – prawdopodobieństwo wystąpienia tego stanu zapisujemy jako p Wystąpienie stanu 2 – określamy mianem porażki – prawdopodobieństwo wystąpienia tego stanu zapisujemy jako q = 1 – p Rezultatem doświadczenia jest pewna liczba k „sukcesów” oraz liczba (n – k) porażek. Rozkład prawdopodobieństwa opisujący występowanie wszystkich możliwych liczb „sukcesów” k, nosi nazwę rozkładu dwumianowego Prawdopodobieństwo w tym rozkładzie oblicza się za pomocą wzoru: Parametry tego rozkładu to: E(X) = n*p D 2 (X) = n*p * (1 – p) = n*p*q

54 Twierdzenie de Moivre’a – Laplace’a Dowiedziono, że: dla dostatecznie dużej liczby doświadczeń (czyli liczby n) dystrybuantą graniczną dla dystrybuanty rozkładu dwumianowego jest dystrybuanta rozkładu normalnego o parametrach E(X)=n*p oraz D 2 (X) = n*p * (1 – p) = n*p*q, czyli Praktyczne znaczenie tego twierdzenia jest następujące: Jeśli liczba doświadczeń jest duża (w praktyce zwykle przynajmniej 100), to prawdopodobieństwo – dla odpowiedniego rozkładu dwumianowego – można wyznaczyć korzystając z rozkładu normalnego Wynik uzyskany w ten sposób będzie przybliżony, a przybliżenie będzie tym lepsze, im liczba doświadczeń będzie większa Są to te same parametry, jakie występowały w rozkładzie dwumianowym

55 Twierdzenie de Moivre’a – Laplace’a Dlaczego to twierdzenie ma tak duże znaczenie? Weźmy znany nam już przykład: Odsetek osób z wyższym wykształceniem w Polsce wynosi 15%. Pytając 5 wylosowanych osób wchodzących do Złotych Tarasów, czy mają wykształcenie wyższe, musimy liczyć się z tym, że każda z nich może odpowiedzieć: TAK = sukces = 1 lub NIE = porażka = 0 Ale teraz nie zadajemy pytania 5 osobom, ale 105 osobom A chcemy się dowiedzieć jakie jest prawdopodobieństwo, że co najwyżej 20 z nich ma wykształcenie wyższe, co oznacza że wystąpi co najwyżej 20 sukcesów, czyli P(X ≤ 20) = ? Możemy to policzyć wprost ze wzoru na prawdopodobieństwo w rozkładzie dwumianowym:

56 P(X ≤ 20) = P(X = 0) + P(X = 1) + P(X = 2) + … + P(X = 20) … Można te obliczenia wykonać szybciej Skorzystajmy z twierdzenia de Moivre’a-Laplace’a Będzie to dosyć czaso- i pracochłonne

57 X 105 – liczba sukcesów w 105 doświadczeniach (bo pytamy 105 osób) P(X 105 ≤ 20) = ? Najpierw potrzebujemy zatem wiedzieć, jaki rozkład ma X 105 X 105 ma rozkład dwumianowy (dokładny), ale ze względu na dużą liczbę doświadczeń można ten rozkład przybliżyć za pomocą rozkładu normalnego o parametrach E(X 105 ) = n*p = 105*0,15 = 15,75 i D(X 105 ) = X 105 ~ N(15,75; 3,659) P(X 105 ≤ 20) standaryzacja

58 Twierdzenie Lindeberga – Lévy’ego

59 Twierdzenie dotyczące zbieżności sumy niezależnych zmiennych losowych do rozkładu normalnego Co to znaczy?

60 Twierdzenie Lindeberga – Lévy’ego Jeśli zmienna losowa T n jest sumą n niezależnych zmiennych losowych o identycznych rozkładach, to rozkładem granicznym dla zmiennej T n jest rozkład normalny o parametrach oraz czyli Czyli każda ze zmiennych ma taką samą wartość oczekiwaną E(X) i taką samą wariancję D 2 (X) W ogóle nie jest ważne, jaki jest to rozkład, byle tylko był identyczny dla wszystkich zmiennych

61 Twierdzenie Lindeberga – Lévy’ego Praktycznym wnioskiem z tego twierdzenia jest określenie granicznego rozkładu średniej arytmetycznej zmiennych losowych Jeśli bowiem V n jest średnią z n niezależnych zmiennych losowych o identycznych rozkładach, to rozkładem granicznym dla zmiennej V n jest rozkład normalny o parametrach oraz czyli Czyli każda ze zmiennych ma taką samą wartość oczekiwaną E(X) i taką samą wariancję D 2 (X) Ponownie w ogóle nie jest ważne, jaki jest to rozkład, byle tylko był identyczny dla wszystkich zmiennych

62 Twierdzenie Lindeberga – Lévy’ego Podsumowując: Na mocy twierdzenia Lindeberga – Lévy’ego wiemy, że: 1.Suma zmiennych losowych niezależnych i o identycznych rozkładach ma rozkład graniczny 2. Średnia ze zmiennych losowych niezależnych i o identycznych rozkładach ma rozkład graniczny Pamiętajmy, że chodzi o rozkład graniczny, czyli o pewne przybliżenie; Dlatego oba poznane dziś twierdzenia powinno się stosować tylko dla dużych n; Przy niewielkich liczebnościach różnice między wynikami dokładnymi a przybliżonymi (właśnie na podstawie twierdzeń granicznych) będą zbyt duże;

63 Twierdzenie Lindeberga – Lévy’ego - PRZYKŁAD Statystykę na SGH zalicza się w formie standardowego egzaminu. Co roku pisze go około 1000 studentów. Na egzaminie można uzyskać od 0 do 40 punktów. Liczba punktów, jaką może uzyskać dowolny pojedynczy (k-ty) student, jest zmienną losową. Nazwijmy ją X k. Przyjmijmy, że na egzaminie każdy student pracuje zupełnie samodzielnie, a więc wyniki studentów nie zależą od siebie  zmienne X k są niezależne. Przyjmijmy, że rozkład zmiennych X k jest identyczny. Co prawda nie wiemy jaki on jest, ale jest identyczny dla każdego ze studentów. Ponadto po analizie wyników lat ubiegłych okazało się, że studenci z egzaminu dostają przeciętnie 29 punktów (E(X) = 29) z odchyleniem standardowym 6 punktów (D(X) = 6). Jakie jest prawdopodobieństwo, że w tym roku średnia liczba punktów, które uzyskają studenci, nie będzie niższa od 22,4? (czyli że średnio biorąc wszyscy zdadzą)

64 Twierdzenie Lindeberga – Lévy’ego - PRZYKŁAD Dane: n = 1000 E(X) = 29 D(X) = 6 Jakie jest prawdopodobieństwo, że w tym roku średnia liczba punktów, które uzyskają studenci, nie będzie niższa od 22,4? Średnia liczba punktów - standaryzacja

65 Twierdzenie Lindeberga – Lévy’ego - PRZYKŁAD Jakie jest prawdopodobieństwo, że w tym roku średnia liczba punktów, które uzyskają studenci, nie będzie niższa od 22,4? Prawdopodobieństwo to wynosi 99,9999%

66 Twierdzenie Lindeberga – Lévy’ego - PRZYKŁAD Moglibyśmy również zapytać, jakie jest prawdopodobieństwo, że w tym roku wszyscy studenci uzyskają z egzaminu mniej niż 29 500 punktów łącznie Dane: n = 1000 E(X) = 29 D(X) = 6 Suma punktów 1000 studentów, czyli

67 Twierdzenie Lindeberga – Lévy’ego - PRZYKŁAD standaryzacja Jakie jest prawdopodobieństwo, że w tym roku wszyscy studenci uzyskają z egzaminu mniej niż 29 500 punktów łącznie Prawdopodobieństwo to wynosi 99,57%


Pobierz ppt "STATYSTYKA – kurs podstawowy wykład 3 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii."

Podobne prezentacje


Reklamy Google