Statystyka i opracowanie wyników badań dr inż. Janusz J. Bucki Ćwiczenia dla I roku WIM PW Warszawa, 2007
Statystyka i opracowanie wyników badań Główne zagadnienia do omówienia Opis ilościowy próby (statystyka opisowa) Prezentacja wyników, liczne zbiory danych Zmienne losowe, ich funkcje i charakterystyka Formułowanie wniosków statystycznych
Statystyka i opracowanie wyników badań Plan pracy w trakcie semestru 15 godzin po 2 godz. w I poł. sem + praca własna – 15 godzin !!! kalkulator, www.inmat.pw.edu.pl, tablice statystyczne sprawdzian pisemny - zaliczenie Zagadnienia wstępne Parametry pozycyjne i rozproszenia próby Wykresy i grupowanie danych Gęstość i dystrybuanta zmiennej losowej Proste testy stat. - Istotność wart. oczekiwanej Błędy grube i pomyłki Wiele zmiennych – korelacja i regresja
Statystyka i opracowanie wyników badań Literatura pomocnicza D.Bobrowski „Probabilistyka w zastosowaniach technicznych” WNT M.Maliński „Weryfikacja hipotez statysty-cznych wspomagana komputerowo” WPŚl A.Plucińska, E.Pluciński „Probabilistyka” WNT S. Brandt „Analiza danych” PWN L. Kukiełka „Podstawy badań inżynierskich” PWN W.Klonecki „Statystyka dla inżynierów” PWN T. Zieliński „Jak pokochać statystykę, czyli STATISTICA do poduszki” StatSoft Kraków M.R.Spiegel „Statistics” McGraw-Hill
Statystyka i opracowanie wyników badań Badane i opisywane cechy Jakościowe Nominalne (np. preferencje kulinarne) Porządkowe (wykształcenie podstawowe, średnie, ...) Ilościowe Interwałowe (A większe od B o x, np. [oC]) Iloczynowe (A 3 razy większe od B, np. [K]) Ciągłe Dyskretne Ograniczenia
Statystyka i opracowanie wyników badań Wyniki pomiarów jednej cechy Populacja i próba. Charakteryzowanie – statystyka opisowa. wartość średnia odchylenie standardowe współczynniki wyższych rzędów mediana, kwantyle dominanta inne charakterystyki pozycyjne i rozproszenia
Typowe błędy i ograniczenia Statystyka i opracowanie wyników badań Wartość średnia – funkcja efektu Funkcja efektu: Suma Iloczyn Suma odwrotności ... Średnia: arytmetyczna geometryczna harmoniczna ... Typowe błędy i ograniczenia
Statystyka i opracowanie wyników badań Wartości średnie
Statystyka i opracowanie wyników badań Charakterystyka jednej cechy (w konkretnej próbie/populacji) odchylenie standardowe współczynnik skośności współczynnik rozproszenia
Statystyka i opracowanie wyników badań Inne charakterystyki rozstęp R = xmax - xmin środek rozstępu xR = (xmax + xmin)/2 dominanta d (wartość występująca najczęściej – o ile jest taka) mediana m dane uporządkowane (rosnąco lub malejąco) nieparzysta liczba wyników: m=x(n+1)/2 parzysta liczba wyników: m=(xn/2 +x(n+2)/2)/2
Statystyka i opracowanie wyników badań Prezentacja graficzna jednej cechy histogram z danych empirycznych dystrybuanta graficzne wyznaczanie wybranych parametrów: mediana kwantyle dominanta
Statystyka i opracowanie wyników badań Histogram z danych empirycznych duża liczność próby (n > 30) decyzja o liczbie klas (k): (n/2) < k < n k 1 + 3,3 log n k < 5 log n dla j(2 ; k-1) liczność j-tej klasy, nj5 stała szerokość klasy R/k początek podziału xp<=xmin; przy czym xmax<=xp+k j-ty przedział klasowy: < xp+(j-1); xp+j ) środek j-tego przedziału xp+(j-0,5)
Statystyka i opracowanie wyników badań Dystrybuanta z danych empirycznych podział na klasy jak do histogramu liczność skumulowana Nj Alternatywne formy histogramu i dystrybuanty: częstość (liczność względna) fj = nj/n częstość skumulowana Fj = Nj/n
Statystyka i opracowanie wyników badań Zmienne losowe Reprezentacja zmiennej losowej gęstość prawdopodobieństwa dystrybuanta Charakteryzowanie zmiennej losowej wartość oczekiwana odchylenie standardowe współczynniki wyższych rzędów mediana, kwantyle dominanta
Statystyka i opracowanie wyników badań Gęstość prawdopodobieństwa i dystrybuanta zmiennej losowej ciągłej
Statystyka i opracowanie wyników badań Gęstość prawdopodobieństwa i dystrybuanta zmiennej losowej ciągłej
Statystyka i opracowanie wyników badań Wartość oczekiwana, odchylenie standardowe, wsp. skośności i rozproszenia zmiennej losowej
Statystyka i opracowanie wyników badań Mediana i kwantyle zmiennej losowej
Statystyka i opracowanie wyników badań Hipotezy statystyczne Testowanie prostych hipotez statystycznych poziom ufności, poziom istotności błędy pierwszego i drugiego rodzaju hipoteza zerowa, dobór hipotezy alternatywnej poziom istotności obliczanie statystyki interpretacja wyników testu - obszar krytyczny, istotność statystyczna (wartość p)
Statystyka i opracowanie wyników badań Eliminacja wyników wątpliwych (1 cecha) Błędy grube i pomyłki Ograniczenia testu „inżynierskiego”, zwanego również testem trzech sigma Liczność próby, rozkład wartości, kolejne iteracje, wybór wyników wątpliwych (xw) do testowania Uproszczona forma testu statystycznego Wynik wątpliwy xw odrzucamy, jeśli:
Statystyka i opracowanie wyników badań Pomiary dwóch cech - wstęp Korelacja (badanie czy zmienne są niezależne) Regresja (dopasowanie zależności funkcyjnej między cechami) Wykresy zależności funkcyjnych