Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Metody pozyskiwania i przetwarzania danych w badaniach naukowych.

Podobne prezentacje


Prezentacja na temat: "Metody pozyskiwania i przetwarzania danych w badaniach naukowych."— Zapis prezentacji:

1 Metody pozyskiwania i przetwarzania danych w badaniach naukowych

2 Dr inż. Agnieszka Strzelczak Zakład Inżynierii Procesowej i Maszynoznawstwa Tel: Pokój: 308 PP Konsultacje: środa 12 – 14 www: https://agstrzelczak.zut.edu.pl

3 Człowiek otoczony jest różnymi zjawiskami i próbuje je poznać, dowiedzieć się w jaki sposób funkcjonują, jakie relacje między nimi zachodzą. Aby coś powiedzieć o jakimś zjawisku należy je najpierw zbadać! Statystyka: obejmuje metody pozyskiwania, prezentacji i analizy danych Użycie statystyki do badania zjawisk sprawia, że badanie jest oparte na sprawdzonych i dopracowanych metodach

4 Statystyka jest tylko narzędziem pozwalającym sprawdzić nasze pomysły badawcze i wyjaśnić zjawiska

5 Podstawowe pojęcia Cechy zmienne rzeczoweczasoweprzestrzenne

6 Podstawowe pojęcia Cechy zmienne rzeczoweczasoweprzestrzenne

7 Podstawowe pojęcia

8

9 przyjmują określone wartości liczbowe (np. wiek-w latach, wzrost-w cm, wskaźnik masy ciała BMI) mogą przyjmować wszystkie wartości liczb rzeczywistych z określonego przedziału liczbowego (np. koszt, wiek, waga) mogą być wyrażone tylko liczbami zmieniającymi się skokami, bez pośrednich wartości (np. liczba studentów na roku, liczba pracowników przedsiębiorstwa)

10 Podstawowe pojęcia

11 nie można ich wyrazić za pomocą liczb, a jedynie słownie (np. płeć - kobieta, mężczyzna; kolor - czarny, biały, zielony, itd.) nie można ich ustawić w odpowiedniej kolejnością (np. płeć, grupa krwi, kolor oczu) cechy słownie dające się uporządkować w pewnej kolejności (np. wykształcenie, oceny egzaminów)

12 Etapy analizy statystycznej POPULACJA PRÓBA STAT. POMIARY OBLICZENIA WYNIKI ANALIZA

13 Etapy analizy statystycznej POPULACJA PRÓBA STAT. POMIARY OBLICZENIA WYNIKI ANALIZA

14 Próba statystyczna Próba wybrana do badania musi być odpowiednia Wybór próby jest kluczowym etapem z punktu widzenia wiarygodności końcowych wyników DOBRZE POBRANA PRÓBKA JEST REPREZENTATYWNA!!!

15 Próba statystyczna Próba reprezentatywna: w dobry sposób odzwierciedla populację, z której została pobrana Dla zapewnienia reprezentatywności konieczna jest odpowiednia liczebność próby. Im większa próba, tym bardziej wiarygodne wyniki. Uwaga! Liczności nie można zwiększać w nieskończoność (koszty analiz!). Należy szukać optimum pomiędzy kosztami a wiarygodnością wyników.

16 Metody opisu statystycznego Stosuje się je do wyników o relatywnie dużej liczebności (n>10) Określanie struktury danych (rozkładu) Mierniki statystyczne

17 Metody opisu statystycznego Stosuje się je do wyników o relatywnie dużej liczebności (n>10) Określanie struktury danych (rozkładu) Mierniki statystyczne

18 Określanie rozkładu danych HISTOGRAM 31,82033,10033,78034,65034,87035,53036,750 32,01033,12033,79034,69034,88035,62036,680 32,01033,26033,79034,69034,90035,78036,780 32,05033,26033,79034,72034,92035,79036,850 32,23033,28033,82034,72034,96035,86038,520 32,60033,30033,82034,81035,09036,120 32,95033,36033,86034,81035,12036,250 33,03033,54033,95034,81035,16036,560 33,05033,56034,21034,86035,28036,560 33,06033,75034,22034,87035,29036,590 Zawartość tłuszczu % w 65 różnych serach żółtych

19 Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: 1.Posortowanie danych w porządku od najmniejszej do największej 2. Wyznaczenie wartości najmniejszej i największej: x min, x max

20 Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: 3.Obliczenie szerokości zakresu, w jakim pojawiają się dane (rozstępu): R=x max -x min 4. Wyznaczenie liczby przedziałów: ilość przedziałów= pierwiastek(ilość pomiarów)

21 Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: 5. Ustalenie szerokości przedziałów: szerokość przedziału=rozstęp/l-ba przedziałów

22 Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: 6. Rozpisanie przedziałów i obliczenie, ile w każdym z nich znajduje się wyników: Przedział wartościIlość wyników w przedziale (31,32]1 (32,33]6 (33,34]21 (34,35]17 (35,36]10 (36,37]9 (37,38]0 (38,39]1

23 Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: 7. Narysowanie wykresu: w zależności od liczby wyników w poszczególnych przedziałach, rysuje się odpowiednią wysokość słupka.

24 Określanie rozkładu danych HISTOGRAM

25 Typy rozkładów (histogramów)

26 Amodalny = skrajnie asymetryczny

27 Typy rozkładów (histogramów)

28 Metody opisu statystycznego Stosuje się je do wyników o relatywnie dużej liczebności (n>10) Określanie struktury danych (rozkładu) Mierniki statystyczne

29 Miary położenia Miary rozproszenia Miary kształtu rozkładu

30 Mierniki statystyczne Miary położenia Miary rozproszenia Miary kształtu rozkładu

31 Mierniki statystyczne Miary położenia Średnia arytmetyczna

32 Mierniki statystyczne Miary położenia Średnia geometryczna Stosuje się ją, gdy badamy dane w postaci logarytmów z wyników. Dane muszą być >0 !!! Średnia geom. Jest zwykle < niż średnia arytm.

33 Mierniki statystyczne Miary położenia Mediana Wynik środkowy w zbiorze danych. Średnia arytmetyczna z dwóch wyników Przy nieparzystej liczbie danych: x 1, x 2. x 3, x 4, x 5 Przy parzystej liczbie danych: x 1, x 2. x 3, x 4, x 5, x 6

34 Mierniki statystyczne Miary położenia Mediana Jeśli  x  Me : struktura wyników jest symetryczna Jeśli  x < Me : struktura wyników jest prawostronnie asymetryczna Jeśli  x > Me : struktura wyników jest lewostronnie asymetryczna

35 Mierniki statystyczne Miary położenia Kwantyle (w tym mediana) Kwantylami możemy dzielić zbiory na różne przedziały. Mediana dzieli zbiór danych na 2 części, czyli 50% wyników jest > niż Me a 50% jest < niż Me. Dzieląc zbiór na 4 części uzyskujemy kwantyle zwane kwartylami: kwartyl dolny i kwartyl górny. x 1, x 2. x 3, x 4, x 5, x 6 MeK d =k 0,25 K g =k 0,75

36 Mierniki statystyczne Miary położenia Kwantyle Jeśli dzielimy zbiór na 10 części: decyle Jeśli dzielimy zbiór na 100 części: percentyle

37 Mierniki statystyczne Miary położenia Miary rozproszenia Miary kształtu rozkładu

38 Zróżnicowanie wyników Miary rozproszenia Wariancja UWAGA! Powyższy wzór obowiązuje, pod warunkiem, że mamy możliwość zbadania całej populacji (czyli mamy nieskończoną liczbę wyników), co jest PRAWIE NIGDY SPEŁNIONE

39 Miary rozproszenia Odchylenie standardowe Przeciętna różnica między średnią a poszczególnymi wynikami UWAGA! Powyższy wzór obowiązuje, pod warunkiem, że mamy możliwość zbadania całej populacji (czyli mamy nieskończoną liczbę wyników), co jest PRAWIE NIGDY SPEŁNIONE

40 Miary rozproszenia Odchylenie standardowe Ponieważ opisujemy rozkład opierając się jedynie na pewnej próbce wyników, pobranej z populacji, stosuje się estymator:

41 Miary rozproszenia Współczynnik zmienności Względna miara rozproszenia.

42 Miary rozproszenia Przedział typowy Przedział wyników typowych. Ma on sens, gdy rozkład wyników jest zbliżony do symetrycznego. Zawiera ok. 68% wyników, pozostałe to wyniki nietypowe (małe lub duże)

43 Mierniki statystyczne Miary położenia Miary rozproszenia Miary kształtu rozkładu

44 Mierniki statystyczne Miary kształtu rozkładu Skośność Wskaźnik niesymetryczności rozkładu, nazywany jest często asymetrią Dla rozkładu symetrycznego wynosi 0!!! UWAGA! Powyższy wzór obowiązuje, pod warunkiem, że mamy możliwość zbadania całej populacji (czyli mamy nieskończoną liczbę wyników), co jest PRAWIE NIGDY SPEŁNIONE

45 Mierniki statystyczne Miary kształtu rozkładu Skośność Ponieważ opisujemy rozkład opierając się jedynie na pewnej próbce wyników, pobranej z populacji, stosuje się estymator:

46 Mierniki statystyczne Miary kształtu rozkładu Skośność Gdy  > 0 : rozkład prawostronnie asymetryczny Gdy  < 0 : rozkład lewostronnie asymetryczny Gdy  = 0 : rozkład symetryczny

47 Mierniki statystyczne Miary kształtu rozkładu Kurtoza Spłaszczenie, wskaźnik opisujący kształt i wyniesienie rozkładu zmiennej. UWAGA! Powyższy wzór obowiązuje, pod warunkiem, że mamy możliwość zbadania całej populacji (czyli mamy nieskończoną liczbę wyników), co jest PRAWIE NIGDY SPEŁNIONE

48 Mierniki statystyczne Miary kształtu rozkładu Kurtoza Ponieważ opisujemy rozkład opierając się jedynie na pewnej próbce wyników, pobranej z populacji, stosuje się estymator:

49 Mierniki statystyczne Miary kształtu rozkładu Kurtoza Gdy  > 0 : rozkład wysmukły, leptokurtyczny Gdy  < 0 : rozkład spłaszczony, platokurtyczny Gdy  = 0 : rozkład mezokurtyczny (normalny)

50 Liczebność próby POPULACJA PRÓBA STAT. POMIARY OBLICZENIA WYNIKI ANALIZA

51 Liczebność próby Przeprowadzając badania z populacji generalnej pobieramy próbę: n  100 próba b. duża n  30 próba duża 10  n < 30 próba mała n < 10 próba b. mała


Pobierz ppt "Metody pozyskiwania i przetwarzania danych w badaniach naukowych."

Podobne prezentacje


Reklamy Google