Metody pozyskiwania i przetwarzania danych w badaniach naukowych

Slides:



Advertisements
Podobne prezentacje
PODZIAŁ STATYSTYKI STATYSTYKA STATYSTYKA MATEMATYCZNA STATYSTYKA
Advertisements

BIOSTATYSTYKA I METODY DOKUMENTACJI Ćwiczenie 1
Statystyka Wojciech Jawień
Estymacja. Przedziały ufności.
W dalszej części zajęć wyróżniać będziemy następujące
Biostatystyka inż. Jacek Jamiołkowski Wykład 2 Statystyka opisowa.
Zmienne losowe i ich rozkłady
Podsumowanie wykładu 1. Najpełniejszą charakterystyką wybranej zmiennej jest jej rozkład.
Skale pomiarowe – BARDZO WAŻNE
PODSUMOWANIE WIADOMOŚCI ZE STATYSTYKI
Charakterystyki opisowe rozkładu jednej cechy
Jak mierzyć asymetrię zjawiska?
Jak mierzyć zróżnicowanie zjawiska? Wykład 4. Miary jednej cechy Miary poziomu Miary dyspersji (zmienności, zróżnicowania, rozproszenia) Miary asymetrii.
Miary jednej cechy Miary poziomu Miary dyspersji Miary asymetrii (skośności)
Właściwości średniej arytmetycznej
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Miary położenia Miary położenia opisują umiejscowienie typowych wartości cechy statystycznej na osi liczbowej.
Krzysztof Jurek Statystyka Spotkanie 4. Miary zmienności m ó wią na ile wyniki są rozproszone na konkretne jednostki, pokazują na ile wyniki odbiegają
Statystyka w doświadczalnictwie
(dla szeregu szczegółowego) Średnia arytmetyczna (dla szeregu szczegółowego) Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek.
BIOSTATYSTYKA I METODY DOKUMENTACJI
BIOSTATYSTYKA I METODY DOKUMENTACJI
Wykład 6 Standardowy błąd średniej a odchylenie standardowe z próby
Wykład 3 Rozkład próbkowy dla średniej z rozkładu normalnego
Statystyczne sterowanie procesem produkcyjnym
STATYSTYCZNE STEROWANIE PROCESEM PRODUKCYJNYM
Rozkład normalny Cecha posiada rozkład normalny jeśli na jej wielkość ma wpływ wiele niezależnych czynników, a wpływ każdego z nich nie jest zbyt duży.
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
Średnie i miary zmienności
Rozkład t.
Konstrukcja, estymacja parametrów
Kurs specjalistyczny dla pielęgniarek, mgr Adam Dudek, PWSZ Nysa 2007
Elementy Rachunku Prawdopodobieństwa i Statystyki
na podstawie materiału – test z użyciem komputerowo generowanych prób
Elementy Rachunku Prawdopodobieństwa i Statystyki
Dane INFORMACYJNE Nazwa szkoły: Zespół Szkół nr 5 w Szczecinku i Zespół Szkół w Opalenicy ID grupy: 97/41_mf_g2 i 97/71_mf_g1 Kompetencja:
Elementy Rachunku Prawdopodobieństwa i Statystyki
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
Statystyka ©M.
Podstawy statystyki, cz. II
Statystyka i opracowanie wyników badań
1 Analiza wyników sprawdzianu ‘2014 Zespół Szkolno-Przedszkolny w Krowiarkach – XI 2014 – XI 2014 Opracował: J. Pierzchała.
Co to jest dystrybuanta?
Wnioskowanie statystyczne
STATYSTYKA Pochodzenie nazwy:
Statystyka medyczna Piotr Kozłowski
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Estymatory punktowe i przedziałowe
Podstawowe pojęcia i terminy stosowane w statystyce
Statystyczna analiza danych w praktyce
Jak mierzyć asymetrię zjawiska? Wykład 5. Miary jednej cechy  Miary poziomu  Miary dyspersji (zmienności, zróżnicowania, rozproszenia)  Miary asymetrii.
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
Statystyczna analiza danych
STATYSTYKA – kurs podstawowy wykład 5 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
ze statystyki opisowej
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Halina Klimczak Katedra Geodezji i Fotogrametrii Akademia Rolnicza we Wrocławiu WYKŁAD 2 ZMIENNE GRAFICZNE SKALA CIĄGŁA I SKOKOWA.
STATYSTYKA – kurs podstawowy wykład 2 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Parametry rozkładów Metodologia badań w naukach behawioralnych II.
Statystyka Wykłady dla II rok Geoinformacji rok akademicki 2012/2013
Jak mierzyć zróżnicowanie zjawiska?
Małgorzata Podogrodzka, SGH ISiD
Statystyka matematyczna
PODSTAWY STATYSTYKI Wykład udostępniony przez dr hab. Jana Gajewskiego
MIARY STATYSTYCZNE Warunki egzaminu.
Korelacja i regresja liniowa
statystyka podstawowe pojęcia
Zapis prezentacji:

Metody pozyskiwania i przetwarzania danych w badaniach naukowych

Dr inż. Agnieszka Strzelczak Zakład Inżynierii Procesowej i Maszynoznawstwa E-mail: Agnieszka-Strzelczak@zut.edu.pl Tel: +48 91 449 65 36 Pokój: 308 PP Konsultacje: środa 12 – 14 www: https://agstrzelczak.zut.edu.pl

Aby coś powiedzieć o jakimś zjawisku należy je najpierw zbadać! Człowiek otoczony jest różnymi zjawiskami i próbuje je poznać, dowiedzieć się w jaki sposób funkcjonują, jakie relacje między nimi zachodzą. Aby coś powiedzieć o jakimś zjawisku należy je najpierw zbadać! Statystyka: obejmuje metody pozyskiwania, prezentacji i analizy danych Użycie statystyki do badania zjawisk sprawia, że badanie jest oparte na sprawdzonych i dopracowanych metodach

Statystyka jest tylko narzędziem pozwalającym sprawdzić nasze pomysły badawcze i wyjaśnić zjawiska

Podstawowe pojęcia Cechy zmienne rzeczowe czasowe przestrzenne

Podstawowe pojęcia Cechy zmienne rzeczowe czasowe przestrzenne

Podstawowe pojęcia

Podstawowe pojęcia

(np. liczba studentów na roku, liczba pracowników przedsiębiorstwa) Podstawowe pojęcia przyjmują określone wartości liczbowe (np. wiek-w latach, wzrost-w cm, wskaźnik masy ciała BMI) mogą przyjmować wszystkie wartości liczb rzeczywistych z określonego przedziału liczbowego (np. koszt, wiek, waga) mogą być wyrażone tylko liczbami zmieniającymi się skokami , bez pośrednich wartości (np. liczba studentów na roku, liczba pracowników przedsiębiorstwa)

Podstawowe pojęcia

Podstawowe pojęcia nie można ich wyrazić za pomocą liczb, a jedynie słownie (np. płeć - kobieta, mężczyzna; kolor - czarny, biały, zielony, itd.) nie można ich ustawić w odpowiedniej kolejnością (np. płeć, grupa krwi, kolor oczu) cechy słownie dające się uporządkować w pewnej kolejności (np. wykształcenie, oceny egzaminów)

Etapy analizy statystycznej WYNIKI POPULACJA PRÓBA STAT. OBLICZENIA POMIARY ANALIZA

Etapy analizy statystycznej WYNIKI POPULACJA PRÓBA STAT. OBLICZENIA POMIARY ANALIZA

DOBRZE POBRANA PRÓBKA JEST REPREZENTATYWNA!!! Próba statystyczna Próba wybrana do badania musi być odpowiednia Wybór próby jest kluczowym etapem z punktu widzenia wiarygodności końcowych wyników DOBRZE POBRANA PRÓBKA JEST REPREZENTATYWNA!!!

Próba statystyczna Próba reprezentatywna: w dobry sposób odzwierciedla populację, z której została pobrana Dla zapewnienia reprezentatywności konieczna jest odpowiednia liczebność próby. Im większa próba, tym bardziej wiarygodne wyniki. Uwaga! Liczności nie można zwiększać w nieskończoność (koszty analiz!). Należy szukać optimum pomiędzy kosztami a wiarygodnością wyników.

Metody opisu statystycznego Stosuje się je do wyników o relatywnie dużej liczebności (n>10) Określanie struktury danych (rozkładu) Mierniki statystyczne

Metody opisu statystycznego Stosuje się je do wyników o relatywnie dużej liczebności (n>10) Określanie struktury danych (rozkładu) Mierniki statystyczne

Określanie rozkładu danych HISTOGRAM Zawartość tłuszczu % w 65 różnych serach żółtych 31,820 33,100 33,780 34,650 34,870 35,530 36,750 32,010 33,120 33,790 34,690 34,880 35,620 36,680 33,260 34,900 35,780 36,780 32,050 34,720 34,920 35,790 36,850 32,230 33,280 33,820 34,960 35,860 38,520 32,600 33,300 34,810 35,090 36,120 32,950 33,360 33,860 35,120 36,250 33,030 33,540 33,950 35,160 36,560 33,050 33,560 34,210 34,860 35,280 33,060 33,750 34,220 35,290 36,590

Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: Posortowanie danych w porządku od najmniejszej do największej 2. Wyznaczenie wartości najmniejszej i największej: xmin, xmax

Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: Obliczenie szerokości zakresu, w jakim pojawiają się dane (rozstępu): R=xmax-xmin Wyznaczenie liczby przedziałów: ilość przedziałów= pierwiastek(ilość pomiarów)

Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: 5. Ustalenie szerokości przedziałów: szerokość przedziału=rozstęp/l-ba przedziałów

Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: 6. Rozpisanie przedziałów i obliczenie, ile w każdym z nich znajduje się wyników: Przedział wartości Ilość wyników w przedziale (31,32] 1 (32,33] 6 (33,34] 21 (34,35] 17 (35,36] 10 (36,37] 9 (37,38] (38,39]

Określanie rozkładu danych HISTOGRAM Procedura rysowania histogramu: 7. Narysowanie wykresu: w zależności od liczby wyników w poszczególnych przedziałach, rysuje się odpowiednią wysokość słupka.

Określanie rozkładu danych HISTOGRAM

Typy rozkładów (histogramów)

Typy rozkładów (histogramów) Amodalny = skrajnie asymetryczny

Typy rozkładów (histogramów)

Metody opisu statystycznego Stosuje się je do wyników o relatywnie dużej liczebności (n>10) Określanie struktury danych (rozkładu) Mierniki statystyczne

Mierniki statystyczne Miary położenia Miary rozproszenia Miary kształtu rozkładu

Mierniki statystyczne Miary położenia Miary rozproszenia Miary kształtu rozkładu

Mierniki statystyczne Miary położenia Średnia arytmetyczna

Mierniki statystyczne Miary położenia Średnia geometryczna Stosuje się ją, gdy badamy dane w postaci logarytmów z wyników. Dane muszą być >0 !!! Średnia geom. Jest zwykle < niż średnia arytm.

Mierniki statystyczne Miary położenia Mediana Wynik środkowy w zbiorze danych. Przy nieparzystej liczbie danych: x1 , x2 . x3 , x4 , x5 Przy parzystej liczbie danych: x1 , x2 . x3 , x4 , x5 , x6 Średnia arytmetyczna z dwóch wyników

Mierniki statystyczne Miary położenia Mediana Jeśli x  Me : struktura wyników jest symetryczna Jeśli x < Me : struktura wyników jest prawostronnie asymetryczna Jeśli x > Me : struktura wyników jest lewostronnie asymetryczna

Mierniki statystyczne Miary położenia Kwantyle (w tym mediana) Kwantylami możemy dzielić zbiory na różne przedziały. Mediana dzieli zbiór danych na 2 części, czyli 50% wyników jest > niż Me a 50% jest < niż Me. Dzieląc zbiór na 4 części uzyskujemy kwantyle zwane kwartylami: kwartyl dolny i kwartyl górny. x1 , x2 . x3 , x4 , x5 , x6 Kd=k0,25 Me Kg=k0,75

Mierniki statystyczne Miary położenia Kwantyle Jeśli dzielimy zbiór na 10 części: decyle Jeśli dzielimy zbiór na 100 części: percentyle

Mierniki statystyczne Miary położenia Miary rozproszenia Miary kształtu rozkładu

Miary rozproszenia Miary rozproszenia Wariancja Zróżnicowanie wyników UWAGA! Powyższy wzór obowiązuje, pod warunkiem, że mamy możliwość zbadania całej populacji (czyli mamy nieskończoną liczbę wyników), co jest PRAWIE NIGDY SPEŁNIONE

Odchylenie standardowe Miary rozproszenia Miary rozproszenia Odchylenie standardowe Przeciętna różnica między średnią a poszczególnymi wynikami UWAGA! Powyższy wzór obowiązuje, pod warunkiem, że mamy możliwość zbadania całej populacji (czyli mamy nieskończoną liczbę wyników), co jest PRAWIE NIGDY SPEŁNIONE

Odchylenie standardowe Miary rozproszenia Miary rozproszenia Odchylenie standardowe Ponieważ opisujemy rozkład opierając się jedynie na pewnej próbce wyników, pobranej z populacji, stosuje się estymator:

Współczynnik zmienności Miary rozproszenia Miary rozproszenia Współczynnik zmienności Względna miara rozproszenia.

Miary rozproszenia Miary rozproszenia Przedział typowy Przedział wyników typowych. Ma on sens, gdy rozkład wyników jest zbliżony do symetrycznego. Zawiera ok. 68% wyników, pozostałe to wyniki nietypowe (małe lub duże)

Mierniki statystyczne Miary położenia Miary rozproszenia Miary kształtu rozkładu

Mierniki statystyczne Miary kształtu rozkładu Skośność Wskaźnik niesymetryczności rozkładu, nazywany jest często asymetrią Dla rozkładu symetrycznego wynosi 0!!! UWAGA! Powyższy wzór obowiązuje, pod warunkiem, że mamy możliwość zbadania całej populacji (czyli mamy nieskończoną liczbę wyników), co jest PRAWIE NIGDY SPEŁNIONE

Mierniki statystyczne Miary kształtu rozkładu Skośność Ponieważ opisujemy rozkład opierając się jedynie na pewnej próbce wyników, pobranej z populacji, stosuje się estymator:

Mierniki statystyczne Miary kształtu rozkładu Skośność Gdy  > 0 : rozkład prawostronnie asymetryczny Gdy  < 0 : rozkład lewostronnie asymetryczny Gdy  = 0 : rozkład symetryczny

Mierniki statystyczne Miary kształtu rozkładu Kurtoza Spłaszczenie, wskaźnik opisujący kształt i wyniesienie rozkładu zmiennej. UWAGA! Powyższy wzór obowiązuje, pod warunkiem, że mamy możliwość zbadania całej populacji (czyli mamy nieskończoną liczbę wyników), co jest PRAWIE NIGDY SPEŁNIONE

Mierniki statystyczne Miary kształtu rozkładu Kurtoza Ponieważ opisujemy rozkład opierając się jedynie na pewnej próbce wyników, pobranej z populacji, stosuje się estymator:

Mierniki statystyczne Miary kształtu rozkładu Kurtoza Gdy  > 0 : rozkład wysmukły, leptokurtyczny Gdy  < 0 : rozkład spłaszczony, platokurtyczny Gdy  = 0 : rozkład mezokurtyczny (normalny)

Liczebność próby WYNIKI POPULACJA PRÓBA STAT. OBLICZENIA POMIARY ANALIZA

Liczebność próby Przeprowadzając badania z populacji generalnej pobieramy próbę: n  100 próba b. duża n  30 próba duża 10  n < 30 próba mała n < 10 próba b. mała