Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia Wykład 1
Treści i efekty kształcenia Treści: Statystyka matematyczna, planowanie eksperymentu Efekty: umiejętności i kompetencje matematycznego opisu zjawisk, formułowania modeli matematycznych i ich wykorzystania
Statystyka w doświadczalnictwie Wykłady (10 spotkań w środy, 8:15) dr hab. Michał Zasada Ćwiczenia (10 spotkań po 2 godz.) dr Robert Tomusiak, dr Rafał Wojtan
Statystyka w doświadczalnictwie Cel zajęć: Dostarczenie praktycznej umiejętności wyboru odpowiednich metod, planowania eksperymentów badawczych oraz wykorzystywania metod statystycznych, szczególnie w kontekście pisania pracy magisterskiej z zakresu technologii drewna Nabycie umiejętności posługiwania się oprogramowaniem statystycznym
Wykłady Statystyka opisowa i prezentacja danych Estymacja statystyczna i zagadnienia pokrewne Metoda reprezentacyjna, pobieranie próby Planowanie eksperymentów Regresja Analiza wariancji Metody nieparametryczne Zagadnienia uzupełniające
Ćwiczenia Zastosowanie pakietu statystycznego „Statistica” do przetwarzania danych Statystyka opisowa i prezentacja danych Regresja liniowa, wielokrotna i nieliniowa Analiza wariancji (jednoczynnikowa i wieloczynnikowa) Metody nieparametryczne Zagadnienia bardziej zaawansowane
Doświadczalnictwo leśne Materiały do zajęć (zakres / konspekt poszczególnych zajęć, pliki z danymi, zagadnienia do opracowania na zaliczenie przedmiotu - wkrótce na serwerze: http://wl.sggw.waw.pl/units/produkcyjnosc/ dydaktyka/Statystyka/WTD Kontakt (pytania, sugestie, problemy): Michal.Zasada@wl.sggw.pl
Podstawowe pojęcia
Podstawowe pojęcia Badanie statystyczne Populacja, jednostka, cecha Rodzaje zmiennych / cech Skale pomiarowe Graficzna prezentacja danych Miary położenia Miary zmienności
Badania statystyczne
Badanie statystyczne Eksperymenty planowane / zakładane Oparte na próbie pobieranej z populacji Podstawą zastosowania każdej metody wnioskowania statystycznego jest dokładne zdefiniowanie populacji, jednostki i cech
Populacja statystyczna Obiekt badania Zbiór elementów / jednostek (obiektów materialnych lub zjawisk) powiązanych ze sobą logicznie (tzn. posiadających wspólną cechę/cechy stałą/stałe) i jednocześnie nieidentycznych (tzn. różniących się ze względu na cechy zmienne) Populacja skończona i nieskończona
Jednostka statystyczna Element populacji Źródło cech
Cecha Badana własność elementów populacji statystycznej, która różnicuje tę populację Cechy mierzalne (ilościowe): możliwe do opisania za pomocą liczb ciągłe: przyjmujące dowolne wartości w danym przedziale skokowe: przyjmująca określone wartości w danym przedziale, Cechy niemierzalne (jakościowe): można je jedynie opisać słownie lub za pomocą odpowiednich skal
Rodzaje cech Skale pomiarowe ilościowe jakościowe Uzależnione są od rodzaju opisywanych zmiennych Determinują, co można zrobić z daną zmienną
Skale pomiarowe Zmienne jakościowe Zmienne ilościowe Skala nominalna Skala porządkowa (rangowa) Zmienne ilościowe Skala przedziałowe (interwałowa) Skala ilorazowa (stosunkowa)
Skala nominalna Pozwala rozpoznawać obiekty jednakowe i różne, bez wypowiadania się o relacjach między nimi, np. gatunek, rodzaj drewna, rodzaj zakładu pracy, płeć, itp. Często pomiar na skali nominalnej jest liczbowym etykietowaniem badanych obiektów, np. kody w niektórych bazach danych Bardzo słaba skala pomiarowa Graficzna prezentacja, dominanta
Skala porządkowa Dodatkowo wprowadza relację porządku w zbiorze zmiennych jakościowych, np. drewno suche, wilgotne; uszkodzenie słabe, średnie, silne; ... Jest skalą mocniejszą niż nominalna Powoduje najwięcej problemów i nieporozumień, przedmiot powszechnie popełnianych błędów
Skala porządkowa Przykład: skala ocen (ndst, dst, db, bdb) Wszelkiego rodzaju obliczenia są tutaj nadużyciem: nieznana jest odległość między poszczególnymi ocenami (różnica w między różnymi stopniami jest różna; często mieszane kategorie) Możliwe jest jedynie określenie, że np. silny stopień uszkodzenia jest mocniejszy, niż słaby
Skala przedziałowa Zachowuje własności skali porządkowej, ale dodatkowo wyposażona jest w stałą jednostkę miary i umowne zero Możliwy jest pomiar odległości między uporządkowanymi zmiennymi Jest skalą mocniejszą od porządkowej
Skala przedziałowa Przykład: skala Celsjusza dla temperatury Możliwe jest określenie o ile stopni dana temperatura różni się od innej Ale nie można opisać sensownie stosunku dwóch wartości zmiennych Np. średnia temperatura lipca w centralnej Polsce (17C) różni się od średniej rocznej temperatury tego obszaru (7C) o 10 stopni, ale nie oznacza to, że w lipcu jest prawie 2,5 raza cieplej, niż średnio w roku
Skala ilorazowa różni się od skali przedziałowej tym, że jest posiada zero absolutne, a nie umowne Możliwe jest określenie ile razy dana cecha jest większa od innej Jest to najsilniejsza skala pomiarowa
Skala ilorazowa Przykład: skala Kelwina Gleba o temperaturze 50C (323K) jest 1.1 raza (czyli o 10%) cieplejsza od gleby o temperaturze 20C (293K) Przykład: liczba kandydatów na studia Na WTD (100) było 5 razy mniej kandydatów na studia, niż na WL (500) – zerem absolutnym jest tu brak kandydatów na dany kierunek studiów
Graficzna prezentacja danych
Graficzna prezentacja danych Ważny element wstępnej analizy danych Nieodzowna ilustracja problemu i uzyskanych wyników Dobór skali i szerokości klas Wybór sposobu prezentowania danych
http://onlinestatbook.com/stat_sim/histogram/index.html
Statystyka w doświadczalnictwie Wydział Technologii Drewna SGGW Studia II stopnia Wykład 2
Statystyka opisowa
Miary położenia średnia arytmetyczna i mediana
Miary położenia
Miary położenia
Miary położenia Miąższości [m3]: 0.45, 0.39, 0.35, 0.51, 0.41, 0.38, 0.42, 0.4, 0.3, 0.6 Średnia miąższość [m3]: 0.421
Miary położenia
Miary położenia
Miary położenia Miąższości [m3]: 0.45, 0.39, 0.35, 0.51, 0.41, 0.38, 0.42, 0.4, 0.3, 7.1 Średnia miąższość [m3]: 1.07 Mediana [m3]: 0.3, 0.35, 0.38, 0.39, 0.4, 0.41, 0.42, 0.45, 0.51, 7.1
Miary położenia Zależności miar statystycznych w zależności od rodzaju rozkładu: http://onlinestatbook.com/stat_sim/descriptive/index.html
Miary zmienności odchylenie standardowe i współczynnik zmienności
Miary zmienności Pomierzono wysokości w dwóch drzewostanach jodłowych na pogórzu Uzyskano następujące wyniki:
Miary zmienności Średnia wysokość d-stanu 1: 40m Odchylenie standardowe 1: 3m Średnia wysokość d-stanu 2: 10m Odchylenie standardowe 2: 3m
Miary zmienności Średnia wysokość d-stanu 1: 40m Odchylenie standardowe 1: 3m Średnia wysokość d-stanu 2: 10m Odchylenie standardowe 2: 3m Współczynniki zmienności: 7.5% i 30%
A na zakończenie...
Na zakończenie... Analiza formy Adama Małysza Jakie wnioski? 1 turniej: 102 m, 97 m, 116 m, 98 m, 86 m 2 turniej: 106 m, 110 m, 114 m, 127 m, 120 m 3 turniej: 108 m, 84 m, 111 m, 82 m, 76 m Jakie wnioski? Na podstawie: K. Stróżyński „Jej Wysokość Niekompetencja” Matematyka (dwumiesięcznik PTM, online)
Na zakończenie... Średnie: 99.8, 115.4, 92.2 (102,5) SD: 10.8, 8.3, 16.1 (15.1) Porównanie średniej ze wszystkich skoków oraz poszczególnych średnich szczegółowych: zwyżka lub obniżenie formy zawodnika Odchylenie standardowe dla poszczególnych turniejów: czy rozrzut wyników rośnie czy maleje w miarę kolejnych zawodów (czy forma się stabilizuje)
Na zakończenie... Zestawienie średnich wyników z odchyleniami standardowymi: czy najlepsze średnie wyniki pochodzą z zawodów, gdzie skoczek ma nierówną formę (wyższe odchylenie standardowe), czy z zawodów charakteryzujących się stabilną formą (niższe odchylenie) Czy po okresie szczytu formy następuje stabilizacja wyników (nawet gdy średnia spada), czy też rozchwianie kondycji zawodnika (wzrost odchylenia standardowego)? Może to świadczyć o braku odporności psychicznej czy nieumiejętności znoszenia porażek
Dziekuje za uwagę!