Wizualizacja rozkładu zmiennej

Slides:



Advertisements
Podobne prezentacje
Badania statystyczne Wykłady 1-2 © Leszek Smolarek.
Advertisements

Excel Narzędzia do analizy regresji
BIOSTATYSTYKA I METODY DOKUMENTACJI Ćwiczenie 1
Wykład 13 Estymacja wartości oczekiwanej zmiennej zależnej.
Wykład 14 Diagnostyka Diagnostyka – ocena prawidłowości założeń
Zmienne losowe i ich rozkłady
Skale pomiarowe – BARDZO WAŻNE
STATYSTYCZNA ANALIZA DANYCH
Elementy Modelowania Matematycznego
Estymacja przedziałowa
ANALIZA STRUKTURY SZEREGU NA PODSTAWIE MIAR STATYSTYCZNYCH
Symulacja zysku Sprzedaż pocztówek.
Statystyka w doświadczalnictwie
Dzisiaj na wykładzie Regresja wieloraka – podstawy i założenia
Analiza korelacji.
Niepewności przypadkowe
OPIS SEPARACJI JAKO KLASYFIKACJA
Wykład 4 Rozkład próbkowy dla średniej z rozkładu normalnego
Wykład 14 Liniowa regresja
Pobieranie próby Populacja generalna: zbiór wyników wszystkich możliwych doświadczeń określonego typu. Próba n-wymiarowa: zbiór n wyników doświadczeń.
Wykład 4. Rozkłady teoretyczne
Metody Symulacyjne w Telekomunikacji (MEST) Wykład 6/7: Analiza statystyczna wyników symulacyjnych  Dr inż. Halina Tarasiuk
STATYSTYCZNA ANALIZA DANYCH
Średnie i miary zmienności
Co to są rozkłady normalne?
Jednoczynnikowa analiza wariancji (ANOVA)
Konstrukcja, estymacja parametrów
Analiza współzależności cech statystycznych
Ocena rozkładu na podstawie wykresów kwantylowych
i jak odczytywać prognozę?
Ekonometria. Co wynika z podejścia stochastycznego?
Elementy Rachunku Prawdopodobieństwa i Statystyki
Rozkłady wywodzące się z rozkładu normalnego standardowego
Irena Woroniecka EKONOMIA MENEDŻERSKA - dodatek do W2
Elementy Rachunku Prawdopodobieństwa i Statystyki
Statystyka ©M.
MOiPP Wykład 3 Matlab Przykłady prostych metod obliczeniowych.
Statystyka i opracowanie wyników badań
Planowanie badań i analiza wyników
Ekonometryczne modele nieliniowe
MOiPP Matlab Aproksymacja Interpolacja Inne metody obliczeniowe
Testowanie hipotez statystycznych
Co to jest dystrybuanta?
Dopasowanie rozkładów
Ekonometryczne modele nieliniowe
Wnioskowanie statystyczne
Statystyka medyczna Piotr Kozłowski
Statystyczna analiza danych
Metody Matematyczne w Inżynierii Chemicznej Podstawy obliczeń statystycznych.
Program przedmiotu “Opracowywanie danych w chemii” 1.Wprowadzenie: przegląd rodzajów danych oraz metod ich opracowywania. 2.Podstawowe pojęcia rachunku.
Przenoszenie błędów (rachunek błędów) Niech x=(x 1,x 2,...,x n ) będzie n-wymiarową zmienną losową złożoną z niezależnych składników o rozkładach normalnych.
Podstawowe pojęcia i terminy stosowane w statystyce. Rozkłady częstości Seminarium 2.
Podstawowe pojęcia i terminy stosowane w statystyce
Monte Carlo, bootstrap, jacknife. 2 Literatura Bruce Hansen (2012 +) Econometrics, ze strony internetowej :
Osoby prowadzące zajęcia z Informatyki (II część): Prof. Mirosław Czarnecki (W+L) Konsultacje:piątek (p. 302a)
Rozkłady statystyk z próby dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Osoby prowadzące zajęcia z Informatyki (II część): Prof. Mirosław Czarnecki (W+L) Konsultacje:piątek (p. 302a)
STATYSTYKA – kurs podstawowy wykład 11
Estymacja parametryczna dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz.
Statystyka Powtorzenie
Informacje ogólne.
EWD 2016 Język polski.
Podstawy Informatyki.
Małgorzata Podogrodzka, SGH ISiD
Statystyka matematyczna
Historia i wiedza o społeczeństwie
Analiza niepewności pomiarów Zagadnienia statystyki matematycznej
Podstawy Informatyki.
Monte Carlo, bootstrap, jacknife
Korelacja i regresja liniowa
Zapis prezentacji:

Wizualizacja rozkładu zmiennej z wykorzystaniem pakietu Matlab 6.5 mgr inż. Anna Tomkowska

Cel pracy Celem pracy jest przegląd podstawowych 1/12 Cel pracy Celem pracy jest przegląd podstawowych sposobów wizualizacji rozkładu zmiennej oraz ich implementacja w środowisku Matlab’a

Wykres kołowy i słupkowy [pie, bar] 2/12 Wykres kołowy i słupkowy [pie, bar] Wykres kołowy zmiennej WYKSZTAŁCENIE Rozkład częstości zmiennej WYKSZTAŁCENIE wyksztalcenie={'ogólne','zawodowe','policealne','licencjat'}; liczebnosci=[8 8 7 7]; subplot(1,2,1) wycinek = [0 0 1 1 ]; pie(liczebnosci,wycinek) legend(wyksztalcenie,3); subplot(1,2,2) bar(liczebnosci); set(gca,'ylim',[0 9],'xticklabel',wyksztalcenie) wykształcenie ogólne zawodowe policealne licencjat licz. 8 7 % 27 23

Histogram [hist] 3/12 LUB (…) dane=[55 34 72 28 55 72 … 34]; subplot(2,2,1) hist(dane,50); (…) subplot(2,2,1) [Y,X]=hist(dane,50); bar(X,Y); LUB

4/12 Wykres gęstości

Wykres gęstości [ksdensity, plot] 5/12 Wykres gęstości [ksdensity, plot] h=0.1 h=0.25 h=0.5 h=1 dane=[55 34 72 28 55 72 … 34]; [Y,X] = hist(dane, 20); (…) subplot(2,2,1) [Yksd,Xksd] = ksdensity(dane,'kernel','normal','width',0.1); hold on bar(X,Y,'b'); plot(Xksd,Yksd,'r'); hold off

Wykres skrzynkowy [boxplot] 6/12 Wykres skrzynkowy [boxplot] (…) dane=[55 34 72 28 55 72 … 34]; subplot(5,2,1) boxplot(dane ,1,’o’,0)

Wykres kwantylowy (kwantyl-kwantyl) [qqplot] 7/12 Wykres kwantylowy (kwantyl-kwantyl) [qqplot] (…) dane=[55 34 72 28 55 72 … 34]; subplot(5,2,2) qqplot(dane);

Wykres słupkowy zgrupowany kategorie={'brak','1','2','3','4 i więcej'}; legenda ={'podstawowe', 'średnie', 'wyższe'}; a=[430 320 720 580 460]; b=[280 300 440 160 70]; c=[80 100 100 30 10]; d=[a' b' c']; bar(d); set(gca,'xticklabel',kategorie); xlabel('liczba dzieci'); ylabel('wykształcenie'); legend(legenda);

Wykresy skrzynkowe zgrupowane … dane=[dane1' dane2' dane3']; boxplot(dane,0,'o',1,1.2)

Wykres rozrzutu (korelacyjny) [lsline, smooth] 2017-03-24 8/12 Wykres rozrzutu (korelacyjny) [lsline, smooth] dopasowywana jest prosta dopasowywana jest parabola daneX=[55 34 72 28 55 72 … 34]; daneY=[4 6 2 5 3 1 … 7]; subplot(2,2,1) hold on plot(daneX,daneY,’o’) lsline hold off subplot(2,2,2) hold on plot(daneX,daneY,’o’) Y = smooth(daneX,daneY,0.5,’lowess’) plot(daneX,Y,’r’,’linewidth’,2); hold off Wygładzanie metodą ważonych najmniejszych kwadratów LOWESS – dopasowanie do danych wielomianu 1-go stopnia (linia prosta) LOESS – dopasowanie do danych wielomianu 2-go stopnia (parabola)

Podstawowe funkcje statystyczne 9/12 Podstawowe funkcje statystyczne dane=[12 0 14 6 12 14 0 12 6 6 0 … 14]; srednia = mean(dane); odchylenie = std(dane); mediana = median(dane); wsp_skosnosci = skewness(dane); wsp_skupienia = kurtosis(dane);

Rozkład Weibulla Rozkład Weibulla jest często stosowany w teorii niezawodności do matematycznego modelowania rozkładu czasu bezawaryjnego użytkowania obiektu.

Rozkład Weibulla w pakiecie Matlab Generowanie próby losowej o rozkładzie Weibulla probka = wblrnd(beta,alfa,m,n); Graficzny test zgodności z rozkładem Weibulla weibplot(probka); Estymacja parametrów rozkładu Weibulla [e, uf] = wblfit(probka,1-przedzial_ufnosci); Estymacja parametrów rozkładu Weibulla [m,v] = wblstat(beta,alfa); funkcja gęstości prawdopodobieństwa gesto = wblpdf(dziedzina, beta,alfa) dziedzina=min(probka):range(probka)/n*m:max(probka); dystrybuanta dystryb = wblcdf(dziedzina,beta,alfa); niezawodność niezaw = 1 - dystryb;

Rozkład Weibulla w pakiecie Matlab

Pomocne toolbox’y w Matlab’ie 10/12 Pomocne toolbox’y w Matlab’ie disttool (przegląd f-kcji gęstości i dystrybuant popularnych rozkładów zmiennej), cftool (analizowanie danych, wykres rozrzutu, wygładzanie, dopasowywanie krzywych do danych), polytool (dopasowanie do danych wielomianu różnego stopnia ).

11/12 Podsumowanie Możliwości graficznej analizy i prezentacji danych są bardzo duże. wykres skrzynkowy i kwantylowy - dostarczają najwięcej informacji przydatnych do analitycznego badania danych, wykres słupkowy - jest niezawodny dla zmiennych o małej liczbie kategorii, histogram oraz wykres słupkowy – przydatny gdy chcemy otrzymane przez nas wyniki pokazać osobom, które nie zajmują się statystyką. Pomoc jaką w tym zakresie oferuje pakiet Matlab’a pozwala na pominięcie długotrwałych i żmudnych obliczeń, co oszczędza czas oraz wyklucza błędy obliczeń.

Literatura G. Wieczorkowska: 12/12 Literatura G. Wieczorkowska: „Statystyka. Wprowadzenie do analizy danych sondażowych i eksperymentalnych” Sholar 2005 B. Mrozek, Z. Mrozek: „Matlab 5.x. Simulink 2.x. Poradnik użytkownika” PLJ 1998