Wizualizacja rozkładu zmiennej z wykorzystaniem pakietu Matlab 6.5 mgr inż. Anna Tomkowska
Cel pracy Celem pracy jest przegląd podstawowych 1/12 Cel pracy Celem pracy jest przegląd podstawowych sposobów wizualizacji rozkładu zmiennej oraz ich implementacja w środowisku Matlab’a
Wykres kołowy i słupkowy [pie, bar] 2/12 Wykres kołowy i słupkowy [pie, bar] Wykres kołowy zmiennej WYKSZTAŁCENIE Rozkład częstości zmiennej WYKSZTAŁCENIE wyksztalcenie={'ogólne','zawodowe','policealne','licencjat'}; liczebnosci=[8 8 7 7]; subplot(1,2,1) wycinek = [0 0 1 1 ]; pie(liczebnosci,wycinek) legend(wyksztalcenie,3); subplot(1,2,2) bar(liczebnosci); set(gca,'ylim',[0 9],'xticklabel',wyksztalcenie) wykształcenie ogólne zawodowe policealne licencjat licz. 8 7 % 27 23
Histogram [hist] 3/12 LUB (…) dane=[55 34 72 28 55 72 … 34]; subplot(2,2,1) hist(dane,50); (…) subplot(2,2,1) [Y,X]=hist(dane,50); bar(X,Y); LUB
4/12 Wykres gęstości
Wykres gęstości [ksdensity, plot] 5/12 Wykres gęstości [ksdensity, plot] h=0.1 h=0.25 h=0.5 h=1 dane=[55 34 72 28 55 72 … 34]; [Y,X] = hist(dane, 20); (…) subplot(2,2,1) [Yksd,Xksd] = ksdensity(dane,'kernel','normal','width',0.1); hold on bar(X,Y,'b'); plot(Xksd,Yksd,'r'); hold off
Wykres skrzynkowy [boxplot] 6/12 Wykres skrzynkowy [boxplot] (…) dane=[55 34 72 28 55 72 … 34]; subplot(5,2,1) boxplot(dane ,1,’o’,0)
Wykres kwantylowy (kwantyl-kwantyl) [qqplot] 7/12 Wykres kwantylowy (kwantyl-kwantyl) [qqplot] (…) dane=[55 34 72 28 55 72 … 34]; subplot(5,2,2) qqplot(dane);
Wykres słupkowy zgrupowany kategorie={'brak','1','2','3','4 i więcej'}; legenda ={'podstawowe', 'średnie', 'wyższe'}; a=[430 320 720 580 460]; b=[280 300 440 160 70]; c=[80 100 100 30 10]; d=[a' b' c']; bar(d); set(gca,'xticklabel',kategorie); xlabel('liczba dzieci'); ylabel('wykształcenie'); legend(legenda);
Wykresy skrzynkowe zgrupowane … dane=[dane1' dane2' dane3']; boxplot(dane,0,'o',1,1.2)
Wykres rozrzutu (korelacyjny) [lsline, smooth] 2017-03-24 8/12 Wykres rozrzutu (korelacyjny) [lsline, smooth] dopasowywana jest prosta dopasowywana jest parabola daneX=[55 34 72 28 55 72 … 34]; daneY=[4 6 2 5 3 1 … 7]; subplot(2,2,1) hold on plot(daneX,daneY,’o’) lsline hold off subplot(2,2,2) hold on plot(daneX,daneY,’o’) Y = smooth(daneX,daneY,0.5,’lowess’) plot(daneX,Y,’r’,’linewidth’,2); hold off Wygładzanie metodą ważonych najmniejszych kwadratów LOWESS – dopasowanie do danych wielomianu 1-go stopnia (linia prosta) LOESS – dopasowanie do danych wielomianu 2-go stopnia (parabola)
Podstawowe funkcje statystyczne 9/12 Podstawowe funkcje statystyczne dane=[12 0 14 6 12 14 0 12 6 6 0 … 14]; srednia = mean(dane); odchylenie = std(dane); mediana = median(dane); wsp_skosnosci = skewness(dane); wsp_skupienia = kurtosis(dane);
Rozkład Weibulla Rozkład Weibulla jest często stosowany w teorii niezawodności do matematycznego modelowania rozkładu czasu bezawaryjnego użytkowania obiektu.
Rozkład Weibulla w pakiecie Matlab Generowanie próby losowej o rozkładzie Weibulla probka = wblrnd(beta,alfa,m,n); Graficzny test zgodności z rozkładem Weibulla weibplot(probka); Estymacja parametrów rozkładu Weibulla [e, uf] = wblfit(probka,1-przedzial_ufnosci); Estymacja parametrów rozkładu Weibulla [m,v] = wblstat(beta,alfa); funkcja gęstości prawdopodobieństwa gesto = wblpdf(dziedzina, beta,alfa) dziedzina=min(probka):range(probka)/n*m:max(probka); dystrybuanta dystryb = wblcdf(dziedzina,beta,alfa); niezawodność niezaw = 1 - dystryb;
Rozkład Weibulla w pakiecie Matlab
Pomocne toolbox’y w Matlab’ie 10/12 Pomocne toolbox’y w Matlab’ie disttool (przegląd f-kcji gęstości i dystrybuant popularnych rozkładów zmiennej), cftool (analizowanie danych, wykres rozrzutu, wygładzanie, dopasowywanie krzywych do danych), polytool (dopasowanie do danych wielomianu różnego stopnia ).
11/12 Podsumowanie Możliwości graficznej analizy i prezentacji danych są bardzo duże. wykres skrzynkowy i kwantylowy - dostarczają najwięcej informacji przydatnych do analitycznego badania danych, wykres słupkowy - jest niezawodny dla zmiennych o małej liczbie kategorii, histogram oraz wykres słupkowy – przydatny gdy chcemy otrzymane przez nas wyniki pokazać osobom, które nie zajmują się statystyką. Pomoc jaką w tym zakresie oferuje pakiet Matlab’a pozwala na pominięcie długotrwałych i żmudnych obliczeń, co oszczędza czas oraz wyklucza błędy obliczeń.
Literatura G. Wieczorkowska: 12/12 Literatura G. Wieczorkowska: „Statystyka. Wprowadzenie do analizy danych sondażowych i eksperymentalnych” Sholar 2005 B. Mrozek, Z. Mrozek: „Matlab 5.x. Simulink 2.x. Poradnik użytkownika” PLJ 1998