Wykład 1 dr Małgorzata Radziukiewicz Statystyka Wykład 1 dr Małgorzata Radziukiewicz
Co to jest statystyka ? Statystykę rozumiemy jako dane ilościowe o zjawiskach w różnych dziedzinach rzeczywistości. Statystyka jest nauką o metodach badania zjawisk masowych. Zatem teorię statystyki lub, krócej statystykę rozumiemy jako naukę wyjaśniającą metody statystyczne.
Historia statystyki Słowo „statystyka”, „statystyk”, „statystyczny” w ich obecnym znaczeniu liczą zaledwie sto lat. Słowo „statystyka” pochodzi od łacińskiego status, oznaczającym stan państwa. Początki gałęzi wiedzy, zwanej statystyką, sięgają XVI wieku. Włochów, których zadaniem było opisanie stanu państwa (włoskie stato) za pomocą liczb nazywano statiti, a pracę, którą wykonywali statystyką. Statystyka – rozumiana jako metoda liczbowego opisu stanu państwa, rozwinęła się dopiero w XVII i XVIII wieku, głównie w Niemczech i Anglii.
Najwcześniejszy znany fakt użycia słowa „statystyka” znajdujemy w książce pruskiego barona Jacoba Friedricha von Bielfelda „The Elements of Universal Erudition”(1770). Rozdział Statystyka zawiera definicję tego przedmiotu : „...nauka, która uczy nas , jaki jest polityczny układ wszystkich współczesnych państw w świecie...” Książka niemieckiego geografa i zoologa Eberharda Augusta Wilhelma von Zimmermanna „A Political Survey of the Present State of Europe“ (1787), zawiera szerszą definicję statystyki “…gałąź wiedzy politycznej, której przedmiotem jest aktualna i relatywna siła licznych współczesnych państw, siła wynikająca z ich naturalnych warunków, przemysłu i cywilizacji ich obywateli oraz mądrości ich rządów...”
Sir John Sinclair (1754-1835) angielski ekonomista i agronom, założyciel i pierwszy prezes angielskiego urzędu do spraw rolnictwa, wydawca i organizator pierwszego rachunku statystycznego Szkocji (1791-99). W liście do duchownych Kościoła Szkocji (1790) wyjaśnia, że w Niemczech „..badania statystyczne ....są prowadzone na bardzo szeroką skalę” i dodaje iż badania statystyczne dotyczą „...ludności, warunków politycznych, produkcji kraju i innych spraw państwa..” W swojej pionierskiej 21 tomowej pracy „Statistical Accounts of Scotland” jako pierwszy użył słowa statystyka w języku angielskim
W ciągu pierwszych lat 19-tego wieku trwał nieprzerwanie rozrost danych oficjalnych, a zestawienia liczbowe zaczęły zastępować wcześniejsze opisy słowne. „Statystyka” stopniowo przyjmowała węższy sens - zaczęto ją pojmować jako przedstawienie charakterystyk państwa za pomocą metod numerycznych (ilościowych). Z biegiem czasu metody opracowane dla potrzeb analizy stanu państwa wykorzystywano do analizy różnego rodzaju danych. W ten sposób powstała dziedzina wiedzy zwana statystyka opisową.
W okresie, gdy powstawały metody statystyki opisowej, rozwijana była równolegle metodologia rachunku prawdopodobieństwa. Matematycy: Pascal (1623-1662), James Bernoulli (1654-1705), Abraham De Moivre (1667- 1754), Laplace (1749-1827), Gaus (1777-1855), Joseph Louis Lagrange (1736-1813), Leonhard Euler (1707-1783) wnieśli ogromny wkład do rozwoju teorii prawdopodobieństwa. Połączenie tych dwóch dziedzin wiedzy zaowocowało powstaniem statystyki matematycznej, zwanej czasami teorią wnioskowania statystycznego.
W końcu 19-tego wieku następuje dalsza przemiana znaczenia słowa „statystyka”. Od nazwy nauki przeniesiono termin na oznaczenie danych, którymi ta nauka się zajmuje. Następnie termin „statystyka” zostaje użyty do podobnych danych liczbowych występujących w innych naukach (m.in. antropologii i meteorologii). W roku 1834 utworzono Królewskie Towarzystwo Statystyczne (Royal Statistical Society) W latach 1838-39 wydano pierwszy tom czasopisma „The Journal of the Royal Statistical Society” Od roku 1885 działa Międzynarodowy Instytut Statystyczny z siedzibą w Hadze.
Statystyka, nauka zajmująca się metodami badania przedmiotów lub zjawisk masowych w przestrzeni lub w czasie i ich ilościową lub jakościową analizą z punktu widzenia nauki do której należą. (Encyklopedia Powszechna PWN, W-wa, 1987)
statystykę opisową (elementarną) statystykę matematyczną W statystyce wyodrębnia się dwa działy: statystykę opisową (elementarną) statystykę matematyczną
zajmuje się metodami gromadzenia danych statystycznych, (zbiorowości statystyczne), prezentacji danych statystycznych ( w sposób tabelaryczny i graficzny), sumarycznego opisu danych statystycznych (za pomocą parametrów statystycznych) Statystyka opisowa
Statystyka matematyczna zajmuje się metodami poznania własności rozkładu jednej lub kilku cech w zbiorowości statystycznej (populacji generalnej) na podstawie zbadania części tej zbiorowości (zwanej próbą lub próbką), wybranej w sposób losowy Statystyka matematyczna
W statystyce matematycznej wyróżnia się dwa działy: teorię estymacji, teorię weryfikacji hipotez statystycznych
analiza współzależności Najczęściej stosowanymi metodami w statystyce matematycznej są: analiza wariancji to technika postępowania statystycznego stosowana przy badaniu systematycznego wpływu danych czynników na przypadkowe wyniki. Analiza wariancji dostarcza kryteriów pozwalających rozstrzygać czy dane uzyskane z obserwacji przeprowadzonego eksperymentu można uznać za przypadkowe, czy należy je uznać za odchylenia systematyczne. analiza współzależności to jednoczesne badanie populacji ze względu na dwie lub więcej cech (analiza regresji i analiza korelacji) metoda reprezentacyjna wyznacza charakterystyki badanej zbiorowości statystycznej bez statystycznego opracowywania całej zbiorowości, lecz na podstawie danych z próby (z reprezentacji).
Przedmiotem statystyki jest populacja generalna zwana też zbiorowością statystyczną populacja generalna = zbiorowość statystyczna = zbiór jednostek (elementów zbiorowości)
1. Populacja generalna musi być w sposób jednoznaczny określona. Pytania o przedmiot badania gospodarstwa domowe co? miejscowość, województwo, kraj gdzie? moment czasu kiedy?
Cecha statystyczna to właściwość pozwalająca odróżnić 2. Mając w sposób jednoznaczny określoną populację generalną należy następnie odpowiedzieć jakie własności lub cechy będą nas w badaniu interesowały Cecha statystyczna to właściwość pozwalająca odróżnić jednostki zbiorowości cechy o charakterze jakościowym (niemierzalna): - płeć, zawód, wykształcenie, źródło utrzymania, typ rodziny biologicznej, dział zatrudnienia, sektor zatrudnienia głowy gospodarstwa domowego, itp. wyrażana słownie lub za pomocą symboli cechy o charakterze ilościowym (mierzalna): - wiek, liczba osób w gospodarstwie domowym, liczba osób bezrobotnych, liczba osób pracujących, dochód rozporządzalny gospodarstwa, wydatki gospodarstwa domowego, wydatki na żywność, itp. cecha mierzalna jest zmienną bowiem przyjmuje różne wartości liczbowe cechy statystyczne występujące w różnych wariantach
Uwaga!!! Cechy statystyczne występują w różnych wariantach, a więc poszczególne jednostki (jeśli nie wszystkie) różnią się między sobą z punktu widzenia poszczególnych cech. Statystyka interesują wyłącznie zbiorowości, w których występuje zmienność, tzn. występowanie różnic między poszczególnymi jednostkami ze względu na rozpatrywane cechy
populacja próbna = próba = część badanej populacji 1. Liczba jednostek wchodzących w skład zbiorowości statystycznej może być skończona lub nieskończona. 2. W przypadku, gdy zbadanie całej populacji jest niemożliwe lub zbyt kosztowne, badamy część populacji (tzw. próbę) i na tej podstawie oceniamy całą populację populacja próbna = próba = część badanej populacji
Etapy badania statystycznego
Etapy badania statystycznego Obserwacja statystyczna Opracowanie materiału statystycznego Opis Wnioskowanie statystyczne
1. Obserwacja statystyczna - zebranie informacji o jednostkach zbiorowości statystycznej podlegającej badaniu obserwacja całkowita (pełna ,kompletna, wyczerpująca) – np. sprawozdawczość statystyczna, powszechny spis ludności, obserwacja częściowa (reprezentatywna, niewyczerpująca, niepełna, niekompletna) –np. badania budżetów gospodarstw domowych, reprezentacyjne spisy rolne htpp/www.stat.gov.pl
2. Opracowanie materiału statystycznego (opis) – uporządkowanie zebranych informacji, tak by w sposób syntetyczny i przystępny pozwalały na zapoznanie się z podstawowymi własnościami badanej populacji klasyfikacja (grupowanie), a więc dobór odpowiednich cech i właściwe przyporządkowanie poszczególnym wartościom cech liczebności tablice statystyczne metody graficzne (wykresy)
3. Opis – obliczenie charakterystyk opisowych badanej populacji - charakterystyki obliczone dla populacji generalnej noszą nazwę parametrów - charakterystyki obliczone dla populacji próbnej noszą nazwę statystyk - przeprowadzenie znaczenia uzyskanych wartości parametrów
4. Wnioskowanie statystyczne – na podstawie zbadania populacji próbnej wyciąganie wniosków o własnościach całej populacji generalnej, z której pochodzi próba. W metodach wnioskowania zakłada się, że elementy populacji próbnej wybrane są: - w sposób celowy – tzn. polegający na świadomym typowaniu jednostek statystycznego badania do próby - w sposób losowy z populacji generalnej
Losowy dobór próby oznacza iż: każda jednostka populacji generalnej ma dodatnie znane prawdopodobieństwo znalezienia się w próbie istnieje możliwość ustalenia prawdopodobieństwa znalezienia się w próbie dla każdego elementu populacji Występują najróżniejsze (schematy) sposoby losowania