STATYSTYKA MATEMATYCZNA wykład 1 - wprowadzenie Dr Aldona Migała-Warchoł.

Slides:



Advertisements
Podobne prezentacje
Analiza współzależności
Advertisements

Analiza współzależności
Proces doboru próby. Badana populacja – (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje.
Równowaga chemiczna - odwracalność reakcji chemicznych
Plan Czym się zajmiemy: 1.Bilans przepływów międzygałęziowych 2.Model Leontiefa.
Ekonometria stosowana WYKŁAD 4 Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Zarządzanie Zmianą Sesja 3 Radzenie sobie z ludzkimi aspektami zmiany: opór.
Tworzenie odwołania zewnętrznego (łącza) do zakresu komórek w innym skoroszycie Możliwości efektywnego stosowania odwołań zewnętrznych Odwołania zewnętrzne.
Próba rozciągania metali Wg normy: PN-EN ISO :2010 Metale Próba rozciągania Część 1: Metoda badania w temperaturze pokojowej Politechnika Rzeszowska.
STATYSTYKA – kurs podstawowy wykład 1 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
Teoria gry organizacyjnej Każdy człowiek wciąż jest uczestnikiem wielu różnych gier. Teoria gier zajmuje się wyborami podejmowanymi przez ludzi w warunkach.
Analiza rozkładu empirycznego dr Marta Marszałek Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium.
Umowy Partnerskie w projektach zbiór najważniejszych składników Uwaga! Poniżej znajdują się jedynie praktyczne wskazówki dotyczące tworzenia umów. Dokładne.
© Kazimierz Duzinkiewicz, dr hab. inż. Katedra Inżynierii Systemów Sterowania 1 Metody optymalizacji - Energetyka 2015/2016 Metody programowania liniowego.
© Matematyczne modelowanie procesów biotechnologicznych - laboratorium, Studium Magisterskie Wydział Chemiczny Politechniki Wrocławskiej, Kierunek Biotechnologia,
ZASTOSOWANIE FUNKCJI WYKŁADNICZEJ I LOGARYTMICZNEJ DO OPISU RUCHU DRGAJĄCEGO Agnieszka Wlocka Agnieszka Szota.
Ekonometria stosowana Autokorelacja Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Niepewności pomiarowe. Pomiary fizyczne. Pomiar fizyczny polega na porównywaniu wielkości mierzonej z przyjętym wzorcem, czyli jednostką. Rodzaje pomiarów.
Ćwiczenia Zarządzanie Ryzykiem Renata Karkowska, ćwiczenia „Zarządzanie ryzykiem” 1.
Ekonometria Wykład 1 Uwarunkowania modelowania ekonometrycznego. Uogólniona metoda najmniejszych kwadratów dr hab. Mieczysław Kowerski.
Cel analizy statystycznej. „Człowiek –najlepsza inwestycja”
Wyrażenia Algebraiczne Bibliografia Znak 1Znak 2 Znak 3 Znak 4 Znak 5 Znak 6 Znak 7 Znak 8 Znak 9 Znak 10 Znak 11.
Połączenie towarzystw budownictwa społecznego Opracowano w BNW UMP 2008.
 Czasem pracy jest czas, w którym pracownik pozostaje w dyspozycji pracodawcy w zakładzie pracy lub w innym miejscu wyznaczonym do wykonywania pracy.
Ryzyko a stopa zwrotu. Standardowe narzędzia inwestowania Analiza fundamentalna – ocena kondycji i perspektyw rozwoju podmiotu emitującego papiery wartościowe.
Podstawowe pojęcia termodynamiki chemicznej -Układ i otoczenie, składniki otoczenia -Podział układów, fazy układu, parametry stanu układu, funkcja stanu,
Klasyczny model regresji liniowej (KMRL) Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa.
Analiza wariancji (ANOVA) Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie.
Podział wartości dodanej Michał Lewandowski, Szkoła Główna Handlowa, Główny Urząd Statystyczny Maciej Banaś, Ministerstwo Rodziny, Pracy i Polityki Społecznej.
Wyniki badania - Infolinia jako kanał komunikacji z klientem Aby zobaczyć prezentację badania należy wybrać przycisk F5. Poruszanie się pomiędzy.
Zmienne losowe Zmienne losowe oznacza się dużymi literami alfabetu łacińskiego, na przykład X, Y, Z. Natomiast wartości jakie one przyjmują odpowiednio.
… przemy ś lenia pedagogiczne. „Najważniejszym okresem w życiu nie są lata studiowania na wyższej uczelni, ale te najwcześniejsze, czyli okres od narodzenia.
Kontrakty terminowe na indeks mWIG40 Prezentacja dla inwestorów Giełda Papierów Wartościowych w Warszawie S.A. Dział Notowań GPW kwiecień 2005.
BYĆ PRZEDSIĘBIORCZYM - nauka przez praktykę Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego.
Analiza tendencji centralnej „Człowiek – najlepsza inwestycja”
Funkcja liniowa Przygotował: Kajetan Leszczyński Niepubliczne Gimnazjum Przy Młodzieżowym Ośrodku Wychowawczym Księży Orionistów W Warszawie Ul. Barska.
© Prof. Antoni Kozioł, Wydział Chemiczny Politechniki Wrocławskiej MATEMATYCZNE MODELOWANIE PROCESÓW BIOTECHNOLOGICZNYCH Prezentacja – 4 Matematyczne opracowywanie.
STATYSTYKA – kurs podstawowy wykład 10 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
ANALIZA DANYCH DO OPRACOWANIA MAP TEMATYCZNYCH HALINA KLIMCZAK INSTYTUT GEODEZJI I GEOINFORMATYKI UNIWERSYTET PRZYRODNICZY WE WROCŁAWIU.
W KRAINIE TRAPEZÓW. W "Szkole Myślenia" stawiamy na umiejętność rozumowania, zadawania pytań badawczych, rozwiązywania problemów oraz wykorzystania wiedzy.
Metoda kartogramów. Definicja Metoda służy do przedstawiania średniej intensywności zjawiska w granicach określonych pól odniesienia. Wartości obliczane.
RAPORT Z BADAŃ opartych na analizie wyników testów kompetencyjnych przeprowadzonych wśród uczestników szkoleń w związku z realizacją.
KOSZTY W UJĘCIU ZARZĄDCZYM. POJĘCIE KOSZTU Koszt stanowi wyrażone w pieniądzu celowe zużycie majątku trwałego i obrotowego, usług obcych, nakładów pracy.
Metody Analizy Danych Doświadczalnych Wykład 9 ”Estymacja parametryczna”
Skuteczności i koszty windykacji polubownej Wyniki badań zrealizowanych w ramach grantu Narodowego Centrum Nauki „Ocena poziomu rzeczywistej.
BADANIA STATYSTYCZNE. WARUNKI BADANIA STATYSTYCZNEGO musi dotyczyć zbiorowościstatystycznej musi określać prawidłowościcharakteryzujące całą zbiorowość.
Matematyka przed egzaminem czyli samouczek dla gimnazjalisty Przygotowała Beata Czerniak FUNKCJE.
Menu Jednomiany Wyrażenia algebraiczne -definicja Mnożenie i dzielenie sum algebraicznych przez jednomian Mnożenie sum algebraicznych Wzory skróconego.
POLITECHNIKA RZESZOWSKA im. Ignacego Łukasiewicza WYDZIAŁ ELEKTROTECHNIKI I INFORMATYKI ZAKŁAD METROLOGII I SYSTEMÓW POMIAROWYCH METROLOGIA Andrzej Rylski.
Optymalna wielkość produkcji przedsiębiorstwa działającego w doskonałej konkurencji (analiza krótkookresowa) Przypomnijmy założenia modelu doskonałej.
Metody sztucznej inteligencji - Technologie rozmyte i neuronowe 2015/2016 Perceptrony proste nieliniowe i wielowarstwowe © Kazimierz Duzinkiewicz, dr hab.
# Analiza cech taksacyjnych drzewostanów przy wykorzystaniu technologii LIDAR 1 15 Sep 2010 Analiza cech taksacyjnych drzewostanów przy wykorzystaniu technologii.
Definiowanie i planowanie zadań typu P 1.  Planowanie zadań typu P  Zadania typu P to zadania unikalne służące zwykle dokonaniu jednorazowej, konkretnej.
Zmienna losowa dwuwymiarowa Dwuwymiarowy rozkład empiryczny Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych.
1 Definiowanie i planowanie zadań budżetowych typu B.
Renata Maciaszczyk Kamila Kutarba. Teoria gier a ekonomia: problem duopolu  Dupol- stan w którym dwaj producenci kontrolują łącznie cały rynek jakiegoś.
Budżetowanie kapitałowe cz. III. NIEPEWNOŚĆ senesu lago NIEPEWNOŚĆ NIEMIERZALNA senesu strice RYZYKO (niepewność mierzalna)
Statystyka Wykłady dla II rok Geoinformacji rok akademicki 2012/2013
Test analizy wariancji dla wielu średnich – klasyfikacja pojedyncza
System wspomagania decyzji DSS do wyznaczania matematycznego modelu zmiennej nieobserwowalnej dr inż. Tomasz Janiczek.
Liczby pierwsze.
Pojedyńczy element, mała grupa
Małgorzata Podogrodzka, SGH ISiD
FORMUŁOWANIE HIPOTEZ STATYSTYCZNYCH
REGRESJA WIELORAKA.
WYBRANE ZAGADNIENIA PROBABILISTYKI
Zapis prezentacji:

STATYSTYKA MATEMATYCZNA wykład 1 - wprowadzenie Dr Aldona Migała-Warchoł

Warunkiem zaliczenia przedmiotu jest uzyskanie co najmniej połowy punktów z zaliczenia wykładu. Zaliczenie to przeprowadzone zostanie w formie pisemnej (zadania). Liczba punktów decyduje o ocenie:  pkt. – ndst  pkt. – dst  pkt. – + dst  pkt. – db  pkt. – + db  pkt. – bdb Warunki zaliczenia przedmiotu

Statystyka to nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska masowe. Statystyka matematyczna zajmuje się metodami wnioskowania o całej zbiorowości generalnej na podstawie badania jej części losowej, zwanej próbą. STATYSTYKA

a)umożliwia dokładniejszy sposób opisu interesującej nas rzeczywistości, b) umożliwia formułowanie uogólnień na podstawie uzyskanych wyników analizy, c) pozwala na przewidywanie rozwoju zjawisk w przyszłości, czyli pobudza do prognoz, d) dostarcza narzędzi do porządkowania informacji o zjawiskach. Statystyka:

Chcemy poznać średnią płacę (w zł) siedmiu osób, które zatrudnione są w określonym dziale danej firmy: 1000; 1500; 1200; 1200; 1200; 1100; zł Czy obliczenie wartości średniej arytmetycznej w taki właśnie sposób oddaje istotę analizowanego problemu? Przykłady zastosowań statystyki

Zmiana skali na osiach układu współrzędnych powoduje drastyczne zmiany w ocenie przebiegu funkcji: Przykłady te pokazują, że statystyka w rękach szarlatanów jest niebezpieczna. Trzeba pamiętać, że wyniki wszelkich obliczeń zawsze należy łączyć ze zdrowym rozsądkiem.

Miary statystyczne można podzielić na następujące kategorie: Miary położenia – służą m.in. do określania wartości zmiennej, wokół której skupiają się pozostałe wartości zmiennej. W tej kategorii szczególnie ważne są miary tendencji centralnej, nazywane miarami przeciętnymi. Poniżej przykład rozkładu dwóch zmiennych różniących się wartościami średnimi.

Miary zmienności – służą analizie stopnia zróżnicowania wartości zmiennej. Miary zmienności wskazują, czy część lub większość obserwacji jest skoncentrowana wokół wartości centralnej, czy też są one rozproszone. Poniżej przykład rozkładu dwóch zmiennych różniących się wartością miar zmienności.

Miary asymetrii – służą ocenie stopnia skośności wartości zmiennej. Poniżej przykład rozkładu dwóch zmiennych różniących się skośnością. Miary koncentracji – służą do badania nierównomierności rozkładu ogólnej sumy wartości zmiennej pomiędzy poszczególne jednostki zbiorowości.

Zbiorowość statystyczna, nazywana też populacją statystyczną - zbiór elementów (osób, przedmiotów, zdarzeń) podobnych, lecz nie identycznych pod względem określonej cechy, poddanych badaniom statystycznym. PODSTAWOWE POJĘCIA STATYSTYKI

Element zbiorowości statystycznej (populacji statystycznej) jest nazywany jednostką statystyczną. Liczba jednostek statystycznych, czyli elementów zbiorowości, jest nazywana liczebnością zbiorowości. PODSTAWOWE POJĘCIA STATYSTYKI

Badanie statystyczne to proces pozyskiwania danych na temat rozkładu cechy statystycznej w populacji. Badanie może mieć charakter: pełny - badanie obejmuje całą populację częściowy - odbywa się na pewnych (zazwyczaj losowo) wybranych elementach populacji, czyli próbie losowej, zazwyczaj reprezentatywnej dla populacji BADANIE STATYSTYCZNE

Schemat badania statystycznego obejmuje następujące kroki: Krok 1. projektowanie BADANIA, Krok 2. gromadzenie materiału statystycznego, Krok 3. opracowanie materiału statystycznego, Krok 4. analiza statystyczna. CEL, PRZEDMIOT I SCHEMAT BADAŃ STATYSTYCZNYCH

PRÓBA Próba jest to każdy niepusty podzbiór zbiorowości generalnej, który poddawany jest badaniu i który stanowi podstawę do formułowania wniosków o całej zbiorowości generalnej. Warunkiem formułowania znaczących wniosków w odniesieniu do całej zbiorowości generalnej jest reprezentatywność próby. Reprezentatywność próby oznacza, że powinna ona stanowić swego rodzaju miniaturę zbiorowości generalnej, zachowującą wszystkie własności jej struktury.

Przyjmuje się, że dla zapewnienia reprezentatywności próby wystarczy, aby była ona losowa i dostatecznie liczna. Próba jest losowa wówczas, gdy każdy element zbiorowości generalnej ma jednakową szansę trafienia do próby. Oszacowania parametrów zbiorowości generalnej uzyskiwane na podstawie badania próby są tym dokładniejsze im liczniejsza jest próba.

Cel badania jest możliwy do osiągnięcia wówczas, gdy jednostki statystyczne są precyzyjnie określone pod względem: -rzeczowym (przedmiot badań), -przestrzennym (miejsce badań), -czasowym (okres badań).

Ostatecznym celem stosowania metod statystycznych jest otrzymanie użytecznych informacji na temat zjawiska, którego dotyczą. Istotne jest, aby badania statystyczne były zaplanowane w sposób nie budzący zastrzeżeń. Ich cel powinien być określony zrozumiale i szczegółowo. Materiał statystyczny powinien zaś być wiarygodny i przejrzysty.

Cecha statystyczna (nazywana też zmienną) to właściwość elementów zbiorowości statystycznej będąca przedmiotem badania statystycznego. CECHA STATYSTYCZNA

Cecha statystyczna Klasyfikacja cech statystycznych ilościowa (mierzalna) wyrażone za pomocą liczb jakościowa (niemierzalna) wyrażona w sposób opisowy. skokowa przyjmuje skończoną lub przeliczalną liczbę wartości ciągła - może przyjąć każdą wartość z określonego przedziału liczbowego

Zbiorowość statystyczna Klasyfikacja zbiorowości statystycznych Skończona Ma skończoną liczbę jednostek; np. 50 firm farmaceutycznych Nieskończona Ma nieskończona lub niemożliwą do ustalenia liczbę jednostek statystycznych; Np. zbiorowość mikroorganizmów, klienci odwiedzający centrum handlowe

Zbiorowość statystyczna Klasyfikacja zbiorowości statystycznych Jednowymiarowa badana ze względu na jedną cechę np. firmy farmaceutyczne badane ze względu na wielkość obrotów Wielowymiarowa badana jednocześnie ze względu na kilka cech np. firmy farmac. w których badamy zależność wielkości obrotów od liczby przedstawicieli handlowych

Zbiorowość statystyczna Klasyfikacja zbiorowości statystycznych Względnie jednorodna Jej podzbiorowości mało różnią się własnościami np. zbiorowość gospodarstw 2 – osobowych badana ze względu na tygodniowe wydatki na żywność Niejednorodna Jej podzbiorowości wyraźnie różnią się własnościami np. zbiorowość gospodarstw o różnej wielkości badana ze względu na tygodniowe wydatki na żywność

Zbiorowość statystyczna Klasyfikacja zbiorowości statystycznych Statyczna Wszystkie jednostki statystyczne pochodzą z tego samego okresu np. firmy farmaceutyczne zarejestrowane we wrześniu 2012 r., spółki na giełdzie notowane r. Dynamiczna Jednostki statystyczne pochodzą z różnych okresów np. kolejne sesje giełdowe w październiku 2012 r.

Analiza współzależności Współczynnik korelacji liniowej Pearsona Współczynnik korelacji rang Spearmana Analiza zależności Liniowa funkcja regresji

Zależność przyczynowa Zależność przyczynowa – rodzaj zależności, w której jesteśmy w stanie wskazać, która ze zmiennych stanowi przyczynę zmian, a która ilustruje skutek. Przykładem zależności przyczynowej może być związek pomiędzy stażem pracy (przyczyna) i wysokością zarobków (skutek).

Zależność pozorna Zależność pozorna – pomiędzy dwoma zjawiskami wydaje się istnieć zależność, ale jest ona wywołana istnieniem wspólnej przyczyny. Przykładowo waga i poziom cholesterolu w organizmie wydają się być powiązane ze sobą, niemniej jednak jest to zależność pozorna. W rzeczywistości posiadają wspólną przyczynę – ilość i rodzaj spożywanych produktów.

Zmienna niezależna (zmienna X) – zmienna która wywołuje zmiany, stanowi ich przyczynę. Zmienna zależna (zmienna Y) – zmienna, której wartości są w mniejszym lub większym stopniu kształtowane przez zmienną niezależną (zmienne niezależne). Wykres korelacyjny (rozrzutu) – dla każdego i-tego przypadku nanosimy na układ współrzędnych punkt o współrzędnych (X i, Y i ), gdzie Xi i Yi to kolejne wartości badanych zmiennych.

Kowariancja to miara natężenia współzależności dwóch cech. Znak kowariancji informuje o charakterze współzależności – dodatni oznacza zgodne kierunki zmian, ujemny – kierunki zmian przeciwne. Kowariancja

Przykład Dla sześciu studentów zmierzono czas pisania egzaminu oraz uzyskaną liczbę punktów. Obliczenia rozpoczynamy od ustalenia średnich dla zmiennej X (czas pisania) oraz Y (liczba punktów):

Współczynnik korelacji liniowej r Współczynnik korelacji liniowej r przyjmuje wartości z przedziału. Gdy r = 0, oznacza to, że cechy nie są skorelowane. O doskonałej współzależności między cechami mówimy wówczas, gdy r przyjmuje wartość „-1” (korelacja doskonała ujemna) lub „1” (korelacja doskonała dodatnia).

Współczynnik korelacji liniowej Pearsona Współczynnik korelacji liniowej Pearsona przyjmuje wartości z przedziału od -1 do +1. Jeżeli współczynnik korelacji liniowej wynosi: mniej niż 0,2 to brak związku liniowego między badanymi zmiennymi, 0,2 – 0,4 zależność liniowa wyraźna, lecz niska, 0,4 – 0,7 zależność umiarkowana, 0,7 – 0,9 zależność znacząca, powyżej 0,9 zależność bardzo silna. Analogicznie interpretujemy wartości współczynnika mniejsze od zera, z tą różnicą, że wówczas mamy do czynienia z ujemną zależnością.

Współczynnik korelacji rang Spearmana służy do opisu siły korelacji dwóch cech, w przypadku gdy: Cechy są mierzalne, a badana zbiorowość jest nieliczna. Cechy mają charakter jakościowy i istnieje możliwość ich uporządkowania. Współczynnik korelacji rang Spearmana stosuje się do analizy współzależności obiektów pod względem cechy dwuwymiarowej (X, Y).

Kolejne etapy wyznaczania współczynnika korelacji rang Spearmana są następujące: 1.Jednostki danej zbiorowości statystycznej, ze względu na wielkość odpowiadającej im pierwszej cechy, porządkuje się. 2.Tak uporządkowanym ze względu na pierwszą cechę jednostkom, przypisuje się kolejne numery począwszy od 1. Jeżeli kilka jednostek ma tę samą wielkość cechy, wtedy z odpowiadających im kolejnych rang oblicza się średnią arytmetyczną i przydziela wszystkim jednostkom, z których ta średnia została obliczona. Następna jednostka otrzymuje już najbliższą, niewykorzystaną dotąd rangę. Ostatni numer powinien równać się łącznej liczbie jednostek. 3.Następnie dla jednostek drugiej cechy w analogiczny sposób przypisuje się numery począwszy od 1 (dla jednostki o najniższej lub najwyższej wartości).

Wzór na współczynnik korelacji rang Spearmana jest następujący: gdzie: d i = r 1i – r 2i, r 1i – ranga i-tego obiektu w pierwszym uporządkowaniu, r 2i – ranga i-tego obiektu w drugim uporządkowaniu, n – liczba badanych obiektów. Współczynnik korelacji rang Spearmana przyjmuje wartości z przedziału. Im bliższy jest on liczbie 1 lub -1, tym silniejsza jest analizowana zależność.

Warto zauważyć, że czas pisania dla studentów 5 i 6 jest taki sam i wynosi 45 minut. Jest to trzeci i czwarty czas pisania egzaminu, w związku z czym przypisujemy jednakowe rangi stanowiące średnią arytmetyczną wartości 3 i 4. Student Czas pisania egzaminu (ranga r 1i ) Liczba uzyskanych punktów (ranga r 2i ) Różnica rang d i = r 1i -r 2i Różnica rang podniesiona do kwadratu d i ,530,50,25 53,54-0,50, Suma68,5

Obliczoną sumę kwadratów różnic podstawiamy do wzoru: Współczynnik równy świadczy o istnieniu bardzo wyraźnej negatywnej zależności pomiędzy czasem pisania egzaminu a ilością punktów. Im student dłużej pisze, tym statystycznie rzec biorąc otrzymuje mniej punktów (co można wytłumaczyć faktem, że najlepiej przygotowani studenci kończą pisać egzamin wcześniej).

Zależność pomiędzy jedną lub większą liczbą zmiennych niezależnych a zmienną zależną przedstawiamy w postaci tak zwanej funkcji regresji. Poniżej przedstawiono przykłady wykorzystania modeli regresji do rozwiązywania praktycznych problemów: Określenie zależności pomiędzy wiekiem, poziomem wykształcenia (mierzonym na przykład przez liczbę lat poświęconych na naukę), stażem pracy a wysokością zarobków w danej branży. Określenie wpływu działań marketingowych (mierzonych na przykład wydatkami na reklamy telewizyjne, prasowe, billboardy, etc.) na przyszłą sprzedaż produktu. Określenie wpływu wieku, wagi, aktywności ruchowej (mierzonej na przykład liczbą godzin w tygodniu przeznaczoną na uprawianie sportu) a kondycją fizyczną (mierzoną na przykład wynikiem biegu na 1km).

Funkcja regresji - to narzędzie do badania powiązań między zmiennymi. Dużym problemem jest wybór postaci analitycznej funkcji dla analizowanego zagadnienia. Ułatwieniem może być sporządzenie m.in. wykresu rozrzutu, gdzie dla każdej (i-tej) pary wartości zmiennej niezależnej (X) i zmiennej zależnej (Y) tworzymy punkt o współrzędnych Xi, Yi. Jeżeli zmiennych niezależnych jest więcej, wówczas konstruujemy odpowiednio większą ilość wykresów rozrzutu, przedstawiających zależność pomiędzy każdą zmienną niezależną (oś odciętych) a zmienną zależną (oś rzędnych). Z wykresu (wykresów) odczytujemy prawdopodobny rodzaj zależności pomiędzy zmiennymi niezależnymi a zmienną zależną.

Naszym zadaniem jest wyznaczenie parametrów liniowej funkcji regresji, o ogólnej postaci: y = a + bx Gdzie: y - wartość przewidywana na podstawie wartości x a - parametr a jest nazywany wyrazem wolnym i odpowiada wartości funkcji y dla argumentu x = 0 b - współczynnik kierunkowy, który decyduje o tym, czy funkcja jest rosnąca, czy malejąca oraz jak szybko następują zmiany (jeśli b jest dodatnie, to funkcja jest rosnąca – to znaczy, im większe wartości zmiennej x, tym większe wartości funkcji, czyli y) Do wyznaczenia parametrów tej funkcji (a i b) wykorzystuje się metodę najmniejszych kwadratów.

Po wyznaczeniu parametrów funkcji regresji liniowej należy ocenić poziom dopasowania funkcji regresji do rzeczywistych danych. Sprowadza się to do odniesienia generowanych przez funkcję regresji wartości teoretycznych do wartości zaobserwowanych. Wykorzystuje się w tym celu szereg miar, do najczęściej stosowanych należą: odchylenie standardowe reszt, współczynnik zbieżności oraz współczynnik determinacji. Wartości teoretyczne obliczamy podstawiając do funkcji regresji liniowej wartości zmiennej niezależnej X. Przykład Dla pewnej funkcji regresji liniowej: y = 250 – 2x Obliczamy wartości teoretyczne dla zmiennej niezależnej x równej 10 oraz 11. Dla x = 10 otrzymujemy: y = 250 – 2*10 = 230 Dla x = 11 otrzymujemy: y = 250 – 2*11 = 228

Współczynnik zbieżności: Współczynnik determinacji: Oszacowane powyżej miary świadczą o bardzo wysokim poziomie dopasowania funkcji regresji. Wartości teoretyczne zmiennej Y (liczba punktów) obliczone na podstawie funkcji regresji odchylają się od wartości rzeczywistych zaledwie o 1,63 punktu. Na podstawie wartości współczynnika determinacji wnioskujemy, że 95,59% zmienności zmiennej Y (liczba punktów) wynika ze zmienności zmiennej X (czas pisania egzaminu).