Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Matematyczne techniki zarządzania - 91 Testowanie równości wariancji populacji Stosuje się test Hartleya zwany też testem F max, który pozwala rozstrzygnąć.

Podobne prezentacje


Prezentacja na temat: "Matematyczne techniki zarządzania - 91 Testowanie równości wariancji populacji Stosuje się test Hartleya zwany też testem F max, który pozwala rozstrzygnąć."— Zapis prezentacji:

1

2 Matematyczne techniki zarządzania - 91 Testowanie równości wariancji populacji Stosuje się test Hartleya zwany też testem F max, który pozwala rozstrzygnąć czy próbki pochodzą z populacji o jednakowej wariancji (czy wariancje pró- bek są homogeniczne). Jeśli założymy, że każda populacja ma rozkład normalny i że ich wariancje są równe  2 i (i = 1, 2,..., k), to możemy zweryfikować hipotezy H 0 :  2 1 =  2 2 =.... =  2 k H 1 : nie wszystkie  2 i są jednakowe Reguła decyzyjna: odrzucamy H 0, jeżeli odczytujemy ze specjalnej tablicy, gdzie: k — liczba czynników i (max) — największa liczba stopni swobody spośród próbek Przykład 27 cd. Wariancje próbek dla poszczególnych skryptów: 114,889; 325,111; 292,000. Stąd =0,05 k=3 i (max)=9 F tabl =5,34 JAKI WNIOSEK?

3 Matematyczne techniki zarządzania - 92 ANALIZA WARIANCJI DWUCZYNNIKOWA SSTO CZYNNIK BLOK x ij — wartość obserwacji w i-tym poziomie bloku i j- tym poziomie czynnika  — ogólna średnia zmiennej X  i — odchylenie średniej i-tego poziomu bloku od   j — odchylenie średniej j-tego poziomu czynnika od   ij — składnik losowy (reszta) N(0;  2 ) [ — ksi] CZYNNIK=BLOK RANDOMIZED BLOCK DESIGN Założenia: mamy losowe próbki z n poziomów bloku i przydzielamy losowo jednostki z każdego bloku do każdego z k poziomów czynnika reakcja w i-tym poziomie bloku na j-ty poziom czynnika pochodzi z rozkładu normalnego wariancja każdej populacji n k wynosi  2 nie ma wzajemnego oddziaływania między blokiem i czynnikiem RESZTA

4 Matematyczne techniki zarządzania - 93 Przykład 29. Zmienną losową X jest ilość kilometrów przejechanych na 1 litrze benzyny różnej marki. Do pomiarów używamy 5 różnych samochodów: CZYNNIK BLOK Co można stwierdzić „gołym okiem”: czy marka benzyny wpływa na jej zużycie? czy egzemplarz użytego samochodu wpływa na zużycie paliwa? Tabelka ANOWY %

5 Matematyczne techniki zarządzania - 94 Przyjmujemy  = 0,01 i stawiamy hipotezy: H 0 : czynnik nie wpływa...H 1 : czynnik... H 0 : blok nie wpływa...H 1 : blok... JAKI JEST OFICJALNY JĘZYK TYCH HIPOTEZ? Wartości krytyczne testu Fishera: Decyzje i wnioski ANALIZA WARIANCJI DWUCZYNNIKOWA Z UWZGLĘDNIENIEM WZAJEMNEGO ODDZIAŁYWANIA CZYNNIKÓW SSA SSB SSAB SSE SSTO SUMY KWADRATÓWŚREDNIE KWADRATY ZAŁOŻENIA! CZYNNIK A CZYN- NIK B CZYNNIK A i B RESZTA SSTO

6 Matematyczne techniki zarządzania - 95 Przykład 30. W pewnym przedsiębiorstwie postanowiono przeprowadzić badania co wpływa na sukces kierowników sklepów — wykształcenie czy doświadczenie. Z dużej liczby sklepów wylosowano 24 kierowników i dla każdego określono współczynnik sukcesu będący ilorazem rzeczywistej rocznej sprzedaży do sprzedaży prognozowanej, określonej na podstawie równania regresji uwzględniającego lokalizację, powierzchnię, liczbę pra- coników itd. WykształcenieStaż n = — P1.6 — <5 lat 2.8 — Ś2.6 — 5-10 lat 3.8 — W3.6 — lat 4.6 — >15 lat %

7 Matematyczne techniki zarządzania - 96 Można rozwiązać dwa problemy: 1.H 0 : nie ma wzajemnego oddziaływania czynników A i B H 1 : jest wzajemne oddziaływanie A i B Odrzucamy H 0, jeżeli 2.H 0 : czynnik A (lub B) nie wpływa na pracę kierownika H 1 : czynnik A (lub B) wpływa na pracę kierownika Odrzucamy H 0, jeżeli b—1 ANALIZA REGRESJI I KORELACJI  umożliwia badanie wpływu czynników mierzalnych, takich jak: czas nauki, zużycie materiałów, wielkość produkcji itd. umożliwia ustalanie przyczyn zachowania się danego zjawiska: dlacze- go rosną koszty, co powoduje straty w firmie itd. jest to bardzo popularna metoda, zgodna z naszą intuicją obliczenia wykonuje się metodą najmniejszych kwadratów stosuje: estymację, testowanie hipotez, analizę wariancji itd.

8 Matematyczne techniki zarządzania - 97 Bardzo często robimy — odruchowo — wykres zależności dwu zmiennych: Y X obserwacje empiryczne model rzeczywistości Zapisujemy to jako: Dla układu trójwymiarowego: Zmienna losowa wielowymiarowa x ijkl lub x i, y j, z k itd. Tablica dwudzielna dwa wymiary P ij — „trzeci wymiar” P i i P j — rozkłady brzegowe suma =1 jeśli rozkłady normalne, to równanie liniowe

9 Matematyczne techniki zarządzania - 98 Trzy rodzaje związków pomiędzy Y i X związek funkcyjny (deterministyczny) Y X xixi yiyi Domena — matematyka KAŻDEJ WARTOŚCI x i ODPOWIADA JEDNA I TYLKO JEDNA WARTOŚĆ y i związek stochastyczny (losowy) Domena — rzeczywistość KAŻDEJ WARTOŚCI x i ODPOWIADA CAŁY ZBIÓR WARTOŚCI y i TWORZACYCH OKREŚLONY ROZKŁAD DANE Lp. x i y i 1 x 1 y 1 2 x 2 y 2 3 x 3 y xixi Obserwacja rzeczywistości  Waga i wzrost studentek

10 Matematyczne techniki zarządzania - 99 związek statystyczny Domena — model rzeczywistości xixi — średnia rozkładu  — obrazuje rozrzut — środek ciężkości zbioru Dlaczego w rzeczywistości mamy do czynienia ze związkami stochastycznymi? Podstawowe pojęcia i terminy KORELACJA — fakt powiązania, współzależności, związku zmiennych ze sobą WSPÓŁCZYNNIK KORELACJI — liczba określająca siłę i kierunek tego związku współczynnik korelacji liniowej dwu zmiennych: r lub r xy r Współczynnik r niesie dwie informacje poprzez swój znak i moduł

11 Matematyczne techniki zarządzania Znak informuje o kierunku zależności r>0 Korelacja dodatnia r<0 Korelacja ujemna  Moduł informuje o sile zależności r=1 r=0,5r=0 Który współczynnik korelacji jest korzystniejszy: —0,8 czy 0,2?

12 Matematyczne techniki zarządzania współczynnik korelacji liniowej wielu zmiennych (korelacji wielo- krotnej lub wielorakiej): R R Interpretacja: im wyższa wartość R, tym silniejsza współzależność (R=0: brak korelacji, R=1: zależność funkcyjna, nie ma składnika losowego) R określa siłę powiązania zmiennej Y z wszystkimi zmiennymi X i, bez względu na to jak poszczególne z nich są skorelowane z Y współczynnik korelacji cząstkowej dwu zmiennych REGRESJA — funkcja odzwierciedlająca powiązanie zmiennych (czynników) w mowie potocznej regresja to cofanie się, spadek, zanik skąd się wzięło to słowo w statystyce? wzrost synów wzrost ojców WSPÓŁCZYNNIK REGRESJI — liczba stojąca przy każdej zmiennej X, określająca jej wpływ na zmienną Y a — wyraz wolny (stała), współrzędna punktu przecięcia z osią Y a b — współczynnik regresji, tangens kąta  nachylenia prostej 

13 Matematyczne techniki zarządzania Czynności przy badaniu zależności zmiennych określenie co jest skutkiem (Y), a co przyczynami (X 1, X 2, itd.) zebranie danych (pobranie próbki statystycznej) wyznaczenie równania regresji dla próbki sprawdzenie (testowanie) czy równanie to może być przyjęte dla populacji wnioskowanie o przyczynach na podstawie zweryfikowanego równania Funkcja regresji I i II rodzaju regresja I rodzaju dotyczy populacji (jest nieznana) regresja II rodzaju dotyczy próbki (jest znana) Współczynniki regresji to  i oraz a i ; tak jak przy estymacji innych parametrów mamy to do czynienia z estymatorami, ich odchyleniami standardowymi (czyli błędami oszacowania) oraz z wartościami oszacowanymi. 

14 Matematyczne techniki zarządzania Wydruk komputerowy równania regresji Pełny zapis równania regresji Y — zmienna zależna, zmienna-skutek, zmienna objaśniana y i — zaobserwowane wartości zmiennej zależnej dla jednostek próbki X k — zmienne niezależne, zmienne-przyczyny, zmienne objaśniające x ki — zaobserwowane wartości zmiennych niezależnych a 0 — oszacowana wartość wyrazu wolnego (interpretację podano) Y X1X1 X2X2 (wszystkie punkty czerwone) parametry strukturalne i stochastyczne reszta u i

15 Matematyczne techniki zarządzania a i... — oszacowane wartości współczynników regresji; określają wpływ poszczególnych zmiennych X i na zmienną Y  — składnik losowy, reprezentujący rozrzut punktów wokół płaszczyz- ny regresji; składnik ten jest zmienną losową; jego wartości nazywają się reszty a jego rozkład jest rozkładem normalnym o E(  )=0 i V(  )=s 2 (y) s(a 0 ) — błąd oszacowania wyrazu wolnego; służy do budowy przedziału ufności dla nieznanej wartości wyrazu wolnego  0 dla populacji oraz do weryfikacji istotności  0 (H 0 :  0 =0) s(a i ) — błędy oszacowania współczynników regresji; służą do budowy przedziału ufności dla nieznanych wartości  i współczynników regresji dla populacji oraz do weryfikacji ich istotności (H 0 :  i =0) s(y) — błąd resztowy; jest odchyleniem standardowym składnika losowego  ; określa średnią wielkość reszty u i R 2 (r 2 )— współczynnik determinacji; określa jaka część zmienności całko- witej SSTO została wyjaśniona przez równanie regresji  2 — współczynnik zbieżności (zgodności); określa jaka część zmien- ności całkowitej SSTO nie została wyjaśniona przez równanie regresji

16 Matematyczne techniki zarządzania Wszystko to jest łatwiejsze do zrozumienia w układzie dwuwymiarowym X Y = SSTO (zmienność całkowita) = SSTR (zmienność wyjaśniona) = SSE (zmienność niewyjaśniona) (SUMOWANIE OD „1” DO „n” ) SSTO = SSTR + SSE RÓWNANIE REGRESJI JEST MODELEM RZECZYWISTOŚCI WSZYSTKO TO JUŻ ZNAMY Z ANALIZY WARIANCJI

17 Matematyczne techniki zarządzania Krzywe Neymana X Y obserwacje (dane empiryczne) środek ciężkości próbki prosta regresji II rodzaju (dla próbki) krzywe wyznaczające pas ufnoś- ci, w którym z prawdopobieńst- wem 1- znajduje się nieznana prosta regresji I rodzaju (dla populacji) dlaczego taki kształt? (2 ruchy) krzywe wyznaczające przedziało- we prognozy wartości zmiennej Y dla danego x i prognoza punktowa uzyskana przez wstawienie x i do równania gg,dg przedział, w którym z szansą 1- mieści się nieznana wartość y i dla i- tej nowej jednostki spoza próbki Przykłady: waga — wzrost studentek ocena egzaminu — zaliczenie koszt produkcji — wielkość produkcji utarg — wydatki na reklamę prędkość — zużycie paliwa 

18 Matematyczne techniki zarządzania Jak patrzeć na krzywe Neymana? przypadek z poprzedniej planszy: niezależnie od tego, co się zdarzy,  0 >0 i  1 >0 (jak to rozumieć) ale może być inna sytuacja co wtedy wiemy o  0 i  1 ? NIC — mogą być >0, =0, <0; nie wyklu- czymy więc, że: X nie wpływa na Y prosta I rodzaju przechodzi przez (0,0) Te problemy można rozwiązać przez testowanie hipotez o  i oraz o  Identyczne wnioski można wyciągnąć przy porównaniu dwu prostych II rodzaju mały rozrzutduży rozrzut obserwacji

19 Matematyczne techniki zarządzania Regresja krzywoliniowa Kiedy występuje regresja liniowa? — gdy obie zmienne mają rozkład normalny! W wielu przypadkach dane układają się w zależności nieliniowe: gdy mają postać szeregu czasowego gdy dane przekrojowe układają się w smugę nieliniową (na przykład — efekt skali) gdy krzywoliniowa funkcja wielu zmiennych lepiej opisuje rzeczy- wistość niż funkcja liniowa (plansza 103); tego nie widać, która lepsza można poznać tylko po R 2

20 Matematyczne techniki zarządzania Do opisu takich zjawisk stosujemy rozmaite funkcje krzywoliniowe: 1. proste funkcje (rosnące lub malejące) dwu zmiennych: wykładnicze, potęgowe itp. 2. wielomiany różnego stopnia (ich fragmenty) 3. funkcje bardziej złożone: krzywe nasycenia, krzywe logistyczne itp.. 4. funkcję potęgową wielu zmiennych ABY MOŻNA BYŁO STOSOWAĆ METODĘ NAJMNIEJ- SZYCH KWADRATÓW, FUNKCJE TE MUSZĄ BYĆ SPROWADZONE DO POSTACI LINIOWEJ 2. Wielomiany są funkcjami liniowymi pod wzglę- dem swych parametrów 3. Stosuje się „chwyty” (wielokrotne podstawianie)

21 Matematyczne techniki zarządzania Także stosujemy transformację logarytmiczną Kolejność czynności przy estymacji funkcji regresji krzywoliniowej: 1. zebranie danych empirycznych 2. dobranie modelu (funkcji nieliniowej) 3. transformacja modelu do liniowego (logarytmowanie — transformata) 4. przeliczenie danych na układ liniowy (robi to komputer) 5. oszacowanie równania regresji liniowej 6. retransformacja do postaci pierwotnej (odlogarytmowanie) Retransformacji podlegają tylko parametry strukturalne, natomiast wszystkie parametry stochastyczne dotyczą tylko transformaty Metody estymacji równania regresji klasyczna metoda najmniejszych kwadratów (KMNK) w wielu wariantach obliczeniowych podwójna MNK regresje specjalne: grzbietowa (ridge regression), odporna (robust) itd. metoda największej wiarygodności

22 Matematyczne techniki zarządzania Klasyczna metoda najmniejszych kwadratów (KMNK) W książkach jest całe mnóstwo różnych wa- riantów, wersji, metod itd. — nie należy tra- cić głowy ani denerwować się!  PLANSZA 105 Wersja 1. Metoda równań normalnych Wyznaczamy pochodne cząstkowe względem a oraz b i przy- równujemy je do zera, po przekształceniu otrzymujemy uk- ład równań normalnych Niewiadome: a, b Współczynniki: z tabelki roboczej Z tego układu równań wywodzą się dziesiątki rozmaitych wzorów na obliczanie wartości a i b

23 Matematyczne techniki zarządzania Na analogicznej regule można zbudować układ równań normalnych dla równania Wersja 2. Metoda „sigma prim” uzyskuje się uproszczone równania Wersja 3. Metoda mnożników Gaussa, posługuje się formularzami obliczeniowymi opartymi o wartości „sigma prim” (W. Volk, Statystyka dla inżynierów) Wersja 4. Metoda przekształceń Jordana Wersja 5. Metoda macierzowa X T X — współczynniki układu r. n. X t y — prawe strony układu r. n.

24 Matematyczne techniki zarządzania na głównej przekątnej tej macierzy znajdują się wariancje s 2 (a 0 ), s 2 (a 1 )... Wersja 5. Metoda uproszczona Hellwiga Praktyczne zastosowania analizy regresji i korelacji (przykłady): wydajność pracy = f (liczby szkoleń i stażu)zysk z akcji = f (ceny i dywidendy) cena = f (liczby asortymentów)czas demolki = f (ilości pracy i odległości) zużycie prądu = f (pogody i produkcji)produkcja = f (kapitału i robocizny) udział w rynku = f (ceny i liczby reklam)płaca = f (wieku, funkcji, stażu) cena działki = f (obszaru i odległości od morza)sprzedaż biletów MPK = f(pogody, dnia utarg = f (liczba klientów)tygodnia, liczby mieszkańców) plon z ha = f (zużycie nawozów) czas choroby = f (temperatury i liczby bakterii) koszt reklamy = f (czasu) I II Dzielimy zbiór na 2 podzbiory i wyzna- czamy ich środki ciężkości po czym budujemy prostą przechodzącą przez te punkty Zmienne 0-1:3 — profesor 1 — profesor2 — adiunkt 2 — nie-profesor1 — asystent

25 Matematyczne techniki zarządzania E K O N O M E T R I A  TROCHĘ GREKI I ŁACINY Probabilistyka — probabilis (prawdopodobny, d. godny pochwały) Statystyka — status (stan, państwo); kto to jest lo statista we Włoszech? A kto la comparsa? Ekonomia — oikos (dom, środowisko) + nomos (prawo, ustawa); oiko-nomos (pan domu); oikonomia — zarządzanie gospodarstwem domowym Metr, -metria — metron (miara) Ekonometria — nauka zajmująca się ustalaniem, za pomocą metod matematyczno-statystycznych, ilościowych prawidłowości zachodzących w życiu gospodarczym Nastawienie bardziej na makroekonomię niż na mikroekonomię (ekonomikę przedsiębiorstwa i przemysłu) — sprawdzanie teorii ekonomicznych: zależność eksportu krajowego od PKB, zależność dochodu narodowego od ilości pieniądza w obiegu, także na badanie poziomu życia ludności: zależność wydatków na określone dobra od dochodów ludności, zależność obrotu sklepów detalicznych od odległości od dużego miasta, funkcje popytu i podaży

26 Matematyczne techniki zarządzania ale również na zagadnienia związane z zarządzaniem przedsiębiorstwem: zależność wartości dodanej na roboczo-godzinę od stawki godzinowej i kapitałochłonności pracy, funkcje produkcji opisujące zależność wielkości produkcji od majątku trwałego i robocizny. Specyficzne warunki prowadzenia badań ekonometrycznych brak możliwości powtórzenia eksperymentu (nie działają prawa statystyki matematycznej) zaostrzone kryteria matematyczne (n>100) trudności z danymi: dostępność, ilość, wiarygodność, porównywalność NARZĘDZIEM BADAWCZYM EKONOMETRII JEST MODEL EKONOMETRYCZNY, KTÓRY MATEMATYCZNIE ODPOWIADA RÓWNANIU REGRESJI LUB KILKU RÓWNANIOM Terminologia zmienna objaśniana (Y) — zmienna egzogeniczna zmienne objaśniające (X 1, X 2...) — zmienne endogeniczne zmienne opóźnione w czasie: y t, y t-1, x t, x t-k ; służą do analizy wpływu czasu

27 Matematyczne techniki zarządzania Klasyfikacja modeli ekonometrycznych I. Klasyfikacja według wnoszonej informacji: modele przyczynowo-skutkowe y — skutek X i — przyczyny Przykłady zmiennej Y: średnia z indeksu studentów zużycie energii elektrycznej w firmach koszty produkcji różnych partii wyrobów Modele te budujemy z danych przekrojowych (różne obiekty w tym samym momencie) modele tendencji rozwojowej y — analizowane zjawisko t — czas Przykłady zmiennej Y: codzienne ceny cebuli miesięczne zużycie prądu na WZ AGH roczne zużycie gazu ziemnego w PL Modele te budujemy z szeregów czasowych (ten sam obiekt w różnych momentach) Analiza szeregów czasowych ( Analiza szeregów czasowych (time series analysis) — odrębny dział matematyki interesuje nas jak zjawisko zmienia się w czasie, nie obchodzi nas co te zmiany wywołuje efekt długoterminowy: trend (tendencja) efekt długoterminowy: trend (tendencja) efekty krótkoterminowe: wahania okresowe, sezonowe, cykliczne efekty krótkoterminowe: wahania okresowe, sezonowe, cykliczne Długość: doba,....,rok, 25 lat, 500 lat

28 Matematyczne techniki zarządzania Przykład 31. Zinterpretuj wykres powstały z szeregu czasowego miesięczne- go zużycia energii elektrycznej przez WZ AGH II. Klasyfikacja według stopnia uwzględniania czasu: modele statyczne modele dynamiczne III. Klasyfikacja według powiązania równań: modele proste modele rekurencyjne modele o równaniach współzależnych JEDNO RÓWNANIE LUB KILKA ODDZIELNYCH IV. Klasyfikacja według liniowości: modele liniowe modele nieliniowe (konieczna transformacja liniowa)

29 Matematyczne techniki zarządzania ETAPY BUDOWY MODELU EKONOMETRYCZNEGO 1. Sformułowanie modelu a. wybór zmiennych: y, x 1, x 2,... b. wybór postaci matematycznej modelu: liniowa, potęgowa, Zebranie danych statystycznych (różne źródła) 3. Selekcja zmiennych objaśniających (celem podziału na dwie grupy — nadające się do modelu i niepotrzebne w nim) 4. Estymacja parametrów modelu: a. parametrów strukturalnych: a 0, a 1, a 2,... b. parametrów stochastycznych: s(a i ), s(y), R 2, R 5. Weryfikacja modelu (przy użyciu hipotez i testów statystycznych) MODEL BEZ WERYFIKACJI NIE MA ŻADNEJ WARTOŚCI NIE NALEŻY KORZYSTAĆ Z PROGRAMÓW KOMPUTEROWYCH NIE DAJĄCYCH MOŻLIWOŚCI WERYFIKACJI NIE NALEŻY KORZYSTAĆ Z PROGRAMÓW KOMPUTEROWYCH NIE DAJĄCYCH MOŻLIWOŚCI WERYFIKACJI 6. Interpretacja modelu wyciągnięcie wniosków dla celów zarządzania sprzedanie go klientowi

30 Matematyczne techniki zarządzania ETAP 1a. WYBÓR ZMIENNYCH zmienna objaśniana Y: według zainteresowań (na ćwiczeniach), według polecenia szefa (w przedsiębiorstwie), według życzenia klienta (w firmie konsultingowej) zmienne objaśniające X i (jak najwięcej dla modelu przyczynowo- skutkowego) z następujących źródeł (w kolejności): — teoria danej dziedziny wiedzy — doświadczenie zleceniodawcy i statystyka — metodą prób i błędów (intuicyjnie) wybrane zmienne muszą mieć dużą zmienność (W>30%) najczęstszy błąd — „masło maślane” prowadzące do związku funkcyjne- go i nie dające żadnej informacji o zmiennej objaśnianej przykład modelu bez sensu: wynagrodzenie = f(płacy, premii i dodatku stażowego) ETAP 1b. WYBÓR POSTACI MATEMATYCZNEJ modele przyczynowo-skutkowe — najbardziej zalecane jest równoczesne prowadzenie obliczeń dla dwu postaci: — liniowej — potęgowej Co typujesz, gdy Y to: wynik studiów zysk firmy

31 Matematyczne techniki zarządzania — stosuje się też modele nieliniowej o narzuconej postaci nieliniowej, których parametry ustala się przez programowanie liniowe lub innymi metodami modele tendencji rozwojowej: — funkcja liniowa — proste funkcje nieliniowe — wielomiany — funkcje skomplikowane — modele kombinowane: trend + wahania okresowe (t zamiast x) są to zależności dla ln, dla układu y=f(x) mogą być dziwne (R 2 >1) są to funkcje „sztywne”, „nieposłuszne wielomian jest modelem liniowym! można znaleźć optymalny stopień wielomianu (przez badanie którego rzędu wartości Δy są sobie mniej więcej równe) Efekt „krzywego lustra”


Pobierz ppt "Matematyczne techniki zarządzania - 91 Testowanie równości wariancji populacji Stosuje się test Hartleya zwany też testem F max, który pozwala rozstrzygnąć."

Podobne prezentacje


Reklamy Google