Excel Narzędzia do analizy regresji Analysis ToolPak Wykłady 3-4 © Leszek Smolarek
Okno dialogowe Regresja — wypełnienie panelu
Dane wejściowe Dane wejściowe powinny być numeryczne w postaci wektorów kolumnowych o tej samej liczbie wierszy. W nowszych wersjach Excela liczba obserwacji jest ograniczona jedynie pamięcią operacyjną komputera. Zakres wejściowy Y Wprowadź odwołanie do zakresu wejściowego danych zależnych. Zakres musi składać się z pojedynczej kolumny danych. Zakres wejściowy X Wprowadź odwołanie do zakresu wejściowego danych niezależnych. Program Microsoft Excel porządkuje zmienne niezależne z tego zakresu rosnąco od lewej do prawej. Maksymalna liczba zmiennych niezależnych jest równa 16.
Tytuły Zaznacz to pole wyboru, jeżeli pierwszy wiersz albo pierwsza kolumna zakresów wejściowych zawiera etykiety. Wyczyść je, jeżeli zakres wejściowy nie zawiera etykiet; program Excel generuje odpowiednie etykiety danych w tabeli wyjściowej. Poziom ufności Zaznacz to pole, aby uwzględnić dodatkowy poziom w podsumowującej tabeli wyjściowej. W polu wprowadź wartość poziomu ufności, który będzie stosowany oprócz domyślnego poziomu 95 procent. Stała wynosi zero Zaznacz to pole, jeżeli chcesz wymusić, aby linia regresji przechodziła przez początek układu współrzędnych.
Zakres wyjściowy Wprowadź odwołanie do lewej górnej komórki tabeli wyników. Nowy arkusz Kliknij, aby wstawić w bieżącym skoroszycie nowy arkusz i wkleić do niego wyniki, rozpoczynając od komórki A1. Nazwę nowego arkusza wpisz w polu. Nowy skoroszyt Kliknij, aby utworzyć nowy skoroszyt i wkleić wyniki do nowego arkusza w nowym skoroszycie. Składniki resztkowe Zaznacz to pole, aby uwzględnić składniki resztkowe w tabeli wyjściowej składników resztkowych.
Standaryzowane składniki resztkowe Zaznacz to pole, aby uwzględnić standaryzowane składniki resztkowe w tabeli wyjściowej składników resztkowych. Rozkład reszt Zaznacz to pole wyboru, aby wygenerować wykres każdej zmiennej niezależnej w funkcji składnika resztkowego. Rozkład linii dopasowanej Zaznacz to pole, aby wygenerować wykres wartości prognozowanych w funkcji wartości obserwowanych. Rozkład prawdopodobieństwa normalnego Zaznacz to pole, aby wygenerować wykres rozkładu prawdopodobieństwa normalnego.
Wyniki analizy regresji
Statystyki analizy regresji Narzędzie analityczne Regresja dokonuje analizy regresji liniowej, stosując metodę „najmniejszych kwadratów” w celu wyznaczenia przebiegu linii w zbiorze zaobserwowanych wartości. Umożliwia ono analizowanie wpływu, jaki na pojedynczą zmienną zależną wywierają zmienne niezależne. Można na przykład zanalizować wpływ takich czynników, jak wiek, wzrost i waga na wyniki lekkoatlety. Opierając się na zbiorze danych dotyczących osiąganych wyników, każdemu z trzech czynników można przypisać udział w wyniku osiągniętym przez sportowca, a następnie na tej podstawie przewidywać rezultaty innego atlety. Narzędzie Regresja wykorzystuje funkcję arkusza LINEST.
Funkcje regresji są generowane na bazie danych empirycznych, dlatego rezultat estymacji zawsze należy porównać z rzeczywistą wartością zmiennej zależnej (opisywanej). Podstawą tych porównań jest tzw. składnik resztowy – reszta . Funkcja regresji jest poprawnie oszacowana, jeżeli wartości reszt są niewielkie i mają charakter losowy. Wariancje resztowe wyznacza się ze wzorów : Odchylenie standardowe reszt zwane również średnim błędem szacunku, określa, o ile ( średnio rzecz biorąc ) wartości empiryczne odchylają się od wartości teoretycznych. Wraz ze wzrostem odchylenia standardowego reszt maleje „dobroć” oszacowania funkcji regresji.
Współczynnikiem determinacji R2 nazywa się wyrażenie: W przypadku zależności liniowej współczynnik determinacji równy jest współczynnikowi korelacji liniowej. Tak więc im wartość jest bliższa jedności, tym „dobroć” dopasowania funkcji regresji do danych empirycznych jest lepsza.
MODELE REGRESJI KRZYWOLINIOWEJ Rodzaje modeli krzywoliniowych: rodzina krzywych transformowanych do postaci liniowej (np. model wykładniczy, potęgowy, hiperboliczny) poprzez rachunek logarytmiczny lub przekształcenie algebraiczne, wielomiany nie nadające się do transformacji liniowej.
Transformacja logarytmiczna MODEL WYKŁADNICZY Model jest bardzo dobrze dopasowany, gdy współczynnik determinacji r2 jest bliski jedności. MODEL POTĘGOWY
Przekształcenie algebraiczne MODEL HIPERBOLICZNY MODEL PIERWIASTKOWY Wielomiany
DZIĘKUJĘ ZA UWAGĘ