Technika planowania eksperymentu r.r@wp.pl: Prezentacja wygłoszona dnia 17.12.2002 na seminarium dyplomowym specjalności robotyka wydziału Mechatroniki Politechniki Warszawskiej Technika planowania eksperymentu Robert Ręgowski gr. R57 http://Robert.Regowski.Tripod.com
Wstęp Współczesne badania z jakimi spotykamy się w nauce wymagają niekiedy dużych nakładów środków – kosztów, czasu, energii. Technika planowania eksperymentu, powstała na gruncie statystyki matematycznej, próbuje dać odpowiedź na pytanie: jak przeprowadzić doświadczenie, aby przy minimalnych nakładach uzyskać jak najbardziej miarodajne wyniki.
Podstawowe zagadnienia planowania eksperymentów Pojęcie eksperymentu Przebieg eksperymentu Potrzeba stosowania sformalizowanych planów Rodzaje planów Porównanie metod – tradycyjnej i współczesnej
Eksperyment Jako eksperyment uznajemy serię doświadczeń, umożliwiającą utworzenie opisu matematycznego (modelu) bądź poprawienie działania dotychczasowego obiektu. Inaczej mówiąc: eksperyment ma umożliwić identyfikację lub optymalizację rozważanego obiektu. Ponadto jakość identyfikacji lub optymalizacji zależeć może w dużym stopniu od doboru doświadczeń.
Przebieg eksperymentu Poszukujemy związków i zależności między zmienną wyjściową Y a zbiorem zmiennych wejściowych X=[X1, X2,...Xn ] Przeprowadzamy doświadczenia w których zadajemy konkretne wartości zmiennych niezależnych Wyznaczamy wartości zmiennych wyjściowych Analizujemy statystycznie wyniki doświadczeń celem uzyskania zależności Y=f(X1, X2,...Xn) Analiza wariancji lub kowariancji Analiza regresji
Regresja a korelacja Znajomość regresji umożliwia przewidywanie przeciętnego zachowania się obiektu Korelacja (kowariancja) daje nam możliwość określenia natężenia wzajemnej zależności zmiennych X i Y Przy analizie regresji x, realizacja zmiennej X jest ustalana i przyjmuje się ze nie zawiera błędów. Mierzymy y – uzyskaną realizację zmiennej Y W przypadku badania korelacji, zarówno X i Y zawierają błędy obserwacji
Potrzeba planowania eksperymentu Szukamy odpowiedzi na pytanie: jakie mamy przyjąć wartości zmiennych wejściowych aby przeprowadzić doświadczenie z najmniejszym nakładem środków. Plany stanowią zespół wytycznych, co do wyboru wartości wejść w zależności od tego jakie informacje o obiekcie nas interesują
Poziomy planu Wartości wielkości wejściowych nazywamy poziomami czynników Zakładamy, że liczba poziomów czynników w planie jest jednakowa i nazywamy ją liczbą poziomów planu
Podstawowe rodzaje planów eksperymentów Plany dwupoziomowe Kompletne Ułamkowe (frakcyjne) Plany wielopoziomowe Kompozycyjne Ortogonalne Trój- i wielo- poziomowe Ułamkowe Plany symplektyczne (dla mieszanin)
Plany dwupoziomowe Plan eksperymentu dwupoziomowego zakłada przyjmowanie wartości wejść na dwóch poziomach. np. dla zmiennej Xi przyjmujemy dwa poziomy: mniejszy – x(min)i większy – x(max)i Plany dwupoziomowe są najprostsze w realizacji i niekiedy nazywa się je planami eliminacyjnymi.
Standaryzacja zmiennych Jeśli zmienna Xi przyjmuje dwie wartości x(min)i i x(max)i, przeprowadzamy normowanie do poziomów –1, +1, stosując zależność kodującą: W ten sposób, bez względu na charakter zmiennych wejściowych, eksperyment możemy zapisać w postaci takiego samego planu
Plan kompletny dwuwartościowy 2p Plan kompletny polega na wyczerpaniu wszystkich możliwych skojarzeń zmiennych wejściowych. np. Dla dwóch zmiennych (p=2), z kodowaniem ±1 ma on postać: Liczba doświadczeń realizujących plan kompletny dwupoziomowy: 22 =4 Nr. 1 2 3 4 -1 -1 -1 1 1 -1 1 1
Plan kompletny dla 2 zmiennych 1 -1 2 3 4 Punkty planu kompletnego w przestrzeni zakodowanych zmiennych niezależnych
Macierze wejść Postać zakodowana Postać normalna 1 kolumna: x0 formalna zmienna o wartościach 1 2 kolumna: wartości zmiennej x1 3 kolumna: wartości zmiennej x2 4 kolumna:człon interakcyjny, lub dodatkowa zmienna X3 Środkowe kolumny stanowią plan eksperymentu.
W wyniku przeprowadzonego doświadczenia otrzymujemy wektor wyjść: Y’=[y1,y2,y3,y4]; Szukamy wektora współczynników regresji liniowej (metoda najmniejszej sumy kwadratów): b=(x’x)-1x’y Otrzymujemy wektor: Wynik eksperymentu dwupoziomowego ma zatem postać funkcji:
Plan 23 Plan kompletny dwupoziomowy dla 3 zmiennych Nr 1 3 7 5 4 2 8 6 -1 2 +1 3 4 5 6 7 8 Plan 23 1 3 7 5 4 2 8 6 Plan kompletny dwupoziomowy dla 3 zmiennych
Metoda Boxa – Wilsona Służy do planowania eksperymentów polegających na szukaniu ekstremów funkcji wielu zmiennych. Dwa etapy: Niewielka seria doświadczeń dla znalezienia lokalnego opisu matematycznego; Większa seria doświadczeń w pobliżu obszaru najbardziej interesującego
Przykład – planowanie dwupoziomowe Rozważmy obiekt opisany charakterystyką nieliniową: y=f(x1,x2,x3). Szukamy maksimum wyjścia obiektu w obszarze o ograniczeniach: 0x1 100; 0x2 500; 0x3 100; Rozwiązanie: Startujemy z punktu: x10=30; x20=250; x30=50 W otoczeniu tego punktu szukamy opisu liniowego o postaci y=b0+b1x1+ b2x2+b3x3 Przyjmujemy kroki próbne: x1=3; x2=20; x3=2; Przeprowadzamy eksperyment otrzymując macierz wyjść y
Standaryzacja Obliczamy: Podstawiamy do powyższych wzorów wartości poziomów próbnych: xn: xn0- xn ; xn0+ xn Otrzymamy: : -1; +1
Macierze wejść i macierz wyjść Postać zakodowana Postać normalna Macierz wyjść
Szukana funkcja Postać funkcji nieliniowej
Wyznaczanie współczynników szukamy na podstawie wzoru: Obliczamy : det =4096 ( )-1=1/8 I Zatem:
Poszukiwany model w postaci funkcji regresji:
Szukanie maksimum Aby znaleźć maksimum przeprowadzamy kolejne doświadczenia: Przyjmujemy kroki robocze Rxn proporcjonalne do współczynników i xn według wzoru: krok roboczy: x1=+10 x2=+200 x3=+5 Dla x2 napotykamy Ograniczenia, wstawiamy więc do tabeli 0 Osiągnięte maksimum lokalne: y=455,0 Nr x1 x2 x3 y 9 40 50 55 385,0 10 60 450,0 11 65 455,0 12 70
Maksimum globalne W dalszych doświadczeniach szukamy maksimum globalnego: Dla x1=100, x2=0, x2=0 (oba ograniczenia przekroczone) mamy: max(y)=800
Eksperyment ułamkowy 2p-k W przypadku 3 zmiennych, w kompletnym dwupoziomowym eksperymencie przeprowadzamy 23=8 doświadczeń; Dla 30 zmiennych: 230=1 073 741 824 dośw. które, jeśli trwały by 1 s. wymagały by 34 lat; Dla dużej liczby zmiennych tworzymy plany połówkowe (2p-1), ćwiartkowe (2p-2), ósemkowe (2p-3) itp. Liczba k nie może przekroczyć wartości przy której liczba równań nie pozwala na uzyskanie założonego modelu regresji
Tworzenie planu frakcyjnego Model o postaci: Przyjmujemy, że jedna ze zmiennych unormowanych równa jest współdziałaniu pierwszego rzędu pozostałych zmiennych: Relację taką nazywamy funkcją generującą: Model przyjmuje postać:
Tabele planów Plan 23 23-1 dla Nr. 1 – 1 –1 –1 --------------- 2 + 1 –1 –1 ------------ 3 – 1 +1 – 1 4 +1 +1 – 1 -------------- 5 –1 –1 +1 ----------- 6 +1 –1 +1 7 –1 +1 +1 8 +1 +1 +1
Plany 23-1 dla dla 1 3 5 2 8 1 7 4 6
Równania 2, 3, 5, 8 spełniają założenie: Dla funkcji gen.: mamy spełnione: Biorąc pod uwagę funkcję generującą i powyższe równania, poszukiwana funkcja przyjmie postać:
Struktura uwikłania interakcji Na podstawie powyższych zależności możemy stwierdzić że równanie: jest prawidłowym modelem pod warunkiem, że człony interakcyjne są pomijalne w porównaniu z oddziaływaniami głównymi.
Plany wielopoziomowe Użycie dwóch poziomów zmiennych wejściowych nie daje możliwości analizy zależności nieliniowych Testowanie zależności i interakcji kwadratowych wymaga co najmniej trzech poziomów planu
Centralne plany kompozycyjne Umożliwiają wyznaczenie równania regresji postaci: Wyróżniamy: Plany ortogonalne; Plany rotalne (rotatabilne); Plany kompletne trójpoziomowe 3p; Plany kompletne frakcyjne 3p-k;
Plany ortogonalne Dają możliwość aproksymacji wielomianu drugiego stopnia Plan nazywać będziemy ortogonalnym, jeżeli w każdej kolumnie macierzy planu suma iloczynu poszczególnych elementów kolumny będzie równa 0. Jeśli kolumny macierzy planu są ortogonalne, to wówczas macierz jest macierzą diagonalną W przypadku pełnej ortogonalności poziomy czynników i członów interakcyjnych nie są skorelowane.
Pozostałe zmienne dla tych poziomów równają się 0 Celem zapewnienia jak największej ortogonalności planu typu 2p lub 2p-k stosuje się rozszerzenie o dwa dodatkowe poziomy +ort –ort – tzw. punkty gwiezdne Pozostałe zmienne dla tych poziomów równają się 0 Wartość ort nazywamy odległością osiową i wyznaczamy z zależności: Gdzie: ns – liczba punktów wierzchołkowych jądra planu; ns – liczba punktów gwiezdnych; no - liczba punktów centalnych;
Plan ortogonalny 1 -1 2 3 4 5 7 8 6 9 Nr. Nazwa grupy 1 –1 22 punkty kubiczne 2 +1 3 4 5 ort Punkty gwiezdne 6 7 8 9 Punkty centralne .... ...... 1 -1 2 3 4 5 7 8 6 9
Plany rotalne Plany ortogonalne maja wadę: dokładność aproksymacji zależy w nich od przyjętych wartości zmiennych niezależnych Wady tej nie mają plany rotalne w których punkty wartości zmiennych wejściowych są umieszczone na powierzchni wielowymiaro-wej sfery o środku w początku układu współrzędnych, czyli: gdzie – promień Wariancja zmiennej zależnej pozostaje stała bez względu na wartości zmiennych niezależnych
Do warunku rotalności prowadzi rozszerzenie planu typu 2p lub 2p-k ( jądra planu) o punkty gwiezdne +rot –rot Odległość osiowa rot wyznaczana jest z zależności:
Plany optymalne Procedury planów optymalnych polega na wy-borze z listy możliwych punktów planu (kan-dydatów), takich punktów które zagwarantują uzyskanie maksimum informacji Ogólne kryterium: minimalizacja korelacji zmiennych wejściowych;
Plany A–optymalne Najmniejsza korelacja między zmiennymi niezależnymi wystąpi, gdy wybierzemy taki plan, by na przekątnej macierzy były możliwie największe wartości w stosunku do elementów poza przekątną Warunek A–optymalności: tr(.) – suma elementów na przekątnej macierzy (ślad macierzy)
Plany D–optymalne Najmniejsza korelacja między zmiennymi niezależnymi wystąpi, gdy wybierzemy taki plan, by wyznacznik macierzy miał możliwie największą wartość Warunek D–optymalności: Kryterium D–optymalności skraca czas obliczeń w stosunku do A–optymalności
Porównanie planów tradycyjnego (XIX w.) i współczesnego .... xn1 xn2 xn7 en yn Rozpatrujemy prosty obiekt liniowy o 7 wejściach i wyjściu opisanym zależnością: n=1,2,... – numery obserwacji
... Zakłócenia en mają rozkład normalny Model obiektu: Przyjmujemy, że pomiary mogą być dokonywane w obszarze ograniczonym: -1xk +1 k=1,2,...,7 ... xn1 xn2 xn7
Plan najbardziej tradycyjny: Układ równań: n x1 x2 x3 x4 x5 x6 x7 y 1 y1 2 +1 y2 3 y3 4 y4 5 y5 6 y6 7 y7 8 y8 Współczynniki modelu: Wariancje współczynników
Plan unowocześniony: Układ równań: Współczynniki modelu: x1 x2 x3 x4 x5 x6 x7 y 1 –1 y1 2 +1 y2 3 y3 4 y4 5 y5 6 y6 7 y7 8 y8 Współczynniki modelu: Wariancje współczynników:
Plan współczesny: Dla zmiennych x1,x2,x3, przyjęto plan dwupoziomowy 23, a dla dalszych zmiennych przyjęto: n x1 x2 x3 x4 x5 x6 x7 y 1 –1 y1 2 +1 y2 3 y3 4 y4 5 y5 6 y6 7 y7 8 y8 Współczynniki modelu: Wariancje współczynników:
Literatura Dobosz Marek.: Wspomagana komputerowo statystyczna analiza wyników badań. Akademicka Oficyna Wydawnicza EXIT Warszawa 2001 Mańczak Kazimierz.: Technika planowania eksperymentu. WNT Warszawa 1976
Dziękuję za uwagę