Marcin Miczek Algorytmy genetyczne i ich zastosowanie do dopasowywania zależności teoretycznych do doświadczalnych Szanowni Państwo! Mam zaszczyt przedstawić referat pt. … Referat w Zakładzie Fizyki Stosowanej Instytutu Fizyki Politechniki Śląskiej Gliwice, 27 października 2004 roku
Plan referatu Problem optymalizacji globalnej Algorytmy genetyczne od podstaw Zastosowanie AG w dopasowaniu… na przykładzie metody PLS3 Podsumowanie i literatura o AG Plan dalszej pracy Na wstępie przedstawię, na czym polega problem optymalizacji globalnej...
1. Problem optymalizacji globalnej Jak znaleźć globalne maksimum (globalne minimum) f(x) x maksimum globalne maksimum lokalne ? – błądzenie przypadkowe – symulowane wyżarzanie – sieci neuronowe – logika rozmyta – algorytmy genetyczne Nowe metody Np.: wieloparametrowe dopasowanie krzywych teoretycznych do punktów eksperymentalnych parametry modelu W wielu zagadnieniach naukowych i technicznych pojawia się problem optymalizacji tzn. poszukiwania maksimum lub minimum pewnej funkcji. Jest tak np. w przypadku dopasowania zależności teoretycznych do punktów doświadczalnych – jest to inaczej mówiąc minimalizacja funkcji błędu dopasowania. W ogólnym przypadku analizowana funkcja ta może posiadać wiele maksimów bądź minimów, najwyższe maksimum i najniższe minimum nazywamy odpowiednio maksimum globalnym i minimum globalnym. Wiele metod – klasyczne metody numeryczne (gradientowe) są metodami optymalizacji lokalnej (rysunek). Jak zatem znaleźć globalne maksimum bądź minimum? Od lat 60. XX wieku zaproponowano wiele nowych metod optymalizacji opartych często na naśladowaniu procesów występujących w naturze. Są to m. in. … W dzisiejszym wystąpieniu chciałbym skupić się na AG i pokazać, iż stanowią one efektywne narzędzie optymalizacyjne. – analityczne – numeryczne (np. gradientowe) – enumeracyjne Metody klasyczne
2. Algorytmy genetyczne od podstaw AG = Poszukiwanie maksymalnej wartości funkcji przystosowania oparte na mechanizmach doboru naturalnego oraz dziedziczności łączące ewolucyjną zasadę przeżycia najlepiej przystosowanych z systematyczną i po części losową wymianą informacji. Krótka historia 1957-62: Barricelli, Fraser, Martin, Cockerham – modelowanie procesów genetycznych 1960: Holland (Uniw. Michigan) – systemy adaptacyjne AG 1967: Bagley – program gry w 6 pionków 1971: Hollstien; 1975: De Jong – optymalizacja funkcji 1985: Goldberg – optymalizacja pracy gazociągu Polacy: Michalewicz (Uniw. Północnej Karoliny, Charlotte, USA) Buller (ATR Kioto, Japonia) AG można zdefiniować jako... Krótka historia: ... John Holland, ... David Goldberg – doktorant Hollanda, Polacy: Zbigniew Michalewicz – autor monografii tłumaczonej na kilka języków, Andrzej Buller – pracuje nad sztucznym mózgiem.
biologia (genetyka) komputer (AG) gen bit chromosom ciąg bitów osobnik punkt w przestrzeni rozwiązań populacja zbiór punktów krzyżowanie wymiana ciągów bitów mutacja negacja bitów http://britneyspears.ac/lasers.htm 00101010101011100 kod binarny DNA liczby tekst (ASCII, tex, doc) grafika (bmp, gif, jpeg) dźwięk (wav, midi, mp3) wideo (avi, mpeg) Pierwszym pytaniem, na które należy odpowiedzieć w przypadku AG jest, jak przetłumaczyć pojęcia genetyczne na język zrozumiały dla komputera. Okazuje się, że jest to dość proste, gdyż w zarówno w naturze jak i w komputerach całe bogactwo ich „świata” jest odpowiednio kodowane – w DNA albo w ciągach bitów. Należy podkreślić, że operacje genetyczne (zarówno w przyrodzie jak i w AG) zachodzą na poziomie kodu – AG nie ma bezpośredniego dostępu do wartości zmiennych w przeszukiwanej przestrzeni rozwiązań. Operowanie na kodzie!
Kodowanie binarne liczb rzeczywistych Kodowanie liniowe za pomocą n bitów x[a, b]: podział [a, b] na 2n podprzedziałów wartości z k-tego podprzedziału k-1 w postaci binarnej Kodowanie logarytmiczne x = kodowanie liniowe log|x| gen chromosom Kodowanie wielu zmiennych sklejanie łańcuchów zmienna 1 zmienna 2 Kodowanie binarne - ... jest przyporządkowaniem niejednoznacznym i wiąże się z pewną utratą informacji - tzw. błąd dyskretyzacji jest tym mniejszy, im więcej bitów użyje się do kodowania, wtedy jednak wzrasta czas przetwarzania kodu.
Operatory genetyczne: selekcja Metoda ruletki – prawdopodobieństwo wyboru osobnika proporcjonalne do wartości FP 1. pokolenie nowe pokolenie obliczenie FP dla każdego osobnika mutacja krzyżowanie selekcja Pierwsze pokolenie osobników jest zwykle generowane w sposób czysto losowy – każdy gen może przyjąć wartość 0 lub 1 z prawdopodobieństwem 0.5. Następnie rozkodowuje się chromosom każdego osobnika i oblicza wartość funkcji przystosowania, aby dokonać selekcji czyli wyboru najlepszych osobników. 2 4 3 3 3 1 FP = funkcja przystosowania
Operatory genetyczne: krzyżowanie i mutacja 1. pokolenie nowe pokolenie obliczenie FP dla każdego osobnika mutacja krzyżowanie selekcja krzyżowanie jednopunktowe wymiana fragmentów chromosomów rodzice dzieci " mutacja negacja bitów z małym prawdopodobieństwem FP = funkcja przystosowania
Ewolucja – dążenie do optymalnego rozwiązania maksimum globalne FP 1. pokolenie 2. pokolenie itd. ... W kolejnych pokoleniach pojawiają się coraz lepsze osobniki, a ich liczba wzrasta.
3. Zastosowanie AG w dopasowaniu… na przykładzie metody PLS3 F laser filtr E PL Eg F1>F2 próbka temp. pokojowa EC EV Eg YPL= IPL/F natężenie światła wzbudzającego F wydajność kwantowa PL fotodetektor Analiza ilościowa! NSS(E) eV-1cm-2 EC EV energia, eV
Schemat analizy danych w PLS3 Dane eksperymentalne Zależność teoretyczna YPL(F) Symulator Wyznaczenie NSS(E) dobrze Procedura dopasowująca źle 5 parametrów NSS(E) 1. dobór procedury dopasowującej 2. definicja błędu dopasowania: pomiary w jednostkach względnych jednoczesna analiza wielu zależności eksperymentalnych 2 kluczowe problemy Dopasowanie = = minimalizacja błędu dopasowania ... Dwoma kluczowymi problemami, które pojawiają się w każdej metodzie wykorzystującej dopasowanie, są... W przypadku PLS3 należy zwrócić jeszcze uwagę na to, iż YPL jest wyrażone w jednostkach względnych oraz na występującą często potrzebę analizy wielu zależności eksperymentalnych równocześnie (np. pomiar PL w układzie pomiarowym o tej samej geometrii z tej samej powierzchni poddanej cyklowi obróbek). Ad 1. Wybór algorytmu genetycznego: metoda bezgradientowa (szybkość obliczeń) brak wstępnych danych o NSS(E)
Definicja funkcji błędu dopasowania (FBD) zmodyfikowana metoda najmniejszych kwadratów a·yt1(x) a·yt2(x) y x 1 100 PLS3: xF, yYPL, a – czynnik geometryczny ... Warto zauważyć, iż zaproponowana definicja umożliwia jednoczesną analizę dwu zależności różnych wielkości fizycznych (np. PL i SPV)…
Proces dopasowania za pomocą AG końcowe pośrednie pierwsze pokolenie YPL F * * * * * FBD 5 parametrów Nss(E)
Przykłady dopasowań Powierzchnia InP(100) poddana cyklowi obróbek M. Miczek: praca doktorska Powierzchnia InP(100) poddana cyklowi obróbek dopasowanie
Przykłady dopasowań M. Miczek: praca doktorska Powierzchnia GaAs(100) przed i po siarkowaniu w Na2S(aq) dopasowanie
… ale na razie ostatnie słowo ma człowiek. 4a. Podsumowanie + odporność na lokalne ekstrema + niepotrzebna wstępna wiedza (punkt startowy) + słabe założenia co do FP + wydajność + prostota pojęciowa Zalety AG – słabsza podbudowa teoretyczna – kodowanie (czasem konieczność naprawy chromosomów) – często koniecznośc skalowania FP Wady AG rozpoznawanie obrazów synteza i optymalizacja układów (mechanicznych, elektronicznych) sterowanie strategia gier klasyfikacja i automatyczne wnioskowanie analiza danych (dopasowanie, modelowanie) Zastosowania sztuczny mózg … ale na razie ostatnie słowo ma człowiek.
4b. Literatura o AG D. E. Goldberg, Algorytmy genetyczne i ich zastosowania, WNT, Warszawa, 1998 Z. Michalewicz, Algorytmy genetyczne + struktury danych = programy ewolucyjne, WNT, Warszawa, 1996 J. Arabas, Wykłady z algorytmów ewolucyjnych, WNT, Warszawa, 2001. M. D. Vose, The simple genetic algorithm. Foundations and theory, MIT Press, Cambridge, Massachusetts, 1999. T. Burczyński, Współczesne tendencje w rozwoju metod komputerowych w naukach stosowanych, wykład inauguracyjny w roku akad. 1998/1999 w Politechnice Śląskiej w Gliwicach, Gliwice, 1998. M. Miczek, Electronic Properties of III-V Semiconductor Surfaces from Computer-Aided Analysis of Photoluminescence, praca doktorska, Politechnika Śląska, Gliwice, 2004. P. Coveney, R. Highfiled, Granice złożoności, Prószyński i S-ka, Warszawa, 1997 (popularnonaukowa). A. Buller, Sztuczny mózg, Prószyński i S-ka, Warszawa, 1998 (popularnonaukowa). J. R. Koza, M. A. Keane, M. J. Streeter, O dokonywaniu wynalazków drogą ewolucji, Świat Nauki, 140 nr 4 (2003) 41. Illinois Genetic Algorithms Laboratory: http://www-illigal.ge.uiuc.edu/
5. Plan dalszej pracy 2DEG H E M T wykorzystanie idei alg. ewolucyjnych większa efektywność hybrydyzacja z alg. gradientowym większa jednoznaczność zastosowanie w innych metodach (np. fototermicznych) A. Rozbudowa procedury dopasowującej połączenie PLS3 z SPV(F) NSS(E), EFS (większa jednoznaczność) SPV(l) dla hc/l>Eg a, Eg, r(E), sondowanie w głąb YPL(F, l) B. Rozwój bezkontaktowych metod diagnostyki powierzchni PL SPV NSS SRV x E e- h+ GaAs In0,22Ga0,78As Al0,24Ga0,76As Si-d Al0,24Ga0,76As:Si GaAs:Si H E M T InGaAs AlGaAs 2DEG EC EV metody fototermiczne SRV C(V) NSS(E) C. Korelacje z innymi metodami
PLS3 + SPV(F) z realnej powierzchni GaAs B. Adamowicz, M. Miczek, P. Tomkiewicz, D. Zahn, J. Mizsei, H. Hasegawa: Contactless determination of surface state density spectrum at GaAs(100) surfaces from rigorous analysis of photon-induced effects Plakat prezentowany i nagrodzony na konferencji Nano and Giga Challenges in Microelectronics (Kraków, 13-17 IX 2004) Porównując ze sobą metody PLS3 i SPV(phi) warto zauważyć, iż 1. YPL jest wyrażone w jednostkach względnych, zaś SPV bezwzględnych (eV), co upraszcza analizę w przypadku SPV (brak czynnika skalującego) 2. SPV wymaga mniejszych wzbudzeń 3. sygnał SPV jest wyższy dla powierzchni z większa gęstością stanów powierzchniowych. 4. objętościowy czas życia nośników wpływa na PL, a praktycznie nie wpływa na SPV Obie metody są komplementarne i mogą ze sobą dobrze współdziałać. Univ. Technol. Chemnitz (Niemcy) Univ. Technol. & Econ. Budapeszt (Węgry)
technologia powierzchni związki III-V oraz azotki Współpraca z Research Center for Integrated Quantum Electronics w Sapporo (Japonia) Umowa 2003-5: Badania stanów powierzchniowych kwantowych nanostruktur związków półprzewodnikowych Możliwość rocznego wyjazdu do nanoelektronika przyrządy kwantowe charakteryzacja pasywacja technologia powierzchni związki III-V oraz azotki
Dziękuję za uwagę... © RCIQE W czasie pobytu w RCIQE mam nadzieję brać udział w procesie przejścia do świata kwantowej nanoelektroniki. Dziękuję za uwagę...
Informacja o źródłach slajd 1: rysunek zaczerpnięto z http://www.genetic-programming.org/ slajd 5: rysunek DNA zaczerpnięto z http://www.linnaeus.uu.se/online/ fysik/mikrokosmos/fylevande.html zdjęcie Britney Spears z http://britneyspears.ac/lasers.htm rysunek muszki owocowej z http://www.biologia.pl/nowosci/ genom_muszki_owocowej.phtml zdjęcie owcy Dolly z http://www.biologia.pl/kurs/klonowanie.phtml zdjęcie cesarskiej korony z http://www.pharmakobotanik.de/systematik/ 7_bilder/liebermn/lb-00047.jpg slajdy 10 i 20: logo RCIQE zaczerpnięto ze strony http://www.rciqe.hokudai.ac.jp/indexE.html slajd 18: rysunek HEMT-a i jego schemat pasmowy zaczerpnięto z artykułu Y. T. Cheng, Y. S. Huang, D. Y. Lin, F. H. Pollak, K. R. Evans, Surface photovoltage spectroscopy characterization of the GaAlAs/InGaAs/GaAs pseudomorphic high electron mobility transistor structures with varied quantum well compositional profiles, Physica E 14 (2002) 313-322. slajdy 20-21: zdjęcie i rysunki pochodzą z materiałów drukowanych RCIQE