Planowanie bezkolizyjnego ruchu w środowisku wielu robotów z wykorzystaniem gier niekooperacyjnych OWD 2003 0.01 0.02 0.51 7.01 1.01 0.11 3.41 0.00 0.09 ? R L S Krzysztof Skrzypczyk, Andrzej Świerniak Politechnika Śląska
Plan referatu: 1. Sformułowanie problemu planowania 2. Modelowanie 011000101001 Plan referatu: 1. Sformułowanie problemu planowania 2. Modelowanie dyskretyzacja przestrzeni decyzyjnej wyznaczenie funkcji kosztów 3. Rozwiązanie bazujące na grach niekooperacyjnych 4. Wyniki symulacyjne 5. Podsumowanie
Sformułowanie problemu 011000101001 Sformułowanie problemu System wyznaczania pozycji obiektów Robot 1 + T2 +TN nawigacyjne Zadanie Robot 2 +T1 O1 Robot N
Sformułowanie problemu: 011000101001 Sformułowanie problemu: Danych jest N robotów R1,R2, ... RN i M przeszkód O1,O2, ... ON umieszczonych we wspólnej przestrzeni roboczej W . Położenie i orientacja i-tego robota: Natomiast położenie i orientacja i-tej przeszkody: Przy czym orientacja przeszkody estymowana jest na bazie informacji o położeniu przeszkody w chwili t i t-1:
Sformułowanie problemu: 011000101001 Sformułowanie problemu: Cel nawigacyjny i-tego robota: Sterowanie danym robotem odbywa się przez zmianę jego prędkości kątowej i liniowej. Zapiszmy sterowanie i-tego robota jako wektor: Dyskretyzując przestrzeń sterowań otrzymujemy skończony zbiór działań (decyzji) Ui, które mogą być podejmowane przez i-ty robot:
Sformułowanie problemu: 011000101001 Sformułowanie problemu: Celem systemu jest wybór w każdej chwili t, zbioru decyzji (sterowań) S: Które wykonane przez każdego z robotów zapewnią bezkolizyjne przybliżenie tychże robotów do ich celów nawigacyjnych.
Modelowanie- założenia 011000101001 Modelowanie- założenia dana jednostka ma dostęp do informacji o położeniu pozostałych jednostek oraz ich zdolnościach lokomocyjnych (działaniach). brak jest komunikacji pomiędzy poszczególnymi jednostkami oraz role poszczególnych jednostek są symetryczne (podejmują decyzje w tych samych chwilach czasowych). Korzystając z tych założeń modelujemy proces planowania ruchu jako N-osobową grę macierzową o sumie niezerowej. Nawigacja robotów we wspólnym środowisku ma charakter procesu o sumie niezerowej, gdyż sprzeczność interesów ma miejsce tylko na pewnych płaszczyznach decyzyjnych (tylko pewne posunięcia są ze sobą w konflikcie inne natomiast nie).
Modelowanie- preselekcja prędkości liniowej 011000101001 Modelowanie- preselekcja prędkości liniowej Dyskretyzacja przestrzeni sterowań tylko ze względu na prędkość kątową: Prędkość liniowa vi ustalana jest jako funkcja oległości robota do jego celu i odległości do najbliższej przeszkody: Gdzie vopt,i to preferowana prędkość linowa, a wg i wt współczynniki wpływu najbliższego obiektu i celu nawigacyjnego:
Modelowanie-wyznaczanie funkcji kosztów 011000101001 Modelowanie-wyznaczanie funkcji kosztów Załóżmy, że N robotów operuje we wspólnej przestrzeni roboczej. Ponadto w tejże przestrzeni znajduje się M ruchomych przeszkód. Aby zamodelować problem jako N osobową grę w postaci normalnej należy znaleźć dla każdego z graczy (robotów) funkcję kosztów: gdzie oznacza decyzję (sterowanie) wykonane przez i-ty robot, polegającą na wyborze k-tego elementu ze zbioru Ui
Modelowanie -wyznaczanie funkcji kosztów 011000101001 Modelowanie -wyznaczanie funkcji kosztów Do wyznaczenia funkcji kosztów wykorzystano ideę sztucznych potencjałów zgodnie z którą robot poddany jest działaniu wirtualnych sił odpychających robot od przeszkód i przyciągających go do celu. Wypadkowa siła działająca na robot Cel Siła odpychająca Siła przyciągająca
Modelowanie -wyznaczanie funkcji kosztów 011000101001 Modelowanie -wyznaczanie funkcji kosztów Wartość siły przyciągającej, działającej na i-ty robot po wykonaniu przez niego działania k: Gdzie jest predykowaną odległością i-tego robota do celu, po czasie t: a :
Modelowanie -wyznaczanie funkcji kosztów 011000101001 Modelowanie -wyznaczanie funkcji kosztów Siła odpychająca, działająca na i-ty robot jest sumą wektorową sił generowanych przez pozostałe roboty i przeszkody: Gdzie: Oraz:
Modelowanie -wyznaczanie funkcji kosztów 011000101001 Modelowanie -wyznaczanie funkcji kosztów Wypadkowa siła, której działaniu poddany jest i-ty robot jest sumą wektorową sił odpychających i siły przyciągającej: Funkcja kosztów dla i-tego robota wyznaczana jest jako rzut siły Fi wybrany przez robot kierunek ruchu :
011000101001 Rozwiązanie problemu Rozwiązaniem problemu planowania jest zbiór działań (ruchów), dla którego koszty ponoszone przez poszczególne jednostki są dla nich satysfakcjonujące. Zakładając dążenie wszystkich jednostek do ponoszenia jak najmniejszych kosztów można poszukiwać rozwiązania jako punktu równowagi zgodnie z koncepcją zaproponowaną przez Nash’a:
011000101001 Rozwiązanie problemu W przypadku braku istnienia punktu równowagi możemy poszukiwać rozwiązania problemu jako rozwiązania minimaxowego:
011000101001 Rozwiązanie problemu W przypadku istnienia więcej niż jednego rozwiązania istnieje problem jednoznacznego wyboru.W ogólnym przypadku jest to zagadnienie złożone. W naszym przypadku jednak zadanie uprościć wprowadzając tzw. hierarchię wtórną: K-elementowy rozwiązań pierwotnego problemu niekooperacyjnego Wybór na danym etapie robota lidera Wybór rozwiązania „najlepszego” dla lidera Rozwiązanie 1 Rl R1 Rozwiązanie 2 Rozwiązanie b RN Rozwiązanie K
011000101001 Rozwiązanie problemu W przypadku istnienia więcej niż jednego rozwiązania istnieje problem jednoznacznego wyboru.W ogólnym przypadku jest to zagadnienie złożone. W naszym przypadku jednak zadanie uprościć wprowadzając tzw. hierarchię wtórną: K-elementowy rozwiązań pierwotnego problemu niekooperacyjnego Wybór na danym etapie robota lidera Wybór rozwiązania „najlepszego” dla lidera Rozwiązanie b Rozwiązanie 1 Rl R1 Rozwiązanie 2 RN Rozwiązanie K
Symulacja 1 - wpływ wzmocnienia ka siły przyciągającej 011000101001 Symulacja 1 - wpływ wzmocnienia ka siły przyciągającej Zbiory sterowań: Preferowane prędkości liniowe: Odstęp pomiędzy kolejnymi sterowaniami: t=0.2 [s]
011000101001 ka=350, kr=100
011000101001 ka=1000, kr=100
Symulacja 2- wpływ wzmocnienia kr sił odpychających 011000101001 Symulacja 2- wpływ wzmocnienia kr sił odpychających Zbiory sterowań: Preferowane prędkości liniowe: Odstęp pomiędzy kolejnymi sterowaniami: t=0.2 [s]
011000101001 ka=550, kr=100
011000101001 ka=550, kr=200
011000101001 Symulacja 3 - działanie systemu w obecności ruchomych przeszkód : ka=550, kr=100
011000101001 Podsumowanie Na podstawie przeprowadzonych symulacji można stwierdzić, iż proponowana metoda daje poprawne wyniki (w ramach przyjętych założeń) Istnieje konieczność doboru współczynników sił odpychających i przyciągaj ących – potrzeba zbadania możliwości zastosowania metod adaptacyjnych do ich doboru Powiększanie liczby możliwych decyzji poprawia skuteczność metody z jednej strony, z drugiej natomiast powoduje wzrost kosztów obliczeniowych, co w efekcie może dyskwalifikować ją z zastosowań on-line. Należy zbadać możliwość adaptacyjnego doboru zbiorów decyzyjnych.