Geometria obliczeniowa Wykład 14 Algorytmy randomizowane 1.Programowanie liniowe w R 2. 2.Lokalizacja punktu w siatce trapezów. 3.Znajdywanie średnicy zbioru punktów w R 3. Algorytmy równoległe 1. Otoczka wypukła.
Podstawowe metody stosowane w algorytmach randomizowanych. Metoda Las Vegas. Metoda ta zawsze daje poprawne rozwiązanie. Natomiast czas trwania algo- rytmu może być zmienny w zależności od układu danych. Przykładem takie- go algorytmu moze być np. Quickhull lub dowolny algorytmy przyrostowy z losowo uporządkowanymi danymi. Metoda Monte Carlo. Metoda ta zawsze kończy się w ustalonym czasie, ale może z pewnym praw- dopodobieństwem zwrócić zły wynik bądź zwraca wynik tylko z pewną do- kładnością. Przykładem takiego algorytmu może być np. szukanie ścieżki łą- czącej dwa punkty w labiryncie przy losowym wyborze kierunku poruszania się lub losowe próby lokalizacji punktu na płaszczyźnie podzielonej na obszary. Formalnie efektywność takiego algorytmu jest zmienną losową określoną na przestrzeni możliwych losowych ciągów. Wartość oczekiwana takiej zmien- nej nazywana jest oczekiwanym czasem działania.
Programowaniee liniowe w R 2. Dana jest liniowa funkcja celu c oraz n warun- ków brzegowych (zbiór H nierówności linio- wych) opisujących obszar dopuszczalny D, w którym poszukujemy punktu maksymalizujcego (minimalizującego) wartość funkcji c. Algorytm if obszar wyznaczany przez półpłaszczyzny z H jest ograniczony w kierunku wzrostu wartości funkcji c i nie jest pusty then określ półpłaszczyzny h 1, h 2 ograniczające wzrost wartości funkcji c, punkt przecięcia ich brzegów x:= (h 1 ) (h 2 ) i D:= h 1 h 2 else return(„Brak rozwiązania”); for h H-{h 1,h 2 } do if x h then D := D h; if D then x := {q: c(q) = max p (h) D c(p)} else return(„Brak rozwiązania”); return(x, c(x)); max 3x+2y y - 0,5x - 3 0 y + 2x - 17 0 -y + x - 7 0 y - 5 0 -y + 0,5x - 3 0 y + x - 10 0
Twierdzenie Problem programowania liniowego w R 2 dla n warunków brzegowych można rozwiązać w czasie oczekiwanym O(n) z wykorzystaniem O(n) pamięci. Dowód. Niech v i będzie punktem, w którym funkcja c przyjmuje maksimum (minimum) w obszarze wyznaczanym przez i półpłaszczyzn, a h i i-tą półpłaszczyznę. Zdefiniujmy zmienną losową X i przyjmującą wartość 1, gdy v i-1 h i oraz 0 w przeciwnym przypadku. Ponieważ znalezienie nowego maksimum (rozwiązanie problemu jednowymiarowego programowania liniowego), wymaga czasu O(n) (można to zrobić w czasie O(log n) - ale pociąga to za sobą zmiany w strukturze, których chcemy uniknąć), więc oczekiwany czas działania algorytmu wynosi E( n i=3 O(i)X i ) = n i=3 O(i)E(X i ). Wartość E(X i ) szacujemy stosując tzw. analizę powrotną. W tym celu badamy, jak zmie- nia się problem, gdy mając i warunków brzegowych, odejmiemy jedną z półpłaszczyzn. Punkt, w którym funkcja c ma maksimum (minimum) może ulec zmianie, gdy odejmie- my co najwyżej dwie spośród półpłaszczyzn wyznaczających obszar (wyznaczają one wierzchołek, w którym przyjmowane jest maksimum (minimum) - jeśli przez ten punkt przechodzi więcej prostych będących brzegami danych półpłaszczyzn, to może się zda- żyć, że usunięcie dowolnej półpłaszczyzny nie wpływa na wartość funkcji celu. Zatem E(X i ) 2/i-2. Stąd n i=3 O(i)E(X i ) = n i=3 O(1) = O(n).
Lokalizacja punktu w siatce trapezów. Problem Dany jest prostokątny obszar oraz n zawar- tych w nim odcinków (z których żaden nie jest pionowy i żadne dwa końce nie mają tej samej współrzędnej x-owej ani y-owej). Chcemy odpowiadać na pytanie: Miedzy którymi dwoma odcinkami (od góry i od dołu) znajduje się dany punkt ? Przedstawimy algorytm przyrostowy znaj- dujący podział obszaru na trapezy oraz tworzący Skonstruujemy strukturę danych umożliwia- jącą odpowiedź na zapytania o położenie punktów, wykorzystującą podział obszaru na trapezy.
Struktura jest grafem skierowanym, którego wierzchołki odpowiadają trapezom podziału, końcom odcinków i samym odcinkom. Wierzchołki odpowiadające odcinkom mogą występować wielokrotnie. Wierzchołki od- powiadające trapezom mają zerowy stopień wyjściowy. Niech p i i q i oznaczają odpowiednio począ- tek i koniec i-tego odcinka s i. Gdy odcinek s i zawiera się w jednym z już istniejących trapezów, to w miejsce odpo- wiadającego mu wierzchołka wstawiamy wierzchołek p i, którego lewym synem jest wierzchołek odpowiadający trapezowi pow- stającemu po lewej stronie p i a prawym sy- nem jest q i. Prawym synem q i jest wierzcho- łek odpowiadający trapezowi powstającemu po prawej stronie q i a lewym synem jest s i. Lewy i prawy syn s i odpowiadają odpowied- nio trapezowi powyżej i poniżej odcinka s i. sksk smsm A DS(S i-1 ) A sisi E D C B qiqi sisi pipi B CD E
CBA Gdy odcinek s i przecina wiele istniejących już trapezów, to w miejsce wierzchołka odpowiadającego skrajnie lewemu trape- zowi wstawiamy p i, którego lewym synem jest wierzchołek odpowiadający trapezowi powstającemu po lewej stronie p i a pra- wym synem jest s i. W miejsce wierzchołka odpowiadającego skrajnie prawemu trapezowi wstawiamy q i, którego prawym synem jest wierzcho- łek odpowiadający trapezowi powstają- cemu po prawej stronie q i a lewym synem jest s i. Pozostałym trapezom odpowiadają wierz- chołki s i. Lewy i prawy syn dowolnego wierzchołka s i odpowiada odpowiednio trapezowi powstałemu powyżej i poniżej odcinka s i w miejscu poprzedniego trapezu. C AB sdsd scsc sbsb sasa DS(S i-1 ) I sisi H G F E D pipi qiqi sisi sisi sisi GD EFH I
Algorytm inicjalizuj strukturę DS ; for i:=1 to n do z pomocą struktury DS znajdź trapezy, które przecina odcinek s i ; zastąp w strukturze DS przecinane tra- pezy nowymi układami wierzchołków; E D C B A J I H G F E D C B A J I H G F
Twierdzenie Algorytm oblicza sieć trapezów T(S) dla zbioru n odcinków S i tworzy strukturę danych DS(S) dla sieci T(S) w oczekiwanym czasie O(n log n). Oczekiwany rozmiar struktury wynosi O(n), a lokalizacja punktu wymaga oczekiwanego czasu O(log n). Dowód. Zmiana wierzchołka odpowiadającego trapezowi zwiększa długość ścieżki wyszukującej punkt o co najwyżej 3 wierzchołki. Jednak szacowanie długości ścieżki wyszukiwań w ten sposób jest zbyt grube. Rozważmy ścieżkę wyszukiwań punktu q w strukturze danych DS. Niech X i oznacza dla 1 i n liczbę wierzchołków na ścieżce wyszukiwań dodanych w i-tej iteracji. Zatem oczekiwana długość ścieżki wyszukiwań wynosi E( n i=1 X i ) = n i=1 E(X i ). Niech P i oznacza prawdopodobieństwo przejścia w trakcie lokalizacji punktu q przez wierzchołki stworzone w i-tej iteracji. Mamy E(X i ) 3P i. Ale P i =P[t q (S i ) t q (S i-1 )], gdzie t q (S i ) oznacza trapez w sieci powstałej po i-tej iteracji zawierający punkt q.
Aby oszacować prawdopodobieństwo P i zastosujemy analizę powrotną. W sieci powstałej po i-tej iteracji, zmianę trapezu zawierającego punkt q spowodować może usunięcie co najwyżej czterech krawędzi: - będącej górną krawędzią trapezu, - będącej dolną krawędzią trapezu, - wyznaczającej poprzez swój koniec lewą ścianę trapezu, - wyznaczającej poprzez swój koniec prawą ścianę trapezu. Jeśli koniec krawędzi będącej np. dolną krawędzią trapezu wyznacza równocześnie np. lewą ścianę trapezu, to liczba krawędzi, których usunięcie może wpłynąć na zmianę trapezu zawierającego punkt q, może być mniejsza niż 4. Zatem P i =P[t q (S i ) t q (S i-1 )] = P[t q (S i ) T(S i-1 )] 4/i. Stąd n i=1 E(X i ) n i=1 3P i n i=1 12/i = 12 n i=1 1/i = 12H n = O(log n). czyli oczekiwany czas lokalizacji punktu jest O(log n).
Zbadajmy oczekiwany rozmiar struktury. Wynosi on: (Liczba trapezów) + n i=1 (Liczba wierzchołków wewnętrznych stworzonych w i-tej iteracji). Liczba trapezów szacuje się przez O(n). Natomiast liczba wierzchołków dodanych w jednej iteracji może być liniowa względem liczby zbadanych odcinków. Prowadzi to do kwadratowego (pesy- mistycznego) oszacowania rozmiaru omawianej struktury danych (ćwiczenia). Niech k i oznacza liczbę trapezów tworzonych w i-tej iteracji. Zatem liczba nowych wierzchołków wewnętrznych wynosi k i -1 (ćwiczenia). Niech (t,s) będzie równe 1, gdy trapez t T(S i ) nie będzie należeć do T(S i- 1 ), gdy usuniemy odcinek s oraz 0 w przeciwnym przypadku. Mamy s S t [t T(S i )] (t,s) 4T(S i ) = O(i). Stąd E(k i ) = 1/i s S t [t T(S i )] (t,s) O(i)/i = O(1), czyli oczekiwana liczba nowych wierzchołków wewnętrznych powstałych w i-tej iteracji jest stała. Zatem oczekiwany rozmiar struktury danych wynosi O(n) + n i=1 E(k i-1 ) = O(n) + n i=1 E(k i ) = O(n) + n i=1 O(1) = O(n), czyli jest liniowy względem liczby odcinków.
Teraz możemy obliczyć oczekiwany czas pracy algorytmu, który wynosi: (Koszt inicjalizacji) + n i=1 (średni czas wyszukiwania położenia końców odcinka dodawanego w i-tej iteracji + liczba nowych wierzchołków dodawanych w i-tej iteracji) = O(1) + n i=1 (O(log i) + O(E(k i ))) = O(n log n), co kończy dowód.
I (S) D(S) Znajdywanie średnicy zbioru punktów w R 3. Definicja Dla danego zbioru n punktów S średnicą D(S) nazywamy odległość między dwo- ma najdalszymi punktami w S. Definicja Niech I (S) oznacza obszar będący częścią wspólną kul o promieniu i środkach w punktach należących do zbioru S. F(p) oznacza maksymalną odległość mię- dzy punktem p a jakimkolwiek innym punktem ze zbioru S. p F(p)
Fakt. Dla każdego punktu q I (S), gdy = F(p), zachodzi F(q) F(p) D(S). Natomiast dla q I (S), mamy F(p) F(q) D(S). Algorytm while S do wybierz losowo z S punkt p; oblicz F(p); znajdź I (S) dla = F(p); S := S – (S I (S) ); return( );
Lemat. Średnicę zbioru n punktów w R 3 można znaleźć w oczekiwanym czasie O(n log n). Dowód. W każdym kroku usuwamy co najmniej jeden punkt (wybrany). F(p) obliczamy w czasie liniowym. Znalezienie I (S) wymaga czasu O(n log n) (postępujemy identycznie jak w przypadku znajdywania przecięcia półprzestrzeni, co jest problemem dualnym do znajdywania otoczki wypukłej). Punkty z S należące do I (S) znajdujemy w czasie O(n log n) (ćwiczenia). Ustawmy wartości F(p i ), gdzie p i S w ciąg niemalejący. Wtedy wybór punktu p, podobnie jak w quicksorcie, dzieli ciąg na dwie części - punkty, wśród których będziemy szukać rozwiązania i pozostałe. Zakładając, że punkty wybieramy z jednakowym prawdopodobieństwem, możemy obliczyć oczekiwany czas działania algorytmu : T(n) = O(n) + O(n log n) + n-1 i=0 T(i)/n, co daje T(n) = O(n log n).
Algorytmy równoległe. Otoczka wypukła. Chcemy znaleźć otoczkę wypukłą n elementowego zbioru S punktów na płaszczyźnie. Rozpatrujemy model PRAM, w którym procesory komunikują się poprzez wspólną pamięć. Wyróżniamy różne rodzaje obliczeń w zależności od tego, czy procesory mogą jednocześnie czytać (CR) informacje z tej samej komórki pamięci czy nie (ER) oraz czy mogą jednocześnie zapisywać dane (CW) czy tylko osobno (EW). W przypadku CW określamy dodat- kowo jaki sposób zapisu danych nie powoduje konfliktu. Algorytm 1. Dysponujemy O(n 3 ) procesorami CRCW PRAM typu AND (mogą bez- konfliktowo zapisywać te same informacje).
for każdy p S do CH(p,1) := true; CH(p,2):=true; for każda para q,r S-{p} do if qpr > then CH(p,1) := false; if rpq > then CH(p,2) := false; if CH(p,1) or CH(p,2) then return(p) ; Lemat. Algorytm 1 znajduje otoczkę wypukłą w czasie stałym.
Algorytm 2. Dysponujemy O(n 2 ) procesorami CRCW PRAM typu SMALL (zapisują dane o naj- mniejszej wartości). Mierzymy kąt między prostą równoległą do osi x-ów przechodzącą przez punkt p a od- cinkiem łączącym p z punktem q powyżej (G) i poniżej (D), zgodnie (C) i przeciwnie (CC) do ruchu wskazówek zegara. for każdy p S do for każdy q S-{p} do A(p) := GC(q); B(p) := DCC(q); C(p) := GCC(q); D(p) := DC(q); if A(p)+B(p) or C(p)+D(p) then return(p) ;
Lemat. Algorytm 2 znajduje otoczkę wypukłą w czasie stałym. Algorytm 3. Dysponując O(n) procesorami CREW PRAM skorzystamy z metody „dziel i rządź”. posortuj punkty względem x-ów; while zbiory nie są dostatecznie małe do dziel je na pierwiastkowo wiele części o zbliżonym rozmiarze; znajdź otoczki małych zbiorów; while jest więcej niż jedna otoczka do połącz otoczki w kolejności odwrot- nej do kolejności podziału;
Jak łączymy małe otoczki ? oblicz styczne zewnętrzne dla każdej pary otoczek stosując wyszukiwanie binarne; systemem pucharowym znajdź krawędzie lub styczne maksymalnie odchylone od pionu w górę (dla górnych) i w dół (dla dolnych); połącz krawędzie nowych otoczek w listy; zastosuj sumy prefiksowe do okreś- lenia kolejności wierzchołków; stablicuj otoczki;
Twierdzenie. Algorytm 3 znajduje otoczkę wypukłą n elementowego zbioru S punktów na płaszczyźnie w czasie O(log n) wykorzystując w tym celu O(n) pro- cesorów CREW PRAM. Dowód. Sortowanie, wyszukiwanie binarne, system pucharowy, sumy prefiksowe na zbiorze n elementowym można wykonać w czasie O(log n). Zatem złożoność algorytmu opisuje równanie: T(n) = T(n 1/2 ) + O(log n), czyli T(n) = O(log n).