Geometria obliczeniowa Wykład 13 Algorytmy randomizowane 1.Lokalizacja punktu w siatce trapezów. 2.Znajdywanie średnicy zbioru punktów w R 3. Algorytmy równoległe 1.Otoczka wypukła.
Lokalizacja punktu w siatce trapezów. Problem Dany jest prostokątny obszar oraz n zawar- tych w nim rozłącznych odcinków (z których żaden nie jest pionowy i żadne dwa końce nie mają tej samej współrzędnej x-owej ani y-owej). Chcemy odpowiadać na pytanie: Miedzy którymi dwoma odcinkami (od góry i od dołu) znajduje się dany punkt ? Przedstawimy algorytm przyrostowy znaj- dujący podział obszaru na trapezy. Skonstruujemy strukturę danych umożliwia- jącą odpowiedź na zapytania o położenie punktów, wykorzystującą podział obszaru na trapezy.
Struktura jest grafem skierowanym, którego wierzchołki odpowiadają trapezom podziału, końcom odcinków i samym odcinkom. Wierzchołki odpowiadające odcinkom mogą występować wielokrotnie. Wierzchołki od- powiadające trapezom są liśćmi (wierzchoł- kami o zerowym stopniu wyjściowym). Niech p i i q i oznaczają odpowiednio począ- tek i koniec i-tego odcinka s i. Gdy odcinek s i zawiera się w jednym z już istniejących trapezów, to w miejsce odpo- wiadającego mu wierzchołka wstawiamy wierzchołek p i, którego lewym synem jest wierzchołek odpowiadający trapezowi pow- stającemu po lewej stronie p i a prawym sy- nem jest q i. Prawym synem q i jest wierzcho- łek odpowiadający trapezowi powstającemu po prawej stronie q i a lewym synem jest s i. Lewy i prawy syn s i odpowiadają odpowied- nio trapezowi powyżej i poniżej odcinka s i. sksk smsm A DS(S i-1 ) A sisi E D C B qiqi sisi pipi B CD E
CBA Gdy odcinek s i przecina wiele istniejących już trapezów, to w miejsce wierzchołka odpowiadającego skrajnie lewemu trape- zowi wstawiamy p i, którego lewym synem jest wierzchołek odpowiadający trapezowi powstającemu po lewej stronie p i a pra- wym synem jest s i. W miejsce wierzchołka odpowiadającego skrajnie prawemu trapezowi wstawiamy q i, którego prawym synem jest wierzcho- łek odpowiadający trapezowi powstają- cemu po prawej stronie q i a lewym synem jest s i. Pozostałym trapezom odpowiadają wierz- chołki s i. Lewy i prawy syn dowolnego wierzchołka s i odpowiada odpowiednio trapezowi powstałemu powyżej i poniżej odcinka s i w miejscu poprzedniego trapezu. C AB sdsd scsc sbsb sasa DS(S i-1 ) I sisi H G F E D pipi qiqi sisi sisi sisi GD EFH I
Algorytm inicjalizuj strukturę DS ; for i:=1 to n do z pomocą struktury DS znajdź trapezy przecinane przez odcinek s i ; zastąp w strukturze DS przecinane tra- pezy nowymi układami wierzchołków; E D C B A J I H G F E D C B A J I H G F
Twierdzenie Algorytm oblicza sieć trapezów T(S) dla zbioru n odcinków S i tworzy strukturę danych DS(S) dla sieci T(S) w oczekiwanym czasie O(n log n). Oczekiwany rozmiar struktury wynosi O(n), a lokalizacja punktu wymaga oczekiwanego czasu O(log n). Dowód. Zmiana wierzchołka odpowiadającego trapezowi zwiększa długość ścieżki wyszukującej punkt o co najwyżej 3 wierzchołki. Jednak szacowanie długości ścieżki wyszukiwań w ten sposób jest zbyt grube. Rozważmy ścieżkę wyszukiwań punktu q w strukturze danych DS. Niech X i oznacza dla 1 i n liczbę wierzchołków na ścieżce wyszukiwań dodanych w i-tej iteracji. Zatem oczekiwana długość ścieżki wyszukiwań wynosi E( n i=1 X i ) = n i=1 E(X i ). Niech P i oznacza prawdopodobieństwo przejścia w trakcie lokalizacji punktu q przez wierzchołki stworzone w i-tej iteracji. Mamy E(X i ) 3P i oraz P i =P[t q (S i ) t q (S i-1 )], gdzie t q (S i ) oznacza trapez w sieci powstałej po i-tej iteracji zawierający punkt q.
Aby oszacować prawdopodobieństwo P i zastosujemy analizę powrotną. W sieci powstałej po i-tej iteracji, zmianę trapezu zawierającego punkt q spowodować może usunięcie co najwyżej czterech krawędzi: - będącej górną krawędzią trapezu, - będącej dolną krawędzią trapezu, - wyznaczającej poprzez swój koniec lewą ścianę trapezu, - wyznaczającej poprzez swój koniec prawą ścianę trapezu. Jeśli koniec krawędzi będącej np. dolną krawędzią trapezu wyznacza równocześnie np. lewą ścianę trapezu, to liczba krawędzi, których usunięcie może wpłynąć na zmianę trapezu zawierającego punkt q, może być mniejsza niż 4. Zatem P i =P[t q (S i ) t q (S i-1 )] = P[t q (S i ) T(S i-1 )] 4/i. Stąd n i=1 E(X i ) n i=1 3P i n i=1 12/i = 12 n i=1 1/i = 12H n = O(log n). czyli oczekiwany czas lokalizacji punktu jest O(log n).
Zbadajmy oczekiwany rozmiar struktury. Wynosi on: (Liczba trapezów) + n i=1 (Liczba wierzchołków wewnętrznych stworzonych w i-tej iteracji). Liczba trapezów szacuje się przez O(n). Natomiast liczba wierzchołków dodanych w jednej iteracji może być liniowa względem liczby zbadanych odcinków. Prowadzi to do kwadratowego (pesy- mistycznego) oszacowania rozmiaru omawianej struktury danych. Niech k i oznacza liczbę trapezów tworzonych w i-tej iteracji. Zatem liczba nowych wierzchołków wewnętrznych wynosi k i -1. Niech (t,s) będzie równe 1, gdy trapez t T(S i ) nie będzie należeć do T(S i-1 ) po usunięciu odcinka s oraz 0 w przeciwnym przypadku. Mamy s S t [t T(S i )] (t,s) 4T(S i ) = O(i). Stąd E(k i ) = 1/i s S t [t T(S i )] (t,s) O(i)/i = O(1), czyli oczekiwana liczba nowych wierzchołków wewnętrznych powstałych w i-tej iteracji jest stała. Zatem oczekiwany rozmiar struktury danych wynosi O(n) + n i=1 E(k i -1) = O(n) + n i=1 E(k i ) = O(n) + n i=1 O(1) = O(n), czyli jest liniowy względem liczby odcinków.
Teraz możemy obliczyć oczekiwany czas pracy algorytmu, który wynosi: (Koszt inicjalizacji) + n i=1 (średni czas wyszukiwania położenia końców odcinka dodawanego w i-tej iteracji + liczba nowych wierzchołków dodawanych w i-tej iteracji) = O(1) + n i=1 (O(log i) + O(E(k i ))) = O(n log n), co kończy dowód.
I (S) D(S) Znajdywanie średnicy zbioru punktów w R 3. Definicja Dla danego zbioru n punktów S średnicą D(S) nazywamy odległość między dwo- ma najdalszymi punktami w S. Definicja Niech I (S) oznacza obszar będący częścią wspólną kul o promieniu i środkach w punktach należących do zbioru S. F(p) oznacza maksymalną odległość mię- dzy punktem p a jakimkolwiek innym punktem ze zbioru S. p F(p)
Fakt. Dla każdego punktu q I (S), gdy = F(p), zachodzi F(q) F(p) D(S). Natomiast dla q I (S), mamy F(p) F(q) D(S). Algorytm while S do wybierz losowo z S punkt p; oblicz F(p); znajdź I (S) dla = F(p); S := S – (S I (S) ); return( );
Lemat. Średnicę zbioru n punktów w R 3 można znaleźć w oczekiwanym czasie O(n log n). Dowód. W każdym kroku usuwamy co najmniej jeden punkt (wybrany). F(p) obliczamy w czasie liniowym. Znalezienie I (S) wymaga czasu O(n log n) (postępujemy identycznie jak w przypadku znajdywania przecięcia półprzestrzeni, co jest problemem dualnym do znajdywania otoczki wypukłej). Punkty z S należące do I (S) znajdujemy w czasie O(n log n). Ustawmy wartości F(p i ), gdzie p i S w ciąg niemalejący. Wtedy wybór punktu p, podobnie jak w algorytmie Hoare’a dzieli ciąg na dwie części - punkty, wśród których będziemy szukać rozwiązania i pozostałe. Zakładając, że punkty wybieramy z jednakowym prawdopodobieństwem, możemy obliczyć oczekiwany czas działania algorytmu : T(n) = O(n) + O(n log n) + n-1 i=0 T(i)/n, co daje T(n) = O(n log n).
Algorytmy równoległe w modelu PRAM. Otoczka wypukła. Chcemy znaleźć otoczkę wypukłą n elementowego zbioru S punktów na płaszczyźnie. Rozpatrujemy model PRAM, w którym procesory komunikują się poprzez wspólną pamięć. Wyróżniamy różne rodzaje obliczeń w zależności od tego, czy procesory mogą jednocześnie czytać (CR) informacje z tej samej komórki pamięci czy nie (ER) oraz czy mogą jednocześnie zapisywać dane (CW) czy tylko osobno (EW). W przypadku CW określamy dodat- kowo jaki sposób zapisu danych nie powoduje konfliktu.
Dysponując O(n) procesorami CREW PRAM skorzystamy z metody „dziel i rządź”. posortuj punkty względem x-ów; while zbiory nie są dostatecznie małe do dziel je na pierwiastkowo wiele części o zbliżonym rozmiarze; znajdź otoczki małych zbiorów; while jest więcej niż jedna otoczka do połącz otoczki w kolejności odwrot- nej do kolejności podziału;
Jak łączymy małe otoczki ? (a)oblicz styczne zewnętrzne dla każdej pary otoczek stosując wyszukiwanie binarne; (b)systemem pucharowym znajdź krawędzie lub styczne maksymalnie odchylone od pionu w górę (dla górnych) i w dół (dla dolnych); (c)połącz krawędzie nowych otoczek w listy; (d) zastosuj sumy prefiksowe do określenia kolejności wierzchołków; (e)stablicuj nowe otoczki;
Twierdzenie (Cole’88). Zbiór n liczb rzeczywistych można posortować w czasie O(log n) z pomocą O(n) procesorów CREW PRAM Twierdzenie. Algorytm znajduje otoczkę wypukłą n elementowego zbioru S punktów na płaszczyźnie w czasie O(log n) wykorzystując w tym celu O(n) pro- cesorów CREW PRAM. Dowód. Wyszukiwanie binarne, system pucharowy, sumy prefiksowe na zbiorze n elementowym można wykonać w czasie O(log n). Zatem złożoność algorytmu opisuje równanie: T(n) = T(n 1/2 ) + O(log n), czyli T(n) = O(log n).
Dziękuję za uwagę.
Ćwiczenia. 1. Który z poniższych algorytmów generuje losowe permutacje dla danej tablicy A długości n (tzn. każda możliwa permutacja A jest równie prawdopodobna jako wynik): a) (bez identyczności) for i:=1 to n do zamień(A[i],A[RANDOM(i+1,n)]); b) for i:=1 to n do zamień(A[i],A[RANDOM(1,n)]); c) for i:=n downto 2 do zamień(A[i],A[RANDOM(1,i)]); 2. Podaj przykład układu odcinków generującego w pesymistycznym przypadku strukturę podziału na trapezy rozmiaru O(n 2 ). 3. Udowodnij, że liczba wewnętrznych węzłów w strukturze przeszukiwań D algorytmu tworzenia mapy trapezowej wzrasta o k i -1 w iteracji i, gdzie k i jest liczbą nowych trapezów w T(S i ) (a stąd nowych liści w D). 4. Udowodnij, że mapa trapezowa n odcinków w położeniu ogólnym ma co najwyżej 3n+1 trapezów.
5. Prosty wielokąt nazywamy gwiaździstym, gdy zawiera punkt q widoczny z każdego punktu wielokąta. Podaj algorytm, którego oczekiwany czas działania jest liniowy i sprawdza, czy dany prosty wielokąt jest gwiaździsty. 6. Z pomocą O(n) procesorów CREW PRAM znajdź w czasie O(log n) minimalny pas zawierający dany zbiór n punktów na płaszczyźnie.