Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałAnna Szczepańska Został zmieniony 6 lat temu
1
Rola i znaczenie syntezy logicznej w technice układów FPGA i analizie danych
Tadeusz Łuba Faculty of Electronics and Information Technology Warsaw University of Technology II Sympozjum FPGA 2016, Uniwersytet Jagielloński, Kraków 2016 1
2
Motto Why Again Logic Synthesis?
Giovanni De Micheli, EPFL Workshop on Logic Synthesis and Verification, 10 December 2015 Why Again Logic Synthesis? “Most logic synthesis and optimization problems are not inherently solved, as demonstrated by the fact that current commercial systems are based on heuristics”. Niedoskonałość metod syntezy logicznej w komercyjnych systemach projektowania 2
3
Przyczyny… Powszechnie stosowaną metodą syntezy logicznej jest minimalizacja funkcji boolowskich, a ta procedura jest niedostosowana do zasobów układów FPGA, wyposażonych w komórki LUT oraz pamięci ROM. 3
4
Logic synthesis 3.3. Functional decomposition
Próby zaradzenia tej sytuacji podejmowane były od dawna, ale szczególnej intensywności nabrały stosunkowo niedawno… Mocnym głosem okazała się książka .., w której po raz pierwszy tak wyraźnie stwierdzono, że jedynymi skutecznymi metodami syntezy Dla układów FPGA są: Redukcja argumentów Dekompozycja funkcjonalna 3.3. Functional decomposition 11. Reduction of the Number of Variables 4
5
zastępuje się pamięcią ROM
Filtr f5 w technice DA .i 11 .o 11 .p 2048 . .i 7 .o 11 .p 128 . Układ mnożenia zastępuje się pamięcią ROM R e j s t r y ROM + R .i 11 .o 11 .p 2048 .i 7 .o 11 .p 128 5
6
Bez redukcji Synteza programem Vivado Dla układu Virtex-7 6
7
Po redukcji Synteza programem Vivado 2015.4.2
Dla układu Virtex-7 (xc7vx330tffg1157-2) 7
8
Realizacje układu AR filtru f5
Bez redukcji argumentów Z redukcją argumentów System and chip LE pcs Vivado Virtex-7 (xc7vx330tffg1157-2) LUT6 LUT5 LUT4 LUT3 LUT2 MUXF7 MUXF8 330 86 49 34 32 5 1 9 Altera Quartus II Stratix V (5SEE9H40I2) ALUT7 ALUT6 ALUT5 ALUT4 ALUT3 62 294 2675 1022 1677 140 160 65 61 PrecisionRTL Synthesis VIRTEX-7 (7VX330TFFG1157) LUT 1915 (total) 8
9
Zastosowania: Index Generation Functions,
T. Sasao: Index Generation Functions: Logic Synthesis for Pattern Matching Index Generation Functions, to metodyka syntezy logicznej układów cyfrowych starająca się sprostać wyzwaniom stawianym przez konieczność precyzyjnego wyodrębniania właściwych danych z ogromnej masy danych niepotrzebnych. Zastosowania: dystrybucja adresów IP, skanowanie wirusów, wykrywanie niepożądanych danych, konwersja kodów itp. 9
10
Układ do wykrywania wzorców
x1 y1 x2 Pattern matching circuit y2 x3 y3 y4 x40 Trzeba wykryć stosunkowo niewielką liczbę wzorów spośród ogromnej liczby innych wektorów 40-bitowych… T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching, EPFL Workshop on Logic Synthesis & Verification, Dec 10
11
Jak zaprojektować układ do wykrywania wzorców?
10 wektorów 40 bitowych Jak zaprojektować układ do wykrywania wzorców? T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching, EPFL Workshop on Logic Synthesis & Verification, Dec 11
12
Głównym problemem jest zatem obliczanie reduktów!
Generator indeksów Zadanie takie rozwiązuje się algorytmem redukcji argumentów 5 4 x1 4 5 Linear Circuity Main Memory AND AUX Memory 35 x2 35 Głównym problemem jest zatem obliczanie reduktów! 35 Comparator x2 T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching, EPFL Workshop on Logic Synthesis & Verification, Dec 12
13
Komentarz Najpilniejsze zadanie… Current Projects
• Minimizers for input variables – high-speed applications – exact minimum • Functional decomposition – using multiple IGUs T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching EPFL Workshop on Logic Synthesis & Verification, Dec 13
14
Błyskawica Reduction of attributes 14
15
Błyskawica …wszystkie redukty (ponad 100tys.) w czasie 292 sek; redukty najmniejsze (2261) znajduje w czasie 1435 ms. Jeden z najmniejszych reduktów x6, x16, x24 i x31 Wynik Sasao 0000 1011 1111 1110 1010 0010 0100 1100 1101 0001 01100 01011 11110 00011 00111 01110 00100 11111 11101 10100 15
16
Dodatkowe uproszczenie struktury
Generator indeksów 5 4 4 x1 4 5 4 Linear Circuity Main Memory AND AUX Memory 35 x2 36 35 36 35 Comparator x2 36 Dodatkowe uproszczenie struktury 16
17
RSES vs Błyskawica 15000 razy szybciej! 60 min. 250 ms. 5574 reduktów
.type fr .i 21 .o 1 .p 31 .end {x2, x4, x7, x9, x16} .type fr .i 5 .o 1 .p 22 .e Czas obliczeń: RSES 60 min. 5574 reduktów Błyskawica 250 ms. 15000 razy szybciej! 17
18
Klasyczna metoda redukcji atrybutów…
polega na transformacji wyrażenia boolowskiego CNF na DNF (Dysjunkcyjna Postać Normalna). Transformacja taka tradycyjnie jest obliczana metodami przekształceń boolowskich. Klasyczną metodę można ulepszyć... przez zastosowanie procedury uzupełniania funkcji boolowskiej Zamiast transformować CNF na DNF Reprezentuje się macierz rozróżnialności (CNF) w postaci binarnej macierzy M, a następnie jako funkcję boolowską F liczy się uzupełnienie F (Complement) tej funkcji. Uzupełnienie reprezentuje wszystkie redukty 18
19
Algorytm redukcji argumentów…
Macierz rozróżnialności Discernibility Matrix (DM) Funkcja rozróżnialności Discernibility Function (DF) x1 x2 x3 x4 x5 x6 x7 f 1 2 3 4 5 6 7 8 9 Zredukowana macierz rozróżnialności Zmienne niezbędne 19
20
Klasyczna metoda redukcji atrybutów To są wszystkie redukty…
CNF Iloczyn sum DNF Suma iloczynów - Macierz rozróżnialności Funkcja rozróżnialności (x1 + x2) (x3 + x5 + x7) (x2 + x3) (x2 + x7) = (x1, x2) = (x2 +x1)(x2 + x3)(x2 + x7)(x3 + x5 + x7) = (x3, x5, x7) (x2, x3) =(x2 +x1x3x7) (x3 + x5 + x7) = (x2, x7) = x2x3 + x2x5 +x2x7 + x1x3x7 {x4,x6} {x2,x3,x4,x6} {x2,x4,x5,x6} {x2,x4,x6,x7} {x1,x3,x4,x6,x7} To są wszystkie redukty… 20
21
Redukcja argumentów Funkcja jest zależna od {x2,x4,x6,x7} 21 x1 x2 x3
2 3 4 5 6 7 8 9 x2 x4 x6 x7 f 1 2 3 4 5 6 7 8 9 21
22
…w algorytmie uzupełniania
F = x4 x6(x1 + x2) (x3 + x5 + x7)(x2 + x3)(x2 + x7) .i 7 .o 1 .p 6 .end .i 7 .o 1 .p 4 .end Complement {x1,x3,x4,x6,x7} {x2,x3,x4,x6} …ten sam wynik co poprzednio {x2,x4,x5,x6} {x2,x4,x6,x7} 22
23
Obliczanie uzupełnienia
Dla koniunkcyjnej postaci normalnej obliczonej w przykładzie reprezentację funkcji F zapisaną w postaci zbioru kostek wpisujemy do Tablicy Karnaugha x5x7 x1x2x3 00 01 11 10 000 001 1 011 010 110 111 101 100 (x1 + x2) (x2 + x3) (x2 + x7) (x3 + x5 + x7) x1x2x3x5x7 11--- -11-- -1--1 --111 {x1,x2} {x2,x3} {x2,x7} {x3,x5,x7} 23
24
Obliczanie uzupełnienia
Uzupełnienie funkcji (Complement) obliczamy bezpośrednio z tablicy Karnaugha {x2,x3} x5x7 x1x2x3 00 01 11 10 000 001 1 011 010 110 111 101 100 {x2,x5} x x {x2,x7} {x1,x3,x7} x x Po dodaniu zmiennych niezbędnych mamy ten sam wynik jak poprzednio 24
25
Metoda uzupełniania Sprytna procedura uzupełniania polega na iteracyjnym rozkładzie zbioru kostek macierzy M na kofaktory. Kofaktory te są obliczane tak długo, aż odpowiadające im zbiory kostek staną się „łatwe” do obliczenia ich uzupełnienia. Proces kończy „scalanie” wyników cząstkowych. Matrix M Cofactor …. Cofactor 1 Cofactor 0 Complement 25
26
Metoda uzupełniania… Kilka tysięcy razy! Cytowania … ….
Matrix M cofactor …. cofactor 1 cofactor 0 complement Kilka tysięcy razy! Borowik G., Łuba T., Fast Algorithm of Attribute Reduction Based on the Complementation of Boolean Function, Ch. 2, pp , Springer International Publishing, 2014, Cytowania … Guilong Liu et al.: Attribute reduction approaches for general relation decision systems, pp , Pattern Recognition Letters, Vol. 65, Nov „Note that we use fast algorithm based on the complementation of Boolean function, proposed by Borowik and Luba (Borowik and Luba, 2014), in calculation process of transforming CNF into DNF and finding a minimum set implicants”. 26
27
Redukcja argumentów (atrybutów)
Najnowsza realizacja… Fast algorithm for feature extraction : Borowik, G., Jankowski, J., Kowalski, K. Proceedings of SPIE - The International Society for Optical Engineering, 2015 Oblicza 1 redukt; potrafi obliczyć redukt dla bazy 2 mln. obiektów w ciągu 1000 s. 27
28
Niestety… KOD 2 z 16 …procedura redukcji argumentów nie zawsze jest skuteczna w redukowaniu wejść do pamięci ROM realizujących funkcje generowania indeksów Minimalna liczba argumentów dla k z n wynosi n - 1 28
29
(Linear Decomposition)
Dekompozycja liniowa (Linear Decomposition) y1 = xi1 yi1 MUX n yp = xip yip . Linear Function General X n p q Łączenie argumentów w pary Zmniejszanie liczby wejść… T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching, EPFL Workshop on Logic Synthesis & Verification, Dec 29
30
Dekompozycja liniowa - ogólnie
F = H(G1, G2,…, X) X reprezentuje zmienne nie biorące udziału w realizacji funkcji G Funkcję G nazywać można g-argumentem x0 x1 xn ROM Założenie: W dekompozycji liniowej stosujemy funkcje o zredukowanej liczbie argumentów. 30
31
Zbiory niezgodności Cpq = {x1, x3, x6,...} F: Dn {0,1}m
Cpq = {xi: aibi = 1}, gdzie ai, bi, to składowe wektorów a, b a,b{0,1}n : F(a) ≠ F(b), będą reprezentowane liczbami p,q K = {1,..., | Dn |} x1 x2 x3 x6 xn p 1 output1 q output2 Cpq = {x1, x3, x6,...} Rodzina zbiorów Cpq - RCpq 31
32
Twierdzenie *) Dekompozycja nierozłączna: Dekompozycja wielokrotna:
jest dekompozycją minimalno-argumentowej funkcji F, wtedy i tylko wtedy gdy {xi, xj} RCpq. Dekompozycja nierozłączna: Dekompozycja wielokrotna: zmienne wejściowe współdzielone są pomiędzy dwie lub wiele bramek: {xi xj , xj xk}, g-argumenty są powtarzane dla rozłącznych par zmiennych: {xi xj , xk xl , …}. *)Łuba, T., Rybnik J.: Algorithmic Approach to Discernibility Function with Respect to Attributes and Objects Reduction, Foundations of Computing and Decision Sciences, Vol. 18, No. 3-4, 241–258, 1993. 32
33
Dekompozycja nierozłączna i wielokrotna
Istnienie dekompozycji z funkcją {xi xj , xj xk}, może zostać zweryfikowane przez sprawdzenie czy zbiór zmiennych {xi, xj, xk} zawarty jest w rodzinie RCpq. Istnienie dekompozycji z funkcją {xi xj , xk xl}, może zostać zweryfikowane przez sprawdzenie czy zbiór zmiennych {xi, xj, xk, xl} zawarty jest w rodzinie RCpq. Uzupełnienie RCpq względem rodziny wszystkich podzbiorów o liczności równej liczności analizowanych Cpq : COM(RCpq) 33
34
Przykład*) 1-OUT-OF-10 FUNCTION F = H(y1, y2, y3, y4, y5, y6) x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 1: | | 2: | | 3: | | 4: | | 5: | | 6: | | 7: | | 8: | | 9: | | 10:| | y1 y2 y3 y4 y5 y6 y1 = y2 = y3 = y4 = y5 = y6 = * T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching EPFL Workshop on Logic Synthesis & Verification, Dec 34
35
Przykład… Brak zmiennej x2 Nowe oznaczenia… x1 x3 x4 x5 x6 x7 x8 x9
1-OUT-OF-10 FUNCTION a1 a2 a3 a4 a5 a6 a7 a8 a9 1: | | 2: | | 3: | | 4: | | 5: | | 6: | | 7: | | 8: | | 9: | | 10:| | Brak zmiennej x2 Nowe oznaczenia… x1 x3 x4 x5 x6 x7 x8 x9 x10 a1 a2 a3 a4 a5 a6 a7 a8 a9 35
36
Przykład… Cała rodzina niezgodności a1 a2 a1 a3 a1 a4 a1 a5 a1 a6
1-OUT-OF-10 FUNCTION a1 a2 a3 a4 a5 a6 a7 a8 a9 1: | | 2: | | 3: | | 4: | | 5: | | 6: | | 7: | | 8: | | 9: | | 10:| | 36
37
wszystkie możliwe zbiory trzy elementowe
Przykład… Rodzina niezgodności a1 a2 a1 a3 a1 a4 a1 a5 a1 a6 a1 a7 a1 a8 a1 a9 a2 a3 a2 a4 a2 a5 a2 a6 a2 a7 a2 a8 a2 a9 a3 a4 a3 a5 a3 a6 a3 a7 a3 a8 a3 a9 a4 a5 a4 a6 a4 a7 a4 a8 a4 a9 a5 a6 a5 a7 a5 a8 a5 a9 a6 a7 a6 a8 a6 a9 a7 a8 a7 a9 a8 a9 COM(RCpq) 36 par pusty zbiór par! ale są wszystkie możliwe zbiory trzy elementowe Wszystkie możliwe trójelementowe podzbiory zbioru: a1 a2 a3 a4 a5 a6 a7 a8 a9 37
38
Przykład… Nie ma żadnej dekompozycji:
1-OUT-OF-10 FUNCTION a1 a2 a3 a4 a5 a6 a7 a8 a9 1: | | 2: | | 3: | | 4: | | 5: | | 6: | | 7: | | 8: | | 9: | | 10:| | Nie ma żadnej dekompozycji: Nie ma żadnej dekompozycji rozłącznej wielokrotnej Natomiast ma dekompozycję nierozłączną wielokrotną dla wszystkich możliwych trójek argumentów: ai aj ak al am an ap aq ar 38
39
Konfrontacja z wynikiem Sasao
…to również dla takich a1 a4 a5 a2 a6 a8 a3 a7 a9 …co jest zgodne z wynikiem Sasao: …który w jego artykule zapisany jest z inną kolejnością argumentów Sasao nie mógł nie natrafić na taką dekompozycję! 39
40
Sekwencyjna kompresja argumentów
1-OUT-OF-10 FUNCTION Reducing arguments [x0, x1, x2, x3, x4, x5, x6, x7, x8] .type fr .i 9 .o 4 .p 10 [x0, x1, x2, x3, x4, x5, x6, x7, x8, x9] .type fr .i 10 .o 4 .p 10 Redukcja argumentów 40
41
Sekwencyjna kompresja argumentów
Reducing arguments [x0, x1, x2, x3, x4, x5, x6, x7, x8] [x3, x4, x5, x6, x7, x8, x0 ⊕ x1, x1 ⊕ x2] .type fr .i 9 .o 4 .p 10 .type fr .i 8 .o 4 .p 10 Dekompozycja dla trzech pierwszych zmiennych Compressing arguments [0, 1, 2] 41
42
Sekwencyjna kompresja…
Plik wejściowy Wynik kompresji .type fr .i 10 .o 4 .p 10 .type fr .i 4 .o 4 .p 10 Obliczona dekompozycja liniowa y1 = x0 ⊕ x1 ⊕ x3 ⊕ x4, y2 = x3 ⊕ x4 ⊕ x6 ⊕ x7, y3 = x1 ⊕ x2 ⊕ x4 ⊕ x5, y4 = x4 ⊕ x5 ⊕ x7 ⊕ x8 Wynik lepszy od wyniku Sasao 42
43
Skuteczność… "Nasza metoda" - heurystyczne iteracyjne liczenie pokrycia kolumnowego na oryginalnych argumentach i bramkach XOR: 2-out-of16: Nasza metoda: 9 kolumn (Sasao s-min: 11 kolumn) 2-out-of-20: Nasza metoda: 11 kolumn (Sasao s-min: 14 kolumn) 43
44
Podsumowanie Nowe zadania syntezy logicznej: redukcja argumentów
dekompozycja liniowa dekompozycja funkcjonalna są wynikiem nie tylko specyficznej budowy układów FPGA, ale również pojawiających się nowych zastosowań w analizie danych: dystrybucja adresów IP, skanowanie wirusów, wykrywanie niepożądanych danych, konwersja kodów itp. 44
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.