Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Tadeusz Łuba Faculty of Electronics and Information Technology

Podobne prezentacje


Prezentacja na temat: "Tadeusz Łuba Faculty of Electronics and Information Technology"— Zapis prezentacji:

1 Rola i znaczenie syntezy logicznej w technice układów FPGA i analizie danych
Tadeusz Łuba Faculty of Electronics and Information Technology Warsaw University of Technology II Sympozjum FPGA 2016, Uniwersytet Jagielloński, Kraków 2016 1

2 Motto Why Again Logic Synthesis?
Giovanni De Micheli, EPFL Workshop on Logic Synthesis and Verification, 10 December 2015 Why Again Logic Synthesis? “Most logic synthesis and optimization problems are not inherently solved, as demonstrated by the fact that current commercial systems are based on heuristics”. Niedoskonałość metod syntezy logicznej w komercyjnych systemach projektowania 2

3 Przyczyny… Powszechnie stosowaną metodą syntezy logicznej jest minimalizacja funkcji boolowskich, a ta procedura jest niedostosowana do zasobów układów FPGA, wyposażonych w komórki LUT oraz pamięci ROM. 3

4 Logic synthesis 3.3. Functional decomposition
Próby zaradzenia tej sytuacji podejmowane były od dawna, ale szczególnej intensywności nabrały stosunkowo niedawno… Mocnym głosem okazała się książka .., w której po raz pierwszy tak wyraźnie stwierdzono, że jedynymi skutecznymi metodami syntezy Dla układów FPGA są: Redukcja argumentów Dekompozycja funkcjonalna 3.3. Functional decomposition 11. Reduction of the Number of Variables 4

5 zastępuje się pamięcią ROM
Filtr f5 w technice DA .i 11 .o 11 .p 2048 . .i 7 .o 11 .p 128 . Układ mnożenia zastępuje się pamięcią ROM R e j s t r y ROM + R .i 11 .o 11 .p 2048 .i 7 .o 11 .p 128 5

6 Bez redukcji Synteza programem Vivado Dla układu Virtex-7 6

7 Po redukcji Synteza programem Vivado 2015.4.2
Dla układu Virtex-7 (xc7vx330tffg1157-2) 7

8 Realizacje układu AR filtru f5
Bez redukcji argumentów Z redukcją argumentów System and chip LE pcs Vivado Virtex-7 (xc7vx330tffg1157-2) LUT6 LUT5 LUT4 LUT3 LUT2 MUXF7 MUXF8 330 86 49 34 32 5 1 9 Altera Quartus II Stratix V (5SEE9H40I2) ALUT7 ALUT6 ALUT5 ALUT4 ALUT3 62 294 2675 1022 1677 140 160 65 61 PrecisionRTL Synthesis VIRTEX-7 (7VX330TFFG1157) LUT 1915 (total) 8

9 Zastosowania: Index Generation Functions,
T. Sasao: Index Generation Functions: Logic Synthesis for Pattern Matching Index Generation Functions, to metodyka syntezy logicznej układów cyfrowych starająca się sprostać wyzwaniom stawianym przez konieczność precyzyjnego wyodrębniania właściwych danych z ogromnej masy danych niepotrzebnych. Zastosowania: dystrybucja adresów IP, skanowanie wirusów, wykrywanie niepożądanych danych, konwersja kodów itp. 9

10 Układ do wykrywania wzorców
x1 y1 x2 Pattern matching circuit y2 x3 y3 y4 x40 Trzeba wykryć stosunkowo niewielką liczbę wzorów spośród ogromnej liczby innych wektorów 40-bitowych… T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching, EPFL Workshop on Logic Synthesis & Verification, Dec 10

11 Jak zaprojektować układ do wykrywania wzorców?
10 wektorów 40 bitowych Jak zaprojektować układ do wykrywania wzorców? T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching, EPFL Workshop on Logic Synthesis & Verification, Dec 11

12 Głównym problemem jest zatem obliczanie reduktów!
Generator indeksów Zadanie takie rozwiązuje się algorytmem redukcji argumentów 5 4 x1 4 5 Linear Circuity Main Memory AND AUX Memory 35 x2 35 Głównym problemem jest zatem obliczanie reduktów! 35 Comparator x2 T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching, EPFL Workshop on Logic Synthesis & Verification, Dec 12

13 Komentarz Najpilniejsze zadanie… Current Projects
• Minimizers for input variables – high-speed applications – exact minimum • Functional decomposition – using multiple IGUs T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching EPFL Workshop on Logic Synthesis & Verification, Dec 13

14 Błyskawica Reduction of attributes 14

15 Błyskawica …wszystkie redukty (ponad 100tys.) w czasie 292 sek; redukty najmniejsze (2261) znajduje w czasie 1435 ms. Jeden z najmniejszych reduktów x6, x16, x24 i x31 Wynik Sasao 0000 1011 1111 1110 1010 0010 0100 1100 1101 0001 01100 01011 11110 00011 00111 01110 00100 11111 11101 10100 15

16 Dodatkowe uproszczenie struktury
Generator indeksów 5 4 4 x1 4 5 4 Linear Circuity Main Memory AND AUX Memory 35 x2 36 35 36 35 Comparator x2 36 Dodatkowe uproszczenie struktury 16

17 RSES vs Błyskawica 15000 razy szybciej! 60 min. 250 ms. 5574 reduktów
.type fr .i 21 .o 1 .p 31 .end {x2, x4, x7, x9, x16} .type fr .i 5 .o 1 .p 22 .e Czas obliczeń: RSES 60 min. 5574 reduktów Błyskawica 250 ms. 15000 razy szybciej! 17

18 Klasyczna metoda redukcji atrybutów…
polega na transformacji wyrażenia boolowskiego CNF na DNF (Dysjunkcyjna Postać Normalna). Transformacja taka tradycyjnie jest obliczana metodami przekształceń boolowskich. Klasyczną metodę można ulepszyć... przez zastosowanie procedury uzupełniania funkcji boolowskiej Zamiast transformować CNF na DNF Reprezentuje się macierz rozróżnialności (CNF) w postaci binarnej macierzy M, a następnie jako funkcję boolowską F liczy się uzupełnienie F (Complement) tej funkcji. Uzupełnienie reprezentuje wszystkie redukty 18

19 Algorytm redukcji argumentów…
Macierz rozróżnialności Discernibility Matrix (DM) Funkcja rozróżnialności Discernibility Function (DF) x1 x2 x3 x4 x5 x6 x7 f 1 2 3 4 5 6 7 8 9 Zredukowana macierz rozróżnialności Zmienne niezbędne 19

20 Klasyczna metoda redukcji atrybutów To są wszystkie redukty…
CNF Iloczyn sum DNF Suma iloczynów - Macierz rozróżnialności Funkcja rozróżnialności (x1 + x2) (x3 + x5 + x7) (x2 + x3) (x2 + x7) = (x1, x2) = (x2 +x1)(x2 + x3)(x2 + x7)(x3 + x5 + x7) = (x3, x5, x7) (x2, x3) =(x2 +x1x3x7) (x3 + x5 + x7) = (x2, x7) = x2x3 + x2x5 +x2x7 + x1x3x7  {x4,x6} {x2,x3,x4,x6} {x2,x4,x5,x6} {x2,x4,x6,x7} {x1,x3,x4,x6,x7} To są wszystkie redukty… 20

21 Redukcja argumentów Funkcja jest zależna od {x2,x4,x6,x7} 21 x1 x2 x3
2 3 4 5 6 7 8 9 x2 x4 x6 x7 f 1 2 3 4 5 6 7 8 9 21

22 …w algorytmie uzupełniania
F = x4 x6(x1 + x2) (x3 + x5 + x7)(x2 + x3)(x2 + x7) .i 7 .o 1 .p 6 .end .i 7 .o 1 .p 4 .end Complement {x1,x3,x4,x6,x7} {x2,x3,x4,x6} …ten sam wynik co poprzednio {x2,x4,x5,x6} {x2,x4,x6,x7} 22

23 Obliczanie uzupełnienia
Dla koniunkcyjnej postaci normalnej obliczonej w przykładzie reprezentację funkcji F zapisaną w postaci zbioru kostek wpisujemy do Tablicy Karnaugha x5x7 x1x2x3 00 01 11 10 000 001 1 011 010 110 111 101 100 (x1 + x2) (x2 + x3) (x2 + x7) (x3 + x5 + x7) x1x2x3x5x7 11--- -11-- -1--1 --111 {x1,x2} {x2,x3} {x2,x7} {x3,x5,x7} 23

24 Obliczanie uzupełnienia
Uzupełnienie funkcji (Complement) obliczamy bezpośrednio z tablicy Karnaugha {x2,x3} x5x7 x1x2x3 00 01 11 10 000 001 1 011 010 110 111 101 100 {x2,x5} x x {x2,x7} {x1,x3,x7} x x Po dodaniu zmiennych niezbędnych mamy ten sam wynik jak poprzednio 24

25 Metoda uzupełniania Sprytna procedura uzupełniania polega na iteracyjnym rozkładzie zbioru kostek macierzy M na kofaktory. Kofaktory te są obliczane tak długo, aż odpowiadające im zbiory kostek staną się „łatwe” do obliczenia ich uzupełnienia. Proces kończy „scalanie” wyników cząstkowych. Matrix M Cofactor …. Cofactor 1 Cofactor 0 Complement 25

26 Metoda uzupełniania… Kilka tysięcy razy! Cytowania … ….
Matrix M cofactor …. cofactor 1 cofactor 0 complement Kilka tysięcy razy! Borowik G., Łuba T., Fast Algorithm of Attribute Reduction Based on the Complementation of Boolean Function, Ch. 2, pp , Springer International Publishing, 2014, Cytowania … Guilong Liu et al.: Attribute reduction approaches for general relation decision systems, pp , Pattern Recognition Letters, Vol. 65, Nov „Note that we use fast algorithm based on the complementation of Boolean function, proposed by Borowik and Luba (Borowik and Luba, 2014), in calculation process of transforming CNF into DNF and finding a minimum set implicants”. 26

27 Redukcja argumentów (atrybutów)
Najnowsza realizacja… Fast algorithm for feature extraction : Borowik, G., Jankowski, J., Kowalski, K. Proceedings of SPIE - The International Society for Optical Engineering, 2015 Oblicza 1 redukt; potrafi obliczyć redukt dla bazy 2 mln. obiektów w ciągu 1000 s. 27

28 Niestety… KOD 2 z 16 …procedura redukcji argumentów nie zawsze jest skuteczna w redukowaniu wejść do pamięci ROM realizujących funkcje generowania indeksów Minimalna liczba argumentów dla k z n wynosi n - 1 28

29 (Linear Decomposition)
Dekompozycja liniowa (Linear Decomposition) y1 = xi1 yi1 MUX n yp = xip yip . Linear Function General X n p q Łączenie argumentów w pary Zmniejszanie liczby wejść… T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching, EPFL Workshop on Logic Synthesis & Verification, Dec 29

30 Dekompozycja liniowa - ogólnie
F = H(G1, G2,…, X) X reprezentuje zmienne nie biorące udziału w realizacji funkcji G Funkcję G nazywać można g-argumentem x0 x1 xn ROM Założenie: W dekompozycji liniowej stosujemy funkcje o zredukowanej liczbie argumentów. 30

31 Zbiory niezgodności Cpq = {x1, x3, x6,...} F: Dn  {0,1}m
Cpq = {xi: aibi = 1}, gdzie ai, bi, to składowe wektorów a, b a,b{0,1}n : F(a) ≠ F(b), będą reprezentowane liczbami p,q  K = {1,..., | Dn |} x1 x2 x3 x6 xn p 1 output1  q output2 Cpq = {x1, x3, x6,...} Rodzina zbiorów Cpq - RCpq 31

32 Twierdzenie *) Dekompozycja nierozłączna: Dekompozycja wielokrotna:
jest dekompozycją minimalno-argumentowej funkcji F, wtedy i tylko wtedy gdy {xi, xj}  RCpq. Dekompozycja nierozłączna: Dekompozycja wielokrotna: zmienne wejściowe współdzielone są pomiędzy dwie lub wiele bramek: {xi  xj , xj  xk}, g-argumenty są powtarzane dla rozłącznych par zmiennych: {xi  xj , xk  xl , …}. *)Łuba, T., Rybnik J.: Algorithmic Approach to Discernibility Function with Respect to Attributes and Objects Reduction, Foundations of Computing and Decision Sciences, Vol. 18, No. 3-4, 241–258, 1993. 32

33 Dekompozycja nierozłączna i wielokrotna
Istnienie dekompozycji z funkcją {xi  xj , xj  xk}, może zostać zweryfikowane przez sprawdzenie czy zbiór zmiennych {xi, xj, xk} zawarty jest w rodzinie RCpq. Istnienie dekompozycji z funkcją {xi  xj , xk  xl}, może zostać zweryfikowane przez sprawdzenie czy zbiór zmiennych {xi, xj, xk, xl} zawarty jest w rodzinie RCpq. Uzupełnienie RCpq względem rodziny wszystkich podzbiorów o liczności równej liczności analizowanych Cpq : COM(RCpq) 33

34 Przykład*) 1-OUT-OF-10 FUNCTION F = H(y1, y2, y3, y4, y5, y6) x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 1: | | 2: | | 3: | | 4: | | 5: | | 6: | | 7: | | 8: | | 9: | | 10:| | y1 y2 y3 y4 y5 y6 y1 = y2 = y3 = y4 = y5 = y6 = * T. Sasao, Index Generation Functions: Logic Synthesis for Pattern Matching EPFL Workshop on Logic Synthesis & Verification, Dec 34

35 Przykład… Brak zmiennej x2 Nowe oznaczenia… x1 x3 x4 x5 x6 x7 x8 x9
1-OUT-OF-10 FUNCTION a1 a2 a3 a4 a5 a6 a7 a8 a9 1: | | 2: | | 3: | | 4: | | 5: | | 6: | | 7: | | 8: | | 9: | | 10:| | Brak zmiennej x2 Nowe oznaczenia… x1 x3 x4 x5 x6 x7 x8 x9 x10 a1 a2 a3 a4 a5 a6 a7 a8 a9 35

36 Przykład… Cała rodzina niezgodności a1 a2 a1 a3 a1 a4 a1 a5 a1 a6
1-OUT-OF-10 FUNCTION a1 a2 a3 a4 a5 a6 a7 a8 a9 1: | | 2: | | 3: | | 4: | | 5: | | 6: | | 7: | | 8: | | 9: | | 10:| | 36

37 wszystkie możliwe zbiory trzy elementowe
Przykład… Rodzina niezgodności a1 a2 a1 a3 a1 a4 a1 a5 a1 a6 a1 a7 a1 a8 a1 a9 a2 a3 a2 a4 a2 a5 a2 a6 a2 a7 a2 a8 a2 a9 a3 a4 a3 a5 a3 a6 a3 a7 a3 a8 a3 a9 a4 a5 a4 a6 a4 a7 a4 a8 a4 a9 a5 a6 a5 a7 a5 a8 a5 a9 a6 a7 a6 a8 a6 a9 a7 a8 a7 a9 a8 a9 COM(RCpq) 36 par pusty zbiór par! ale są wszystkie możliwe zbiory trzy elementowe Wszystkie możliwe trójelementowe podzbiory zbioru: a1 a2 a3 a4 a5 a6 a7 a8 a9 37

38 Przykład… Nie ma żadnej dekompozycji:
1-OUT-OF-10 FUNCTION a1 a2 a3 a4 a5 a6 a7 a8 a9 1: | | 2: | | 3: | | 4: | | 5: | | 6: | | 7: | | 8: | | 9: | | 10:| | Nie ma żadnej dekompozycji: Nie ma żadnej dekompozycji rozłącznej wielokrotnej Natomiast ma dekompozycję nierozłączną wielokrotną dla wszystkich możliwych trójek argumentów: ai aj ak al am an ap aq ar 38

39 Konfrontacja z wynikiem Sasao
…to również dla takich a1 a4 a5 a2 a6 a8 a3 a7 a9 …co jest zgodne z wynikiem Sasao: …który w jego artykule zapisany jest z inną kolejnością argumentów Sasao nie mógł nie natrafić na taką dekompozycję! 39

40 Sekwencyjna kompresja argumentów
1-OUT-OF-10 FUNCTION Reducing arguments [x0, x1, x2, x3, x4, x5, x6, x7, x8] .type fr .i 9 .o 4 .p 10 [x0, x1, x2, x3, x4, x5, x6, x7, x8, x9] .type fr .i 10 .o 4 .p 10 Redukcja argumentów 40

41 Sekwencyjna kompresja argumentów
Reducing arguments [x0, x1, x2, x3, x4, x5, x6, x7, x8] [x3, x4, x5, x6, x7, x8, x0 ⊕ x1, x1 ⊕ x2] .type fr .i 9 .o 4 .p 10 .type fr .i 8 .o 4 .p 10 Dekompozycja dla trzech pierwszych zmiennych Compressing arguments [0, 1, 2] 41

42 Sekwencyjna kompresja…
Plik wejściowy Wynik kompresji .type fr .i 10 .o 4 .p 10 .type fr .i 4 .o 4 .p 10 Obliczona dekompozycja liniowa y1 = x0 ⊕ x1 ⊕ x3 ⊕ x4, y2 = x3 ⊕ x4 ⊕ x6 ⊕ x7, y3 = x1 ⊕ x2 ⊕ x4 ⊕ x5, y4 = x4 ⊕ x5 ⊕ x7 ⊕ x8 Wynik lepszy od wyniku Sasao 42

43 Skuteczność… "Nasza metoda" - heurystyczne iteracyjne liczenie pokrycia kolumnowego na oryginalnych argumentach i bramkach XOR: 2-out-of16: Nasza metoda: 9 kolumn (Sasao s-min: 11 kolumn) 2-out-of-20: Nasza metoda: 11 kolumn (Sasao s-min: 14 kolumn) 43

44 Podsumowanie Nowe zadania syntezy logicznej: redukcja argumentów
dekompozycja liniowa dekompozycja funkcjonalna są wynikiem nie tylko specyficznej budowy układów FPGA, ale również pojawiających się nowych zastosowań w analizie danych: dystrybucja adresów IP, skanowanie wirusów, wykrywanie niepożądanych danych, konwersja kodów itp. 44


Pobierz ppt "Tadeusz Łuba Faculty of Electronics and Information Technology"

Podobne prezentacje


Reklamy Google