Parallel Processing, Pipelining, Flynn’s taxonomy

Slides:



Advertisements
Podobne prezentacje
Poland - DAPHNE subproject
Advertisements

Paweł Solon PRESENTS Jagiellonian Uniwersity Jagiellonian university Jagiellonian university in Krakow was the second university to be founded in Central.
Projekt Do kariery na skrzydłach – studiuj Aviation Management Projekt współfinansowany ze ś rodków Europejskiego Funduszu Społecznego. Biuro projektu:
Introduction to SystemC
Usługi sieciowe Wykład 9 VPN
Statistics – what is that? Statystyka dla gimnazjalistów.
Projekt Do kariery na skrzydłach – studiuj Aviation Management Projekt współfinansowany ze ś rodków Europejskiego Funduszu Społecznego. Biuro projektu:
Pomysł Sukces Wstępne rozwiązanie Symulacja Wynik zadowala? Poprawa rozwiązania Nie Tak Podstawowa pętla projektowania.
Interplay between magnetism and superconductivity in EuFe 2-x Co x As 2 studied by 57 Fe and 151 Eu Mössbauer spectroscopy A. Błachowski 1, K. Ruebenbauer.
Projekt Do kariery na skrzydłach – studiuj Aviation Management Projekt współfinansowany ze ś rodków Europejskiego Funduszu Społecznego. Biuro projektu:
Projekt Do kariery na skrzydłach – studiuj Aviation Management Projekt współfinansowany ze ś rodków Europejskiego Funduszu Społecznego. Biuro projektu:
Projekt Do kariery na skrzydłach – studiuj Aviation Management Projekt współfinansowany ze ś rodków Europejskiego Funduszu Społecznego. Biuro projektu:
Sun altitude Made by: Patryk Cichy Patryk Cichy Mateusz Dąbrowicz Mateusz Dąbrowicz Mariusz Król Mariusz Król Mariusz Dyrda Mariusz Dyrda Group leader:
Wstęp do geofizycznej dynamiki płynów. Semestr VI. Wykład
Netiquette Wiktoria Pacholik. Netiquette Netiquette is a collection of cyberspace rules. Netiquette is obligatory every internets user.
Copyright for librarians - a presentation of new education offer for librarians Agenda: The idea of the project Course content How to use an e-learning.
Rekursja Teoretyczne podstawy informatyki Wykład 5
Team Building Copyright, 2003 © Jerzy R. Nawrocki Requirements Engineering Lecture.
Dzielenie relacyjne / Relational Division
by Ernest Jamro Katedra Elektroniki, AGH Kraków
Ernest Jamro Kat. Elektroniki AGH, Kraków Dep. Of Electronics, AGH
Najczęściej popełniane błędy w VHDL’u
JET PUMPS introduction POMPY STRUMIENIOWE wstęp
Ministerstwo Gospodarki Poland'sexperience Waldemar Pawlak Deputy Prime Minister, Minister of Economy March 2010.
WYZWALACZE (TRIGGERY) Wyzwalacz jest specjalnym rodzajem procedury składowanej, która może być wykonana w odpowiedzi na jedną z trzech sytuacji: UPDATE.
Nadprzewodniki na bazie żelaza
Superconducting FeSe studied by Mössbauer spectroscopy
Polaryzacja światła.
Współprogramy Plan: Motywacja Składnia Scenariusz obiektu współprogramu Przykłady Producent – konsument ( instrukcja attach ) Czytelnik -pisarze ( instukcja.
Przykłady sieci obiektowych
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego Tworzenie aplikacji sieciowych w języku Java Threads Prezentacja.
The school volunteer club 1 / 19 Wolontariat XII 2006r. Gimnazjum im. Ks. W. Rabczyńskiego w Wasilkowie
Tadeusz Janasiewicz IT Group, Tadeusz Janasiewicz, WSUS, IT Group, r.
Prof. dr hab. Hubert Izdebski. Projekt : Odpowiedź na wyzwania gospodarki opartej na wiedzy: nowy program nauczania na WSHiP. Projekt współfinansowany.
YOUR PARTNER IN WIND ENERGY PROJECTS
REKURENCJA.
Trade unions - how to avoid problems ? Kancelaria Prawna Bujakiewicz & Sancewicz 1.
Piotr Nowak Development Manager Construction Innovation and Development Department The Chartered Institute of Building.
PIEZO MOTOR Piezo materiały: Przyłożone napięcie zmienia ich
United Kingdom.
INAUGURACYJNE POSIEDZENIE ZARZĄDU SEKCJI FENS PTF Wydział Fizyki Politechniki Warszawskiej Warszawa 08 maja 2004 r.
Theory of Computer Science - Basic information
Development of Polish Geothermics and Heat Flow data relationship. Marta Wróblewska, Jan Szewczyk ENGINE, Launching Conference, Orlean February 2006.
Global Financial Crisis and its Consequences for Polish Housing Market
TVP SA Odział w Łodzi Łódź ul. Narutowicza 13 TVP Łódź the Year of anniversary – it is already 55 years together.
BLOOD DONATION.
Click to show the screen.
Pamięci RAM.
Stakeholder Analysis Lazarski University May, 2011 Edward T. Jennings, Jr. University of Kentucky Martin School of Public Policy and Administration.
Uczenie w sieciach Bayesa
Preface 2.General characteristics of the problem 3.Classical and non-classical approaches 4.Griffith-Irwin concept and linear fracture mechanics.
Elektroniczny rozdział siły hamowania
NEW MODEL OF SCHOOL HEADS PREPARATION, INDUCTION AND CONTINUING PROFESSIONAL DEVELOPMENT IN POLAND Roman Dorczak, Grzegorz Mazurkiewicz   Jagiellonian.
Copyright © 2010 Intel Corporation. All rights reserved. Intel and the Intel logo are trademarks or registered trademarks of Intel Corporation or its subsidiaries.
Polish cadastral system Land Administration Domain Model
1.
A presentation made by Nicole Moulds form class 6B.
X Ogólnopolskie Seminarium Spektroskopii Mössbauerowskiej OSSM’2014
INSTYTUT METEOROLOGII I GOSPODARKI WODNEJ INSTITUTE OF METEOROLOGY AND WATER MANAGEMENT THE USE OF COSMO LM MODEL FOR AVIATION METEOROLOGICAL SERVICE IN.
What comes to your mind when you think about WATERFALLS? *** Co Ci się przypomina gdy myślisz o WODOSPADACH?
Struktura przedsiębiorstwa SAP Best Practices. ©2014 SAP SE or an SAP affiliate company. All rights reserved.2 Obszar rachunku kosztów 1000 Dane te są.
2 Review What is bionomial nomenclature Explain What is a genus
Wydział Elektroniki Kierunek: AiR Zaawansowane metody programowania Wykład 6.
Wydział Elektroniki Kierunek: AiR Zaawansowane metody programowania Wykład 5.
Projektowanie systemów cyfrowych z wykorzystaniem języka VHDL Układy sekwencyjne.
Opracowanie: Katarzyna Gagan, Anna Krawczuk
Rejestry przesuwne, sumatory
Projektowanie systemów cyfrowych z wykorzystaniem języka VHDL
CSIC 5011 Mini-Project 1:Principle Component Analysis on Finance Data
1.2.4 Hess’s Law.
Zapis prezentacji:

Parallel Processing, Pipelining, Flynn’s taxonomy Ernest Jamro Dep. of Electronics AGH, Kraków

Example of parallelism / Przykład zrównoleglenia General case Postać ogólna Parrallel-Array Multiplier

Parallel Processing /Przetwarzanie Równoległe Increases throughput R (http://en.wikipedia.org/wiki/Throughput) / Zwiększa przepustowość R. Increases Area A / Wymaga więcej sprzętu A. Optimal parallel processing / Optymalne zrównoleglenie: RP= NR1 AP= NA1 TP= T1 - (clock period) Real / Rzeczywiste RP< NR1 AP= NA1+ADMUX + AMUX TP= T1 + TDMUX + TMUX

Functional Density D / Funkcjonalność układu D A- Area; R- throughput Parallel processing usually results in decreasing D: DP < D1 as: requires additional connection, arbitration logic synchronization of parallel processors (PP), cache coherency conficts between PPs, sharing of the same bus or memory

Amdahl’s Law D- Speedup P- Parallel portion N- number of Parallel Units Example: P= 0.9, Sequancial S=(1-P)=0.1 N=1  t1=(P+S) N=2  t2=t1*(P/2+S)=0.55t1 N=10  t10=t1(P/10+S)=0.19t1 N=100 t100=t1(P/100+S)=0.109t1 tN=t1(P/N + S) http://en.wikipedia.org/wiki/Amdahl’s_law

Power consumption and parallel processing Pobór energii a równoległość Moc strat jest w przybliżeniu proporcjonalna do częstotliwości, powierzchni i kwadratu nap. zasilania Power consumption is roughly proportional to square supply voltage fP= f1/N – same throughput for PP / taka sama przepustowość przepustowość dla przetw. rów. AP= NA1 – assumption of perfect PP RP= NR1 Lower freq. => lower power supply

Pipelining / Potokowość Example / Przykład: F= (AB+C)D F1= AB F2= F1+C F3= F2 * D Without pipelining / Bez potokowości (bez rejestrów): T= T1 + T2 + T3 A= A1 + A2 + A3 With pipelining / Architektura potokowa: T= MAX(T1, T2, T3) A= A1 + A2 + A3 + AFF

Pipelining Pentium Processor time / czas

Pipelining and external SRAM memory access Potokowy dostęp do pamięci zewnętrznej SRAM

Waveforms / Przebiegi

Additional registers are required to compensate different delays (Cut-Set Rule). Example of adders

Pipeling and reduction of transient states and energy consumption

Employing double clock edge Należy używać tylko pojedynczego zbocza zegara – wykorzystywanie zarówno opadającego i narastającego zbocza zegara powoduje nieoptymalne wykorzystanie logiki Only a single clock edge (rising or falling) should be used Lepiej dwa razy większą częstotliwość zegara Better double clock frequency

Piplining and Clock Enable Blocking

Piplining and Clock Enable Non-Blocking

Control logic and pipelining Kontrola przepływu danych sel – urządzenie typu Master jest gotowe do wysłania danych / Master ready to send data ack – Slave jest gotowe do odbioru danych / Slave is ready to accept new data

Adding pipeline registers Źle działający układ – dwa transfery tej samej danej Not working properly – double transfer of the same data

Additionaol logic selq Process (clk) begin if clk’event and clk=‘1’then sel_Q<= sel and not ack; end if; end process; Wady: 1) Maksymalny transfer ograniczony do co drugiego taktu zegara / transfer only every second clock cycle 2) Długa ścieżka sygnału Ack (bez potokowości) / long Ack path

Piplining and FIFO (First-In First-Out) Wada: Skomplikowana logika i stosunkowo duże zajmowane zasoby Drawback: Complicated logic and large occupied resources

Użycie pojedynczego bufora FIFO dla wielu etapów potokowości Single FIFO buffer for many pipeline stages Fifo_full – must take into account pipline stages of the module. FIFO depth must be greater than the number of pipeline stages

Wady potokowości / Pipelining drawbacks Użycie dodatkowych rejestrów (dodatkowy hardware i opóźnienie) - w FPGA i tak są rejestry po każdym bloku logicznym Utrudnienie analizy i symulacji układu Bardziej rozbudowany system sterujący przepływem danych szczególnie dla instrukcji warunkowych (np. w procesorach: predykcja skoku), przy pętli zwrotnej danych Ograniczoność stosowania - wzrost szybkości szybko ulega nasyceniu. Additional flip-flops are required (additional resources and delay – latency), in FPGA every LUT (logic) is associated with FF Much more difficult design and simulation of the circuit Much more difficult control logic, esp. for feedback data path Limited level of pipelining (quick saturation of the architecture)

Zalety potokowości / Advantages of pipelining Znaczne przyspieszenie przepustowości często niewielkim kosztem Możliwość obniżenia poboru mocy poprzez obniżenie napięcia zasilania podobnie jak dla architektury równoległej przy tej samej przepustowości Obniżenie zużycia energii poprzez ograniczenie rozchodzenia się przebiegów przejściowych wynikających z czasów propagacji Much increase of the throughputby often insignificant increase of occupied hardware resources Reduction of power consuption similarty like for parallel architecture – by decreasing supply voltage in the same throughput Reduction of power consumption by limited transient state propagation

Architektura potokowa i równoległa przepustowość R= f(Area) Pipelining and parallel processing R= f(Area)

Flynn’s Taxonomy Klasyfikacja Flynn’a SISD (Single Instruction Single Data-stream) SIMD (Single Instruction Multiple Data-stream) MISD (Multiple Instruction Single Data-stream) MIMD (Multiple Instruction Multiple Data-stream) http://en.wikipedia.org/wiki/Flynn’s_taxonomy

Single Instruction Single Data Stream (SIMD)

Single Instruction Multiple Data Stream (SIMD) ( Pentium MMX/SSE/AVX)

Multiple Instruction Single Data Stream (MISD) (e.g. Pipelining)

Multiple Instruction Multiple Data Stream (MIMD)

DSP TMS320C80