Architektura komputerów

Slides:



Advertisements
Podobne prezentacje
Połączenia oporników a. Połączenie szeregowe: R1 R2 Rn i U1 U2 Un U.
Advertisements

Tryby adresowania Prawie każda operacja wykonywana przez mikroprocesor wykonywana jest na pewnych argumentach (lub argumencie). Sposoby wskazywania argumentów.
Zerowanie mikroprocesorów Cel: wprowadzenie mikroprocesora w określony stan początkowy Zwykle realizowany poprzez: inicjalizację licznika rozkazów (PC)
Wykonał : Marcin Sparniuk
S – student, P – przedmiot, W – wykładowca
6. Układy kształtujące funkcje odcinkami prostoliniowymi
Idea, podstawowe parametry, cechy, charakterystyka
ALGORYTM Co to jest algorytm?
Łączenie rezystorów Rezystory połączone szeregowo R1 R2 R3 RN
Zamiana GWIAZDA-TRÓJKĄT
Twierdzenie Thevenina-Nortona
Zrównoleglanie programu sekwencyjnego
1 RISC – nasze założenia Podstawowe cechy: Wszystkie operacje są realizowane na rejestrach, Tylko operacje typu load i store wymagają dostępu do pamięci,
Prąd Sinusoidalny Jednofazowy Autor Wojciech Osmólski.
SPRAW WEWNĘTRZNYCH I ADMINISTRACJI i Systemu Rejestrów Państwowych
Wykład 4: Architektury mikroprocesorów: von Neumanna, Harvard
Procesor DSP Sharc ADSP21161 firmy Analog Devices
Podstawowe składniki funkcjonalne procesora i ich rola.
Alokacja pamięci struct Test {char c; int n; double x; } st1; st1 cnxcnx
Mikrokontrolery - - podstawowe architektury
ARCHITEKTURA KOMPUTERÓW definicja komputera PROCESOR PAMIĘĆ OPERACYJNA URZĄDZENIA ZEWNĘTRZNE.
Wykład nr 7: Synchronizacja procesów
Systemy operacyjne Wykład nr 4: Procesy Piotr Bilski.
Wykład nr 2: Struktura systemu komputerowego a system operacyjny
Sztuczna Inteligencja Reprezentacja wiedzy II Systemy produkcyjne Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch.
Komputer, procesor, rozkaz.
Temat nr 10: System przerwań
Procesory RISC.
Projektowanie i programowanie obiektowe II - Wykład IV
ZARZĄDZANIE PROCESAMI
4. TEORETYCZNE MODELE PROCESÓW WSPÓŁBIEŻNYCH Teoretyczne modele uwzględniają wybrane cechy rzeczywistych procesów, stanowiąc kompromis pomiędzy łatwością
Elektryczność i Magnetyzm
Elektryczność i Magnetyzm
Algorytmy Opracowanie: Maria Skalska na podstawie „Informatyka 2000” wydawnictwa Czarny Kruk.
Zależności funkcyjne.
Architektura komputerów
MCS51 - wykład 2.
Architektura komputerów
Opracowanie: Maria W ą sik. Pierwsze komputery budowano w celu rozwi ą zywania konkretnych problemów. Gdy pojawiało si ę nowe zadanie, nale ż ało przebudowa.
Architektura komputerów
Architektura komputerów
Zasada działania komputera
Mikroprocesory mgr inż. Sylwia Glińska.
Architektura systemów komputerowych (jesień 2013)
Mikroprocesory.
Mikroprocesory mgr inż. Sylwia Glińska.
Koncepcja procesu Zadanie i proces. Definicja procesu Process – to program w trakcie wykonywania; wykonanie procesu musi przebiegać w sposób sekwencyjny.
Pamięć komputerowa S t r u k t u r a p a m i ę c i.
Metody analizy obwodów elektrycznych
Układ trójkąt - gwiazda
Wykład 7 Synchronizacja procesów i wątków
W ą t e k (lekki proces) thread.
606.Dwa opory R połączono raz szeregowo a raz równolegle z ogniwem o SEM E=12V i oporze wewnętrznym r=1 . W obu przypadkach moc wydzielona na oporach.
Systemy rozproszone  Rozdzielenie obliczeń między wiele fizycznych procesorów.  Systemy luźno powiązane – każdy procesor ma lokalną pamięć; procesory.
Temat 7: Instrukcje warunkowe
Wykład nr 4: Mikrokontrolery - wprowadzenie Piotr Bilski
Procesor – charakterystyka elementów systemu. Parametry procesora.
Obwody elektryczne - podstawowe prawa
567.Jakie prądy płyną przez poszczególne opory na schemacie poniżej, jeśli R 1 =3 , R 2 =7 , R 3 =20 , U=20V, a galwanometr wskazuje i G =0? B R1R1.
Procesor, pamięć, przerwania, WE/WY, …
603.Baterię o SEM E=12V i oporze wewnętrznym r=1  zwarto dwoma oporami R 1 =10  i R 2 =20  połączonymi równolegle. Jakie prądy płyną przez te opory?
Struktura wewnętrzna mikrokontrolera zamkniętego
Architektury procesorów rdzeniowych mikrokontrolerów.
Procesy, wątki Program a proces Proces: Przestrzeń adresowa, kod, dane, stos (część pamięci do przechowania zmiennych lokalnych i niektórych adresów) Otwarte.
WPROWADZENIE DO MIKROPROCESORÓW. Klasyfikacja mikroprocesorów SIMD – ang. Single Instruction Multiple Data SISD – ang. Single Instruction Single Data.
Tryby adresowania i formaty rozkazów mikroprocesora
Algorytmy. Co to jest algorytm? Przepis prowadzący do rozwiązania zadania.
Programowanie strukturalne i obiektowe Klasa I. Podstawowe pojęcia dotyczące programowania 1. Problem 2. Algorytm 3. Komputer 4. Program komputerowy 5.
Organizacja i Architektura Komputerów
Podział mikroprocesorów
Zapis prezentacji:

Architektura komputerów Wykład nr 12: Architektury superskalarne Piotr Bilski

Organizacja superskalarna Rejestry całkowitoliczbowe Rejestry zmiennopozycyjne Potokowe jednostki funkcjonalne Operacje na pamięci Zwielokrotnienie potoków Za każdy potok odpowiedzialna jest inna jednostka funkcjonalna

Przetwarzanie superpotokowe Pobranie Dekod. Exec. Zapis Architektura superskalarna stopnia 2 Architektura superpotokowa stopnia 2 czas

Ograniczenia architektury superskalarnej Paralelizm na poziomie rozkazu Paralelizm na poziomie maszyny Ograniczenia: Prawdziwa zależność danych Zależność proceduralna Konflikt zasobów Zależność wyjściowa Antyzależność

Wpływ zależności na wykonanie programu Zależność danych lub konflikt zasobów i1 Zależność proceduralna i2 i3 i4 i5 i6 czas

Prawdziwa zależność danych I1 Add r1, r2 I2 Move r3, r1 Obie instrukcje mogą zostać pobrane i zdekodowane jednocześnie I2 nie może być wykonana zanim I1 nie zostanie wykonana

Paralelizm na poziomie rozkazu Wymaga niezależności między następującymi po sobie instrukcjami Możliwa do osiągnięcia, jeśli istnieje niezależność proceduralna i danych Na przykład: Load R1  R2 Add R3  R3, „1” Add R4  R4, R2 Add R3  R3, „1” Add R4  R3, R2 Store [R4]  R0

Strategie wydawania rozkazów Kolejne wydawanie/kolejne kończenie Kolejne wydawanie/inna kolejność kończenia Inna kolejność wydawania/inna kolejność kończenia

Kolejne wydawanie/kolejne kończenie Dekodowanie wykonywanie zapis I1 I2 I3 I4 I5 I6 I1 I2 I3 I4 I5 I6 I1 I2 I3 I4 I5 I6 I1 – dwa cykle na wykonanie I3 i I4 – ta sama ALU I5 zależy od I4 I5 i I6 – ta sama ALU

Kolejne wydawanie/inna kolejność kończenia Dekodowanie wykonywanie zapis I1 I2 I3 I4 I5 I6 I1 I2 I3 I4 I5 I6 I2 I1 I3 I4 I5 I6 I1 – dwa cykle na wykonanie I3 i I4 – ta sama ALU I5 zależy od I4 I5 i I6 – ta sama ALU

Zależność wyjściowa I3 nie może być ukończona przed I1 I1: R3 ← R3 op R5 I2: R4 ← R3 + 1 I3: R3 ← R5 + 1 I4: R7 ← R3 op R4 I3 nie może być ukończona przed I1 Zmiana kolejności wykonywania rozkazów jest trudna i wymaga rozwiązań sprzętowych

Inna kolejność wydawania/inna kolejność kończenia Dekodowanie okno wykonywanie zapis I1 I2 I3 I4 I5 I6 I1, I2 I3, I4 I4,I5,I6 I5 I1 I2 I3 I6 I4 I5 I2 I1 I3 I4 I6 I5 I1 – dwa cykle na wykonanie I3 i I4 – ta sama ALU I5 zależy od I4 I5 i I6 – ta sama ALU

Antyzależność I1: R3 ← R3 op R5 I2: R4 ← R3 + 1 I3: R3 ← R5 + 1 I3 nie może być zakończona, zanim I2 jest wykonana Zależność jest odwrócona

Przemianowanie rejestrów Zmiana sekwencji wykonywania rozkazów uniemożliwia określenie zawartości rejestrów w dowolnej chwili Nowym danym procesor przypisuje wolne rejestry Rozkazy sięgają do danej poprzez numer/nazwę odpowiadającego jej rejestru

Paralelizm maszynowy Powielanie jednostek funkcjonalnych ma sens tylko, gdy przemianuje się rejestry Okno rozkazu powinno być dostatecznie duże, aby pomieścić efektywnie dużo rozkazów (>16) Konieczna jest skuteczna predykcja rozgałęzień

Przyspieszenie architektur superskalarnych (bez przemianowania rejestrów)

Przyspieszenie architektur superskalarnych (z przemianowaniem rejestrów)

Przetwarzanie superskalarne

Przykład superskalarności – P4 Procesor pobiera rozkazy sekwencyjnie Rozkaz tłumaczony jest na mikrooperacje (rozkazy RISC) Mikrooperacje są przetwarzane superskalarnie w 20-elementowych potokach Wyniki mikrooperacji są wysyłane do wewnętrznych rejestrów i porządkowane

Architektura Pentium 4

Działanie Pentium 4 Pobranie instrukcji z pamięci w porządku programu statycznego Tłumaczenie instrukcji na jedną lub więcej instrukcji RISC o ustalonej długości (mikrooperacji) Wykonywanie mikrooperacji w potoku superskalarnym Mikrooperacje mogą być wykonywane w innej kolejności! Umieszczenie wyników mikrooperacji w zbiorze rejestrów w oryginalnym porządku programu Zewnętrzna powłoka CISC z wewnętrznym rdzeniem RISC Wewnętrzny rdzeń RISC o długości co najmniej 20 etapów

Potok Pentium 4

Architektura PowerPC Procesor składa się z trzech niezależnych jednostek wykonawczych (wykonanie trzech rozkazów jednocześnie): Jednostka przetwarzania rozgałęzień Jednostka zmiennopozycyjna Jednostka całkowitoliczbowa

Schemat PowerPC 601

Potok PowerPC 601