Documente Academic
Documente Profesional
Documente Cultură
Recapitulare
Recapitulare
Curs 1
Un sistem de calcul este format din mai multe blocuri functionale:
-elemente de procesare - P
- elemente de memorare - M
- elemente de interconectare de tip magistrala - L
- unitati de comanda - K
- operatori de date - D
- switch-uri de interconectare - S
- terminale - T
- curs 1 - pag 9 - diagrama masinii von Neumann
- pag 10 - componentele arhitecturii
- pag 11 - memoria
Arhitectura von Neumann este alcatuita din - Ucmd, UAL, registre, memorie,
interfata input, output, echipamente periferice input, output
Un sistem de calcul este alcatuit din: masina de baza (unitatea
centrala( unitatea centrala de prelucrare (Ucmd, UAL, RG ), memoria ),
interfata input, output), echipamentele periferice, software de baza.
UAL realizeaza calcule in virgula fixa(int) si mobila(float), s-a extins catre
coprocesorul matematic.
Ucmd- realizeaza etapele de intruction fetch, decode, execute - citire,
interpretare, executia instructiunilor masina. Setul de instructiuni poate fi
RISC, CISC.
Subsistemul I/E - asigura transferul datelor intre UC si mediul extern.
Interfetele I/E asigura o adaptare electrica intre EP si UCP. Transfer de date
intre EP si UC: transfer programat(busy waiting - UCP lucreaza la viteza EP,
sistem de intreruperi), DMA - transfer de date intre EP si M fara interventia
UCP, dialogul intre UCP si DMA are loc doar la initiere si incheiere. Arbitrarea
conflictului de acces la M al UCP / DMA se face prin furt de ciclu sau rafala.
Dou metode de efectuare a transferului DMA:
1. Prin utilizarea intervalelor de timp n care UCP nu face acces la memorie;
metoda se numete transfer prin furt de ciclu (cycle stealing), deoarece
modulul
DMA fur un ciclu de memorie de la UCP. Activitatea UCP nu este
influenat
de operaiile DMA, cu excepia cazului cnd se ajunge la un punct n
care este necesar memoria.
2. Prin suspendarea operaiilor efectuate de UCP n timpul transferului i
trecerea
magistralei n starea de nalt impedan. Ciclul de instruciuni se va relua
apoi
din punctul n care a fost suspendat. Metoda se numete transfer n rafal
(data break).
Pentru a nu irosi cicli de procesor subsistemul I/E mai are 2 metode: Canalul
Curs 2 - pms
Nivelul structural de descriere al sistemelor numerice - PMS (Processor
Memory Switches)
PMS - procesoare, memorii, switch-uri de interconectare, legaturi, unitati de
comanda, operator de date, terminal, procesoare de I/E.
- curs 2 - pag 3 - memoria, procesorul central
- pag 4 - switch, legatura
- pag 5 - unitate de comanda, procesor de I/E
- pag 6 - operator de date, terminal
Curs 3a - sbc
SBC = Reprezentarea PMS a unei structuri multiprocesor organizata pe o
magistrala comuna
Resurse SBC - procesor, sistem de intreruperi, interfete (S/P), memorie locala,
globala(RAM)
- curs 3 - pag 2 - mai ales schema
- pag 3 mecanisme acces magistrala - Ks , K bus, K ml, schema
- pag 5,6 descriere Kbus, Kml
Pentru a gestiona accesul pe magistrala (exclusiv) sunt necesare:
Kbus - unitate de comanda pentru accesul la magistrala
Kml - unitate de control a accesului la memoria locala
KLd - unitate de comanda a memoriei locale(refresh,etc)
Ks - unitate de comanda a intregului sistem - asigura controlul procesoarelor
la resursele sistemului
http://en.wikipedia.org/wiki/Single-board_computer
Curs 3b - comutatoare
Comutatoare - ierarhice - conecteaza o componenta de tip a cu una de tip b
(p-m)
- neierarhice - conecteaza 2 componente de acelasi tip ( p - p )
- curs 3 - pag 2, 3, 4
Ierarhice
Comutatoare duplex - comunicatie intre o componenta de tip a si mai multe
de tip b
Comutatoare dual duplex - 2 componente de tip a si mai multe de tip b
Comutatoare de tip legatura multipla (cross - bar switch) - comunicatia intre
m componente de tip a si n componente de tip b
Comutatoare de tip trunchi K - k linii de comunicatie - k optim - poate fi
min(m,n) - imbina conectivitatea oferita de S cross bar cu costul redus al
celorlalte tipuri de comutatoare
- curs 3 - pag 6, 7
Neierarhice - conexiunea intre elemente de acelasi tip(p - p , m -m ):
Comutatoare duplex neierarhice - vezi schema
Comutatoare legatura multipla - tip central
Comutatoare trunchi K neierarhic
Curs 5 - CELL
http://cs.curs.pub.ro/wiki/asc/asc:lab6:index
Un Cell conine un Power Processor Element (PPE) i opt Synergistic
Processor Elements (SPE) interconectate prin magistrala Element
Interconnect Bus (EIB). Procesorul PPE i SPE-urile comunic ntre ele, cu
spaiul principal de stocare (main storage) i cu elementele I/O prin
intermediul magistralei EIB.
Magistrala EIB: Limea de band intern a magistralei EIB este de 96
bytes pe ciclu i suport mai mult de 100 de cereri DMA n ateptare ntre
SPE-uri i spaiul principal de stocare (Main Storage).
Multiprocesor, pipeline
curs 6 pag 8 Flux de instructiuni si de date - clasificarea sistemelor de calcul
pag 9 -> 16 poze cu sisd, simd, mimd, misd
Strans cuplate - shared memory - acelasi sistem - multiprocesor
Slab cuplate - distributed memory - sisteme unite printr-o retea - transfer de
mesaje
curs 6 de citit mimd pag 13 - 16
Curs 9 MIMD
Fiecare procesor poate functiona autonom ca un sistem universal - pot prelua
taskurile altor procesoare, previn degradarea performantelor sistemului,
fiecare procesor ar trebui sa aiba acces la toata memoria.
Structurile MIMD dpdv arhitectural se pot imparti in:
- sisteme multiprocesor - paralel
- sisteme multicalculator - distribuit
Dpdv accesul la memorie MIMD sunt:
- cu memorie shared - comunicarea se face prin retele de comutatie,
magistrale
- cu memorie distribuita - comunicatie prin mesaje, LAN
Sisteme cu memorie partajata - UMA, NUMA - CC NUMA, COMA
Sisteme cu memorie distribuita - transfer de mesaje - acces doar la memoria
locala
Sisteme strans / slab cuplate
slab - de tip cluster - calculatoare conectate intre ele - interactiunea intre
procesoare e minima
strans pag 11 curs 9
Structura Cm* pag 13 - 14 - conecteaza mai multe module individuale structura multipla de calculatoare == cluster
Curs 11 GPU
Procesorul grafic are o arhitectura de tip SIMD si un spatiu propriu de
memorie (GPU dedicat VRAM, GPU integrat parte din RAM). In cadrul unui
sistem procesorul general care coordoneaza executia este numit HOST (CPU)
pe cand unitatea care efectueaza calculele este numit TARGET (GPU). Orice
fel de procesare necesita in prealabil un transfer din spatiul de memorie de la
CPU catre spatiul de memorie de la GPU. In cazul unui procesor grafic dedicat
acest transfer se face printr-o magistrala (PCIe, AGP, USB). Viteza de
transfer RAM-VRAM via magistral este inferioara vitezei RAM/VRAM si prin
urmare necesita eficientizata
Motivul discrepantei intre performanta in virgula mobila dintre CPU si GPU
este faptul ca GPU sunt specializate pentru procesare masiv paralela si
intensiva computational (descrierea perfecta a taskurilor de randare grafica)
si construite in asa fel incat majoritatea tranzistorilor de pe chip se ocupa de
procesarea datelor in loc de cachingul datelor si controlul fluxului executiei.
Un Streaming Processor (SP) este un microprocesor cu executie secventiala,
ce contine un pipeline, 2 unitati aritmetico-logice (ALU) si o unitate de calcul
in virgula mobila (FPU). Nu are un cache, fiind bun doar la executia multor
operatii matematice.
8 SP impreauna cu 2 Special Function Units (SFU) sunt incapsulate intr-un
Streaming Multiprocessor. Fiecare SFU contine 4 unitati pentru inmultire in
virgula mobila, utilizate pentru operatii transcendente (sin, cos) si interpolare.
MT se ocupa cu trimiterea instructiunilor pentru executie la SP si SFU.
Pe langa acestea, exista si un cache (de dimensiuni reduse) pentru
instructiuni, unul pentru date precum si memorie shared de 16KB, partajata
de cele 8 SP. Urmatorul nivel de incapsulare este Texture / Processor Cluster
(TPC). Acesta contine 3 SM, logica de control si un bloc de handling pentru
texturi. Acest bloc se ocupa de modul de adresare al texturilor, logica de
filtrare a acestora precum si un cache pentru texturi.
Curs 13 - Benchmark
Benchmark reprezinta un program sau un pachet de programe dezvoltate
pentru diagnosticarea si evaluarea performantelor unui sistem. Benchmarkurile vizeaza testarea randamentului hardware si/sau software relativ la alte
sisteme sau arhitecturi.
- tipuri de benchmark : aplicatii reale, kernel, pentru sistemele i/o , pentru