Sunteți pe pagina 1din 38

Arhitectura si organizarea

calculatoarelor
Curs Calculatoare/Electronica
aplicata anul III
2013
Ce reprezinta arhitectura si
organizarea calculatoarelor?
• Arhitectura exprima acele Nivele de
caracteristici vizibile structurare
In cadrul sistemelor
programatorului, principalul de calcul:
•Sisteme de operare
element il reprezinta ISA •Programe monitor
•Programe dedicate
(Instruction Set Architecture) – •Nivel fizic

intereseaza in special pe softist


• Organizarea este legata de
structurarea elementelor
componente ale sistemului ce Periferic 1
formeaza un calculator – Periferic 2
Memoria
intereseaza in special pe
proiectantul de calculatoare- sau
Periferic n-1
proiectantul de hardware UC
Periferic n
Care sunt principalele elemente ale
unui calculator?

• Unitatea centrala sau


Sistemul procesorul
de
Calcul • Memoria
• Unitatile periferice

Tipuri de mesaje vehiculate:


•Programat
•Spontane
Procesul Alte Sisteme
Fluxurile informationale pe care le distingem
in cadrul unui sisteme de calcul
Mediul extern
In raport cu sistemul de calcul

• Fluxul de intrare
• Fluxul de
procesare/memorare
• Fluxul de iesire
Detalierea fluxurilor de procesare
Posibilitatile de transfer a
informatiilor si procesare (1/2)
• Transferul informatiilor:
– Zone de memorie comuna (MC):
Acest tip de transfer presupune accesarea succesiva a aceleiasi zone de memorie
dinspre cel putin doua magistrale avand capacitati de transfer diferite. Rolul acestui
tip de transfer MC consta in asigurarea sincronizarii transferului datelor si reducerea
latentelor ce apar in procesele de transfer. In acest caz sincronizarea accesului la
date este “explicita”, iar natura datelor nu este in mod necesar cunoscuta

– Transferul mesajelor pe magistrale:


Acest tip de transfer se deruleaza sub forma unor “cadre” ce include o structura de
date aprioric definita. O astfel de structura contine markerii de inceput si sfarsit a
cadrului, precum si informatiile care sunt efectiv vehiculate. Sincronizarea transferului
se realizeaza urmare sistemului de detectie a inceputului si sfarsitului de cadru. In
general mesajele au cel putin o semnificatie care este explicitata I conjunctie
cu protocolul de comunicatie utilizat
Prin protocol de comunicatie se intelege ansamblul de reguli ce fac referire la
hardware si software ce asigura comunicatia fiabila si fara latente semnificative
Posibilitatile de transfer a
informatiilor si procesare (2/2)
• Procesarea datelor:
– Centralizata:
Acest caz corespunde unei topologii a transferului de date catre CPU de tip
“stelat” si necesita ca orice transfer I/E – memorie, memorie-memorie, sau I/O –
I/O sa se faca prin intermediul CPU.

– Distribuita:
Corespunde sistemelor multiprocesor intreconectate in retea topologia retelelor
poate fi stelata, de tip “mesh” sau mixta. In acest caz, fiecare CPU al retelei
dispune de propriul sistem de operare, poate fi identificat de catre programator si
poate rula aplicatii atat ce tin de task-urile etelei, cat si independent de acestea

– Cluster-izata:
Corespunde sistemelor multiprocesor in organizate in retea dar care datorita
sistemului de operare si a facilitatilor acestuia de control, sunt vazute din punctul
de vedere al programatorului ca un singur calculator. Desi admit prin metoda
virtualizarii multiple sisteme de operare, totusi preponderent sunt utilizate
impreuna CPU-urile cluster-ului
Sincronizarea functionarii
calculatoarelor cu procesele controlate
• Prin scanarea porturilor sistemului:
– Presupune citirea ciclica continua a porturilor de intrare, compararea starii
acestora cu starile “marcate”-de interes prin rularea programului corespunzator
– Adoptand scanarea soft ocupam in intregime timpul CPU

• Cu ajutorul sistemului de intreruperi (SI):


– Sistemul de intreruperi este ansamblu hardware / software care asigura
mecanismul de sincronizare a CPU cu evenimentele externe sistemului. SI
asigura proptitudine, identificare automata a sursei intrerupatoare si specificitate
– Utilizarea SI elibereaza CPU de sarcina scanarii continue a porturilor; Verificarea
aparitiei unei cereri d eintrerupere se face intotdeauna la sfarsitul fiecarui ciclu
instructiune

• Prin intermediul circutelor DMA:


– Sistemul DMA permite transferul datelor intre circuitele de intrare / iesire sau
intre acestea si memoria sistemului fara interventia CPU. CPU va initia si finaliza
sesiunile de transfer. Verificarea unei cereri se va face dupa fiecare
microinstructiiune executata
Istoric al evolutiei calculatoarelor

Sec. XVII, XVIII: Flasneta


utilizeaza came mecanice ptr. Excitarea
unor lamele elastice in scopul producerii
sunetelor

Sec. XVIII, XIX: Masina Jacquard


Utilizeaza cartele perforate ptr.
Implementarea unui automat cu un numar
finit de stari ce permite executia unei
tesaturi
Istoric al evolutiei calculatoarelor 2
Masina Babbage sau masina diferentiala:
Ofera in plus in raport cu masinile anterior
prezentate facilitatea de memorare a informatiilor,
precum si cea de calcul a diferentei intre doua
valori.
Practic prima masina de calcul propriu-zisa.

Masina Zuse (Konrad) Z1, Z3 1936/1938


Masina capabila sa asigure secventierea
calculelor
Istoric al evolutiei calculatoarelor 3
1946 - 14 02 ENIAC (Electronic Numerical Integrator and Computer)
7,4x5,3 m2 18000 de tuburi electronice, 30 tone, 140KW putere
consumata
Performanta atinsa: 5000 de adunari/secunda
Structura calculatorului
Evolutia procesoarelor (1)
anii 1970
Evolutia procesoarelor (2)
anii 1980
Evolutia procesoarelor (3)
anii 1990
Programarea calculatoarelor
• In Hardware
Secventarea
Flux de date aritmetico- logica a Rezultate
procesarii datelor

Flux de Instructiuni Interpretorul de


instructiuni
Semnale de Control

• Prin Software
Registrele generale
Flux de date si unitatea Rezultate
Aritmetico - Logica
Modul de procesare digitala a
datelor
Coada
Acumulator
Memorie
Interfete de
Intrare / Iesire

Unitatea Aritmetico- Logica

Registru tampon
ALU de Memorie

Registru tampon
de Instructiuni Registru PC

Registru Registru de adresare


a memoriei
Memoria
Instructiune
Principala
Circuite de
control UCP
Single Instruction Single Data

Unitatea
Aritmetico

Intrare / Iesire
Interfetele de
Logica
Principala
Memoria

Unitatea
de control
a
programelor

Cod Instructiune Adresa Operand/Operanzi Cod..


Executia Instructiunilor

START Fetch Cycle Execute STOP


Cycle

Cod masina AVR8


0049) #pragma interrupt_handler int0_isr:iv_INT0
(0050) void int0_isr(void)
Calculul (0051) {
Ciclu de adresei pen- (0052) //external interupt on INT0
extragere tru instruc- (0053) //PORTC=~PINC;
(0054) PORTC=PINC<<1;
cod tiunea 0009F B223 IN R2,0x13
instructiune urmatoare
000A0 0C22 LSL R2
000A1 BA25 OUT 0x15,R2
(0055) if(PINC==0)
Cod sursa C 000A2 B223 IN R2,0x13
000A3 2022 TST R2
#pragma interrupt_handler int0_isr:iv_INT0 000A4 F411 BNE 0x00A7
void int0_isr(void) (0056) {
(0057) PORTC=0x01;
{ 000A5 E081 LDI R24,1
PORTC=PINC<<1; 000A6 BB85 OUT 0x15,R24
if(PINC==0) (0058) }
000A7 9019 LD R1,Y+
{ 000A8 BE1F OUT 0x3F,R1
PORTC=0x01; 000A9 9189 LD R24,Y+
} 000AA 9029 LD R2,Y+
000AB 9019 LD R1,Y+
} 000AC 9518 RETI
Compilare (0059) }
Arhitectura Von Neumann
•Neomogenitate a
datelor stocate in
memoria sistemului
•O singura cale de
date/cod utilizata
pentru transferul
datelor catre
memorie si unitati
I/O
•Ordinea in care se
acceseaza
informatia din
memorie da sensul
acesteia:
instructiune sau data
Arhitectura Harvard

Intern Extern
Single Instruction Multiple Data
memorie comuna
Single Instruction Multiple data
memorie distribuita
Multiple Instructions Multiple Data
Memorie comuna partajata
Masini distribuite procesare si
memorie
Arhitectura simetrica multiplu procesor
(NUMA-Non Uniform Memory Access)
AMD Opteron procesor dual core

87369245
Ultimul clasament plaseaza
China pe primul loc
7,168 NVIDIA® Tesla™ M2050 GPU
14,336 CPU
2.507 petaflops – Performanta in calcul
=2.507 x 1015
Memoria 229376 GB

Daca sistemul ar fi fost construit doar cu


CPU ar fi consumat 12MW
Utilizarea GPU reduce la 4.04 MW
consumul

Tianhe-1A
National Supercomputer Center in Tianjin
Road map HyperComputers (1)
Road Map Hyper Computers (2)
GPU versus CPU
Bull NovaScale
C-DAC Param
Cray XD1/XT3
2007 cele mai performante
computer-e cat si unde?
• BlueGene/L
DOE’s Lawrence Livermore National Laboratory in Livermore

• 360TFlops

http://www.top500.org/
Clasament Noiembrie 2010
Performantele Cray CX1 1 PFlops
• Chassis Enclosure Form Factor: 7U modular enclosure (Dimensions: W 12.22" (31.04cm) x H 17.5"
(44.45cm) x D 35.5" (90.42cm) Weight:
• - Chassis with all I/O modules (Gigabit and InfiniBand) and power supplies (28.3kg)
• Power Supplies 1600 watt hot-plug power supplies - Based on high efficiency and “power factor
correction” 1600W @ 220V = 6.66A (92% efficiency: 7.19A)
• - Redundant power supplies support 2+2 Cooling Fans Chassis comes standard with hot pluggable,
redundant fan modules based on Smart Energy Technologies Input Device Front control panel with
touch screen graphical LCD - Supports initial configuration wizard –
• Local server nodes, enclosure, and module information Two USB "pass-throughs" in front and back
Enclosure I/O Modules Up to two fabrics, featuring Ethernet switches providing uplink scalability
and high speed InfiniBand modular switches (8 ports SDR, 12 or 24 ports DDR) Ethernet Switch 16
RJ-45 auto-sensing 10/100/1000 Mbps UTP ports - Bandwidth: 32 Gbps (non-blocking) - Forwarding
Mode: Store-and-forward - Forward rate: 10 Mbps port = 14,800 packets/sec; 100 Mbps port =
148,000 packets/sec; 1000 Mbps port = 1,488,000 packets/sec - Latency: 100 to 100 Mbps = 40 μ
(max); 1000 to 1000 Mbps = 10 μ (max)
• IBS12DDR/IBS24DDR 12 or 24 Ports InfiniBand Switch IBS12DDR - Twelve -4X 10/20Gbps
(SDR/DDR) CX4 ports with support for optical adapters and cables - Subnet management software -
Embedded management with Linux OS with Ethernet and secure shell access - Ultra-low latency <
180ns - InfiniBand v1.2 compliant - Dual redundant auto-sensing - Status LED: Power, activity and
link indicators for each port, link and speed indicators built into each CX4 port - IBS24DDR -
Optional 12-4X 10/20Gbps CX4 Ports daughter card (for a total of 24 ports) - 480Gb/s (SDR) or
960Gb/s (DDR)
• Management Web-based Remote System Management Graphical Mode Console Redirection
Performance monitoring Remote control: Graceful power shutdown and reboot, hard power
shutdown and
Top500.org XI-2012 (1)
Top 500.org XI-2012 (2)