Sunteți pe pagina 1din 8

Probleme propuse pentru examenul de la

disciplina Structura i Organizarea


Calculatoarelor 2014-2015

== MOODLE TYPE ==

Prof. dr. ing. Vasile Gheorghi GITAN

Cap. 1 Introducere
Quiz
1. Fie dou implementri diferite M1 i M2 ale aceluiai set de instruciuni. Exist trei clase de
instruciuni (A, B i C) n setul de instruciuni. M1 are un ceas de 80 de MHz i M2 are un ceas de
100 MHz. Numrul mediu de cicli pentru fiecare clas de instruc iuni i frecven a lor (pentru un
program tipic) sunt dup cum urmeaz:

a) Calculeaz CPI mediu pentru fiecare main M1 i M2.


Pentru masina M1:
Clocks pe Instructiune = (60/100)* 1 + (30/100)*2 + (10/100)*4 = 1.6
Pentru masina M2:
Clocks pe Instructiune = (60/100)*2 + (30/100)*3 + (10/100)*4 = 2.5

b) Calculeaz MIPS mediu pentru fiecare main M1 i M2.


Pentru masina M1:
Average MIPS rating = Clock Rate/(CPI * 106) = (80 * 106) / (1.6*106) = 50.0
Pentru masina M2:
Average MIPS rating = Clock Rate/(CPI * 106) = (100 * 106) / (2.5*106) = 40.0

c) Care main are raportul MIPS mai mic? Pentru care clas individual de instruc iuni trebuie
s schimbi CPI-ul, i ct de mult, pentru ca aceast ma in s aib acelea i performan e
sau mai bune fa de maina cu MIPS-ul mai mare (poi schimba doar CPI-ul pentru una
dintre clasele de instruciuni de pe maina mai lent)?
Masina M2 are raportul MIPS mai mic.Daca schimbam CPI-ul instructiunii clasei A pentru
masina M2 la 1,putem avea un raport mai bun a MIPS decat M1 asa cum urmeaza:
Clocks pe Instructiune = (60/100)*1 + (30/100)*3 + (10/100)*4 = 1.9
Average MIPS rating = Clock Rate/(CPI * 106) = (100 * 106) / (1.9*106) = 52.6

2. Presupunei c avei un procesor care execut un program constnd din 50% nmul iri n virgul
flotant, 20% mpriri n virgul flotant, iar restul de 30% sunt alte instruc iuni (legea lui Amdahl).
a) Managementul dorete ca acest procesor s ruleze de 4 ori mai repede. Se poate face ca
mprirea s mearg de 3 ori mai repede i nmulirea de 8 ori mai repede. Pute i ndeplini
cerina managementului doar cu o singur mbuntire, i care este aceasta?
b) Dogbert a preluat compania nlturnd toi managerii preceden i. Dac realiza i ambele
mbuntiri, la nmulire i la mprire, care este viteza procesorului astfel mbunt it
relativ la procesorul original?
3. Presupunem c putem mbuntii performanele n virgul flotant ale unui procesor cu un factor
avnd valoarea 15 (aceleai instruciuni n virgul flotant sunt de 15 ori mai rapide pe noul
procesor). Ce procentaj dintre instruciuni trebuie s fie n virgul mobil pentru a atinge o
mbuntire a vitezei de cel puin 4 ori?
Vom folosi Legea lui Amdahl.

X va fi procentajul pentru instructiunile in virgula flotanta.Cat timp viteza este 4, daca procesorul
original se executa in 100 ciclii ,noul program va rula in 100/4 = 25 cycles.

(100)/4 = (x)/15 + (100 x)


Solutia lui x va fi:
x = 80.36
Procentajul in virgula flotanta a instructiunilor trebuie sa fie 80.36.

4. Aa cum este definit MIPS-ul se poate defini MFLOPS-ul care nseamn milioane de instruc iuni n
virgul flotant per secund. Dac procesorul A are un MIPS mai mare dect procesorul B, atunci n
mod obligatoriu are i un MFLOPS mai mare dect B?
Un procesor A cu un MIPS mai mare decat un procesor B nu are si un MFLOPS mai mare pentru
procesorul A.Unul din motive ar fi:
Este posibil ca instructiunile in virgula flotanta sa aiba o proportie destul de redusa a instructiunilor in
program.
Deci operatiile in virgula flotanta a procesorului B sunt mult mai eficiente decat operatiile in virgula
flotanta a procesorului A in timp ce (intreg,memorie,etc) celalalte instructiuni sunt mai eficiente in
B,deci procesorul B are rata MFLOPS mai mare in timp ce procesorul A are o rata a MIPS mai mare.
5. Se consider benchmark-ul SPEC. Numii doi factori care influen eaz performan ele rezultate
pentru orice arhitectur particular.
1.Flagurile compilatorului sunt folositi pentru a compila benchmark-ul.
2.Datele de intrare sunt date benchmark-ului in timp ce masoara performantele.
6. Cum a afectat calculatorul dezvoltarea tranzistorilor? Ce a nlocuit tranzistorul?
Dezvoltarea tranzistorului a avut un impact extraordinar in a aduce calculatorul in casele noastre sub
forma de PC-uri si mult mai recent in mainile noastre(PDA-Asistent Personal Digital).Capacitatea de
a impacheta si integra tranzistori pe un chip la o rata care a crescut exponential in conformitate cu
Legea lui Moore a rezultat intr-o performanta extraordinara pentru programe fara a fi nevoie
schimbarea lor.
Tranzistorul a inlocuit tubul in vid in 1951.
7. Presupunem c o echip de proiectare realizeaz mbunt irea unui procesor prin adugarea unui
modul hardware MMX (multimedia extension instruction). Atunci cnd un calcul se realizeaz n
modul MMX pe hardware-ul MMX acesta este de 10 ori mai rapid dect n modul normal de
execuie. Se va numi timpul petrecut utiliznd modul MMX, procentul de mbunt ire media.
a. Ce procent mediu de mbuntire este necesar pentru a ob ine o mbunt ire general a
vitezei de 2?
b. Ce procent din timpul de execuie este petrecut n modul MMX dac se realizeaz mrire
de dou ori a vitezei ? (Sfat: trebuie calculat noul timp general).
c. Ce procent de mbuntire mediu este necesar pentru a ob ine o jumtate din maximum de
mrire a vitezei (one-half) care se poate obine utiliznd modul MMX?
8.
a. Dac procesorul A are ceasul mai mare ca procesorul B, i procesorul A are i MIPS-ul mai
mare dect procesorul B, explicai cnd procesorul A va fi mai rapid dect procesorul B.
Presupunei c exist dou implementri ale aceleia i arhitecturi a setului de instruc iuni.
b. Procesorul A are ciclul de ceas de 20ns i un CPI efectiv de 1,5 pentru unele programe, i
procesorul B are ciclul de ceas de 15ns i un CPI efectiv de 1 pentru unele programe. Care
procesor este mai rapid pentru acest program i cu ct?
9. Presupunem c un segment de program const dintr-o parte pur secven ial care ia pentru execu ie
25 de cicli, i o bucl iterativ care ia 100 de cicli per itera ie. Presupune i c itera iile din bucl sunt
independente, i nu pot fi paralelizate. Dac bucla se execut de 100 de ori, care este cre terea
maxim de viteza posibil dac se utilizeaz un numr infinit de procesoare (n compara ie cu un
singur procesor)
Partea secventiala ia 25 de ciclii. Fiecare iteratie a buclei (care ia 100 ciclii) poate fi executata
independent si sunt in total 100 de iteratii.
Aplicand Legea lui Amdahl:
Timpul de executie dupa imbunatatire = (Timpul de executie afectat de imbunatatire) / (Valoarea
imbunatatirii) + (Executia timpului neafectat) = (100*100)/100 + 25 = 100 + 25.
Viteza = 125/100 = 1.25
10. Procesorul A are un CPI general de 1,3 i poate rula la o frecven de ceas de 600 MHz. Procesorul
B are un CPI de 2,5 i poate rula la o frecven de ceas de 750MHz. Avem un anumit program pe

care dorim s-l executm. n urma compilrii pe procesorul A rezult 100.000 de instruc iuni. Cte
instruciuni trebuie s aib programul compilat pe procesorul B, pentru ca cele dou procesoare s
aib, pentru acest program, exact acelai timp de execu ie?
(CPUTime)A = (Numarul de instructiuni) A * (CPI)A * (Ciclu ceas de Timp)A = (100,000)*(1.3)/

(600*106)ns
(CPUTime)B = (Numarul de instructiuni)B * (CPI)B * (Ciclu ceas de Timp)B = (I)B *(2.5)/

(750*106)ns.

Cat timp (CPUTime)A = (CPUTime)B va trebui sa rezolvam (I)B si obtinem 65000.


11. Imaginai-v c putei realiza o curs bazat pe benchmark pentru a compara dou calculatoare pe
care credei c vrei s le cumprai. Precizai o list cu 5 programe de benchmark sau un scenariu
de utilizare pe care vrei s-l folosii pentru a crea o suit proprie, personalizat de benchmark.
Pentru fiecare program l-ai selectat, justifica i-l. Pentru suita de benchmark-uri ca ntreg, discuta i o
metod pentru calculul mediei ponderate a diferitelor programe n execu ie.
12. O echip de proiectani trebuie s aleag pentru un procesor simplu cu o singur instruc iune pe
ciclu, ntre o implementare pipeline sau fr pipeline. n tabel sunt prezenta i c iva parametrii de
proiectare pentru cele dou opiuni.

a. Pentru un program cu 20% instruciuni ALU instruciuni, 10% instruc iuni de control i 70%
instruciuni de lucru cu memoria, care va fi proiectul mai rapid? Furniza i valoarea medie a
CPI pentru fiecare caz.
b. Pentru un program cu 80% instruciuni ALU instruciuni, 10% instruc iuni de control i 10%
instruciuni de lucru cu memoria, care va fi proiectul mai rapid? Furniza i valoarea medie a
CPI pentru fiecare caz.
13. Un proiectant dorete s mbunteasc performan ele generale a unui procesor dat cu
respectarea unei inte de tip suit benchmark i se ia n considerare o mbunt ire X care se aplic
la 50% instruciunilor originale executate dinamic, i le mre te viteza de execu ie fiecreia dintre ele
cu un factor 3. Managerul de proiectare are unele ngrijorri despre complexitate i costul efectiv
pentru X, i sugereaz ca proiectantul s ia n considerare o mbunt ire Y alternativ.
mbuntirea Y, dac se aplic numai la cteva dintre instruc iunile executate dinamic le va face
doar cu 75% mai rapide. Determinai ce procent dintre toate instruc iunile executate dinamic trebuie
mbuntite utiliznd optimizarea Y pentru a ob ine aceea i cre tere de vitez propus de
mbuntirea X.

Problemele din capitol


14. Descriei paii care transform un program scris ntr-un limbaj de nivel nalt, precum C, ntr-o
reprezentare care este direct executat de procesor.

15. Presupunei c un afior color utilizeaz 8 bii pentru fiecare dintre culorile de baz (ro u, verde i
albastru) per pixel i un cadru avnd mrimea de 1280 x 1024.
a. Care este mrimea minim n octei al buffer-ului pentru cadru care memoreaz cadrul?
8bits x 3 culori=24bits/pixel = 4 bytes/pixel.1280 x 800pixels = 1.024.000 pixels.
1.024.000 pixels x 4 bytes/pixel = 4.096.000 bytes(aprox 4 Mbytes).

b. Cnd de mult dureaz trimiterea unui cadru pe o re ea cu viteza de 100 Mbit/s?


16. Se consider trei procesoare P1, P2 i P3 care execut acela i set de instruc iuni. P1 are frecven a
de ceas de 3 GHz i un CPI de 1,5, P2 are 2,5 GHz i un CPI de 1 i P3 are 4GHz i un CPI de 2,2.
a. Care procesor are performanele cele mai mari exprimat n MIPS?
P2 are performanta cea mai mare
Performance P1(instructions/sec) = 2 x 109/1.5 = 1.33 x 109
Performance P2(instructions/sec) = 1.5 x 109/1.0 = 1.5 x 109
Performance P3(instructions/sec) = 3 x 109/2.5 = 1.2 x 109

b. Dac fiecare procesor execut un program n 10 secunde, calcula i numrul de cicli i


numrul de instruciuni.
Cycles(P1) = 10 x 2 x 109 = 20 x 109s
Cycles(P2) = 10 x 1.5 x 109 = 15 x 109s
Cycles(P3) = 10 x 3 x 109 = 30 x 109s
Time=(No.instr. x CPI)/ clock rate, then No.instructions = No.cycles/CPI
Instructions(P1) = 20 x 109/1.5 = 13.33 x 109
Instructions(P2) = 15 x 109/1 = 15 x 109
Instructions(P3) = 30 x 109/2.5 = 12 x 109

c.

S-a ncercat reducerea timpului cu 30% dar aceasta a condus la o cre tere cu 20% a CPIului. Care frecven de ceas trebuie pentru a avea aceast reducere?
Timenew = timeold x 0.7 = 7s
CPI = CPI x 1.2, then CPI(P1) = 1.8,CPI(P2) = 1.2,CPI(P3)=3
F= No.instr. x CPI/time,then
F(P1) = 13.33 x 109 x 1.8/7 = 3.42GHz
F(P2) = 15 x 109 x 1.2/7 = 2.57GHz
F(P3) = 12 x 109 x 3/7 = 5.14GHz

17. Se consider dou implementri diferite ale aceleia i arhitecturi a setului de instruc iuni.
Instruciunile pot fi divizate n 4 clase n funcie de CPI (clasele A, B, C i D). P1 are frecven a de
ceas de 2,5 GHz i CPI-urile 1,2,3 i 3, iar P2 are un ceas de 3 GHz i CPI-urile 2,2,2 i 2. Dndu-se
un program cu contorul dinamic de instruciuni de 1.0E6 instruc iuni divizate n clase dup cum
urmeaz: clasa A 10%, clasa B 20%, clasa C 50%, i clasa D 20%, care implementare este mai
rapid?
a. Care este CPI-ul global pentru fiecare implementare?
b. Gsii ciclurile de ceas necesare n ambele cazuri.
18. Compilatoarele pot avea un impact profund asupra performan elor unei aplica ii. Presupunem c
pentru un program, compilatorul A genereaz un contor dinamic pentru instruc iuni de 1.0E9 i are
un timp de execuie de 1,1s, n timp ce compilatorul B genereaz un contor dinamic pentru
instruciuni de 1.2E9 i are un timp de execuie de 1,5s.

a. Gsii CPI-ul mediu pentru fiecare program dat fiind faptul c durata unui ciclu de ceas al
procesorului este de 1ns.
Compiler A CPI = 0.80
Compiler B CPI = 0.58

b. Presupunei c programele compilate se execut pe dou procesoare. Dac timpul de


execuie pe cele dou procesoare este acelai, ct de rapid este ceasul procesorului care
ruleaz codul compilat de compilatorul A n raport cu ceasul procesorului care ruleaz codul
compilat de compilatorul B?
1.37

c.

Se dezvolt un nou compilator care utilizeaz doar 6.0E8 instruc iuni i care are un CPI
mediu de 1,1. Care este creterea de vitez utiliznd acest compilator versus compilatoarele
A i B de pe procesorul original?
Compiler A sppedup = 1.21
Compiler B sppedup = 0.88

19. Procesorul Pentium IV Prescott, realizat n 2004, avea un ceas de 3,6 GHz, la o tensiune de lucru de
1,25V. Presupunei c, pe medie, acesta consuma 10W de energie static i 90W de energie
dinamic. Nucleul I5 Ivy Bridge, realizat n 2012, are un ceas de 3,4 GHz la o tensiune de 0,9V.
Presupunei c n medie consum 30W de putere static i 40W de putere dinamic.
a. Pentru fiecare procesor gsii ncrcare capacitiv medie.
b. Gsii procentul din puterea total disipat ce corespunde puterii staticii i raportul dintre
puterea static i cea dinamic pentru fiecare tehnologie.
c. Dac puterea total disipat este redus cu 10%, ct de mult trebuie redus tensiunea
pentru a menine acelai curent de scurgere? Not: puterea este definit ca produsul ntre
tensiune i curent.
20. Presupunei c un procesor are pentru instruciunile aritmetice, load/store i de salt un CPI de 1,2,
respectiv 5. Presupunei de asemenea c un program executat pe un singur procesor necesit
execuia a 2,56E9 instruciuni aritmetice, 1,28E9 instruciuni load/store i 256 de milioane de
instruciuni de salt. Presupunei c fiecare procesor are un ceas de 2 GHz. Presupune i c, dac
programul este paralelizat pentru a se executa pe nuclee multiple, numrul de instruc iuni aritmetice
i load/store per procesor este divizat cu 0,7 x p (unde p este numrul de procesoare), dar numrul
de salturi per procesor rmne acelai.
a. Calculai timpul total de execuie pentru acest program pe 1, 2, 4 i 8 procesoare, i
prezentai creterea relativ de vitez a celor 2, 4 i 8 procesoare la un singur procesor.
b. Dac CPI-ul instruciunilor aritmetice se dubleaz care este impactul execu iei programului
pe 1, 2, 4 i 8 procesoare?
c. La ce valoare trebuie redus CPI-ul instruciunilor load/store pentru un singur procesor pentru
ca acesta s aib aceleai performane cu patru procesoare ce utilizeaz valorile originale
ale CPI?
21. Presupunem un wafer de 15 cm diametru care are un cost de 12, con ine 84 de die, i are 0,020
defecte/cm2. Presupunei ca un wafer de 20 de cm diametru are un cost de 15, con ine 100 de die, i
are 0,031 defecte/ cm2.
a. Calculai yield pentru ambele wafer-e
Yield = 1/(1+(defect per area x die area)/2)2
La wafer de 15 cm yield este de 0.97
La wafer de 20 cm yield este de 0.92

b. Calculai costul per die pentru ambele wafer-e.


Cost per die = cost per wafer/(dies per wafer x yield)
Cost per die = 0.12(la wafer de 15 cm)
Cost per die = 0.16(la wafer de 20cm)

c.

Dac numrul de die per wafer este crescut cu 10% i defectele pe unitatea de arie cresc cu
15%, calculaia aria die i yield.
Dies per wafer = 1.1 x 90 = 99
Defects per area = 1.15 x 0.018 = 0.021 defects/cm2
Die area = wafer area/Dies per wafer = 176.7/99 = 1.78 cm2
Yield = 0.97
Dies per wafer = 1.1 x 140 = 154
Defects per area = 1.15 x 0.024 = 0.028 defects/cm2
Die area = wafer area/Dies per wafer = 490.9/154= 3.19 cm2
Yield = 0.93

d. Presupunei c un proces de fabricaie mbuntete yield de la 0,92 la 0,95. Calcula i


defectele pe unitatea de arie pentru fiecare versiune a tehnologiilor, fiind dat aria die ca
fiind 200 mm2.
T3:defects per area = 0.00043 defects/mm2 = 0.043 defects/cm2
T4:defects per area = 0.00026 defects/mm2 = 0.026 defects/cm2

22. Rezultatele pentru benchmark-ul SPEC CPU2006 bzip2 ce ruleaz pe un AMD Barcelona are un
contor de instruciuni de 2,389E12, un timp de execu ie de 750s i un timp de referin de 9650s.
a. Calculai CPI-ul dac perioada ceasului este de 0,333ns.
CPI(pearl) = 3x109 x 500/2118 x 109

b. Calculai SPECratio.
SPECratio(pearl) = 9770/500 = 19.54

c.

Calculai creterea timpului CPU dac numrul de instruc iuni ale banchmark-ului cre te cu
10% fr a afecta CPI-ul.
CPU time = No.instr. x CPI/clock rate

d. Calculai creterea timpului CPU dac numrul de instruc iuni ale banchmark-ului cre te cu
10% iar CPI-ul crete cu 5%.
CPU time(before) = No.instr. x CPI/clock rate
CPU time(after) = 1.1 x No.instr. x 1.05 x CPI/clock rate
CPU time(after)/CPU time(before) = 1.1 x 1.05 = 1.155.Thus, CPU time is increased by
15.5%

e. Calculai modificrile SPECratio pentru aceast schimbare.


SPECratio = reference time/CPU time
SPECratio(after)/SPECratio(before) = CPU time(before)/CPU time(after) = 1/1.1555 = 0.86
That the SPECratio is decreased by 14%

f.

Presupunei c dezvoltai o nou versiune de procesor AMD Barcelona cu un ceas de 4


GHz. Ai adugat cteva instruciuni adiionale setului de instruciuni astfel nct numrul de
instruciuni a fost redus cu 15%. Timpul de execuie s-a redus la 700s i noul SPECratio
este 13,7. Gsii noul CPI.
CPI =(CPU time x clock rate)/No.instr.
CPI = 450 x 4 x 109/(0.85 x 2118 x 109)=0.99

g. Aceast valoare este mai mare dect aceea obinut la 1.11.1 dei ceasul a crescut de la 3
la 4 GHz. Determinai situaia n care creterea CPI este similar cre terii frecven ei
ceasului. Dac nu sunt similare explicai de ce.
Clock rate ratio = 4 GHz/3GHz = 1.33
CPI @ GHz = 0.99, CPI @ 3GHz = 0.7, ratio = 1.41
They are different because althrough the number of instruction has been reduced by 15 %,
the CPU time has been reduced by a lower percentage

h. Cu ct s-a redus timpul CPU?


450/500 = 0.90, CPU time reduction:10%

i.

Pentru un al doilea benchmark, libquantum, presupune i c timpul de execu ie este 960ns,


CPI de 1,61,i ceasul este de 3 GHz. Dac timpul de execu ie este redus cu 10% fr a
afecta CPI-ul i cu un ceas de 4 GHz, determinai numrul de instruciuni.
No.instr. = CPU time x clock rate/CPI
No.instr. = 820 x 0.9 x 4 x109/0.96 = 3075 x 10

j.

Determinai ceasul necesar pentru o nou reducere cu 10% a timpului CPU men innd
numrul de instruciuni i CPI-ul.
Clock ratenew = No.instr. x CPI/0.9 x CPU time = 1/0.9 clock rateold = 3.33GHz

k.

Determinai ceasul dac CPI se reduce cu 15% i timpul CPU cu 20%, n timp ce numrul
de instruciuni rmne neschimbat.
Clock rate = No.instr. X CPI/CPU time
Clock ratenew = No.instr x 0.85 x CPI/0.80 CPU time = 0.85/0.80 clock rateold = 3.18 GHz

23. Seciunea 1.10 citeaz ca i capcan utilizarea unui subset al ecua iilor pentru performan ca
metric pentru performan. Pentru a ilustra aceasta s considerm urmtoarele dou procesoare.
P1 are un ceas de 4GHz, un CPI mediu de 0,9 i necesit execu ia a 5.0E9 instruc iuni. P2 are un
ceas de 3 GHz, un CPI mediu de 0,75, i necesit execu ia a 1,0E9 instruc iuni.
a. O interpretare greit uzual este s considerm c procesorul cu ceasul mai mare are
performane mai bune. Verificai dac este adevrat pentru P1 i P2.
b. O alt interpretare greit este aceea de a considera c procesorul care execut mai multe
instruciuni va avea un timp CPU mai mare. Considernd c procesorul P1 execut o
secven de 1,0E9 i c CPI-ul celor dou procesoare nu se schimb, determina i numrul
de instruciuni pe care le poate executa P2 n acela i timp necesar ca P1 s execute cele
1,0E9 instruciuni.
c. O alt interpretare greit comun este aceea a utilizrii MIPS pentru a compara
performanele a dou procesoare, i se consider c procesorul cu MIPS mai mare este mai
performant. Verificai dac este valabil pentru P1 i P2.
d. O alt interpretare greit este utilizarea MFLOPS. Presupune i c 40% din instruc iunile
executate att de P1 ct i de P2 sunt instruciuni n virgul flotant. Gsi i interpretarea
MFLOPS greit pentru programe.
24. O alt capcan citat n seciunea 1.10 este aceea c ne a teptm s mbunt im performan ele
generale ale unui calculator prin mbunt irea doar a unui aspect. S considerm un calculator
care ruleaz un program care necesit 250s, cu 70s petrecute executnd instruc iuni FP, 85 de
secunde executnd instruciuni L/S.i 40s executnd instruc iuni de salt.
a. Ct de mult se reduce timpul total dac timpul pentru opera iile FP se reduce cu 20%?
b. Ct de mult se reduce timpul pentru operaiile INT dac timpul total se reduce cu 20%?
c. Poate fi redus timpul total cu 20% reducnd numai operaiile de salt?
25. Presupunei c un program necesit execuia a 50 x 106 instruc iuni FP, 110 x 106 instruc iuni INT,
80 x 106 instruciuni L/S, i 16 x 106 instruc iuni de salt. CPI pentru fiecare tip de instruc iune este
de respectiv 1, 1, 4, i 2. Presupunei c procesorul are ceasul de 2 GHz.
a. Ct de mult trebuie mbuntit CPI-ul instruciunilor FP dac dorim ca programul s ruleze
de dou ori mai repede?
b. Ct de mult trebuie mbuntit CPI-ul instruciunilor L/S dac dorim ca programul s ruleze
de dou ori mai repede?
c. De cte ori este mbuntit timpul de execuie al programului dac CPI pentru instruc iunile
INT i FP este redus cu 40% i CPI pentru instruciunile L/S i de salt este redus cu 30%.
26. Atunci cnd un program este adaptat s se execute pe procesoare multiple ntr-un sistem
multiprocesor, timpul de execuie pe fiecare procesor este alctuit din timpul de calcul i timpul dat
de supracontrolul necesar pentru a bloca seciunile critice i/sau trimiterea datelor de la un procesor
la altul. Presupunei un program care necesit 100s de execu ie pe un singur procesor. Atunci cnd
se ruleaz pe p procesoare necesit t/ps precum i 4s adi ionale pentru supracontrol, indiferent de
numrul de procesoare. Calculai timpul de execu ie per procesor pentru 1, 2, 4, 8, 16, 32, 64, i 128
de procesoare. Pentru fiecare caz, listai creterea relativ de vitez la un singur procesor i raportul
dintre creterea de vitez actual i creterea de vitez ideal (fr supracontrol).

S-ar putea să vă placă și