Sunteți pe pagina 1din 72

Cuprins Introducere Punctul 1 Procesoarele cu mai multe nuclee.........................................................5 Punctul 2 Motivul conceperii procesoarelor cu mai multe nuclee.........................

8 Punctul 3 Avantajele procesoarelor cu mai multe nuclee......................................9 Punctul 4 Miniaturizarea microprocesoarelor cu mai multr nuclee.......................11 Punctul 5 Dezavantajele procesoarelor multi-core................................................13 Capitolul I Arhitectura tipica. Elementele constructive...............................15 Paragraful 1 Arhitectura tipica a unui prosesor multi-core....................................15 Punctul 1 Nucleul..................................................................................................16 Punctul 2 Memoria cache......................................................................................18 Punctul 3 Bus-ul sistemului...................................................................................22 Punctul 4 Paralelismul nucleelor............................................................................23 Capitolul II Arhitecturi shi tehnologii............................................................27 Paragraful 1 Microarhitecturile procesoarelor cu mai multe nuclee...................27 Punctul 1.1 Arhitectura de 64 biti ....................................................................27 Punctul 1.2 Arhitectura Nehalem......................................................................30 Punctul 1.3 Arhitectura Sandy-Bridge..............35 Punctul 1.4 Arhitectura Ivy-Bridge...............40 Punctul 1.5 Arhitectura Hanswell..........43 Punctul 1.6. Arhitectura Tilera 64......45 Paragraful 2 Tehnologiile celei de-a doua generatii de procesoare Intel............48 Punctul 2.1 Intel Turbo Boost Technology 2.0..........48 Punctul 2.2 Intel Hyper-Threading Technology.............53 Punctul 2.3 Intel Smart Cache............................................................................55 Punctul 2.4 Intel HD Graphics...........................................................................56 Capitolul III Clasificarea procesoarelor cu mai multe nuclee.....................58
Mod Coala

Paragraful 1. Procesoare Tehnologia Core............................................................58 UTM FRT TLC 2012 102 008 NE
N.Document Semnat Data

Punctul 1.1. Dual-Core (cu doua nuclee)..............................................................58 A elaborat Procopciuc V. Litera Coala Coli Controlat Nastas V. 70 3 Microprocesoare cu mai
Control n. A aprobat

multe nuclee

UTM FRT TLC - 102 UTM FRT TLC-022

Punctul 1.2. Quad-Core (cu 4 nuclee)...................................................................62 Paragraful 2. Procesoare pentru Intel-Core i......................................................62 Punctul 2.1. Procesoarele din clasa medie...........................................................62 Punctul 2.2. Procesoarele din clasa de virf/clasa a doua......................................63 Subpunctul 2.2.1 Intel Core i3..............................................................................68 Subpunctul 2.2.2 Intel Core i5..............................................................................68 Subpunctul 2.2.3 Intel Core i7..............................................................................69 Concluzii...............................................................................................................70 Bibliografie...........................................................................................................72

Introducere Procesorul ncorporeaz funciile unitii centrale de prelucrare a informaiei (U.C.P. sau n englez: CPU) a unui calculator sau a unui sistem electronic structurat

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

4
Coal

funcional (care coordoneaz sistemul) i care, fizic, se prezint sub forma unui circuit electronic integrat IC cunoscut i sub numele de cip electronic. Reprezint forma structural cea mai complex pe care o pot avea circuitele integrate. El controleaz activitile ntregului sistem n care este integrat i poate prelucra datele furnizate de utilizator. Este elementul principal al unui sistem de calcul; cipul semiconductor, care este plasat pe placa de baz numit motherboard (en), este de obicei foarte complex, putnd ajunge s conin de milioane de foarte mici transistoare (microtranzistoare). Procesorul asigur procesarea instruciunilor i datelor, att a celora din sistemul de operare al sistemului, ct i a celora din aplicaia utilizatorului, i anume le interpreteaz, prelucreaz i controleaz, execut sau supervizeaz transferurile de informaii i controleaz activitatea general a cestorlalte componente care alctuiesc un sistem de calcul. Procesorul este una dintre cele mai importante componente a unui calculator, fiind cel care stabilete cine, ce i cnd sa fac. Deoarece se pot obine performane destul de bune i cu un procesor care nu este vrf de gama, ne poate da falsa impresie c el nu are un rol foarte important. De exemplu,un mptimit al jocurilor va pune un accent mai mare pe placa video dect pe procesor. Totul depinde de destinaia calculatorului, acest lucru nsemnnd c nu avem mereu nevoie de cel mai performant procesor. Vom ntlni des denumirea de CPU n cazul procesorului (Central Processing Unit ), sau UCP, aceasta fiind traducerea n limba romn (Unitate Central de Prelucrare). 1. Procesoarele cu mai multe nuclee Produsele dual si multi-core sunt concepute prin includerea a doua sau mai multe core-uri complete de CPU (unitate centrala de procesare) in interiorul unui singur procesor, care permite astfel gestionarea simultana a mai multor activitati.Unele modele de procesoare folosesc o memorie cache pentru fiecare nucleu, de exemplu AMD dualcore, sau o memorie comun pentru toate nucleele, cum sunt modelele Intel Core 2 Duo acelai cache L2. Procesoarele care au toate nucleele pe un singur circuit integrat se numesc procesoare monolitice. Procesoarele multi-core i dovedesc eficiena cnd sunt puse n sarcina mai multor thread-uri.Cand se combina cu tehnologia HT, care permite

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

5
Coal

unui procesor sa se prezinte sub forma a doua procesoare logice, produsele de tipul Pentium Processor Extreme Edition pot procesa patru apliatii software simultan, utilizand intr-un mod mult mai eficient resurse care, in alte conditii, ar ramane neexploatate. Un procesor multi-core combin dou sau mai multe nuclee (core) ntr-un singur circuit integrat sau mai multe pachete de circuite integrate la un loc. Un procesor dual-core contine doua nuclee, un procesor quad-core contine patru nuclee si un procesor hexa-core contine sase nuclee. Calculatoare de patru ori mai puternice: Intel Corporation a incheiat pregatirile initiale pentru demararea productiei de procesoare dual-core si a oferit detalii suplimentare despre planurile sale pentru procesoare multicore, anuntand inceputul unei noi ere, in care PC-urile vor avea in interior doua sau mai multe "creiere".

Figura 1. Schema bloc a unui procesor cu patru nuclee. Intel intentioneaza sa livreze produse separate dual-core, precum si cipseturi dualcore pentru familiile de procesoare din clasa Pentium,incluzand procesorul Pentium Extreme Edition.Intel are deja in derulare peste zece proiecte pentru produse multi-core si intentioneaza sa creasca nivelul de calitate al software-ului si solutiilor care permit obtinerea de linii de produse, tools, investitii si programe, pentru a aduce la un nou nivel calitativ design-ul de software.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

6
Coal

Ideea de procesor cu mai multe nuclee este o consecin a efectelor, din punct de vedere al performanei, pe care le are folosirea unui PC cu mai multe procesoare n locul unuia singur. Dar un sistem bazat pe o plac de baz multiprocesor devine foarte scump i neatractiv pentru majoritatea utilizatorilor. Folosirea mai multor nuclee pe aceeai pastil de siliciu permite creterea performanei cu costuri minime, deoarece liniile de comunicare ntre cele dou nuclee sunt mult mai scurte, deci mai rapide, n acelai timp disprnd i necesitatea construirii unei infrastructuri pentru interconectarea nucleelor. Iniial, aceast idee era foarte greu de pus n practic din cauza procesului de fabricaie a cip-urilor, ce presupunea creterea dimensiunilor pastilei de siliciu prin folosirea unui numr mai mare de tranzistori, implicit i a consumului. Odat cu micorarea dimensiunilor tranzistorilor a devenit posibil introducerea unui numr mai mare de tranzistori n acelai spaiu pe pastil, pstrndu-se n acelai timp i caracteristicile termice. Primul procesor dual-core a fost conceput i construit de IBM n anul 2000, odat cu lansarea celei de-a patra generaii de procesoare PowerPC: Power 4. Acesta aducea, n premier, mai multe nuclee pe aceeai pastil, fiind vorba n fapt de dou nuclee pe 64 bii PowerPC AS. Memoria cache Level 2 era mprit n trei pri egale, fiecare nucleu avnd acces la oricare dintre ele. De ce am nevoie de mai multe nuclee? Nucleele multiple pot fi folosite pentru a rula doua programe deodata si atunci cnd un program mai intensiv se executa (AV scan, conversie video, CD ripping, etc.) puteti utiliza alt nucleu pentru a rula browser-ul dvs.(de exemplu pentru a verifica adresa dvs. de email). Mai multe nuclee vor straluci cu adevarat atunci cnd utilizati un program care utilizeaza mai mult de un nucleu (numit Parallelization) pentru a mbunatati eficienta programului. Programe precum software de grafica, jocuri etc. pot rula mai multe instructiuni n acelasi timp si sa livreze mai rapid rezultatele. Deci, daca utilizati software-uri care folosesc procesorul intens, nucleele multiple va vor oferi probabil o experienta mai buna atunci cnd utilizati PC-ul. Daca utilizati PC-ul dvs. pentru a verifica e-mailurile si pentru a privi un video ocazional, chiar nu aveti nevoie de un procesor multi-core. 2. Motivul conceperii procesoarelor dual-core Dual-core nu a intrat in lumea PC-urilor desktop din cererea pietei pentru astfel de

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

7
Coal

procesoare, ci pentru ca altfel nu se putea merge mai departe. A devenit clar pentru toata lumea ca frecventa de 4000 MHz nu poate fi atinsa inca de un procesor racit cu aer. Ca dovada in acest sens avem retragerea proiectului Tejas al Intel - procesorul de 4000 MHz si chiar daca Tomshardware a reusit sa atinga 5000 MHz, acesta a fost racit cu azot lichid. Puterea consumata a procesoarelor care se departeaza de 3 GHz a amenintat sa depaseasca 100 Wati. Cum puterea consumata mai mare se traduce in caldura disipata mai mare, posibilitatile de racire ale momentului se dovedesc insuficiente pentru a trece de bariera de 4 GHz. Pentru a putea oferi mai multa putere de calcul, Intel si AMD au ajuns la concluzia ca trebuie sa dubleze numarul de procesoare, daca frecventa nu mai poate creste. Desi distanta intre tranzistorii dintr-un procesor este in continua scadere, efectele benefice ale acesteia - temperatura scazuta si frecvente mai mari de ceas - intarzie sa se faca simtite. Procesoarele dual-core au fost o adevarata mana cereasca pentru producatorii de procesoare. Acestea au o putere mare de calcul la frecvente mai scazute decat cele single-core, drept urmare se incalzesc mai putin. In termeni de frecventa, procesorul dual-core este mai lent decat cel single-core. Cel mai rapid dual-core Intel are frecventa de 3,2 GHz (3,6 este pe drum), pe cand cel mai rapid single-core lucreaza la 3,8 GHz. Pentru AMD, lucrurile sunt si mai clare: single-core au aceeasi frecventa cu dual-core. Cel mai rapid dual-core nu este cel mai rapid procesor, ci doar are o putere de calcul mai mare... pentru aplicatiile optimizate. Celelalte aplicatii nu vor beneficia in nici un fel de pe urma celui de-al doilea procesor, dar acesta va ramane liber pentru alte aplicatii. Windows XP permite selectarea afinitatii unei aplicatii pentru un procesor sau altul, astfel incat acestea pot fi rulate utilizand doar un core. In orice caz, nu trebuie sa insumam frecventele core-urilor pentru a ne face o idee despre performanta unui dualcore, exact cum nu puteam sa facem aceasta socoteala nici pe baza unei configuratii SMP. Factorul de scalare al performantei este undeva intre 1,4 si 1,8. De ce? Simplu. Explicatia este impartirea resurselor. Aceasta induce pierderi de performanta. Nici un procesor dual-core nu ar putea sa functioneze cu software neoptimizat. Primul program, care ruleaza constant pe oricare PC, este sistemul de operare. Daca acesta nu este optimizat pentru multithreading, atunci cel de-al doilea core va ramane inactiv.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

8
Coal

Drept urmare, nu incercati sa utilizati un dual-core cu MS-DOS sau Windows 95, 98 sau Me, pentru ca veti pierde puterea de calcul suplimentara data de al doilea core. Windows 2000, XP, 2003 si oricare distributie de Linux pot sa beneficieze de pe urma mai multor procesoare. In plus, programele care ruleaza pe aceste sisteme trebuie, de asemenea, sa fie optimizate. Intel a propus tehnologia HyperThreading, care umple golurile de procesare ale unui procesor single-core prin falsificarea unui al doilea procesor. Introducerea acestei tehnologii a accelerat optimizarea aplicatiilor standard pentru Windows pentru multithreading. Desi, pentru moment, Intel nu a scos pe piata procesoare dual-core HyperThreading, acestea vor putea rula 4 thread-uri simultan, utilizand la maxim puterea de calcul a procesorului. 3. Avantajele procesoarelor multi-core. n cazul arhitecturii single-core exist mai multe optimizri cu scopul de a crete viteza de execuie a unui program i vizeaz, de obicei, paralelismul la nivel de instruciune, ce presupune executarea simultan a ct mai multor instruciuni. Acest lucru este posibil atta timp ct o instruciune nu depinde de rezultatul alteia ce se dorete executat n paralel. n cazul arhitecturii multi-core se urmrete optimizarea paralelismului la nivel de thread. Un thread este un fir de execuie al unui program, program care poate avea mai multe fire de execuie, fiecare cu setul su de instruciuni ce pot fi i ele rulate n paralel. Viteza unei arhitecturi multi-core depinde de modul n care sunt scrise programele i de compilatorul care furnizeaz date procesorului. Ca specific al arhitecturii multi-core, fiecare nucleu execut un flux independent de instruciuni din cadrul unei zone comune de memorie. Coninutul acestei zone este administrat prin arbitrare, n funcie de coninutul memoriei cache a fiecrui nucleu. Nivelurile de cache pentru fiecare nucleu se justific prin structura procesoarelor actuale, optimizate pentru creterea limii de band a interfeei cu memoria. Fr aceste niveluri de cache locale, fiecare nucleu ar rula la maximum jumtate din potenial. Managementul coninutului memoriilor cache este realizat prin intermediul unui protocol de asigurare a coerenei datelor stocate. Celelalte avantaje constau n localizarea mai precis a datelor, comunicarea mai rapid ntre unitile de procesare,

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

9
Coal

economisirea spaiului i consumului de curent i un raport cost/performan mai bun dect n cazul unui procesor single-core.

Figura 2. Mai multa performanta la un consum mai mic de energie Avantajele procesoarelor cu mai multe nuclee: Posibilitarea de a distribui lucrul programelor, de exemplu, diferite aplicatii se efectueaza cu ajutorul mai multor nuclee; Procesele care necesita calcule intensive decurg mult mai rapid; Utilizare mai eficienta a programelor consumatoare de resurse multimedia, aplicaii precum editori video; Consum redus de energie; Executie dinamica larga; Lucrul utilizatorului PC devine mult mai cofortabil; Memoria cache comuna. Cache-ul multi nucleu optimizat creste probabilitatea ca datele necesare pentru fiecare dintre nuclee vor fi disponibile in cache-ul comun de nivelul doi; Compactitatea ntregului sistem; Cresterea vitezei de lucru a programelor;

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

10
Coal

Figura 3. Timpul de executie a operatiei in procesorul quad-core este de 4 ori mai mic ca-n cazul procesorului obisnuit. Prelucrarea paralela;

Figura 4. Paralelismul in procesul de prelucrare a operatiilor. Sistemul inteligent de alimentare cu energie; Accesul inteligent la memorie. Include un mijloc de aa-numitul "eliminarea neconcordanelor n memorie", care conine algoritmi speciali care permit o probabilitate suficient de ridicata pentru a stabili dependena de comenzi succesive de salvarea i ncrcarea de date. 4. Miniaturizarea microprocesoarelor cu mai multr nuclee. Problemele cu care se confrunta proiectantii de microprocesoare nu sunt insurmontabile, insa solutiile sunt din ce in ce mai greu de gasit. Printre altele, exista doua lucruri importante care limiteaza microprocesoarele: decalajul transmisiei in interiorul cipului si temperatura.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

11
Coal

Decalajul se datoreaza datorita firelor ce conecteaza toate tranzistoarele intr-un cip. Firele sunt incredibil de mici. Un cip reprezinta practic un grup de tranzitoare conectate intre ele, iar un tranzistor functioneaza precum un intrerupator. Atunci cand un tranzistor isi schimba starea din pornit in oprit sau invers, incarca firul ce este legat de urmatorul tranzistor. Insa aceste operatiuni necesita timp. Cu cat firul este mai lung, cu atat va dura mai mult. Reducerea dimensiunilor are o consecinta importanta: traseele pe care trebuie sa le parcurga curentul electric intre componente sunt mai scurte, deci se pot parcurge mai rapid. Proiectantii au putut face astfel procesorul sa functioneze cu un ceas mai rapid. Insa nu doar distanta dintre doi tranzistori e singura problema: comutarea intre doua stari a tranzistorului necesita si ea timp. Aceasta limiteaza viteza unui microprocesor. Mai mult, tranzistorii sunt legati in lant, asadar, cu fiecare tranzistor, timpul se mareste. O alta problema ce limiteaza viteza unui microprocesor este temperatura ridicata. De fiecare data cand tranzistorii isi schimba starea, comuta de pe 0 pe 1 sau invers, pierd putina electricitate. Aceasta creeaza caldura, si cu cat ruleaza mai rapid, cu atat genereaza mai multa caldura. Microprocesoarele au ajuns sa contina un numar impresionant de tranzistori, ajungand pana la cateva sute de milioane. Astfel de circuite sunt foarte greu de verificat si testat. Cheltuielile pentru verificare si testare chiar ajung sa depaseasca pe cele de proiectare si dezvoltare. Miniaturizarea nu va putea si ea continua in acelasi ritm exponential. S-ar ajunge la necesitatea de a realiza un tranzistor mai mic decat un atom, ceea ce e imposibil. Insa pana acolo, mai sunt alte probleme de confruntat. Mark Horowitz, profesor la Universitatea Stanford a scris un articol intitulat Viitorul sarmelor si in care porneste de la caracteristicile electrice ale semiconductorilor si analizeaza o serie de scenarii posibile pentru tehnologiile de fabricatie. Textul ia in considerare mai multi factori precum geometria firelor, capacitati si resistente, disiparea puterii, etc. Mark Horowitz a ajuns la o concluzie interesanta, cum ca nu firele ar constitui un impediment in functionarea sa corecta.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

12
Coal

Performanta microprocesoarelor s-a situat pe o curba exponentiala, iar miniaturizarea si tehnicile folosite au contribuit in mod egal la aceste spectaculoase cresteri. Insa aceasta crestere se apropie de sfarsit datorita unor bariere fizice fundamentale. Asta pana la aparitia unor noi generatii de procesoare ce vor depasi aceste probleme.

Figura 5. Numarul tranzistoarelor pe nucleu 5. Dezavantajele procesoarelor multi-core. Procesoarele au atins o limita tehnologica pe la viteza de 3Ghz. Intr-o cuanta de timp atat de mica (1s/3.000.000.000), lumina (si orice alt semnal) poate parcurge doar aproximativ 10cm, ordinul de marime al unui procesor. Procesorul nu poate functiona mai repede pentru ca atat ii ia semnalului electric sa faca o tura prin procesor. Procesorul reordoneaza executia unor instructiuni care nu depind unele de altele, pentru a putea executa mai multe operatii intr-o singura cuanta de timp, in paralel. De

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

13
Coal

multe ori insa operatia urmatoare depinde de rezultatul celei precedente, deci nu se poate lansa a doua operatie pana nu se termina prima. Pentru a creste performanta, s-a inceput crearea procesoarelor multi-core, care incearca sa imparta procesarea pe mai multe unitati procesor. Din cauza interdependenti intre operatii, un program rulat pe 2 procesoare obtine de obicei mult sub dublul performante. Un program care are doar un fir de executie (thread) obtine pe doua procesoare sub 10% in plus fata de a rula pe un singur procesor. Pe de alta parte se pot rula doua programe in paralel la aceeasi viteza cu a le rula pe fiecare singure pe un procesor. Este vorba de programe care consuma mult CPU fiecare, nu programe care stau deschise fara sa faca nimic. Memoria RAM functioneaza cam de 100 ori mai lent decat procesorul, la fel cum Hard-Discul este mult mai lent fata de RAM. Pentru ca procesorul sa poata executa instructiuni la viteza maxima, exista cache-ul L1 care functioneaza aproximativ la viteza procesorului. Cache-ul este o fereastra spre memorie. El incarca zona de memorie care este in executie, iar cat timp executia nu iese din acea zona procesorul poate functiona la viteza maxima. Imediat ce executia iese din fereastra de cache, procesorul asteapta echivalentul a peste 100 de instructiuni sa se incarce o noua bucata din memorie in cache. De aceea un cache L1 mai mare inseamna o viteza mai mare de executie. Cache-ul L1 este foarte scump, deci mic. Unele procesoare au si cache L2 (de 10 ori mai lent si de 10 ori mai mare/ieftin). Exista si cache L3 care este doar de aproximativ 2 ori mai rapid decat memoria RAM, dar care ajuta sistemele multiprocesor sa nu congestioneze accesul la memoria RAM. Viteza de executie a unui program nu mai depinde atat de tare de frecventa procesorului, cat de numarul de accesari ale memoriei pe care nu le gaseste in cache. Algoritmi complexi incearca sa pre-incarce in cache memoria necesara in viitorul apropiat, totusi in multe cazuri nu reuseste. Chiar si un 5% de "cache miss" (accesari ale memoriei in afara zonei cache) scade performanta drastic. In loc ca 100 operatii sa dureze 100 cuante timp, vor dura

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

14
Coal

95+5*100, deci aproape de 6 ori mai mult decat ar dura executate 100% in cache. S-ar putea ca un cache L1 mai mare sa ajute mai mult decat arata benchmark-urile, intrucat programele benchmark sunt relativ mici, putand sa incapa complet in cache. Viteza cu care ruleaza un program tine foarte mult de felul in care sunt aranjate instructiunile in memorie. Compilatoarele si masinile virtuale incearca sa ajute la aceasta operatie. Salturile in structuri mari de date si "indirectarile" produc totusi foarte multe salturi in afara zonei de memorie incarcate in cache, deci scad performanta. Programarea orientata pe obiecte (C++) tinde sa genereze multe obiecte distribuite in zone de memorie ne-alaturate, deci un cod care iese mai des din cache. Programarea C foloseste in general functii mai mari, indirectari mai putine, zone de date mai compact distribuite, deci are sanse sa genereze un cod care foloseste cache-ul mai eficient. Atunci cand procesorul asteapta dupa memoria RAM, procesorul va arata incarcat 100%, desi el de fapt ... sta degeaba. Este aproape inposibil de detectat impactul iesirilor din cache asupra vitezei, altfel decat prin teste cu diferite procesoare. Capitolul I Arhitectura tipica. Elementele constructive Paragraful 1 Arhitectura tipica a unui prosesor multi-core. Un procesor multi-core este, n general, definit ca un circuit integrat care con ine dou sau mai multe procesoare independente (numite nuclee). Acest termen este distinct de termenul multi-CPU, ce nseamn un grup de mai mai multe procesoare neanexate la acelai circuit integru. Termenul de uniprocesor, n general, semnific a avea un procesor per sistem [Uniprocessor], i c procesorul are un nucleu; acesta este folosit pentru a contrasta cu arhitecturi de multiprocesare, adic fie multi-core, fie multi-CPU, sau ambele. Procesoarele multi-core au aprut n industria de calcul evolund de la tehnologia uniprocesor ca o soluie de a obine o mai mare performan prin paralelism, n dauna obinerii unei frecvene de baz mai mari ntr-un singur nucleu (raw clock speed). De-a lungul ultimilor 30 de ani, industria de calculatoare a dezvoltat uniprocesoare din ce n ce mai rapide, dei aceast goan se apropie de sfrit din cauza limitrilor n ce prive te

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

15
Coal

scalarea transistorului, cerinele n alimentare i disiparea cldurii. Deoarece uniprocesoarele ajung la un platou maxim de frecven de baz (clock speed), productorii au apelat la procesoarele multi-core pentru a mbunti performan a folosind paralelismul. Figura 6, de mai jos, ilustreaz componentele de baz ale unui procesor multi-core obinuit.

Figura 6: Diagrama bloc a unui procesor multi-core 1.1 Nucleul procesorului. Termenul "nucleul microprocesorului" (n englez core) nu este bine definit i, n funcie de contextul de utilizare poate nsemna: parte din microprocesor, care conine blocuri funcionale de baz. un set de parametri ce caracterizeaz microprocesorul. Cipul microprocesorului (CPU sau GPU), de multe ori, deschis.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

16
Coal

Parte a procesorului, care efectueaza executarea unui flux de comenzi. Procesoarele multi-core au mai multe nuclee i, prin urmare, sunt capabile de a executa n paralel independent fluxuri multiple de instruciuni, la un moment dat.

Figura 7. Evolutia arhitecturilor procesoarelor cu mai multe nuclee. Proprietile tipice ale nucleului sunt, de exemplu: microarhitectura; Sistemul de comand; numrul de uniti funcionale (ALU, FPU, transportoare, etc); cantitatea de memorie cache interne; interfa (logic i fizic); ceasurile;

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

17
Coal

tensiunea de alimentare; tehnologie de producie; spatiul cipului.

1. 2. Memoria Cache. Memoria cache este o zon de memorie rapid care echipeaz un dispozitiv electronic in scopul de a mri viteza de lucru a acestuia. In lipsa memoriei cache viteza de procesare ar avea de suferit doarece transferul de date dintre o componente mai rapid si una mai lent s-ar efectua la viteza de lucru a componentei mai lente. Memoria cache vine s dreag lucrurile i furnizeaz componentei rapide datele de care are nevoie imediat la o vitez de lucru sporit sau chiar egal. Ideal ar fi ca memoria RAM s fie nlocuit cu memorie cache, dar costurile de achiziie ale unui calculator ar crete foarte mult. n aceste condiii, se folosete doar o mic cantitate de memorie cache dar care este exploatat la maxim datorit unor algoritmi bine pui la punct. De exemplu, microprocesorul poate anticipa ce date vom utiliza si le va incarca in memoria cache chiar daca noi inca nu le folosim pe moment. Sa ne imaginam ca citim o carte in format electronic suntem la pagina 30 si probabil vom citi si pagina 31 daca nu ne-am plictisit. Un sistem modern nu va astepta pina cand noi apasam butonul next page pentru a incarca pagina urmatoare, continutul acesteia se afla deja in memoria RAM si cel mai probabil in memoria cache deja, astfel ca tranzitia dintre pagini se va face instant pentru cititor. Memoria cache si microprocesorul

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

18
Coal

Figura 8. Legatura procesorului cu memoria cache Memoria cache care se aduce cel mai adesea in discutie este cea care se gaseste localizat direct in microprocesor aceasta fiind si cea mai rapida memorie dintr-un calculator avnd aceiasi vitez de lucru cu a microprocesorului. In cazul mircroprocesoarelor memoria cache este dispus n majoritatea cazurilor pe dou nivele: Cache Level 1 sau L1 : se gsete montat direct n microprocesor i poate reine doar o mic cantitate de date (la procesoarele fabricate dup anul 1997 intre 16 i 128 de kilobaii). Microprocesorul este cea mai rapid component hardware din ntreg calculatorul, iar aceast memorie funcioneaz la aceiai viteza ca i microprocesorul. Cache Level 2 sau L2 : se gsete fie tot n componena microprocesorului fie undeva pe placa n care este montat microprocesorul n cazul calculatoarelor mai vechi. Cache-ul L2 poate funciona la aceaiai vitez ca i microprocesorul sau la o vitez inferioar, dar n toate cazurile la o vitez superioar fa de memoria RAM. (altfel nu s-ar justifica prezenta acestuia) Cache Level 3 sau L3: este posibil sa avem de a face si cu al treilea nivel de cache, denumit L3. Acesta indeplineste aceleasi functii ca si cache-ul L2. Mai mult cache, mai mult performan

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

19
Coal

Cache-ul L2 este adus n discuie deseori atunci cnd trebuie achiziionat un microprocesor. Microprocesoarele performante (i scumpe) sunt dotate ntotdeauna cu mai mult memorie cache dect microprocesoarele cu o performan mai redus dar mult mai ieftine. Totui preul pltit pentru mai mult cache nu este direct proporional cu performana pe care o poate dezvolta microprocesorul. Dac la un microprocesor din aceiai gam ii vom dubla cache-ul L2 de la 2MB la 8MB extra cache-ul va profita doar anumitor aplicaii iar performaneele nicidecum nu se vor dubla ci vor crete procentual cu 10-20% luand n consideraie arhitecturile actuale. Astazi cache-ul L2 in cazul unui microprocesor din gama medie de preturi atinge o capacitate de cativa megabaiti. ( 512KB 8MB) n informatic, memoria cache (sau simplu un cache) este o colecie de date ce sunt o "copie la indigo" a valorilor originale stocate altundeva sau calculate mai devreme, unde operaia de aducere din memorie a datelor originale este costisitoare (datorit timpilor mari de acces la memorie) sau costul recalculrii acestora este mare, n comparaie cu costul citirii acestora din cache. Cu alte cuvinte, un cache este o arie temporar de stocare unde datele utilizate n mod frecvent pot fi depozitate pentru un acces rapid la acestea. Odat ce datele sunt stocate n cache, n viitor vor fi luate de aici i utilizate dect s se ncerce readucerea datelor originale sau recalcularea acestora, astfel nct timpul mediu de acces este mai mic.

Figura 9. Comparatia dintre memoria Cache shi memorie RAM/ROM.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

20
Coal

Memoria cache, sau RAM cache-ul este memorie de tip static RAM. Ca orice SRAM, are o viteza si un cost mult mai ridicate decat RAM-ul dinamic (DRAM). Avand in vedere ca programele acceseaza memoriile de date sau instructiuni in repetate randuri, s-a observat ca prin pastrarea a cat mai multe dintre aceste informatii pe SRAM, intregul sistem functioneaza mai rapid. Memoriile de tip cache s-au dovedit a fi extrem de folositoare n multe domenii ale informaticii pentru c modelele accesului la memorie n programele aplicaie obinuite sunt de tip localitate a referinei. Exist cteva feluri de localitate, dar acest articol prezint cazul n care datele accesate sunt foarte apropiate n domeniul timp (fenomenul de localitate temporal). Datele ar putea fi sau nu localizate fizic aproape una de cealalt (localitate spaial). Exista 3 tipuri de memorie cache: Cache de nivel 1 (Level1 sau L1) - este memoria cache construita in unitateacentrala de procesare; este cel mai rapid tip de memorie, pentru ca poate functiona la aceiasi viteza cu cea a microprocesorului cache de nivel 2 (Level2 sau L2) - este memoria de pe un chip separat fatade UCP; poate ajunge sa functioneze la o viteza de aproape 2 ori mai maredecat RAM-ul. cache de nivel 3 (Level3 sau L3) folosite de anumite UCP-uri contin atat memorie de nivel 1 cat si memorie de nivel 2 atasate sistemulu

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

21
Coal

Figura 10. Ierarhia memoriei Cache Cache L2 Un cache al CPU este utilizat pentru a reduce timpul mediu de acces al memoriei procesorului. Cache-ul este o memorie mai mica si mai rapida care stocheaza copii ale datelor accesate cel mai frecvent de procesor.Cele mai multe pc-uri sunt oferite cu un cache ne nivel 2,Cache L2 este un set de circuite de memorieconcepute pentru a mari viteza de acces la date importante si frecvent utilizate.Dela inceput modelul cache l2 a fost implicat rapid in cipurile de memorie staticCache L2 include RAM construit direct in CPU.Este de obicei mai mare,dar si mailent decat Cache L1. Cache L2 mai este numit si cache secundar. Fizic,cache L2 este fizic aproape de baza,dar este pus in aplicare in DRAM sau Dynamic Ram. Cache L3 Nivelul 3 sau cache L3 este memoria de specialitate care functioneaza mana inmana cu L1 si l2 pentru a a imbunatati performanta computerului.Presupunand

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

22
Coal

cainstructiunile necesare se gasesc in cache L3,bitii de date ar putea fi evacuate din L2 pentru a organiza noi instructiuni in cazul in care e nevoie de ele din nou.Ca si mai multe procesoare incep sa include cache L2 in arhitecturile lor,cache L3este acum numele de cache suplimentar construit in placa de baza intremicroprocessor si memoria principala. Pur si simplu, ceea ce a fost odata memoria cache L2 de pe placile de baza,devineacum cache L3 atunci cand este utilizat cu microprocesoarele care contin cache-uri construite in L2. 1.3. Bus-ul Sistemului Legtura ntre memorie i procesoare se face prin intermediul modulului de bus de sistem. Acesta permite rutarea cererilor la memorie ntr-o arhitectur multiprocesor. Bus-ul implementeaz tehnica de snooping pentru a rezolva coerena datelor.

Figura 11. Bus-ul sistemului Bus-ul are cte o pereche de porturi pentru fiecare dintre procesoarele conectate la el prin intermediul cache-urilor, respectiv una pentru memoria DRAM. Acest lucru este detaliat n figura 3.7. i nu este obligatoriu ca pe aceste porturi s fie legate direct modulele procesoarelor, putndu-se interpune o ierarhie de cache-uri. Scopul bus-ului este de a indeplini rolul de reea de interconectare n cadrul arhitecturii de tip shared memory. Dac se primesc mai multe cereri pe acelai tact, prioritate vor avea mesajele de la memorie, iar ntre procesoare se folosete o politic round robin. 1.4 Paralelismul i Performana n procesoarele multi-core

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

23
Coal

Deoarece procesoarele multi-core folosesc paralelismul pentru a mbunti performana, nelegerea tipurilor principale de paralelism este important la analizarea performanei. Paralelismul este o problem complex, dar vom ncerca totui s elucidm elementele de baz a celor trei tipuri de paralelism Instruction-level paralelism, threas-level paralelism i data-level paralelism, toate sunt angajate n diverse conformaii de procesoare, avnd impact diferit asupra performanei, fapt ce trebuie neles i reinut la o analiz profund a performanei. Paralelismul Instruction-Level (la nivel de instruciuni) Primul tip-cheie de paralelism, instruction-level paralelism (ILP), implic executarea anumitor instruciuni de program simultan, n loc s fie executate secven ial, fapt ce poate pozitiv influena performana, n dependen de combinaia de instruc iuni ale aplicaiei. Majoritatea procesoarelor moderne utilizeaz tehnici de ILP, aa ca pipelining, superscalar execution (execuie superscalar), prediction (pronostic), out-of-rder execution (execuie n afara ordinii), dynamic branch prediction (pronostic de ramur dinamic) sau address speculation (speculaii adres). Cu toate acestea, doar anumite poriuni de instruciuni ale unui program dat pot fi potrivite pentru paralelizare instruction-level, aa cum este ilustrat n Figura 2 de mai jos. Deoarece paii 1 i 2 din operaiunea secvenial snt independente una de cealalt, un procesor care utilizeaz aceast tehnic de paralelizare poate rula instruciunile 1.A. i 1.B. simultan i, prin urmare, s reduc numrul de cicluri cu 33%. Ultimul pas trebuie s fie executat secvenial, n ambele cazuri, aa cum este dependent de cele dou etape anterioare.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

24
Coal

Figura 12: Exemplu de paralelism la nivel de instruciuni (ILP). Acest exemplu este o simplificare, dar, n general, ne arat att beneficiul potenialul, ct i limitele poteniale ale tehnicii. Pentru analist, cheia este de a ntelege care poriuni ale unei aplicaii au instruciuni care ar putea rula n paralel. Paralelismul Thread-Level (la nivel de flux) Al doilea tip de paralelism, thread-level paralelism (sau TLP), implic execu ia fluxurilor de sarcini individuale delegate la CPU simultan. Paralelismul thread-level (TLP) va avea un impact substanial asupra performanei aplicaiilor multi-flux prin diveri factori, de la hardware, pn la applicaii, deci, prin urmare, o n elegere de baz este important pentru analist. Fiecare flux i menine propria sa stiv de memorie i instruciuni, astfel nct acesta poate fi considerat ca o sarcin independent, chiar dac n realitate fluxul de sarcini nu ar putea fi cu adevrat independent n sistemul de program sau de operare. TLP este utilizat de ctre programele i sistemele de operare care au un design multi-flux. Conceptual, este simplu de a nelege de ce TLP ar cre te performana. n cazul n care fluxurile sunt cu adevrat independente, atunci, repartiznd fluxurile ntre nucleele disponibile pe un procesor, aceasta ar reduce timpul de execu ie pn la timpul maxim de execuie a oricrui din fluxuri. n mod ideal, lucrul ar fi, de asemenea, n mod egal mprit ntre fluxuri, iar suprasarcina de alocare i programare a fluxurilor este minim. Figura 3, de mai jos, ilustreaz aceste diferene conceptuale ntre fluxul unic i paralelismul la nivel de flux, presupunnd independena i lipsa suprasarcinii suplimentare per flux.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

25
Coal

Figura 13: O vizualizare conceptual a TLP. Acest simplist model ideal al performanei TLP este complicat de mai mul i factori, aa cum scenariul ideal este rareori observat n aplicaiile reale. Factorii care influeneaz performana includ balana de sarcin, nivelul de independen a executiei, mecanismul de flux-blocare, metode de planificare i necesarul de memorie. Mai mult, paralelismul la nivel de date ntre fluxurile distribuite poate avea un impact asupra performanei. Biblioteca de punere n aplicare a fluxului att n sistemul de operare ct i n aplicaia specific, de asemenea, va avea un impact asupra performanei. n consecin, un analist examinnd o aplicaie cu paralelism la nivel de flux ar putea avea nevoie de a controla sau regresa aceti factori pentru a cuantifica performana multi-core a aplicaiei multi-flux. Paralelismul Data-Level (la nivel de date) Al treilea tip de paralelism, paralelismul la nivel de date (sau DLP), implic partajarea de date comune ntre procesele de executare prin coerena memoriei, mbuntind performanele prin reducerea timpului necesar pentru a ncrca i accesa memoria. Pentru analist, identificarea ariilor de aplicaii care utilizeaz paralelismul la

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

26
Coal

nivel de date va contribui la nelegerea caracteristicilor de performan pe procesoarele multi-core. n contextul unui procesor multi-core, paralelismul la nivel de de date n memoria cache partajat de nuclee poate avea un impact substanial asupra performanei. Aici, procesele de executare care ruleaza pe mai multe nuclee vor finumite fluxuri. Ctigurile de performan sunt de ateptat atunci cnd fluxurile citesc din acelea i date n memoria partajat. Acest scenariu permite o copie a datelor care urmeaz s fie utilizate de mai multe fluxuri, reducnd numrul de operaii de copiere i, astfel, timpul de execuie. Cnd fluxurile nu au date n comun, fiecare flux trebuie s men in o copie a datelor sale i n acest caz ctigurile de performan nu sunt disponibile. Cu toate acestea, n cazul n care mai multiple cereri la aceast memorie dep esc l imea ei de band, creterea numrului de fluxuri pot influena negativ performana.

Capitolul II Arhitecturi si tehnologii

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

27
Coal

Paragraful 1 Microarhitecturile procesoarelor cu mai multe nuclee

Arhitectura de 64 de biti; Nehalem; Sandy Brydge; Ivy Bridge; Haswell; Tillera64. 1.1 Microarhitectura de 64 biti Modalitatea prin care un procesor reprezint numerele este o chestiune de design care afecteaz n mod esenial funcionarea acestuia. Reprezentarea numerelor este caracterizat de mrimea numrului i precizia cu care un procesor le poate reprezenta. Numrul de bii pe care un procesor i folosete s reprezinte numere este adesea numit cuvnt. Acest numr de bii difer n funcie de arhitectura procesorului i poate afecta numrul celulelor de memorie pe care un procesor le poate adresa (localiza). Dac un procesor utilizeaz 32 de bii pentru a reprezenta o adres de memorie, iar fiecare adres de memorie reprezint un octet (8 bii), cantitatea maxim de memorie pe care un procesor o poate adresa este de 232 octei sau 4 GB. Procesoarele pe 64 de bii adreseaz un spaiu de memorie mai mare, dar sunt mai complexe, folosesc mai mult energie, eman mai mult cldur i au un pre mai

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

28
Coal

ridicat.Bit este prescurtarea de la binary digit. Practic, bitul este modalitatea prin care un calculator stocheaz i acceseaz date i memorie. Un bit poate avea valoarea 0 sau 1. Procesorul face calcule tot prin intermediul biilor. Prin utilizarea a 32 de bii procesorul poate reprezenta numere cuprinse ntre 0 si 4,294,967,295, n timp ce procesorul pe 64 de bii poate reprezenta numere cuprinse ntre 0 i 18,446,744,073,709,551,615. n mod evident, un procesor pe 64 de bii poate efectua calcule matematice cu numere foarte mari. Dar ce impact are un tip de procesor sau altul asupra utilizatorului obinuit? Aparent, de beneficiile procesorului pe 64 de bii ar trebui s se bucure marile companii i instituiile academice care acceseaz baze de date uriae i rezolv probleme complexe.

Figura 14. Procesorul Power 5 pe baza arhitecturii de 64 de biti. Un procesor pe 64 de bii are o configuraie mult mbuntit, are mai muli tranzistori i o vitez mai mare. O schimbare de la arhitectura pe 32 de bii la cea pe 64 constituie o modificare fundamental, astfel c cele mai multe sisteme de operare au nevoie de modificri majore pentru a profita de noua arhitectur. Alte aplicaii software trebuie de asemenea s fie portate pentru a utiliza noile capabiliti. Indiscutabil, o arhitectur pe 64 de bii lucreaz mai uor cu seturi de date foarte mari n aplicaii video digitale i n baze de

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

29
Coal

date de dimensiuni foarte mari, dar au existat numeroase dezbateri dac aceast arhitectur va fi mai rapid dect sistemele pe 32 de bii pentru alte taskuri. n arhitectura x86-64 (AMD64), majoritatea sistemelor de operare i aplicaiilor sunt capabile s ruleze uor pe o platform hardware pe 64 de bii. Mainile virtuale Java pe 64 de bii pornesc mai ncet dect mainile virtuale pe 32 de bii pentru c Sun a implementat doar serverul JIT (just-in-time) compiler pentru platforme pe 64 de bii, iar clientul compilatorului JIT (JIT compiler), care produce cod mai puin eficient, dar compileaz mai rapid, nu este disponibil pe platforme pe 64 de bii. Viteza nu este singurul factor care trebuie luat n considerare n compararea acestor procesoare. Avantajele arhitecturilor x64
mai

mult putere de procesare: n termeni simpli, 64 bii reprezint un numr mult memorie: posibilitatea folosirii a mai mult de 4GB de RAM (de fapt, a

dublu de bii gestionai la fiecare clock cycle a procesorului;


mai

mai mult de 3.12 GB ct este maximul vzut de Windows-ul pe 32 de bii) reprezint un mare avantaj n cazul folosirii unor aplicaii ce necesit mult memorie;
securitate

sporit datorit semnturilor digitale prezente n toate drivere-le pentru

x64; de asemenea beneficiai de alte faciliti extinse de securitate prin Kernel Patch Protection i Data Execution Prevention
performane

mai bune datorit valorilor mari de memorie RAM folosit,

sistemele x64 au timpi de rspuns mult mai buni n cazul aplicaiilor complexe (editare video, jocuri, criptare / decriptare) sau n cazul rulrii simultane a mai multor aplicaii complexe; Arhitectura Intel 64 are urmtoarele caracteristici: 64-biti spaiu de adrese virtuale; 64-bii pointeri; 64-bii de registre de uz general; 64-bii de sprijin a calculelor cu numere ntregi;

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

30
Coal

Pn la 1 TB de spaiu de adrese a platformei.

1.2 Microarhitectura Nehalem a firmei Intel Pe numele de cod Nehalem, noua arhitectura inglobeaza variante imbunatatite ale unitatilor de executie din arhitectura Conroe, asezonate cu multiple aditii pe care le voi expune mai tarziu dar din care amintesc cache-ul pe 3 nivele sau controller-ul de memorie integrat. Daca Penryn avea doua pastile a cate doua nuclee pe acelasi suport organic pentru a oferi un total de 4 procesoare per socket, echivalentul din generatia Nehalem va veni cu 4 nuclee integrate in aceeasi pastila si dupa cum unii prefera sa il numeasca, va fi quad-core nativ. As vrea mai intai sa vedem din punct de vedere fizic cum e posibila o arhitectura atat de complexa. Modelul tick-tock pe care eminentele din Santa Clara si l-au propus a debutat in cel mai serios mod anul trecut, odata cu lansarea procesului de fabricatie pe 45nm. Din punctde vedere al performantelor momentul nu a fost crucial, insa o introspectiva in schimbarile tehnologice aduse de generatia Penryn ne ajuta sa punem mai bine in perspectiva evolutiile viitoare. Astfel, micsorarea dimensiunii tranzistoarelor de la 65nm la 45nm a fost posibila doar datorita unei cuceriri a stiintei mult mai importante, adusa la cunostinta lumii intregi sub numele de high-k metal gate. De aproximativ 30 de ani toate aparatele electronice folosesc tranzistoare MOS-FET (sau mai corect, IG-FET) construite cu aceleasi materiale, mai precis strat izolator din oxid de siliciu si poarta din polisilicati. Tehnologia a ajuns insa la o limita si miniaturizarea chiar si la 65nm a fost o reala problema, primele revizii confruntandu-se cu probleme termice grave cauzate de curentii de scurgere. E si normal, tranzistorii sunt atat de mici incat incap 400 de milioane intr-un centimetru patrat de chip, iar stratul izolator de oxid de siliciu a ajuns la o grosime de maxim 100 de diametre atomice. Dioxidul de siliciu si polisilicatii trebuie sa se retraga la pensie si in locul lor sa treaca la treaba portile metalice si izolatorii bazati pe hafniu. Cert e insa ca in loc de 100 de diametre atomice acum se pot folosi intre 3 si 10, iar la aceeasi grosime a izolatorului

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

31
Coal

curentii de scurgere sunt de 100 de ori mai mici. Deschizandu-si astfel o cale noua, urmatorul pas e evident evolutia arhitecturala a procesoarelor astfel incat sa beneficieze din plin de avantajele create. Si cum paralelismul etrendy in 2008, nu vom vedea un procesor mult mai rapid, ci mai degraba mai versatil si mai eficient. Nu putem nega prezenta unor optiuni ce au fost introduse de AMD da-a lungul timpului, cum ar fi controllerul de memorie integrat sau sistemul de power management cetrateaza fiecare nucleu separat. Daca pana acum existau niste piedici tehnologice, acum faptul ca se pot inghesui pe o pastila de siliciu inspre un miliard de tranzistori odata cu trecerea la procesul de fabricatie pe 45nm permite in sfarsit ca puternica masina de calcul care este nucleul de executie Conroe sa fie pusa la munca exact asa cum trebuie, fara limitari de bandwidth cauzate de bus-ul invechit tehnologic de ceva vreme. Punctele importante ale noii arhitecturi sunt: - quad-core si octo-core native; - controller de memorie DDR3 integrat; - o noua conexiune point-to-point, denumita Quick Path Interconnect (QPI pe scurt); - sistem de power management inteligent, independent pe fiecare nucleu, power gating - turbo mode- L3 cache shared; - accelerator grafic on-package; - hyperthreading; - o imbunatatire cu 33% a numarului de micro-ops facute in-flight fata de nucleele Conroe; - branch prediction si TLB-uri pe cate doua nivele. Procesoare Nehalem contin cel putin 731 de milioane de tranzistori, 10% mai putin dect Yorkfield procesor. Dar dimensiunea de cristal a crescut semnificativ n comparaie cu predecesorul su, cu 214 i 263 mm2. Si tot in tendinta catre imbunatatirea lucrului cu bazele de date avem si reorganizarea TLB-ului (Translation Lookaside Buffer). Acest buffer are rolul de a stoca corespondentele intre adresele virtuale de memorie si cele fizice, pentru a micsora timpul de acces al celor mai frecvent utilizate. Nehalem mareste capacitatea TLB-ului de instructiuni din Conroe la 128 de intrari pentru pagini mici (4k marime) si 7 intrari pentru pagini mari(2M/4M marime),

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

32
Coal

iar alcelui de date la 64 de intrari pentru pagini mici si 32 pentru pagini mari. Deasemenea, apare si un TLB de al 2-lea nivel, ce poate stoca 512 intrari de pagini mici.In Conroe a fost intercalat un detector de bucle (Loop Stream Detector LSD) intre etajul de aducere si cel de de codare a instructiunilor pentru a actiona in situatia in care urma un sir de instructiuni repetitive, oprind etajele de predictie si aducere si servind direct instructiunile din buffer-ul propriu; astfel se eliminau timpi de asteptare totodata cu economisirea de energie. Nehalem insa are acest etaj dupa partea de decodare, si in timp ce LSD-ul lui Conroe putea stoca 18 instructiuni cel al lui Nehalem stocheaza acum pana la 28 de micro-ops si le serveste direct in reorder buffer, oprind si etajul de decodare in acest timp. Spre deosebire de hyperthreading de exemplu, aceasta modificare va avea un impact egal in orice tip de mediu de lucru si va imbunatati consumul de energie cat si performanta. Aceste nuclee se vor gasi in numar de doua, patru, sase sau opt integrate in aceeasi pastila, alaturi de partea numita (cu destula lipsa de imaginatie as adauga) de Intel Uncore pentru a forma un procesor complet. Uncore-ul va contine controller-ul de memorie, interfata QPI si cache-ul level 3. Un procesor Bloomfield cu 4 nuclee arata ca in imaginea de mai jos, unde se pot observa atent si proportiile fizice ale fiecarei componente.

Figura 15. Procesorul cu 4 nuclee Arhitectura Nehalem

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

33
Coal

Poate cea mai evidenta modificare fata de generatia anterioara e introducerea busului Quick Path Interconnect (QPI), ce initial a fost denumit Common System Interface. QPI e o conexiune point-to-point packet-based cu largime mare de banda si latenta mica, ce poate atinge 6.4GT/s. GT/s e o unitate de masura caracteristica conexiunilor seriale de mare viteza unde semnalul de ceas e integrat in transferul de date si e prescurtarea de la gigatransfers per second; motivul e ca in asemenea conexiuni se foloseste o codare 8b/10b, adica 8 biti de date utilizabile sunt codate intr-un caracter cu lungimea de 10 biti. Avand in vedere ca fiecare conexiune are o largime de 20 de biti rezulta o rata de transfer de 12.8 GB/s in fiecare directie, sau 25.6 GB/s in total. Largimea maxima teoretica a bus-ului FSB in cazul lui Qx9770 de exemplu este de 12.8 GB/s si acesta trebuie sa suporte si traficul masiv de date dintre procesor si memorie. Ierarhia cache pe 3 nivele e o alta noutate a lui Nehalem relativ la Conroe, si nu e noutate doar pentru ca a aparut un al 3-lea nivel ci pentru ca totul a fost regandit de sus pana jos. L1 cache ramane de aceeasi dimensiune (32k data + 32k instructiuni) dar latenta ii creste de la 3 la 4 cicli de tact. Motivul invocat de Intel e faptul ca devenea un factor limitator pentru frecventa pe noua arhitectura, iar penalizarea de performanta estimata e undeva in zona a 2-3%. L2 cache nu mai e comun ci devine privat si e restrans la numai 256k per procesor. L3 cache-ul are 8MB in varianta Bloomfield, e 16-way associative si e inclusive cu alte cuvinte, contine si datele existente in L1 si L2 al fiecarui procesor. Desi asta micsoreaza spatiul efectiv disponibil, imbunatateste mult coerenta traficului intern, o interogare cu raspuns negativ al L3 va insemna ca datele cautate nu exista sigur nici in L1 sau L2 si in consecinta acestea nu vor fi interogate. Cand 4 sau 8 procesoare impart acelasi cache L3 traficul parazit creat in acest fel ar putea crea penalizari vizibile de performanta. Datorita faptului ca L3 nu e parte a nucleului propriu-zis ci face parte din uncore, frecventa lui de lucru e diferita de cea a nucleelor si a celorlalte nivele de cache, ca dealtfel si tensiunea de alimentare. Desincronizarea uncore fata de nuclee are o influenta asupra latentei L3, iar in cel mai bun caz valoarea acesteia se situeaza in zona 30-40 cicli de tact.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

34
Coal

Arhitectura Nehalem va oferi un design robust, universal, de nucleu de procesare, ce va putea fi folosit atat in device-uri mobile, cat si in servere de mare putere. Procesoarele din familia Nehalem, care vor ajunge pana la 8 nuclee, vor include mai multe functionalitati pe care AMD le are deja cu Barcelona. Este vorba in primul rand despre Hyper Threading, cu o functionalitate dinamica a acestora, permitand oprirea de threaduri individuale fara a le afecta pe celelalte. De asemenea, vor fi controlate dinamic nucleele si memoria cache, fiecare putand fi activate/deazactivate separat, in functie de necesitati. Nehalem va include controllere de memorie si un bus dinamic, QuickPath (anterior numit CSI). Nehalem, primul procesor quad-core nativ de la Intel (desi compania se fereste sa foloseasca aceasta denumire, insusita de catre AMD), va avea 820 milioane de tranzistori, inclusi pe o placuta de doar 107 mm2, cu 36 mm2 mai putin decat Penryn, care are tot 820 milioane de tranzistori in versiunea quad-core. Procesorul "Nehalem-EX" Xeon cu 8 nuclee a fost proiectat pentru serverele care pot folosi mai mult de dou procesoare ( cu dou socket-uri), conine 2.3 miliarde de tranzistori i este capabil s rezolve 16 sarcini diferite n acelai timp. Procesorul va folosi tehnologia Nehalem aceeai arhitectur folosit la linia de procesoare Core i7 i va fi fabricat pe 45 de nanometri i va integra aa numitele "power gates", pentru reducerea consumului de putere. Folosind noua tehnologie Intel QuickPath Interconnect care nlocuiete clasica arhitectur FSB cipul Nehalem-EX va transmite o cantitate mai mare de date n decursul aceleai perioade de timp i va crete performanele sistemului, cele 8 nuclee permind executarea a 16 sarcini n acelai timp. 1.3. Sandy Bridge microarchitectura de procesoare, proiectata de Intel. Bazata pe tehnologia de 32 nanometri si un video accelerator integrat. Primul disain de proiectare bazat pe aceast arhitectur reprezint o combinaie de CPU de pn la 3.5 GHz, cu 2-4 nuclee si GPU high-end cu pn la 1.35 Ghz (Intel HD Graphics 2000, K seria HD Graphics 3000), de asemenea, n chip integrat North

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

35
Coal

Bridge stabilit sistemul de logica (controler PCI Express 2. 0 i dual-channel DDR3 SDRAM memorie standard controller cu pn la 1333 MHz FSB). Fiecare nucleu are un 256 KB L2 cache i pn la 8 MB integrate cache de nivel 3. Procesor, grafica, controlere de memorie i cache sunt implementate pe un singur substrat de siliciu cu 216 mm . Consumul de energie al acest design nu dep e te 130 Watts pentru modele de top. Noile procesoare Intel Core bazate pe arhitectura Sandy Bridge

Figura 15. Nowa arhitectura Intel Sandy- Bridge. Arhitectura Sandy Bridge a fost anunat de ceva timp, iar acum Intel a venit cu lista de procesoare i chipset-uri aferent. Pe scurt, Intel ne ofer a doua generaie de procesoare
Core i3, i5 i i7. Folosind procesul de construcie pe 32 de nanometri.

Arhitectura Sandy Bridge este prima care integreaz n acelai chip unitatea de procesare, controller-ul de memorie i unitatea de procesare grafic. Poate v ntrebai dac nu cumva aveam aceeai configuraie i pn acum. Rspunsul este nu. Procesorul era separat de chip-ul care integra placa video i controller-ul de memorie, fiind ns amplasate n aceeai capsul.Intel ofer acum dou plci grafice integrate, HD 2000 i

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

36
Coal

HD 3000, despre care susine c pot atinge o performa de dou ori mai mare dect cea oferit de GMA 4500. Odat cu ele sunt introduse i tehnologii precum Intel Quick Sync Video

(procesare video hardware) i InThru 3D (vizionarea filmelor Blu-ray 3D cu ajutorul ochelarilor stereoscopici). Structura cipului Sandi Bridge este impartita in urmatoarele elemente: 1. Nucleele procesorului; 2. Nucleul grafic; 3. Memoria cache L3; 4. Agentul de sistema care include: 4.1. un controler de memoria DDR3; 4.2. unitatea de control a alimentarii CPU; 4.3 .blocul de iesire video. Figura 16. Structura cipului Sandy-Bridge. Procesoarele din noua familie Intel Core 2011, cunoscute si sub numele de cod Sandy Bridge, sunt destinate incorporarii in notebook-uri, datorita faptului ca permit integrarea unor caracteristici grafice direct pe chip-uri. Concret, chip-urile se bazeaza pe noua microarhitectura Intel visibly smart, de 32nm, ce include a doua generatie de tranzistori cu poarta de metal si constanta dielectrica ridicata. Iar arhitectura inel va permite motorului grafic integrat sa partajeze resurse (precum memoria cache) cu nucleul de procesare, pentru a mari performanta de calcul si cea grafica, mentinand in acelasi timp eficienta energetica. A doua generatie de procesoare Intel Core include si o varianta imbunatatita a tehnologiei Turbo Boost, care permite realocarea resurselor si distribuirea sarcinilor nucleelor, pentru a asigura utilizatorului un plus de putere atunci cand este nevoie. Din punct de vedere grafic, noile procesoare se concentreaza asupra zonelor cel mai des folosite de utilizatori: video HD, 3D, socializare online, multi-tasking, gaming si multimedia. Iar functionalitatea Advanced Vector Extensions (AVX) ofera o

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

37
Coal

performanta sporita,care permite o gestionare mai buna a datelor, precum si rearanjarea si sortarea lor. Noul set de instructiuni pe 256 biti accelereaza floating point-ul unor aplicatii cu cerinte mari de sistem, cum ar fi programele de editare a fotografiilor sau cele ce permit crearea de continut video.

Figura 17. Microarhitectura Sandy-Bridge. Mai sus avem o schema generala a arhitecturii unui nucleu dintr-un procesor Sandy Bridge. Partea de sus, ce include Instruction Cache, Pre-decode, Instruction Queue, Decoders, uOP cache si Branch Predictor se numeste Front End si are ca rol traducerea sirului de date ce curge catre procesor in micro-operatii. In prima parte a front-end-ului nu au aparut mari diferente fata de Conroe sau Nehalem: aceiasi 32K Instruction cache, aceleasi 4 decodoare (1 complex, 3 simple), micro-fusion, macro-fusion. Ce a disparut e insa Loop Stream Detector-ul, inlocuit acum de un cache de micro-ops, ce in esenta are acelasi rol: opreste partea de decodare atunci cand detecteaza o instructiune care a fost deja decodata si rezultatul se afla in cache, economisind astfel destul de multa energie; are un hit-rate de aproximativ 80%. Cea mai mare schimbare din front end e insa zona de Branch Prediciton, care a fost reconstruita de la zero. Daca la Nehalem fusese

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

38
Coal

introdus un al 2-lea nivel, mai lent dar mai incapator decat primul, ce ajuta mult in lucrul cu baze de date si informatii voluminoase in general, in Sandy Bridge s-a renuntat la acest al 2-lea nivel dubland insa numarul de tinte urmarite. O ultima imbunatarire a nucleului din Sandy Bridge e la nivelul lucrului cu memoria; daca Nehalem avea 3 port-uri, Load, Store Address si Store Data, in Sandy Bridge rolurile se schimba putin, doua dintre port-uri pot face acum fie Load fie Store Address, al 3-lea pastrandu-si rolul in Store Data. Cu ce vine nou Sandy Bridge ? Privind in ansamblu, cea mai vizibila noutate pe care o aduce fata de generatia anterioara e integrarea nucleului grafic in pastila procesorului, si precum vom vedea mai departe nu e vorba numai de o mutare a unor circuite ci de o integrare in adevaratul sens al cuvantului, cu modificari arhitecturale la multe nivele ce fac ca partea grafica sa nu mai penalizeze performanta memoriei asa cum se intampla la Clarkdale. Din acest motiv au avut loc schimbari radicale in interiorul procesorului, in modul cum diversele componente comunica intre ele precum si in aranjarea si functionarea acestora. Grosul memoriei cache, denumit LLC (last level cache) are atat rol de L3 cache pentru procesor cat si rol de cache pentru alte componente cum ar fi nucleul grafic, iar comunicarea intre componentele din pastila procesorului se face acum printr-un bus de tip ring bidirectional. O alta noutate importanta este introducerea Advanced Vector Extension (AVX), o extensie a setului de instructiuni x86 ce va oferi un salt foarte consistent de performanta in aplicatiile ce le vor folosi pe viitor. Pe partea de power management au fost aduce imbunatatiri importante, atat prin ajustarea arhitecturii pentru un consum mai redus cat si prin optimizarea mai buna a tehnologiei Turbo Boost. Precum observati, avem doua modele K, si daca va aduceti aminte de generatiile anterioare sufixul K identifica un model mainstream cu multiplicator deblocat. Ei bine, nu degeaba avem doua asemenea modele inca de la lansare, Intel vrea sa compenseze ceva: datorita noii arhitecturii, unde generatorul de tact e integrat in procesor, ridicarea frecventei Bclock peste valoarea nominala de 100Mhz mai mult de cateva procente va cauza serioase probleme. Pe langa multiplicatorul deblocat insa, modelele K vor veni si cu chip-ul grafic mai puternic, insa si aici e un mic secret: chipul grafic se poate folosi pe placile de baza destinate acestui lucru, mai exact cele

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

39
Coal

construite in jurul chipset-ului H67. Numai ca H67, fiind pozitionat ca o platforma value, nu suporta feature-urile high-end ale modelelor K, asa ca daca vom dori utilizarea graficii integrate a modelelor K va trebui sa renuntam la multiplicatorul deblocat. De prima data cand am pus ochii pe detaliile arhitecturii Sandy Bridge, mi s-a parut ca ring bus-ul e cea mai inteligenta chestie aplicata de Intel intr-o arhitectura. Prima varianta de procesor cu grafica integrata, Clarkdale, avea o problema vizibila pentru astia ca noi, care stau si compara cifre de performanta toata ziua: pentru ca si IGP-ul si CPU-ul trebuiau sa lucreze cu acelasi controller de memorie era evident ca niciunul nu va beneficia de maximul de performanta prea usor, asa ca au hotarat sa dea IGP-ul prioritate. Astfel, performanta grafica nu era penalizata prea rau, iar procesorul suferea doar in aplicatiile in care era necesara o latime de banda mare a memoriei, oarecum atipice pentru o platforma destinata in principal laptop-urilor sau sistemelor low-end. Ei bine, in Sandy Bridge au reusit sa repare aceasta problema, ba chiar sa compenseze cu varf si indesat, prin folosirea unui ring bus pe care se afla atat controllerul de memorie, cat si cache-ul LLC, procesoarele si nucleul grafic. Astfel, fiecare componenta comunica cu oricare alta direct pe cea mai scurta cale, minimizand impactul asupra celorlalte componente si folosind la maxim resursele disponibile. Ring bus-ul e alcatuit din 4 trasee circulare, Request, Acknowledge, Snoop si un Data Ring de 32 byte. Executia fizica nu are impact asupra suprafetei procesorului, fiind in esenta vorba de un set de trasee ce trec pe deasupra componentelor, fiind permisa si scalabilitatea catre arhitecturi cu mult mai multe nuclee fara penalizari importante de performanta. Conectarea fiecarei componente la ring bus se face prin intermediul unei interfete, care se ocupa de coordonarea traficului de informatii prin intermediul bus-ului. Aceste interfete functioneaza la frecventa si voltajul nucleelor procesorului. In afara de cache-urile prezente in fiecare nucleu, accesibil fiecarei componente din Sandy Bridge prin intermediul ring bus-ului este Last Level Cache; rolul lui ar putea fi asimilat cu cel al L3 cache din Nehalem, insa in realitate functiile sunt mai complexe pentru ca este folosit si de nucleul grafic. Ba chiar, alocarea utilizarii se face de catre driverul video, desi poate fi accesat de oricare componenta. Ultima unitate functionala

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

40
Coal

din Sandy Bridge este System Agent, ce se ocupa de interfata cu restul sitemului, continand controller-ul de memorie, PCI-e, DMI si partea de display. Deasemenea, aici regasim si complexa unitate de power management, in esenta o varianta evoluata a celeia din Nehalem, ce coordoneaza pe langa nuclee, procesor grafic sau LLC si iesirea de display, componentele PCI-e sau RAM. System Agent are propria frecventa de lucru si tensiune de alimentare fata de nuclee sau de procesorul grafic. 1.4 Procesoarele Ivy Bridge pe 22 nm
Intel Ivy Bridge este a treia generaie de procesoare Core i

Ivy Bridge este versiunea pe 22 nm a familiei de procesoare Sandy Bridge, apreciate pentru nivelul de performan competitiv i consum de energie redus. Noile chip-uri sunt mult mai mici decat predecesorii lor, avand o suprafata de numai 160 mm2 (75% dintr-un quad core Sandy Bridge), in ciuda unei cresteri a numarului de tranzistori pana la 1.4 miliarde (cu 20% mai multi). Si cel mai mult s-a investit la nivel de GPU, care are acum 16 Stream Processors si 2 unitati de texturare in varianta cea mai performanta (HD 4000). Trecerea la procesul de fabricaie pe 22 nm are o importan mult mai mare pentru Intel deoarece, d startul unei noi ere n industria microprocesoarelor, prin introducerea tehnologiei tranzistoarelor 3D. Potrivit Intel, tranzistoarele 3D sunt cu pn la 37% mai performante dect cele planare, folosite n actuala generaie de procesoare pe 32 nm. Mai mult decit atit, sporul de performan este obinut cu voltaje mai mici decit cele necesare pentru procesoarele actuale, fapt ce reduce consumul de energie chiar i cu 50%.

Figura 18. Tranzistoare tridimensionale in noua arhitectura.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

41
Coal

Procesoarele Ivy Bridge mostenesc n mare parte micro-arhitectura Sandy Bridge, dar cu un numr semnificativ de mbunatatiri. Astfel, sporul de performanta n comparaie cu actuala generaie de procesoare Core i3/i5/i7 va fi de aproximativ 20 % pentru nucleele de calcul i 30 % pentru interfaa grafic integrat. n timp ce interfaa grafic integrat primete suport pentru specificaiile DirectX 11 i tehnologiile OpenCL 1.1, pentru instalarea unei soluii grafice dedicate avem la dispoziie conectivitate PCI Express 3.0 x16. Pentru periferice avem la dispoziie i un controller PCIe 2.0 x4.

Figura 19. Arhitectura de 22nm a procesoarelor Intel Core Printre beneficiile procesoarelor din a treia generatie Core i se numara: - suport nativ pentru USB 3.0 (4 porturi) - suport pentru PCIe 3.0 - procesoarele quad-core (cu 4 nuclee de calcul) vor intra si in gama mainstream - poate folosi memorii DDR3 de pana la 1600 MHz - procesorul grafic integrat o sa aiba 16 EU (shadere) fata de 12 cate are acum realizand un salt de performanta de cel putin 30% - procesorul grafic o sa fie compatibil DirectX 11

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

42
Coal

- se speculeaza ca unele laptopuri din generatia actuala vor putea fi upgradate cu procesoare din noua generatie Ivy Bridge. Desi poate parea la prima vedere un simplu Tick, Intel denumeste Ivy Bridge ca fiind defapt un Tick+ datorita unor imbunatatiri atat in ceea ce priveste performanta cat si in ceea ce priveste consumul energetic (desi conform calculelor mele Ivy Bridge este Tock, nu Tick, nu ne putem impotrivi dorintei celor de la Intel de a ordona evolutia propriilor procesoare dupa cum isi doresc). Astfel putem vedea noutati ca: pipelined divider, next page prefetcher, adaugiri la ISA pentru conversiile in virgula mobila pe 16biti, fast string moves dar si acces rapid la registrele de baza FS/GS. Pentru a economisi energie atunci cand memoria este in mod self-refresh, procesorul poate opri parti ale bufferelor DDR I/O. O alta facilitate utila in special procesoarelor destinate portabilelor este prezenta mai multor TDP-uri, ce pot fi comutate manual din Windows sau automat in functie de starea de incarcare a bateriei. Cu toate acestea, Ivy Bridge nu reprezinta o noutate pentru nimeni, fiind anuntat inca din momentul lansarii Sandy Bridge. Arhitectura de baza in acest caz este arhitectura Sandy Bridge, translatata pe un proces de fabricatie pe 22nm, si imbunatatita asa cum aminteam mai sus. Evident, nu vorbim doar despre un die-shrink, cei de la Intel imbunatatind solutia grafica integrata (HD 4000), care suporta acum DX 11 si aduce un spor de performanta considerabil fata de HD 3000. In afara de imbunatatirile aduse partii de grafica, si partea de CPU beneficiaza de pe urma unor imbunatatiri, procesoarele Ivy Bridge fiind dotate acum cu controller-e PCI-E 3.0, un controller de memorie mai performant, multiplicator maxim crescut, de la 57x la 63x, dar si un alt potential de overclocking in conditii extreme, datorita multiplicatorului mai mare si procesului de fabricatie. Chipset-ul Z77, pe de alta parte, integreaza acum un controller USB 3.0. Partea cea mai frumoasa in cazul acestei lansari este compatibilitatea dintre platforme. Astfel, placile de baza dotate cu Z77 sunt compatibile cu procesoarele Sandy Bridge, in timp ce Ivy Bridge poate fi folosit si pe placile de baza dotate cu chipset Z68 sau P67 B3.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

43
Coal

1.5 Arhitectura Haswell. Urmatoarea generaie de procesoare Intel va avea numele de cod Haswell. Procesoarele Haswell vor fi fabricate pe tehnologia 22nm la fel ca i procesoarele Ivy Bridge. De muli ani Intel folosete modelul de dezvoltare tick-tock n fabricarea procesoarelor. n acest model fiecare tick reprezint folosirea unui nou proces de fabricaie pentru a produce o versiune mai rafinat a arhitecturii existente iar fiecare tock introduce o microarhitectur nou pe procesul de fabricaie existent. Ultimul tick a fost micro-arhitectura Ivy Bridge lansat cu cteva luni n urm. Urmatorul tock va fi arhitectura Haswell. Intel Haswell este o arhitectura complet nou dezvoltata pe 22nm si sistemul "3D" folosit si de procesoarele Intel Ivy Bridge, dar aduce imbunatatiri de performanta si o reducere semnificativa a consumului energetic. Consumul redus este o prioritate pentru Intel nu doar in ceea ce priveste procesoarele. Noile cipuri Haswell vor fi compatibile si cu alte componente cu consum redus, folosite de tablete ARM, aducand practic performantaIntel Ivy Bridge pe gadgeturi mult mai mici, cu baterii mai slabe. Dac procesoarele Ivy Bridge sunt practic versiuni pe 22 nm ale vechilor modele Sandy Bridge, cele din familia Haswell sunt bazate pe o microarhitectur complet nou, cu design modular, compus din elemente ce se vor regsi n toate modelele viitoare de procesoare Intel, mergnd de la PC-uri desktop sau servere pentru companii i pn la tablete i telefoane inteligente. Pe lng scalarea mai uoar a nivelului de performan i complexitate, noul design permite simplificarea etapei de design i proiectare, permind inginerilor s lucreze cu un design unic i s aplice tehnologiile nou descoperite n mod simultan, pentru ntreaga ofert de procesoare Intel. Fr a da prea multe detalii, David Perlmutter - manager general al Intel Architecture Group, a precizat c primele procesoare Haswell pentru cleni vor fi modele
dual-core i quad-core, echipate cu una dintre cele trei variante de grafic integrat: GT1

(pentru procesoare cu eficien energetic ridicat), GT2 (standard) i GT3 (performane duble fa de GT2, la un consum de energie mrit). Raportat la consumul de energie,

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

44
Coal

nucleul grafic rezervat pentru familia de procesoare Haswell ofer performane


aproximativ duble fa de cel folosit n procesoarele Ivy Bridge. Noul GPU este

compatibil DirectX 11.1 i primete mai multe mbuntiri pe partea de multimedia: reglaje avansate pentru ajustarea calitii i stabilizarea imaginii, suport pentru redarea unei game extinse de formate media, encoder hardware pentru formatul MPEG2 i suport pentru redare video la rezoluie 2K /4K. Pe partea de CPU, performanele cresc cu aproximativ 10% fa de un procesor Ivy Bridge la aceeai frecven, ns adugarea setului de instruciuni AVX2 aduce un spor de performan mult mai consistent pentru aplicaiile special optimizate. Cele mai de efect mbuntiri sunt aduse asupra optimizrii consumului de energie. Dac interfaa grafic mai eficient dubleaz practic performanele 2D/3D, fr a crete consumul de energie, adugarea unui nou stadiu de economisire a energiei (S0ix) reduce de 20 ori necesarul de energie pentru funcionarea n idle, cnd procesorul nu execut sarcini de calcul. Ct despre viitoarele generaii de tablete i sisteme ultrabook, David Perlmutter a menionat un consum de energie n sarcin de numai 8W, considerabil mai mic dect cei 17W obinui cu cele mai eficiente procesoare Ivy Bridge disponibile n prezent. Procesoare Haswell vor avea noi caracteristici, cum ar fi instruciuni AVX 2.0, mbuntirea GPU i overclocking-ului, regulator de tensiune integrat, consum redus. Procesoarele vor utiliza socket-uri, socket H3 (LGA1150) pe desktop, i socket G3 pe platforma mobil. Procesoarele Haswell vor avea trei versiuni de uniti de grafic: GT1, GT2 i GT3. GT1 va avea cea mai mic performan din toate cele trei, i va fi folosit doar pe cipuri dual-core. Desktop-urile quad-core vor avea o grafic mai bun folosind GT2 i quad-core-urile mobile produse vor veni cu GT2 sau grafic GT3. Acestea fiind spuse, consumul de energie electric va fi mare, dar i performanele pe msur. Noua generaie se pare c va avea o form standard, ns vor aduce mai multe performane. Pentru o versiune quad core PCH-ul va iei din discuie automat i socketul va fi diferit fa de ceea ce am ntlnit pn acum la ULV. Un dual core fr ULV are un TDP de 37W, iar cel quad core unul de 47W.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

45
Coal

Intel Haswell, primele detalii despre noua (micro) arhitectura Inainte ca procesoarele Intel Ivy Bridge sa soseasca pe piata, producatorul american ofera deja primele detalii despre noua arhitectura, Intel Haswell. Haswell este succesorul pe 22 nm a lui IB(Ivy Bridge) si este preconizat c va aprea n 2013. Haswell va include suport pentru Intels Transactional Synchronization Extensions (TSX), un nou set de instruciuni menite s mreasc performana procesoarelor multi-core. Stabilirea sarcinilor fiecrui procesor, pentru a nu risca erori de date, este prioritatea Intel, care plnuiete s mute acest proces de la nivelul software la cel hardware prin Intel Haswell. Pentru a beneficia la maxim de funciile oferite de noua arhitectur Intel, programatorii vor fi nevoii s adapteze aplicaiile deja existente. Schimbrile aduse prin arhitectura Intel Haswell vor duce att la o mbuntire a performanei CPU fr depirea substanial a vitezelor clock, dar i un consum mai eficient de energie. 1.6. Arhitectura Tilera64. Compania Tilera, cu sprijinul unora de la MIT, a dezvoltat o nou familie de procesoare, nu dual-core, nici quad-core, ci inei-v bine, 64 core!!! Cele 64 uniti de calcul (core) folosesc tehnologia 90nm i ruleaz n intervalul 600-900 MHz. ntreg procesorul este de fapt o plac mprit n 64 de uniti mici, aferente celor 64 core-uri, dispuse 8 x 8. Fiecare astfel de unitate are un consum n intervalul 170 300mW, iar specificaiile tehnice spun c fiecare este un procesor n toat regula. Asta nseamn c fiecare core poate rula independent un ntreg sistem de operare, i luate mpreun, mai multe core-uri pot rula foarte eficient SO-uri multitasking i multi-processing. O ntrebare interesant i capital este nu cte operaii pe secund poate executa noul procesor (dei acest aspect este de asemenea impresionant, Tilera susinnd o capacitate de 192 miliarde operaii/secund), nici eficiena energetic, ci cum vor putea folosi programatorii acest procesor la adevrata valoare Ct de uor va fi s foloseti toate cele 64 procesoare care lucreaz n comun, i fiecare s se neleag cu celelalte?

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

46
Coal

Specificaiile tehnice spun c TILE64 este programabil n C (mai exact standardul ANSI C), i aplicaiile dezvoltate anterior vor putea fi folosite fr probleme pe noul procesor. Core-urile pot fi grupate n clustere, pentru a putea adapta i dimensiona puterea de calcul de care fiecare aplicaie n parte are nevoie. Lucrul interesant este c se pot rula chiar mai multe sisteme de operare n paralel, acest procesor putnd astfel nlocui subsisteme de mai multe procesoare. Cteva cifre interesante din specificaii:

5MB cache pe procesor; 192 miliarde operaii/secund; 50 Gbps bandwidth operaii I/O; 4 controllere de DDR2; 600-900 MHz per core.

Tile64 este realizat pe un sistem parcelar (de unde si numele), cu 64 de parcele. Fiecare parcela acomodeaza un core, memoria cache proprie, si un comunicator. Aceasta configuratie a fost gandita de profesorul Anat Agarwal in urma cu aproximativ 10 ani, si a durat pana acum pentru a ajunge pe piata. Fiecare core are cate trei unitati de procesare, doua ALU ( Arithmetic Logic Unit) si o FPU (Floating Point Unit), si frecvente intre 600 si 900 MHz. Memoria cache este impartita in 16 KB L1 cache exclusiv si inca 64 KB L2 cache per core. Insa cache-ul L2 functioneaza la comun pentru cele 64 nuclee, ducandu-se la 4 MB L2 cache total si comun. Fiecare Tile64 are integrate patru controller-e de memorie DDR2, doua interfete 10-GigaLAN, doua interfete GigaLAN, doua interfete PCI-E 4x si o interfata I/O modulabila. Din toate acestea, ne putem da seama ca Tile64 nu are nevoie nici de un northbridge, nici de un southbridge. Este o solutie single chip. Si cu toate acestea consuma intre 11 si 19 W doar (170 300 mW per core). In plus, Tile64 isi poate trece core-urile nefolosite in sleep mode, petru a scadea si mai mult concursul.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

47
Coal

Aceste procesoare sunt fabricate de TSMC, intr-un proces tehnologic de 90 nm (din motive financiare), vin sub forma unor placi PCI-E si costa 435 $ pentru cantitati de minim 10 000 unitati. Ele exceleaza in procesare de retea avansata si procesare video, dar pot fi pana la urma folosite in orice scop.

Figura 20. Arhitectura procesorului Tilera64. Fiecare din cele 64 de plci componente, dispuse ntr-o reea 8 x 8, include o unitate de procesare, o unitate de memorie cache i un switch, care poate trimite date ctre fiecare dintre cei maxim 4 vecini ai si. Fiecare plac are o lime de band de 500 Gbps, limea de band agregat a intregului chip Tile64 ajungnd la 32 Tbps. O alt caracteristic interesant a procesorului este flexibilitatea arhitecturii memoriei cache. Fiecare plac dispune de 2 blocuri a cte 8 KB de memorie cache L1 i o unitate de 64 KB de memorie cache L2. Toate aceste uniti de memorie cache individuale pot fi ns folosite ca un mare bloc de memorie cache de 5 MB, datorit

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

48
Coal

posibilitii ca datele, dac nu sunt gsite n cache-ul nucleului local, s fie cautate n cache-ul celorlalte nuclee, nainte de a fi luate din memoria RAM.

Paragraful 2 Tehnologiile celei de-a doua generatii de procesoare Intel Intel Turbo Boost Technology 2.0, Intel Hyper-Threading Technology, Intel HD Graphics, Intel Smart Cache 2.1 Intel Turbo Boost Technology
Intel Turbo Boost Technology aduce performane inteligente, chiar dac lucrezi la

sarcini simple ce folosesc un singur nucleu al procesorului, sau dac rulezi sarcini intensive de lucru :

ce

necesit

utilizarea

simultan

mai

multor

nuclee!

Iat cum poti sa beneficiezi si tu de performane sporite pentru o varietate de moduri Nu trebuie s fii expert pentru a rula multitask deoarece zilnic faci asta aproape

fara sa-ti dai seama. De la upload-ul de fotografii la auduia muzical, de la navigatul pe internet la scrierea de texte, folosesti zilnic facilitatea de multitasking si ai nevoie performan pentru a putea rula mai repede mai multe aplicatii simultan, fr sa stii neaprat cum funcioneaz.

Daca esti pasionat de media digital ( ... si cine nu este acum cind fiecare dintre

noi avem unul sau mai multe camere foto digitale si camere video digitale performante ... ), ai nevoie de performane care s-ti permit s lucrezi la mai mult de o aplicaie n acelai timp, de la transmiterea de filme la descrcarea de fi iere audio la uploadul de filme sau editarea fiierelor video.

Daca esti Gamer ( ... si cine nu are nevoie si de o aventura in lumea jocurilor

virtuale ca sa se destinda ... ) trebuie doar sa stii cite ceva despre cele mai noi

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

49
Coal

tehnologii, pe care apoi abia vei ateapa s le testezi. Noua familie 2010 de Procesoare Intel Core i3, i5 si i7 iti asigura performanele de care ai nevoie pentru a sta conecta la joc tot timpul si a obtine satisfactie maxima. Intel Turbo Boost Technology este un concept simplu: orice procesor are o frecven de baz. Majoritatea procesoarelor pot atinge frecvene mai mari n anumite condiii. Intel Turbo Boost Technology crete automat frecvena nucleelor active dup cum este necesar. Poti astfel sa obtii vitez maxim atunci cind rulezi aplicatii intensive (media digitala, jocuri ...etc.) O dat ce sistemul are Intel Turbo Boost Technology, procesorul determin automat frecvena maxim la care poate funciona n funcie de condiiile de funcionare. Intel Turbo Boost Technology permite automat nucleelor procesorului s ruleze mai rapid fa de frecvena de operare de baz dac procesorul ruleaz la o temperatur sczut, curent sau limitele de energie si numai atunci cind este nevoie. Bazndu-se pe cea mai nou microarhitectur Intel, Intel Turbo Boost
Technology este unica pentru procesoarele Intel Core i5 i Intel Core i7. Aceasta

tehnologie este creeat s intre n aciune n funcie de nivelul de incarcare la care este supus procesorul sau de momentul n care este necesar mai mult putere.

Figura 21. Tehnologia Turbo Boost 2.0.


Intel Turbo Boost Technology crete inteligent frecvena procesorului pentru a

oferi performane maxime i distribuie puterea n functie de nivelul de activitate. Se activeaz automat orice numr de nuclee active sau procesoare virtuale. De asemenea, aceasta tehnologie permite procesorului s creasc frecvena nucleelor asigurndu-se c nu se depesc limitele electrice i termale specificate.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

50
Coal

S ne uitm la trei situaii unde Intel Turbo Boost Technology aduce performane:

Performan Single Task : cnd doar un nucleu este n uz ca atunci cnd doar o

singur aplicaie single-threaded este activ Intel Turbo Boost Technology ofer performane doar unui singur nucleu, celui activ.

Multitasking moderat : cnd dou dintre cele patru nuclee ale unui procesor quad-

core sunt activate, Intel Turbo Boost Technology crete automat frecvena celor dou nuclee active ceea ce rezul n performane foarte bune pentru ambele sarcini.

Multitasking complex : chiar dac toate nucleele sunt active, Intel Turbo Boost

Technology crete performanele pentru toate sarcinile atta timp ct procesorul funcioneaz sub specificaiile termice i electrice. Ce este tehnologia Turbo Boost? Acesta tehnologie permite automat ca nuclee procesorului sa poata rula cu o frecventa mai mare decat frecventa de baza (nominala), dar atentie, doar daca procesorul functioneaza in cadrul limitelor de putere, curent si temperatura. Astfel Turbo Boost impreuna cu tehnologia HT aduc o crestere de performana atat in procese multi-threaded cat si single -threaded. Turbo Boost se activeaza atunci cand sistemul de operare (OS) solicita performanta maxima din partea procesorului. Frecvena maxim atinsa depinde de numrul de nuclee active iar cantitatea de timp petrecuta de procesor inTurbo Boost depinde de volumul de munc i mediul de operare. Oricare dintre urmatoarele poate seta limita superioara a Turbo Boost pe un volum de munca dat: numarul de nuclee active ; consumul de curent estima ; consumul de energie estima ; temperatura procesorului. Atunci cand procesorul ruleaza sub aceste limite si volumul de munca cere performanta suplimentara, frecventa procesorului va creste dinamic cu increment de

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

51
Coal

133MHz pe intervale scurte i regulate pana cand limita superioara este atinsa sau pana cand cresterea frecventei pentru numarul activ de nuclee este atins. Este oarecum o explicatie stufoasa si poate greu de inteles, de aceea am sa vedem un exemplu concret. Exemplu concret: Luam ca exemplu un procesor cu 4 nuclee si tehnologie HT : Intel Core i7-870. Frecventa nominala a procesorului este de 2.93 GHz, avand tehnologie HT, practic in sistemul de operare va aprea ca si cum ar avea 8 nuclee. Pentru procesorul de mai sus Intel ne da urmatoarele date pentru Turbo Boost: 2/2/4/5. Ce inseamna acesta? Este multiplicatorul cu care se realizaeaza cresterea de frecventasi se calculeaza in felul urmator: am mentionat mai sus ca toate cresterile de frecventa se realizeaza cu increment de 133 MHz, deci:2*133MHz/2*133MHz/4*133MHz/5*133MHz. Mai avem de stiut un singur lucru, valoarea multiplicatorului (2/2/4/5) se refera mereu in ordine inversa, adica:4/3/2/1. (nuclee active) Adica: -la 4 nuclee active ale procesorului, prin Turbo Boost frecventa poate creste cu 2*133Mhz, ajungand la frecventa maxima de 3200Mhz ( 2933MHz+266MHz). Aceeasi crestere de frecventa o poate arata si daca are 3 nuclee active. Ce face Turbo Boost? Sa zicem ca folosim o aplicatie sau un program care este bine optimizat pe procesoare cu mai multe nuclee (Photoshop CS4) si poate beneficia de performantele lor; inseamna ca toate cele 4 nuclee ale procesorului vor fi active (ocupate) asadar nu prea ramane loc si pentru o crestere semnificativa a frecventei (Turbo Boost), pentru ca atunci procesorul nu s-ar mai incadra in limitele de care spuneam mai sus. Dar, daca totusi chiar si in aceste conditii (e posibil) aceste limite nu sunt atinse atunci, o crestere a frecventei (2*133MHz) este posibila. Scenariul de mai sus insa, din pacate nu se regaseste la majoritatea aplicatiilorsa nu uitam ca procesorul luat ca si exemplu este capabil sa lucreze la 8 thread-uri (fire) simultan.deci asta este un paralelism fantastic, si numai datorata tehnologiei HT. Procesoarele AMD nu pot lucra simultan decat la atatea thread-uri, cate nuclee au.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

52
Coal

Si dorim sa jucam un Crysis, si este binestiut ca majoritatea jocurilor nu prea sunt optimizate pe tehnologie multi-core (mai ales peste 3-4 nuclee, ce-i drept situatia se imbunatateste). Si atunci practic avem un procesor foarte performant, cu 4 nuclee dar care din pacate nu ne va ajuta sa atingem performante mai buneDe obicei la jocuri, frecventa conteaza mai mult, decat prezenta mai multor nuclee. Si asa, un dual-core cu frecventa mai mare, produce FPS-uri mai mari decat un quad-corestrigator la cer!!! Dar Turbo Boost incearca sa rezolve un pic situatiaDin moment ce jocul respectiv nu prea poate folosi celelalte doua nuclee, ele devin inactive, iar ca sa compenseze acest lucru Turbo Boost, va mari frecventa nucleelor activein cazul nostru, daca procesorul nostru va avea doua nuclee inactive si doua active, frecventa poate creste cu 4*133MHz+frecventa nominala. Sistemul Turbo Boost introdus de Intel odata cu Nehalem a permis utilizarea mult mai buna a rezervei termice si energetice puse la dispozitie procesorului, permitand un consum mai redus de energie in situatiile de incarcare medie precum si o performanta crescuta in aplicatiile single-threaded. Odata cu venirea lui Clarkdale si subsistemu lgrafic a fost introdus in ecuatie, acesta fiind partial controlat in functie de incarcarea pe CPU sau IGP si rezerva de putere disponibila. Ei bine, a doua generatie a sistemului Tubo Boost face mai mult de atat, folosind inertia termica a sistemului de racire pentru a impinge si mai sus performanta disponibila pentru o scurta perioada de timp. Pentru o exemplificare grafica rulati animatia de mai jos:

Figura 22. Exemplificarea grafica a tehnologiei Turbo Boost.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

53
Coal

Sa nu uitam totusi ca nu e un lucru linear.nuclee inactive=crestere de frecventaTurbo Boost intervine doar daca e cazul si daca performante maxime sunt necesare, altfel ar fi inutil sa ruleze la frecvente mari, caci pe langa faptul ca trebuie sa fie performant procesorul trebuie sa functioneze si eficient. 2.2 Intel Hyper-Threading Technology Intel Hyper-Threading Technology permite o utilizare mai eficienta a resurselor procesorului si ofera performante imbunatatite in aplicatiile multithread (care suporta procesoare cu multe nuclee). Astfel poti rula simultan o multime de aplicatii desktop cu cerinte ridicate, fara incetiniri de viteza. Noua familie de procesoare Intel Core din 2010 este construit pe arhitectura de 32nm, ce permite echiparea acestora cu un numr de doua ori mai mare de tranzistori pe aceeai suprafa pentru a creea procesoare mai mici i mai puternice. Aceasta perimte integrarea unor tehnologii inteligente asa cum este si Intel Hyper-Threading Technology (Intel HT Technology), disponibil pe noile procesoare Intel Core i3, Intel Core i5 i Intel Core i7 din 2010. Tehnologiile din procesoarele Intel Core pot fi complexe, ceea ce poate fi dificil s nelegeti valoarea imens pe care o au. Dar ctigurile de performan imense, timpul de rspuns uimitor, sunt motive excelente pentru Dvs. s aflati mai multe despre tehnologia Intel Hyper-Threading - i s va doriti un PC echipat cu un nou procesor Intel Core din 2010.
Intel HT Technology permite procesoarelor s ruleze dou sarcini n acelai timp,

deoarece folosete resursele procesorului mai eficient.Veti putea astfel sa rezolvati mai multe cnd rulati multitasking i veti termina cea aveti de fcut mai rapid. Veti putea rula multitask mai inteligent cu tehnologia Intel HT. Aceasta din cauz c Intel HT Technology creeaz nuclee "virtuale", permin procesorului s execute eficient procesare multithread n nucleele sale. Aadar, atunci cnd folositi computerele pentru activiti intense cum ar fi multitaskingul, crearea sau editarea de fiiere grafice, multithreading-ul simultan ofer o cale adiional pentru ca informaiile s circule prin fiecare nucleu. Aceasta nseamn c orice rulati se va rezolva mai repede. De exemplu,

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

54
Coal

noul procesor dual-core Intel Core i5 din 2010 poate rula 4 sarcini simultan folosind inteligent toate resursele din cele 2 nuclee. Procesarea fr tehnologia Intel HT este mai lenta. Rularea aplicatiilor este nceata i dureaz mult s rulezi chiar i o sarcin simpl. Rulnd aplicaii intense pe un nou procesor Intel Core din 2010 echipat cu tehnologia Intel HT asigura un plus de viteza deoarece nucleele sunt complet incarcate. Sarcinile sunt rezolvate mult mai rapid, aadar se rezolv mai multe ntr-un timp mai scurt. Multitaskerii, fanii media digitalai pasionaii de multimedia vor aprecia tehnologia Intel HT. Entuziatii ce utilizeaza aplicatii grafice pot crea, edita i encoda fiiere grafice performante n timp ce ruleaz aplicaii n fundal cum ar fi programe antivirus - toate acestea fr a compromite performanele. i utilizatorii de internet obtin rspuns mai rapid pentru aplicaiile online.

Figura 23. Functionarea Tehnologiei Hyper-Threading. PC-ul tau nu trebuie s ncetineasc doar pentru c ai cteva aplicaii deschise. Cu Intel HT Technology, poti beneficia de performanele inteligente chiar acum si asta deoarece Intel Hyper-Threading Technology permite folosirea mult mai eficient a resurselor procesorului vei rezolva totul mai rapid, vei vedea o cretere important n performane i vei fi pregtit pentru viitoarele aplicaii. Software-ul multithread de astzi necesit performane mbuntite. Mulumit Intel Hyper-Threading Technology, vei putea rula aplicaii cum ar fi Adobe

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

55
Coal

Photoshop* sau Quicktime* fr a pierde din performane sau din putere. Aceasta este mai eficient dect a aduga mai multe nuclee procesorului (ceea ce inseamna o investitie suplimentara) . Noile procesoare Intel quad-core folosesc Intel Hyper-Threading Technology pentru a transforma patru nuclee performante n performan uimitoare pentru 8 sarcini. 2.3 Intel Smart Cache Sistemul Intel Smart Cache includes cache L1 i L2 cache, dar i L3 cache, exclusiv pentru procesoarele Intel Core i5 and Core i7. n aceste noi procesoare, fiecare nucleu are propria memorie cache L1 i L2 pentru instruciuni i date. Toate cele patru nuclee mpart aceast memorie cache L3 - o memorie imens de 8MB L3 care este integrat n structura de memorie a procesorului i care mbuntete performanele. Intel Smart Cache crete probabilitatea ca fiecare procesor s acceseze date de la subsistemul cache care este mult mai rapid i mai eficient dect de la memoria sistemului. Dac un nucleu necesit s acceseze mai mult informaie, poate accesa toat memoria de 8MB din memoria cache L3. Dac toate nucleele necesit accesarea datelor, memoria cache este partajat. Intel Smart Cache pstreaz mai multe informaii mai aproape de procesor pentru o execuie mai rapid i pentru maximizarea utilizrii memoriei cache. Avantajele tehnologice ale Intel Smart Cache cresc memoria total a sistemului i resursele cache, astfel nct aplicaiile ruleaz mai rapid. Cu Intel Smart Cache, clienii pot rula multitask mai eficient i se pot bucura de jocuri 3D intense sau pot edita fiiere video fr probleme.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

56
Coal

Figura 24. Memoria Smart Cache. Iata deci cum mbuntete Intel Smart Cache performanele :

Fiecare nucleu poate accesa memoria cache L3, aadar utilizarea memoriei Nucleele de procesare pot stoca i accesa rapid informaiile utilizate frecvent. Memoria cache este mai rapid i mai eficient dect memoria sistemului. Muli dintre clientii cu care discut despre achizitia unui computer nou cred c

cache este maximizat.


2.4 Intel HD Graphics au nevoie de o plac grafic adiional pentru a beneficia de cele mai bune performane vizuale. Ceea ce spun tuturor celor cu care discut aceasta problema este ca pentru majoritatea sarcinilor - incluznd redarea video HD i chiar editarea video HD procesorul are mai mult de a face cu performanele vizuale dect placa video. Este o informaie foarte important pentru clienii care caut calitate video mbuntit pentru multimedia i experiene de gaming. Trebuie totusi sa stiti despre perfrormanele video mbuntite oferite de noua familie de procesoare Intel Core din 2010. Ati putea avea mai multe beneficii daca ati efectua upgrade-ul procesorului dect achiziionarea unei plci grafice separate. Si asta deoarece, la anumite modele, Intel HD Graphics este construit direct n procesor.
Ce este att de tare la Intel HD Graphics?

Din fericire, Intel HD Graphics ofer att de multe beneficii nct trebuie sa intelegeti modul cum opereaza. Functie de ceea ce doriti s faceti cu noul PC sau Laptop este bine sa stiti urmatoarele :

Noile procesoare Intel Core din 2010 sunt inteligente - fac simpl bucuria

graficii uimitoare deoarece o au ncorporat. Nu este nevoie de o plac grafic n plus. Intel HD Graphics este disponibil pe anumite modele ale familiei de procesoare Intel Core din 2010.

Intel HD Graphics ofer putere grafic pentru sistemul tu laptop sau desktop Trebuie deasemeni stiut c Intel HD Graphics ofer suport total pentru

atunci cnd ai nevoie de ea pentru jocuri, divertisment i multe altele.

Windows 7, oferind o multitudine de avantaje .

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

57
Coal

Daca optati sa achiziionati un PC echipat cu un nou procesor din familia

Intel Core din 2010 cu Intel HD Graphics, v vei bucura de imagini clare, culori bogate i calitate audio incredibil.

Intel HD Graphics include suport puternic pentru grafica 3D pentru a oferi o Intel HD Graphics include Intel Clear Video Technology care ofer o

experien realist la rularea jocurilor.

experien de divertisment bogat. V vei bucura de redare video HD optimizat, calitate uimitoare i audio pe mai multe canale.

Intel HD Graphics i noua familie de procesoare Intel Core din 2010 Vei fi uimii de calitatea video i audio - este ca i cnd ecranul PC-ului Cu Intel HD Graphics putei viziona toate filmele Blu Ray* preferate i filme Daca sunteti pasionat de jocuri putei juca cele mai tari jocuri mainstream i v Vei putea sa va jucati cu milioane de ali juctori online beneficiind de grafic Pe anumite modele de procesoare, Intel HD Graphics ofer memorie video Deoarece muli clieni cred c singurul mod de a te bucura de culori bogate,

permit o experien media HD total.

devine un TV HD!

pe internet n HD.

vei bucura de cea mai bun experien video.

bun i performan.

de pn la 1.7GB deci te poi juca fr ntrzieri sau ntreruperi. video incredibil i experiene multimedia realiste este s cumperi o plac video discret. n timp ce aceasta ar prea soluia ideal vreau sa va spun ca rezultatele oferite de Intel HD Graphics sunt de top pentru majoritatea dintre Dvs. De aceea am recomandat de cele mai multe ori ca, la achizitionarea unui computer nou, clientul sa opteze pentru o placa de baza cu grafica integrata (si un procesor corespunzator echipat) , sa pastreze posibilitatea achizitionarii unei placi video separate in viitor , prin prezenta unui slot PCI-X 16 (facind acum o economie de bani). Concluzionind, trebuie sa cunoasteti beneficiile oferite de noua familie de procesoare Intel Core din 2010 - ce includ Intel HD Graphics, cum ar fi:

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

58
Coal

1. 2. 3. 4.

Imagini mai clare, culori mai bogate i sunet excelent. Abilitatea de a juca cele mai bune jocuri mainstream Experien media HD total Experien high-quality a Microsoft* Windows* 7

Capitolul III Clasificarea procesoarelor cu mai multe nuclee


Paragraful 1. Procesoare Tehnologia Core;

1.1. Procesoarele Dual-Core (cu doua nuclee). Ideea de procesor cu mai multe nuclee este o consecinta a efectelor, din punct de vedere al performantei, pe care le are folosirea unui PC cu mai multe procesoare in locul unuia singur. Dar un sistem bazat pe o placa de baza multiprocesor devine foarte scump si neatractiv pentru majoritatea utilizatorilor. Folosirea mai multor nuclee pe aceeasi pastila de siliciu permite cresterea performantei cu costuri minime, deoarece liniile de comunicare intre cele doua nuclee sunt mult mai scurte, deci mai rapide, in acelasi timp disparand si necesitatea construirii unei infrastructuri pentru interconectarea nucleelor. Initial, aceasta idee era foarte greu de pus in practica din cauza procesului de fabricatie a cip-urilor, ce presupunea cresterea dimensiunilor pastilei de siliciu prin folosirea unui numar mai mare de tranzistori, implicit si a consumului. Odata cu micsorarea dimensiunilor tranzistorilor a devenit posibila introducerea unui numar mai mare de tranzistori in acelasi spatiu pe pastila, pastrandu-se in acelasi timp si caracteristicile termice. Primul processor dual-core a fost conceput si construit de IBM in anul 2000, odata cu lansarea celei de-a patra generatii de procesoare PowerPC: Power 4 . Acesta aducea, in premiera, mai multe nuclee pe aceeasi pastila, fiind vorba in fapt de doua nuclee pe 64 biti PowerPC AS. Memoria cache Level 2 era impartita in trei parti egale, fiecare nucleu avand acces la oricare dintre ele.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

59
Coal

Procesoarele dual-core sunt ceva relativ nou pe piata PC-urilor domestice. Dar este oare noua tehnologia? Cu siguranta, nu. Ce inseamna dual-core? Practic, doua procesoare intr-unul singur. Vom reveni cu detalii la aceasta definitie simplificata pe parcursul articolului. Computerele cu mai multe procesoare sunt printre noi de foarte multa vreme si problemele pe care le-a pus de-a lungul timpului aceasta configuratie au fost multe si suficient de greu de rezolvat. Marii producatori de procesoare au introdus in ultima perioada procesoare dual-core pentru PC-urile domestice. Dar au fost ei primii care au introdus aceasta tehnologie? Desi ambele companii au siteuri Web care prezinta cu mare tam-tam dual-core, conceptul este foarte vechi, el derivand din SMP (Symmetric Multiprocessing). Ce este SMP? Doua sau mai multe procesoare erau instalate pe aceeasi placa de baza, impartind atat memoria RAM a sistemului, cat si toate celelalte resurse. Pentru procesoarele Intel, cea mai frecventa problema a configuratiei era alegerea procesoarelor, care trebuia sa faca parte din acelasi lot (de pe acelasi "die"). Totusi, IBM a reusit sa aiba primul procesor dual-core in 2001. Este vorba de Power 4, pentru serverele RISC ale companiei. In orice caz, Intel si AMD au reusit sa construiasca primele procesoare x86 dual-core. Anuntate in 2004, ele au intrat pe piata in 2005. La capitolul procesoare mobile, tot IBM a castigat cursa cu procesorul low-power PowerPC 970FX, prezentat in 2005, care nu a fost nici disponibil pentru public, nici x86. Batalia x86 a fost castigata de Intel, cu Centrino Duo, care motorizeaza, de asemenea, si noul iMac - primul produs Apple cu procesor Intel. Acesta, desi este un desktop, este construit ca un laptop, cu componente optimizate pentru a fi mobile.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

60
Coal

Motivul conceperii procesoarelor dual-core . Dual-core nu a intrat in lumea PC-urilor desktop din cererea pietei pentru astfel de procesoare, ci pentru ca altfel nu se putea merge mai departe. A devenit clar pentru toata lumea ca frecventa de 4000 MHz nu poate fi atinsa inca de un procesor racit cu aer. Ca dovada in acest sens avem retragerea proiectului Tejas al Intel - procesorul de 4000 MHz si chiar daca Tomshardware a reusit sa atinga 5000 MHz, acesta a fost racit cu azot lichid. Puterea consumata a procesoarelor care se departeaza de 3 GHz a amenintat sa depaseasca 100 Wati. Cum puterea consumata mai mare se traduce in caldura disipata mai mare, posibilitatile de racire ale momentului se dovedesc insuficiente pentru a trece de bariera de 4 GHz. Pentru a putea oferi mai multa putere de calcul, Intel si AMD au ajuns la concluzia ca trebuie sa dubleze numarul de procesoare, daca frecventa nu mai poate creste. Desi distanta intre tranzistorii dintr-un procesor este in continua scadere, efectele benefice ale acesteia - temperatura scazuta si frecvente mai mari de ceas intarzie sa se faca simtite. Procesoarele dual-core au fost o adevarata mana cereasca pentru producatorii de procesoare. Acestea au o putere mare de calcul la frecvente mai scazute decat cele single-core, drept urmare se incalzesc mai putin. In termeni de frecventa, procesorul dual-core este mai lent decat cel single-core. Cel mai rapid dualcore Intel are frecventa de 3,2 GHz (3,6 este pe drum), pe cand cel mai rapid single-core lucreaza la 3,8 GHz. Pentru AMD, lucrurile sunt si mai clare: single-core au aceeasi frecventa cu dual-core. Cel mai rapid dual-core nu este cel mai rapid procesor, ci doar are o putere de calcul mai mare... pentru aplicatiile optimizate. Celelalte aplicatii nu vor beneficia in nici un fel de pe urma celui de-al doilea procesor, dar acesta va ramane liber pentru alte aplicatii. Windows XP permite selectarea afinitatii unei aplicatii pentru un procesor sau altul, astfel incat acestea pot fi rulate utilizand doar un core. In orice caz, nu trebuie sa insumam frecventele core-urilor pentru a ne face o idee despre performanta unui dual-core, exact cum nu puteam sa facem aceasta socoteala nici pe baza unei configuratii SMP. Factorul de scalare al performantei este undeva intre 1,4 si 1,8. De ce? Simplu. Explicatia este impartirea resurselor. Aceasta induce pierderi de performanta. Cheia este multithreading-ul.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

61
Coal

Nici un procesor dual-core nu ar putea sa functioneze cu software neoptimizat. Primul program, care ruleaza constant pe oricare PC, este sistemul de operare. Daca acesta nu este optimizat pentru multithreading, atunci cel de-al doilea core va ramane inactiv. Drept urmare, nu incercati sa utilizati un dual-core cu MS-DOS sau Windows 95, 98 sau Me, pentru ca veti pierde puterea de calcul suplimentara data de al doilea core. Windows 2000, XP, 2003 si oricare distributie de Linux pot sa beneficieze de pe urma mai multor procesoare. In plus, programele care ruleaza pe aceste sisteme trebuie, de asemenea, sa fie optimizate. Intel a propus tehnologia HyperThreading, care umple golurile de procesare ale unui procesor single-core prin falsificarea unui al doilea procesor. Introducerea acestei tehnologii a accelerat optimizarea aplicatiilor standard pentru Windows pentru multithreading. Desi, pentru moment, Intel nu a scos pe piata procesoare dual-core HyperThreading, acestea vor putea rula 4 (!) thread-uri simultan, utilizand la maxim puterea de calcul a procesorului. Dual-core este doar inceputul . Dupa cum va puteti inchipui, acesta este doar inceputul unui drum. Intel pregateste deja un procesor four-core (patru core) pentru servere. Acesta va intra pe piata in 2007. AMD nu ramane in urma si lucreaza si el la un procesor quad-core. Mai departe, planurile Intel scot la iveala un procesor eight-core (Yorkfield) pentru 2008, in timp ce declaratiile AMD sunt mai putin specifice: compania va trece la procesoare cu mai mult decat doua core in 2007. Avantajele procesorului dual-core In cazul arhitecturii single-core exista mai multe optimizari cu scopul de a creste viteza de executie a unui program si vizeaza, de obicei, paralelismul la nivel de instructiune , ce presupune executarea simultana a cat mai multor instructiuni. Acest lucru este posibil atata timp cat o instructiune nu depinde de rezultatul alteia ce se doreste executata in paralel. In cazul arhitecturii multi-core se urmareste optimizarea
paralelismului la nivel de thread . Un thread este un fir de executie al unui program,

program care poate avea mai multe fire de executie, fiecare cu setul sau de instructiuni ce pot fi si ele rulate in paralel. Viteza unei arhitecturi multi-core depinde de modul in care sunt scrise programele si de compilatorul care furnizeaza date procesorului. Ca specific al arhitecturii multi-core, fiecare nucleu executa un flux independent de

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

62
Coal

instructiuni din cadrul unei zone comune de memorie. Continutul acestei zone este administrat prin arbitrare, in functie de continutul memoriei cache a fiecarui nucleu. Nivelurile de cache pentru fiecare nucleu se justifica prin structura procesoarelor actuale, optimizate pentru cresterea latimii de banda a interfetei cu memoria. Fara aceste niveluri de cache locale, fiecare nucleu ar rula samaximum jumatate din potential. Managementul continutului memoriilor cache este realizat prin intermediul unui protocol de asigurare a coerentei datelor stocate. Celelalte avantaje constau in localizarea mai precisa a datelor, comunicarea mai rapida intre unitatile de procesare, economisirea spatiului si consumului de curent si un raport cost/performanta mai bun decat in cazul unui procesor single-core. Intel Core 2 Duo Procesoarele Core 2 Duo sint fabricate folosind doua tipuri de nuclee, anume Conroe si Allendale, care difera intre ele doar prin marimea memoriei cache de tip L2 (2 MB pentru Allendale si 4 MB pentru Conroe). Ele folosesc instructiunile pe 64 de biti (EM64T) si suporta tehnologiile de virtualizare (Intel Virtualization Technology) si de eficientizare a consumului energetic (Intel Enhanced SpeedStep Technology), dar nu si tehnologia Hyper-Threading. Aceste procesoare au nevoie de placi de baza cu soclu LGA775, insa aceste PB nu sint compatibile cu procesoarele Pentium 4 sau Pentium D. Modelele ieftine (E4400, E4300) nu suporta tehnologiile de virtualizare si au frecventa magistralei principale (FSB) de 800 MHz, spre deosebire de modelele mai scumpe la care aceasta este de 1066 MHz. Fiecare nucleu are viteza specificata in tabelul de mai jos, dar asta nu inseamna ca un procesor cu 2 nuclee la frecventa de 1,80 GHz este echivalent cu un procesor cu un singur nucleu la frecventa de 3,6 GHz. O crestere mare de performanta este valabila doar atunci cind procesoarele sint folosite pentru softuri optimizate pentru lucrul cu mai multe nuclee (de ex. programele de grafica 3D). 1.2. Procesoarele Quad-Core (cu 4 nuclee); Un procesor quad-core este un cip cu patru uniti independente numite miezuri care citesc si executa diferite instructiuni in paralel. n cadrul cipului, fiecare nucleu funcioneaz n combinaie cu alte circuite, cum ar fi memoria cache, gestionarea .

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

63
Coal

memoriei, i porturile de intrare / ieire (I / O). Nuclee individuale dintr-un procesor quad-core pot rula mai multe instruciuni, n acelai timp, cre terea vitezei globale pentru programele compatibile cu procesare paralel.
Intel Core 2 Quad

Procesoarele Core 2 Quad sint fabricate pe baza nucleului Kentsfield (compus din doua nuclee Conroe puse unul linga altul) si au frecventa magistralei principale (FSB) de 1066 MHz. Ele folosesc instructiunile pe 64 de biti (EM64T) si suporta tehnologiile de virtualizare ("Intel Virtualization Technology") si de eficientizare a consumului energetic ("Enhanced SpeedStep Technology"), dar nu si tehnologia Hyper-Threading. Aceste procesoare au nevoie de placi de baza cu soclu LGA775. Paragraful 2. Procesoare pentru Intel-Core i; 2.1. Procesoarele din clasa medie; Procesoarele din clasa medie ofera un nivel satisfacator de performanta, la un pret pe care marea majoritate a consumatorilor si-l pot permite. Aceste procesoare au un consum situat in zona 25-35W, ceea ce inseamna ca pot oferi in jur 3 pana la 5 ore de utilizare atunci cand laptopul este alimentat de la baterie (depinde de capacitatea bateriei si modul de utilizare), iar sistemul de racire nu trebuie sa fie unul foarte performant. Producatorii pot astfel sa opteze pentru un sistem de racire mai ieftin care in final se reflecta intr-un pret mai mic al laptopului. Aceste motive fac ca majoritatea lapopturile de pe piata sa foloseasca procesoare din clasa medie. Informatii specifice procesoarelor din clasa medie Cea mai mare imbunatatire pe care o aduc noile procesoare Core i este integrarea completa a procesorului grafic, controlerului de memorie si o parte a chipsetului in procesorul principal. Acest lucru sporeste performantele laptopului printr-o interoperabilitate mai buna a acestor componente. De asemenea producerea procesorului grafic integrat folosind procesul de fabricatie de 32nm si nu 45nm cum era pentru generatia precedenta, permite frecvente mai mari nu numai pentru procesorul grafic dar si pentru procesorul principal. Aceste imbunatatiri, alturi de optimizarile de arhitectura precum si implementarea functiei Turbo 2.0, fac ca in 2011 procesoarele pentru

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

64
Coal

laptopurile din clasa medie sa fie cam cu 20-25% mai performante fata de generatia precedenta si cu 50-60% mai rapide fata de generatia Core 2 de acum 2 ani (2009). 2.2. Procesoarele din clasa de virf/clasa a doua. Clasa de varf este dedicata entuziastilor si profesionistilor. Aceasta categorie ofera performante deosebite, uneori foarte apropiate de cele ale unui desktop de performante medii. Evident ca pretul unui procesor din clasa de varf este destul de mare, incepand de la 320 (cu toate taxele) si urcand pana la 1000 pentru cel mai performant model. De asemenea consumul de curent si caldura degajata sunt in jur de 45W (55W consum max) sau 55W (65W consum max) pentru varful de gama. In continuare, aceste valori reprezinta un consum de curent mic fata de desktop, dar foarte mare in comparatie cu celelalte procesoare pentru laptop. Acesta este si motivul pentru care putine modele de laptop ofera optiunea utilizarii unui astfel de procesor, pe motiv ca necesita o solutie de racire performanta. Mai trebuie mentionat ca datorita consumului relativ mare, laptopul nu va functiona mai mult de doua ore alimentat de la baterie. Durata medie de utilizare folosind alimentarea de la baterie este de 60-90 de minute. De asemenea, laptopurile care utilizeaza astfel de procesoare sunt de obicei mari, avand o greutate de 3-4 kg la care se adauga o sursa de alimentare de minim 120W (cantarind la randul ei in jur 0.20.3 Kg). Cele mai perfomante procesoare din aceasta gama vor contine litera X in denumire. Aceste procesoare nu au o frecventa clar stabilita , adica sunt multiplierunlocked . In mod normal utilizatorul poate, prin BIOS-ul laptopului (meniul cu functiile de baza), sa creasca frecventa procesorului pentru un plus de performanta. Cresterea se poate face cat timp sistemul ramane stabil (nu apar erori in functionare). Spre deosebire de overclocking-ul clasic, atingerea acestui punct critic nu prezinta riscuri pentru procesor sau alte componente ale laptopului. Printr-o usoara reducere a frecventei procesorului, acesta se poate aduce din nou in parametrii normali de functionare, parametrii ce vor oferi oricum performante excelente (mult peste ale altor procesoare din gama).

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

65
Coal

Pana recent, gama de varf a procesoarelor mobile a fost exclusiv ocupata de Intel, motiv pentru care preturile practicate de acest producator sunt inca destul de ridicate. Din mai 2010, AMD a intrat si el pe acest segment de piata cu doua procesoare care vor fi prezentate ulterior. Inainte, vom prezenta oferta din mai cunoscuta gama de varf a celor de la Intel , adica procesoarele din cea de a doua generatie Intel Corei (2011) si cele din prima generatie Intel Core i (2010). A doua generatie Intel Core i7/5/3 (2011)

Figura 25. Un procesor pentru laptopuri din a doua generatie Core "i" Ultima generatie de procesoare Intel pentru laptopuri s-a lansat in ianuarie 2011 si reprezinta a doua generatie de procesore Intel Core i. Printre imbunatatirile aduse de noua platforma se numara trecerea integrala la procesul de fabricatie de 32nm pentru toata gama de procesoare, inclusiv pentru procesorul grafic integrat (pentru generatia precedenta procesoarele grafice integrate erau facute pe 45nm). Astfel noile procesoare ofera performante mai mari fata de generatia precedenta si consumuri mai mici de curent. De asemenea Intel a lucrat la imbunatatirea arhitecturii, astfel incat procesoarele care lucreaza la aceeasi frecventa cu cele din prima generatie Core i (2010) au un plus de performanta de 10-15%. Cea mai mare inovatie pe care o aduce noua platforma este implementarea functiei Turbo 2.0, o varianta imbunatatita a functiei Turbo 1.0. Pentru generatia din 2010, functia Turbo 1.0 functiona astfel (exemplu): la un dual-core (doua nuclee), cand cele 2 nuclee sunt utilizate in mod egal de o aplicatie, ele vor functiona la o viteza de 2.40 GHz. Cand o aplicatie foloseste doar un singur nucleu, procesorul va opri functionare

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

66
Coal

celuilalt si va aloca curentul economisit la nucleul care are nevoie, marindu-i in acelasi timp viteza de la 2.40 GHz la 2.93 GHz. Noua functie Turbo 2.0, nu numai ca variaza frecventa nucleelor in functie de utilizarea lor dar si in functie de caldura pe care o degaja procesorul. Exemplu: la un dual-core (doua nuclee) cu frecventa de baza de 2.50 GHz, daca o aplicatie utilizeaza la maxim ambele nuclee, atunci procesorul va creste frecventa ambelor nuclee de la 2.50 GHz la 3.00 GHz (viteza maxima care poate fi atinsa in acest fel depinde si de sursa de alimentare deoarece frecventele mai mari necesita mai mult curent) iar pe masura ce procesorul se incalzeste, frecventa acestora va scadea treptat pana cand temperatura se stabilizeaza. Astfel, daca sistemul de racire este bun, atunci este foarte probabil ca procesorul sa functioneze in mod constant la frecvente mai mari decat cele de baza. Insa acest lucru nu inseamna ca nu mai are sens achizitionarea unui procesor mai scump care lucreaza la frecvente mai mari. Daca intr-un sistem, un procesor de 2.50 GHz va putea functiona in mod constant la 2.70 GHz, in acelasi sistem si in aceleasi conditii, un procesor de 2.70 GHz va lucra la frecventea mai mari, undeva in jur 2.90 3.00 GHz. In acest fel performantele laptopurilor care folosesc a doua generatie de procesoare Core i depind in mod direct de sistemul de racire. Alte specificatii ale celei de a doua platforme Core i (2011): - Hyperthreading (transformarea unui nucleu de calcul fizic in doua nuclee de calcul virtuale ceea ce sporeste eficienta procesorului) - HDMI 1.4 - Sata III - Intel Gigabit LAN 10/100/1000 integrat in Chipset - Memorii DDR3 de 1333 MHz Informatii specifice procesoarelor din clasa medie Cea mai mare imbunatatire pe care o aduc noile procesoare Core i este integrarea completa a procesorului grafic, controlerului de memorie si o parte a chipsetului in procesorul principal. Acest lucru sporeste performantele laptopului printr-o interoperabilitate mai buna a acestor componente. De asemenea producerea procesorului

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

67
Coal

grafic integrat folosind procesul de fabricatie de 32nm si nu 45nm cum era pentru generatia precedenta, permite frecvente mai mari nu numai pentru procesorul grafic dar si pentru procesorul principal. Aceste imbunatatiri, alturi de optimizarile de arhitectura precum si implementarea functiei Turbo 2.0, fac ca in 2011 procesoarele pentru laptopurile din clasa medie sa fie cam cu 20-25% mai performante fata de generatia precedenta si cu 50-60% mai rapide fata de generatia Core 2 de acum 2 ani (2009).
Platforma Intel Core i7/5/3 (2010)

Printre cele mai importante inovatii aduse de procesoarele pentru laptopuri din seria Core i se afla functia de hyper-threading (transformarea unui nucleu de calcul fizic in doua nuclee virtuale) care sporeste eficienta si performantele procesorului si functia Turbo (performanta nucleelor de calcul variaza cu intensitatea folosirii lor). Functia Turbo a fost implementata pentru ca desi acum aproape toate procesoarele de pe piata au cel putin doua nuclee de calcul, majoritatea aplicatiilor inca nu stiu sa le foloseasca eficient. De aceea functia Turbo schimba automat frecventa diferitelor nuclee de calcul in functie de utilizarea acestora. Exemplu: la un quad-core, cand toate cele 4 nuclee sunt utilizate in mod egal de o aplicatie, ele vor functiona la o viteza de 1.73GHz. Cand o aplicatie foloseste doar un singur nucleu, procesorul va opri functionare celorlalte 3 si va aloca curentul economisit la nucleul care are nevoie, marindu-i in acelasi timp viteza de la 1.73GHz la 3.06 GHz. Procesoarele din generatia Core i sunt fabricate folosind tehnologia de 32nm (generatia precedenta Core 2 folosea 45nm), astfel acestea ofera performante mai mari la un pret ma mic si cu un consum de curent mai mic sau cel putin egal cu cel al generatiei precedente. Drept urmare, generatia de procesoare Core i pentru laptopurile din clasa medie ofera o performanta cu aproximativ 20-25% mai mare fata de procesoare Core 2, pastrand insa acelasi pret. O alta inovatie importanta a procesoarele Core i pentru laptopurile din aceasta
clasa este implementarea unui procesor grafic pe acelasi chip cu procesorul principal. Acest

procesor grafic ofera destula putere de calcul pentru aplicatiile grafice de baza, cum ar fi navigarea pe internet, vizionarea de DVD-uri (nu si Blu-ray) si rularea unor jocuri mai vechi sau mai putin pretentioase.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

68
Coal

Figura 26. Un procesor i7 pentru laptopurile din clasa medie (stanga) si un procesor Core 2 din 2008 tot pentru acelasi gen de laptopuri (dreapta). Se poate observa ca procesorul i7 este mai mare, in mare parte datorita procesorului grafic (chipul mai mare din stanga pe care scrie Intel). Imbunatatiri specifice aduse clasei de varf Toate procesoarele din clasa de varf sunt facute folosind procesul de fabricatie de 32nm. Acest lucru permite frecvente mult mai mari fata de generatia precedenta, fara insa a modifica consumul de curent, caldura degajata si pastrand aceleasi preturi. Astfel procesoarele Core i7 quad-core din 2011 au in medie frecvente cam cu 500 MHz mai mari fata de cele din 2010. Acest lucru, combinat cu imbunatarile de arhitectura si functia Turbo 2.0, fac ca noile procesore sa fie cu peste 50% mai performante fata de generatia precedenta. De asemenea, trebuie mentionat ca acum toate procesoarele, inclusiv cele din clasa de varf au integrate in procesorul principal si un procesor grafic care ofera performante foarte bune. In plus, memoria RAM pe care o utilizeaza laptopul foloseste acum frecvente de 1600 MHz fata de 1333 MHz pentru generatia precedenta. Toate procesoarele din gama de varf folosesc placi de baza cu chipsetul HM67. 2.2.1 Intel Core i3.
Seria Core i3. Un procesor i3 are 2 nuclee.

Linia de procesoare Intel Core i3 a fost ntotdeauna o optiune de buget. Aceste procesoare ramn dual-core, spre deosebire de restul liniei, care este alcatuita din procesoare quad core. Procesoarele Intel Core i3, de asemenea, au multe caracteristici limitate. Principala caracteristica pastrata de procesoarele Core i3 este Turbo Boost, o caracteristica de

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

69
Coal

overclocking dinamic disponibila pe cele mai multe procesoare Intel. Acest lucru, alaturi de designul dual-core, se adauga la diferenta de performanta dintre procesoarele Core i3, i5 si i7. Procesoare Core i3 nu au, de asemenea, tehnologia Intel vPro virtualizaton si tehnologia de accelerare a criptarii AES. Aceste caracteristici va vor dezavantaja putin ca utilizator mediu, si oricum se potrivesc si utilizatorilor din intreprinderi. Totusi, lipsa acestor caracteristici ar trebui sa fie pastrata in minte. O caracteristica pe care Core i3 o are -si i5 nu este Hyper-Threading. Aceasta este tehnologia Intel de duplicare logica a nucleelor care permite fiecarui nucleu fizic pentru a fi utilizat ca doua nuclee logice. Rezultatul acestui fapt este ca Windows va afisa un procesor dual-core Core i3 ca si cum ar fi un quad-core. In cele din urma, Core i3 are procesorul grafic integrat limitat la o viteza maxima de clock de 1100 MHz si toate procesoarele Core i3 au IGP seria 2000, care este limitat la 6 nuclee de executie. Acest lucru va duce la performante usor mai mici decat cu un IGP normal, dar diferenta este mica in multe situatii. 2.2.2 Intel Core i5. Seria Core i5. Un procesor i5 are 2 sau 4 nuclee (n functie de model). Intel a folosit doua linii diferite pentru a imparti brandul Core i5, dintre care una era dual-core si una era quad-core. Acest lucru a fost putin confuz pentru cumparatori. Din fericire, acum toate procesoarele Sandy Bridge Core i5 sunt procesoare quad-core, toate au Turbo Boost dar nu dispun de Hyper-Threading. Cele mai multe dintre procesoare Core i5, in afara de seria K, au acelasi seria IGP 2000, cu o viteza maxima de clock de 1100 MHz si sase nuclee de executie. In lupta dintre cele 3 procesoare, procesorul Core i5 este acum optiunea principala, indiferent de produsul pe care il cumparati. Singura diferenta substantiala intre optiunile Core i5 este viteza de clock, care variaza de la 2,8 GHz la 3,3 GHz. Evident, produsele cu o viteza de clock mai mare sunt mai scumpe decat cele care sunt mai lente. 2.2.3 Intel Core i7. Seria Core i7. Un procesor i7 are 2, 4 sau 6 nuclee (n functie de model).

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

70
Coal

Si seria Intel Core i7 a fost putin curatata. De fapt, aceasta a fost curatata poate prea mult, deoarece in acest moment Intel ofera doar cinci processoare desktop Sandy Bridge Core i7, modelele fiind:i7-2600, i7-2600S, i7-2600K, i7-2700K, i7-3820

Figura 27. Procesorul Intel Core i7 cu 6 nuclee fizice/12 nuclee logice. Aceste procesoare sunt practic identice cu Core i5. Ele au viteza de clock de baza cu 100 MHz mai mare, care este neimportanta in majoritatea situatiilor. Diferenta reala este adaugarea tehnologiei Hyper-Threading pe Core i7, ceea ce inseamna ca procesorul va aparea ca un procesor 8-core in Windows. Acest lucru imbunatateste performanta si poate duce la o crestere substantiala daca utilizati un program care este capabil sa profite de cele 8 thread-uri. Desigur, cele mai multe programe nu pot profita de 8 thread-uri. Aceste procesoare sunt concepute pentru cei din intreprinderele mari sau cei care folosesc aplicatii avansate de editare video programe de redare 3D, programe de editare foto, precum si programe stiintifice. Un utilizator mediu este putin probabil poata beneficia din plin de functia Hyper-Threading. IGP-ul pe procesoare Core i7 poate ajunge la viteza de clock maxima de 1350 MHz. Asa cum am spus mai inainte aceasta diferenta este in mare parte neimportanta atunci cand se masoara n performanta din lumea reala.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

71
Coal

Concluzii Am nevoie de un Dual/Quad core sau un i3/i5/i7? Motivul pentru care cititi acest ghid este pentru a afla ce tip de procesor aveti nevoie. Ca si n cazul tuturor componentelor computerului, tipul de procesor de care aveti nevoie depinde de nevoile dumneavoastra, cat timp doriti sa folositi computerul, precum si bugetul dumneavoastra. Iata o defalcare foarte simpla a ceea ce ar trebui sa caute sa cumperati n functie de necesitatile dumneavostra. Toate sugestiile presupun veti cumpera un PC deja montat (astfel nct nu va trebui sa va faceti griji in legatura cu placa de baza si specificatiile RAM si nu va trebui sa va faceti griji cu privire la compatibilitatea de upgrade). Daca: -Navigati pe Internet, verificati e-mailul si jucati un joc flash ocazional (cum ar fi Farmville): Cumpara-ti un netbook single core sau un desktop (si sa nu cheltui mai mult de 350$). -Folositi procesoare de text, calcul tabelar, ascultati muzica de multe ori si vizionati filme, achizitionati un dual core sau i3. -Jucati jocuri ocazional si sunteti multumiti cu rezolutie mai mica si grafica de calitate inferioara (sugestia mea presupune procesorul grafic de pe PC-ul pre-construite se va potrivi pentru sugestiile procesorului), vizionati filme HD, etc., achizitionati un dualcore sau i5. -Daca veti face editari grafice, creati muzica, programati (si compilati), vizionati filme HD, si va plac jocurile cu grafica ridicata, achizitionati un quad core, i5 sau i7. -Daca va place sa folositi cele mai bune hardware-uri si sa se jucati jocuri la rezolutii foarte mari, achizitionati un i7 Extreme.

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

72
Coal

Bibliografie 1. http://ru.scribd.com/doc/55465805/MultiCore-Architecture Multi-Core Architecture; 2. http://ru.scribd.com/doc/14126566/18/Familia-de-procesoare-x86 Elemente de arhitectura a sitemelor de calcul; 3. http://ru.scribd.com/doc/24616588/Structura-microprocesorului Structura Microprocesorului; 4. ftp://ftp.support.lotus.com/eserver/benchmarks/wp_Dual_Core_072505.pdf Procesorul Dual-Core. Performante 5. https://computing.llnl.gov/tutorials/linux_clusters/ Quad-Core architecture;

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

73
Coal

6. http://www.cse.wustl.edu/~jain/cse567-11/ftp/multcore/index.html Procesorul Multicore 7. http://www1.cse.wustl.edu/~jain/cse567-11/ftp/multcore/index.html 8. http://m.agora.ro/stire/intel-ofera-informatii-despre-procesorul-intel-xeon %C2%AE-%E2%80%98nehalem-ex%E2%80%99?device=mobile Procesorul Intel Xeon; 9. http://en.wikipedia.org/wiki/Nehalem_(microarchitecture) Arhitectura Nehalem; 10. http://www.laptopulmeu.net/2011/noile-tehnologii-intel-i3-i5-i7-tu-ce-alegi/ Noile tehnologii Intel;

Mod Coala N. Document

Semnat

Data

UTM FRT TLC 2012 102 008 NE


TL 021.007 N.E

74
Coal