Sunteți pe pagina 1din 15

PROCESORUL Procesorul este una dintre cele mai importante componente a unui calculator, fiind cel care stabilete

cine, ce i cnd sa fac. Deoarece se pot obine performane destul de bune i cu un procesor care nu este vrf de gama, ne poate da falsa impresie c el nu are un rol foarte important. De exemplu,un mptimit al jocurilor va pune un accent mai mare pe placa video dect pe procesor. Totul depinde de destinaia calculatorului, acest lucru nsemnnd c nu avem mereu nevoie de cel mai performant procesor. om ntlni des denumirea de !P" n ca#ul procesorului $!entral Processing "nit %, sau "!P, aceasta fiind traducerea n limba romn $"nitate !entral de Prelucrare%. INTRODUCERE Produsele dual si multi&core sunt concepute prin includerea a doua sau mai multe core&uri complete de !P" $unitate centrala de procesare% in interiorul unui singur procesor, care permite astfel gestionarea simultana a mai multor activitati."nele modele de procesoare folosesc o memorie cac'e pentru fiecare nucleu, de exemplu ()D dual&core, sau o memorie comun pentru toate nucleele, cum sunt modelele *ntel !ore + Duo acelai cache ,+. Procesoarele care au toate nucleele pe un singur circuit integrat se numesc procesoare monolitice. Procesoarele multi&core i dovedesc eficiena cnd sunt puse n sarcina mai multor t'read&uri.!and se combina cu te'nologia -T, care permite unui procesor sa se pre#inte sub forma a doua procesoare logice, produsele de tipul Pentium Processor .xtreme .dition pot procesa patru apliatii soft/are simultan, utili#and intr&un mod mult mai eficient resurse care, in alte conditii, ar ramane neexploatate. "n procesor multi-core combin dou sau mai multe nuclee $core% ntr&un singur circuit integrat sau mai multe pac'ete de circuite integrate la un loc. "nele modele de procesoare folosesc o memorie cache pentru fiecare nucleu, de exemplu ()D Dual&!ore, sau o memorie comun pentru toate nucleele, cum sunt modelele *ntel !ore + Duo acelai cache ,+. Procesoarele care au toate nucleele pe un singur circuit integrat se numesc procesoare monolitice. Procesoarele multi-core i dovedesc eficiena cnd sunt puse n sarcina mai multor thread&uri. Procesoare Intel Multi-core Ce este un procesor Multi-Core? "n procesor multi&core este compus din doua sau mai multe nuclee independente, fiecare capabil sa procese#e instructiuni individuale. "n procesor dual&core contine doua nuclee, un procesor 0uad&core contine patru nuclee si un procesor 'exa&core contine sase nuclee.

!alculatoare de patru ori mai puternice1 *ntel !orporation a inc'eiat pregatirile initiale pentru demararea productiei de procesoare dual&core si a oferit detalii suplimentare despre planurile sale pentru procesoare multi& core, anuntand inceputul unei noi ere, in care P!&urile vor avea in interior doua sau mai multe 2creiere2. *ntel intentionea#a sa livre#e produse separate dual&core, precum si cipseturi dual&core pentru familiile de procesoare din clasa Pentium,inclu#and procesorul Pentium .xtreme .dition.*ntel are deja in derulare peste #ece proiecte pentru produse multi&core si intentionea#a sa creasca nivelul de calitate al soft/are&ului si solutiilor care permit obtinerea de linii de produse, tools, investitii si programe, pentru a aduce la un nou nivel calitativ design&ul de soft/are. *deea de procesor cu mai multe nuclee este o consecin a efectelor, din punct de vedere al performanei, pe care le are folosirea unui P! cu mai multe procesoare n locul unuia singur. Dar un sistem ba#at pe o plac de ba# multiprocesor devine foarte scump i neatractiv pentru majoritatea utili#atorilor. 3olosirea mai multor nuclee pe aceeai pastil de siliciu permite creterea performanei cu costuri minime, deoarece liniile de comunicare ntre cele dou nuclee sunt mult mai scurte, deci mai rapide, n acelai timp disprnd i necesitatea construirii unei infrastructuri pentru interconectarea nucleelor. *niial, aceast idee era foarte greu de pus n practic din cau#a procesului de fabricaie a cip&urilor, ce presupunea creterea dimensiunilor pastilei de siliciu prin folosirea unui numr mai mare de tran#istori, implicit i a consumului. 4dat cu micorarea dimensiunilor tran#istorilor a devenit posibil introducerea unui numr mai mare de tran#istori n acelai spaiu pe pastil, pstrndu&se n acelai timp i caracteristicile termice. Primul procesor dual-core a fost conceput i construit de *5) n anul +666, odat cu lansarea celei de&a patra generaii de procesoare Po/erP!1 Po/er 7. (cesta aducea, n premier, mai multe nuclee pe aceeai pastil, fiind vorba n fapt de dou nuclee pe 87 bii Po/erP! (9. )emoria cac'e ,evel + era mprit n trei pri egale, fiecare nucleu avnd acces la oricare dintre ele. De ce am nevoie de mai multe nuclee? :ucleele multiple pot fi folosite pentru a rula doua programe deodata si atunci cnd un program mai intensiv se executa $( scan, conversie video, !D ripping, etc.% puteti utili#a alt nucleu pentru a rula bro/ser&ul dvs. $de exemplu pentru a verifica adresa dvs. de email%. )ai multe nuclee vor straluci cu adevarat atunci cnd utili#ati un program care utili#ea#a mai mult de un nucleu $numit Paralleli#ation% pentru a mbunatati eficienta programului. Programe precum soft/are de grafica, jocuri etc. pot rula mai multe instructiuni n acelasi timp si sa livre#e mai rapid re#ultatele. Deci, daca utili#ati soft/are&uri care folosesc procesorul intens, nucleele multiple va vor oferi probabil o experienta mai buna atunci cnd utili#ati P!&ul. Daca utili#ati P!&ul dvs. pentru a verifica e&mailurile si pentru a privi un video oca#ional, c'iar nu aveti nevoie de un procesor multi&core.

(a cum am v#ut, proiectanii tind s ng'esuie din ce n ce mai multe circuite peaceeai pilul de siliciu. 4 evoluie natural este de a face saltul de la mai multe procesoare legate printr& o magistral comun $ca n ca#ul sistemelor cumultiprocesoare simetrice, pe care le&am descris n P! ;eport din noiembrie <==>%n procesoare strns cuplate, pe aceeai pilul de siliciu.De fapt, astfel de sc'eme exist deja1 procesorul pentru mainframes *5) 9?@=6 aredou nuclee identice, care execut sincron acelai program1 n ca#ul n carere#ultatele nu sunt identice se execut o excepie i programul este reluat. (cestaeste un exemplu n care mai multe resurse sunt folosite pentru o fiabilitate sporit,dar *5) a anunat c viitorul lor procesor AB va conine dou nuclee independente pe aceeai pilul, permind reali#area unor sisteme multi& procesor cu un singur cip. )ultit'reading 4 evoluie natural ar fi spre a exploata alte forme de paralelism dect cel la nivelde instruciune $*,P%. !alculatoarele moderne exploatea# excelent paralelismul lanivel de proces, dar exist forme intermediare, i trebuie s ne ateptm s vedemar'itecturi din ce n ce mai orientate spre acestea1 Paralelism la nivel de bucl1 n care iteraii succesive ale unei bucle suntexecutate n paralel. Paralelism la nivel de t'read C despre multit'reading am scris un articolamplu n P! ;eport din ianuarie <==D. .xist o sum de inovaii ar'itecturale legate de aceste te'nologii, nc ne&integraten produse comerciale. 9 privim cteva dintre ele1 T'read&level data speculation1 este o metod de a implementa paralelismulla nivel de bucl, lansnd cte un t'read pentru fiecare iteraie a buclei. Deexemplu, proiectul 9T()Pede de la "niversitatea !arnegie )ellon, condusde profesorul Todd )o/rE explorea# aceast alternativ$'ttp1??///.cs.cmu.edu? Ftcm?9T()Pede.'tml%. 9imultaneous multi&t'reading , propus la universitatea din 9eattle n <==B.(ceast te'nologie menine starea fiecrui t'read n 'ard/are i permite comutarea rapid ntre t'read&uri. Putem distinge dou variante, ca n caseta2)ultit'reading21 ntr&una din variante, n fiecare ciclu de ceas putemexecuta instruciuni dintr&un alt t'read, i alta, n care n fiecare ciclu,instruciuni din t'read& uri diferite candidea# pentru uniti funcionalediferite.(vantajul unor astfel de sc'eme este c, dac un t'read execut operaii care aunevoie de mult timp $de exemplu accese la memorie%, putem alte t'read&uri caresunt gata de execuie, folosind mai eficient unitile funcionale ale procesorului. Dincolo de le ea lui Moore

Gn fine, voi nc'eia acest articol cu o privire extrem de sumar asupra unor proiectede cercetare ambiioase, care ncearc s priveasc nu numai n viitorul imediat, cis anticipe#e peisajul calculatoarelor peste #ece ani i mai mult. ,a acea dat barierele impuse de fi#ic vor fi atinse, aa c trebuie s ne ateptm la o ncetinirea vertiginoasei creteri de performan. Dar c'iar i aa, numrul uria de resurse puse la dispo#iie trebuie s fie folosit cumvaC iat unele posibiliti1 IR!M" Smart Memor# Proiectul *;() $ *ntelligent ;() % de la 5erHeleE este condus de David Patterson$'ttp1??iram.cs. berHeleE.edu?% i i propune integrarea te'nologiilor de fabricaie a memoriilor i procesoarelor $la ora actual liniile de fabricaie sunt completdiferite%. *;() ncearc s evite disparitatea de acces la memorii mpingnd o multitudine de procesoare micue printre celulele de memorie, unde pot lucra independent."n proiect foarte asemntor este cel de la 9tanford, al profesorului )arH -oro/it#, numit 9mart )emories $'ttp1??velox. stanford.edu?smartImemories?%.(ceste proiecte ncearc s depeasc problema accesului lent la memorie prindistribuirea unitilor de procesare printre memorii, astfel nct accesul s fie paralel i rapid. De asemenea, astfel de sc'eme, n care calculul este distribuit nmulte uniti independente, face ca impactul 2srmelor lungi2 s fie redus. R!$ Proiectul ;(J de la )*T $'ttp1??///.cag.lcs.mit.edu?ra/?% atac problema dintr&un cu totul alt punct de vedere1 maina ;(J const din foarte multe procesoare,relativ simple, construite pe aceeai pilul de siliciu. (ceste procesoare cooperea# pentru a executa o singur aplicaie, care este paraleli#at automat de compilator. Ima ine "n proiect foarte interesant este *magine $'ttp1??cva.stanford.edu?imagine?cvaIimagine.'tml%, de#voltat la universitatea 9tanford sub conducerea luiJilliam DallE. Proiectul, orientat mai degrab pe procesarea de semnal, propuneun nou model de programare, orientat spre multimedia, n care paralelismul datelor este fcut explicit prin noiunea de flux $ stream%. De exemplu, pentru a afia scenecomplicate pe ecran, prelucrarea transform datele dintr&un flux de obiecte ntr&unflux de poligoane, care devin un flux de triung'iuri, apoi un flux de pixeli i aamai departe. PipeRenc% &i 'rass Gn fine, menione# dou proiecte care ncearc s mbine 'ard/are&ul reconfigurabil cu procesoarele tradiionale1 proiectul 5rass de la 5erHeleE$'ttp1??'ttp.cs.berHeleE. edu?projects? brass?%, condus de Ko'n Ja/r#EneH, i proiectul Pipe;enc' de la !arnegie )ellon, condus de 9et' Aoldstein i -erman9c'mit $'ttp1??///.ece. cmu.edu?researc'?piperenc'?%.(m vorbit alt dat pe larg despre 'ard/are& ul reconfigurabil $P! ;eport din iulie<==>%. 3iecare poart universal poate fi programat s execute orice

funcielogic, iar comutatoarele pot cupla i decupla srmele $ve#i figura2-ard/arereconfigurabil2 %. Porile universale se pot implementa din mici celule ;(). (stfelse pot sinteti#a uniti funcionale extrem de complexe, care pot opera uneori multmai eficient dect un procesor de u# general. !vanta(ele procesoarelor multi-core Gn ca#ul ar'itecturii single&core exist mai multe optimi#ri cu scopul de a crete vite#a de execuie a unui program i vi#ea#, de obicei, paralelismul la nivel de instruciune, ce presupune executarea simultan a ct mai multor instruciuni. (cest lucru este posibil atta timp ct o instruciune nu depinde de re#ultatul alteia ce se dorete executat n paralel. Gn ca#ul ar'itecturii multi&core se urmrete optimi#area paralelismului la nivel de t'read. "n t'read este un fir de execuie al unui program, program care poate avea mai multe fire de execuie, fiecare cu setul su de instruciuni ce pot fi i ele rulate n paralel. ite#a unei ar'itecturi multi&core depinde de modul n care sunt scrise programele i de compilatorul care furni#ea# date procesorului. !a specific al ar'itecturii multi&core, fiecare nucleu execut un flux independent de instruciuni din cadrul unei #one comune de memorie. !oninutul acestei #one este administrat prin arbitrare, n funcie de coninutul memoriei cac'e a fiecrui nucleu. :ivelurile de cac'e pentru fiecare nucleu se justific prin structura procesoarelor actuale, optimi#ate pentru creterea limii de band a interfeei cu memoria. 3r aceste niveluri de cac'e locale, fiecare nucleu ar rula la maximum jumtate din potenial. )anagementul coninutului memoriilor cac'e este reali#at prin intermediul unui protocol de asigurare a coerenei datelor stocate. !elelalte avantaje constau n locali#area mai precis a datelor, comunicarea mai rapid ntre unitile de procesare, economisirea spaiului i consumului de curent i un raport cost?performan mai bun dect n ca#ul unui procesor single&core. Ce limitea)a vite)a de procesare Procesoarele au atins o limita te'nologica pe la vite#a de @A'#. *ntr&o cuanta de timp atat de mica $<s?@.666.666.666%, lumina $si orice alt semnal% poate parcurge doar aproximativ <6cm, ordinul de marime al unui procesor. Procesorul nu poate functiona mai repede pentru ca atat ii ia semnalului electric sa faca o tura prin procesor. Procesorul reordonea#a executia unor instructiuni care nu depind unele de altele, pentru a putea

executa mai multe operatii intr&o singura cuanta de timp, in paralel. De multe ori insa operatia urmatoare depinde de re#ultatul celei precedente, deci nu se poate lansa a doua operatie pana nu se termina prima.

Pentru a creste performanta, s&a inceput crearea procesoarelor multi&core, care incearca sa imparta

procesarea pe mai multe unitati procesor. Din cau#a interdependenti intre operatii, un program rulat pe + procesoare obtine de obicei mult sub dublul performante. "n program care are doar un fir de executie $t'read% obtine pe doua procesoare sub <6L in plus fata

de a rula pe un singur procesor. Pe de alta parte se pot rula doua programe in paralel la aceeasi vite#a cu a le rula pe fiecare singure pe un procesor. .ste vorba de programe care consuma mult !P" fiecare, nu programe care stau desc'ise fara sa faca nimic. )emoria ;() functionea#a cam de <66 ori mai lent decat procesorul, la fel cum -ard&Discul este

mult mai lent fata de ;(). Pentru ca procesorul sa poata executa instructiuni la vite#a maxima, exista cac'e&ul ,< care functionea#a aproximativ la vite#a procesorului. !ac'e&ul este o fereastra spre memorie. .l incarca #ona de memorie care este in executie, iar cat timp

executia nu iese din acea #ona procesorul poate functiona la vite#a maxima. *mediat ce executia iese din fereastra de cac'e, procesorul asteapta ec'ivalentul a peste <66 de

instructiuni sa se incarce o noua bucata din memorie in cac'e. De aceea un cac'e ,< mai mare inseamna o vite#a mai mare de executie. !ac'e&ul ,< este foarte scump, deci mic. "nele procesoare au si cac'e ,+ $de <6 ori mai lent si de <6 ori mai mare?ieftin%. .xista si cac'e ,@ care este doar de aproximativ + ori mai rapid decat memoria ;(), dar care ajuta

sistemele multiprocesor sa nu congestione#e accesul la memoria ;(). ite#a de executie a unui program nu mai depinde atat de tare de frecventa procesorului, cat de

numarul de accesari ale memoriei pe care nu le gaseste in cac'e. (lgoritmi complexi incearca sa pre&incarce in cac'e memoria necesara in viitorul apropiat, totusi in multe ca#uri nu reuseste. !'iar si un BL de 2cac'e miss2 $accesari ale memoriei in afara #onei cac'e% scade performanta

drastic. *n loc ca <66 operatii sa dure#e <66 cuante timp, vor dura =BMBN<66, deci aproape de 8 ori mai mult decat ar dura executate <66L in cac'e. 9&ar putea ca un cac'e ,< mai mare sa ajute mai mult decat arata benc'marH&urile, intrucat programele benc'marH sunt relativ mici, putand sa incapa complet in cac'e. ite#a cu care rulea#a un program tine foarte mult de felul in care sunt aranjate instructiunile in

memorie. !ompilatoarele si masinile virtuale incearca sa ajute la aceasta operatie. 9alturile in structuri mari de date si 2indirectarile2 produc totusi foarte multe salturi in afara #onei de memorie incarcate in cac'e, deci scad performanta. Programarea orientata pe obiecte $!MM% tinde sa genere#e multe obiecte distribuite in #one de

memorie ne&alaturate, deci un cod care iese mai des din cac'e. Programarea ! foloseste in general functii mai

mari, indirectari mai putine, #one de date mai compact distribuite, deci are sanse sa genere#e un cod care foloseste cac'e&ul mai eficient. (tunci cand procesorul asteapta dupa memoria ;(), procesorul va arata incarcat <66L, desi el de

fapt ... sta degeaba. .ste aproape inposibil de detectat impactul iesirilor din cac'e asupra vite#ei, altfel decat prin teste cu diferite procesoare.

!r%itectura multi-core Procesoare multi&core poat fi clasificate n func ie de pre#en a coeren ei cac'e sprijin ntre nuclee. )omentan sunt procesoare cu un astfel de sprijin si fr ea. )etoda de comunicare ntre nuclee1 5us partajat de reea $plas% pentru punct&la&punct retea cu comutator memorie cac'e totala

Constran eri *i)ice Problemele cu care se confrunta proiectantii de microprocesoare nu sunt insurmontabile, insa solutiile sunt din ce in ce mai greu de gasit. Printre altele, exista doua lucruri importante care limitea#a microprocesoarele1 decalajul transmisiei in interiorul cipului si temperatura. Decalajul se datorea#a datorita firelor ce conectea#a toate tran#istoarele intr&un cip. O3ireleP sunt incredibil de mici. "n cip repre#inta practic un grup de tran#itoare conectate intre ele, iar un tran#istor functionea#a precum un intrerupator. (tunci cand un tran#istor isi sc'imba starea din pornit in oprit sau invers, incarca firul ce este legat de urmatorul tran#istor. *nsa aceste operatiuni necesita timp. !u cat OfirulP este mai lung, cu atat va dura mai mult.

;educerea dimensiunilor are o consecinta importanta1 traseele pe care trebuie sa le parcurga curentul electric intre componente sunt mai scurte, deci se pot parcurge mai rapid. Proiectantii au putut face astfel procesorul sa functione#e cu un ceas mai rapid. *nsa nu doar distanta dintre doi tran#istori e singura problema1 comutarea intre doua stari a tran#istorului necesita si ea timp. (ceasta limitea#a vite#a unui microprocesor. )ai mult, tran#istorii sunt legati in lant, asadar, cu fiecare tran#istor, timpul se mareste. 4 alta problema ce limitea#a vite#a unui microprocesor este temperatura ridicata. De fiecare data cand tran#istorii isi sc'imba starea, comuta de pe 6 pe < sau invers, pierd putina electricitate. (ceasta creea#a caldura, si cu cat rulea#a mai rapid, cu atat generea#a mai multa caldura. "n cip care se supraincal#este se bloc'ea#a sau cau#ea#a erori. !alculatorul poate Oing'etaP pentru mici perioade de timp, se poate restarta automat, sau pot aparea asa numitele 594D $5lue 9creen of Deat'% pe sistemele de operare Jindo/s. )icroprocesoarele au ajuns sa contina un numar impresionant de tran#istori, ajungand pana la cateva sute de milioane. (stfel de circuite sunt foarte greu de verificat si testat. !'eltuielile pentru verificare si testare c'iar ajung sa depaseasca pe cele de proiectare si de#voltare. )iniaturi#area nu va putea si ea continua in acelasi ritm exponential. 9&ar ajunge la necesitatea de a reali#a un tran#istor mai mic decat un atom, ceea ce e imposibil. *nsa pana acolo, mai sunt alte probleme de confruntat. )arH -oro/it#, profesor la "niversitatea 9tanford a scris un articol intitulat O iitorul sarmelorP si in care porneste de la caracteristicile electrice ale semiconductorilor si anali#ea#a o serie de scenarii posibile pentru te'nologiile de fabricatie. Textul ia in considerare mai multi factori precum geometria firelor, capacitati si resistente, disiparea puterii, etc. )arH -oro/it# a ajuns la o conclu#ie interesanta, cum ca nu firele ar constitui un impediment in functionarea sa corecta. 9uprafata circuitelor nu a sca#ut, din cau#a ca designerii au adaugat noi module, insa o problema sunt firele care traversea#a mai multe module. ,ungimea acestora ramanand constanta, in milimetri. 4ri, cum vite#a ceasului creste mereu, asta inseamna ca semnalele electrice nu mai au timp sa parcurga firele de la un capat la altul. !ircuitele viitorului nu vor mai putea comunica prin semnale globale1 pur si simplu va fi imposibil pentru un fir sa uneasca diferite parti ale circuitului. Pe masura ce tran#istorii sunt tot mai mici, firele sunt mai subtiri si consumul de putere este mai mare, circuitele sunt mai sensibile la #gomot, fie el termic, din mediu sau probabil in curand, c'iar efecte cuantice. 3enomenele de transport din semiconductori pe care se ba#ea#a tran#istorul sunt fenomene statice1 ori cand dimensiunile devin atat de mici incat numai cativa electroni produc semnale, statistica nu mai operea#a iar exceptiile incep sa apara. Performanta microprocesoarelor s&a situat pe o curba exponentiala, iar miniaturi#area si te'nicile folosite au contribuit in mod egal la aceste spectaculoase cresteri. *nsa aceasta crestere se apropie de sfarsit datorita

unor bariere fi#ice fundamentale. (sta pana la aparitia unor noi generatii de procesoare ce vor depasi aceste probleme.

Microar%itecturile procesoarelor cu mai multe nuclee

Penr#m Ne%alem $estmere Sand# 'r#d e Iv# 'rid e

Microar%itectura Ne%alem a *irmei Intel

Pe numele de cod Q:e'alemR, noua ar'itectura inglobea#a variante imbunatatite ale unitatilor de executie din ar'itectura !onroe, ase#onate cu multiple aditii pe care le voi expune maitar#iu dar din care amintesc cac'e&ul pe @ nivele sau controller&ul de memorie integrat. Daca PenrEn avea doua pastile a cate doua nuclee pe acelasi suport organic pentru a oferi un totalde 7 procesoare per socHet, ec'ivalentul din generatia :e'alem va veni cu 7 nuclee integratein aceeasi pastila si dupa cum unii prefera sa il numeasca, va fi 0uad&core nativ. (s vrea mai intai sa vedem din punct de vedere fi#ic cum e posibila o ar'itectura atat decomplexa. )odelul QticH&tocHR pe care eminentele din 9anta !lara si l&au propus a debutat incel mai serios mod anul trecut, odata cu lansarea procesului de fabricatie pe 7Bnm. Din punctde vedere al performantelor momentul nu a fost crucial, insa o introspectiva in sc'imbarilete'nologice aduse de generatia PenrEn ne ajuta sa punem mai bine in perspectiva evolutiileviitoare.

TicH&ul (stfel, micsorarea dimensiunii tran#istoarelor de la 8Bnm la 7Bnm a fost posibila doar datorita unei cuceriri a stiintei mult mai importante, adusa la cunostinta lumii intregi subnumele de Q'ig'&H metal gateR. De aproximativ @6 de ani toate aparatele electronice folosesctran#istoare )49&3.T $sau mai corect, *A&3.T% construite cu aceleasi materiale, mai precisstrat i#olator din oxid de siliciu si poarta din polisilicati. Te'nologia a ajuns insa la o limita si miniaturi#area c'iar si la 8Bnm a fost o reala problema, primele revi#ii confruntandu& se cu probleme termice grave cau#ate de curentii de scurgere. . si normal, tran#istorii sunt atat de mici incat incap 766 de milioane intr&un centimetru patrat de c'ip, iar stratul i#olator de oxid de siliciu a ajuns la o grosime de maxim <66 de diametre atomice. a dati seama cum electronii voiosi mai sar gardul in partea cealalta, facand ca la inceput mai bine de jumatate din puterea consumata de un procesor pe 8Bnm sa fie doar QleaHage currentR, iar spre rafinarea te'nologiei valorile sa coboare sub @6L. *n contextul asta, o noua te'nologie de fabricare se impunea si aici faptul ca esti un gigant economic care isi permite sa c'eltuie miliarde de dolari pe researc' S development se pare ca ajuta. Dupa ani de cercetare si testare de sute de materiale si combinatii, baietii de la *ntel au stabilit ca dioxidul de siliciu si polisilicatii trebuie sa se retraga la pensie si in locul lor sa treaca la treaba portile metalice si i#olatorii ba#ati pe 'afniu. )i& ar placea sa va spun exact despre ce metal e vorba si cineva sa imi confirme ca i#olatorii sunt mai exact silicati nitriti de 'afniu $-f9i4: T pentru fanii lui )endeleev%, macar pentru a avea subiect de discutie la coada la !arrefour, insa companiile astea mari se pare ca au un obicei prost in a nu imparti secretele industriale cu restul lumii. !ert e insa ca in loc de <66 de diametre atomice acum se pot folosi intre @ si <6, iar la aceeasi grosime a i#olatorului curentii de scurgere sunt de <66de ori mai mici. Destul de impresionant, dupa parerea mea. TocH&ul Desc'i#andu&si astfel o cale noua, urmatorul pas e evident evolutia ar'itecturala a procesoarelor astfel incat sa beneficie#e din plin de avantajele create. 9i cum paralelismul etrendE in +66>, nu vom vedea un procesor mult mai rapid, ci mai degraba mai versatil si maieficient. :u putem nega pre#enta unor optiuni ce au fost introduse de ()D da&a lungultimpului, cum ar fi controllerul de memorie integrat sau sistemul de po/er

management cetratea#a fiecare nucleu separat. 9i parca ;onaH 9ing'al, liderul ec'ipei ce a creat :e'alem ava#ut produsul concurentei si s&a ambitionat sa arate ca poate face mai bine.;e#ultatul e unul impresionant din foarte multe puncte de vedere si asta e mare lucru mai ales pentru cei care au avut scara de valori data peste cap odata cu lansarea ar'itecturii !onroe.Daca pana acum existau niste piedici te'nologice, acum faptul ca se pot ing'esui pe o pastilade siliciu inspre un miliard de tran#istori odata cu trecerea la procesul de fabricatie pe 7Bnm permite in sfarsit ca puternica masina de calcul care este nucleul de executie !onroe sa fie pusa la munca exact asa cum trebuie, fara limitari de band/idt' cau#ate de bus&ul invec'itte'nologic de ceva vreme. 9i ca sa nu ne mai invartim in jurul co#ii, sa vedem mai exact care sunt punctele importante ale noii ar'itecturi1 & 0uad&core si octo&core native & controller de memorie DD;@ integrat & o noua conexiune point&to&point, denumita QUuicH Pat' *nterconnectR $UP* pe scurt% & sistem de po/er management inteligent, independent pe fiecare nucleu, Qpo/er gatingR & turbo mode& ,@ cac'e s'ared & accelerator grafic on&pacHage & 'Epert'reading & o imbunatatire cu @@L a numarului de micro&ops facute in&flig't fata de nucleele !onroe & branc' prediction si T,5&uri pe cate doua nivele. Procesoare :e'alem contin cel putin D@< de milioane de tran#istori, <6L mai putin dect VorHfield procesor. Dar dimensiunea de cristal a crescut semnificativ n comparaie cu predecesorul su, cu +<7 i +8@ mm+. 9i tot in tendinta catre imbunatatirea lucrului cu ba#ele de date avem si reorgani#area T,5&ului $Translation ,ooHaside 5uffer%. (cest buffer are rolul de a stoca corespondentele intreadresele virtuale de memorie si cele fi#ice, pentru a micsora timpul de acces al celor maifrecvent utili#ate. :e'alem mareste capacitatea T,5&ului de instructiuni din !onroe la <+> deintrari pentru pagini mici $7H marime% si D intrari pentru pagini mari$+)?7) marime%, iar alcelui de date la 87 de intrari pentru pagini mici si @+ pentru pagini mari. Deasemenea, aparesi un T,5 de al +&lea nivel, ce poate stoca B<+ intrari de pagini mici.*n !onroe a fost intercalat un detector de bucle $,oop 9tream Detector T ,9D% intre etajul deaducere si cel de decodare a instructiunilor pentru a actiona in situatia in care urma un sir deinstructiuni repetitive, oprind etajele de predictie si aducere si servind direct instructiunile din buffer&ul propriuC astfel se eliminau timpi de asteptare totodata cu economisirea de energie. :e'alem insa are acest etaj dupa partea de decodare, si in timp ce ,9D&ul lui !onroe puteastoca <> instructiuni cel al lui :e'alem stoc'ea#a acum pana la +> de micro&ops si le servestedirect in reorder buffer, oprind si etajul de decodare in acest timp. 9pre deosebire de'Epert'reading de

exemplu, aceasta modificare va avea un impact egal in orice tip de mediude lucru si va imbunatati consumul de energie cat si performanta. 'ttp1??ru.scribd.com?doc?7D+@8787?)icroar'itectura&:e'alem&a&firmei&*ntel