Sunteți pe pagina 1din 133

1.

Noiuni de baz privind evaluarea performanelor


Benchmarking este un proces utilizat n management i n particular management strategic, n care organizaia evalueaz mai multe aspecte ale propriilor procese n relaie cu "best practice" (succesul), de obicei n interiorul sectorului propriu de activitate. Acest proces permite organizaiilor s dezvolte planuri despre cum s adopte aceste poveti de succes (best preactice), cu scopul de a obine creteri n performanei. Benchmarking-ul poate fi un eveniment de singular, dardeseori este tratat ca un proces continuu n care organizaia caut n mod permanent s-i mbunteasc practicile. Traducere: Bench-mark = (inf) mulime bench-mark (mulime cu un numr minim de lucrri, utilizat pentru evaluarea performanelor);

1.1. Benchmark-ul organizaiilor


1.1.1. Avantajele benchmarking-ului Benchmarking-ul este o unealt de management puternic deoarece nvinge "paradigmul orbului", paradigm care poate fi rezumat la modul de gndire, adic astfel: "Calea pe care o urmm este cea mai bun, deoarece este calea pe care o urmm ntotdeauna". Benchmarkingul deschide organizaiile ctre noi metode, idei i mijloace pentru ai mbunti eficacitatea. El ajut la nvingerea rezistenei naturale mpotriva schimbrilor prin demonstrarea altor metode utilizabile n rezolvarea problemelor i demonstreaz c aceste metode funcioneaz fiind folosite i de alii. Avantajele benchmarking-ului asupra companiilor: O mai bun nelegere asupra ateptrilor clienilor deoarece benchmark-ul este bazat pe realitatea pieei estimate ntr-un mod obiectiv; O planificare economic mai bun a scopurilor i obiectivelor de atins n companie deoarece ele sunt: centrate pe ce are loc n afara spaiului controlat i stpnit; O mai bun cretere a productivitii: rezoluia problemelor reale prin nelegerea proceselor i a ceea ce produc ele; O practic curent mai bun; O mai competitivitate datorit: nelegerii solide a competiiei cu o puternic implicare a noilor idei de vrf n practic i n testarea noilor tehnologii. Benchmark-ul are consecine care sunt dincolo de procesul nsui: el reformeaz toate nivelurile companiei, modific procesul de producie, reformeaz organizarea ierarhic a companiei, producia nsi, i mentalitatea angajailor. 1.1.2. Procedura de realizare a benchmark-ului Identificarea zonelor cu probleme - deoarece benchmakingul poate fi aplicat oricrui proces sau funcii economice, pot fi necesare o serie de tehnici de cercetare. Acestea includ: conversaii informaionale cu clienii, angajaii sau
5

Evaluarea performanelor sistemelor de calcul

furnizorii; tehnici de cercetarea exploratorii, cum ar fi: grupul int, cercetri de marketing, cantitative, supraveghere, chestionare, analiz inginereasc, harta procesului, controlul calitii, analiza indicatorilor financiari: Identificarea organizaiilor care sunt lideri n aceste probleme Examinarea, supravegherea companiilor pentru msurtori i practic companiile ating anumite procese de afaceri folosind examinri detaliate ale msurtorilor i practicilor utilizate pentru a identifica procese alternative i companii de vrf. Supravegherea este realizat, de obicei, asociai i/sau consultani neutri, pentru a proteja datele confideniale; Vizitarea companiilor de succes pentru a identifica cele mai bune metode (practici) companiile sunt de obicei de acord cu schimbul mutual de informaii n interes comun pentru un grup de benchamark i a mpri rezultatele n interiorul grupului, Implementarea i mbuntirea noilor practici acumulate preluarea celor mai bune practici (metode) i dezvoltarea planurilor de implementare care includ identificarea oportunitilor specifice, finanarea proiectului i vnzarea ideilor ctre organizaie n scopul obinerii valorilor demonstrative ale procesului.

1.1.3. Costul benchmarking-ului Benchmarking-ul este un proces cu un cost moderat-scump. Principalele trei tipuri de costuri sunt: Costuri cu deplasri cheltuieli cu transportul, cazarea, diurna, cadouri simbolice, i pierderea timpului cu munca; Costuri cu timpul membrii echipei de benchmark vor investi timp n cercetarea problemelor, gsirea celor mai bune companii pentru studiu, vizitare i implementare. Acest timp este luat din timpul dedicat activitilor curente de producie; Costul bazei de date de benchmarking - organizaiile ca au instituionalizat benchmarkingul n procedura zilnic creeaz i ntrein o baz de date cu best practice i cu companiile asociate fiecrui succes.

1.2. Benchmarking-ului n computere


n domeniul computerelor, benchmarking-ul nseamn rularea unui program de calculaor, sau a unui set de programe sau alte operaii, cu scopul de a stabili performanele relative a unui obiect, normal prin rularea a unui numr de testa standard sau de ncercare asupra lui. Termenlul benchmark mai este de asemenea folosit de specialiti pentru a defini nsi programele de testare. Benchmarking-ul este de obicei asociat cu evaluarea performanelor componentelor hardware caracteristice ale calculatoarelor, de exemplu, testarea performanelor procesoarelor la operarea n virgul mobil. Testarea poate fi aplicat, de asemenea, i software-uli, n special n testarea compilatoarelor sau a bazelor de date de management a sistemului. Benchmark-urile ofer o metod de comparare a performanelor diferitor tipuri de subsisteme n combinaie cu diferite sisteme. Benchmark-ul este util n nelegerea modului n care managerul bazei de dare rspunde n diferite condiii. Pot fi create scenarii care testeaz blocarea definitiv a manipulrii, utiliti de performan, diferite
6

Cap 1: Noiuni de baz privind evaluarea performanelor

metode de ncrcat date, caracteristica ratei de tranzacie cnd sunt conectai mai muli utilizatori i chiar efectele utilizrii unei versiuni noi a produsului. 1.2.1. Scopul benchmarking-ului Odat cu avansarea arhitecturii calculatoarelor, este din ce n ce mai dificil compararea performanelor diferitelor sisteme de calcul doar prin analizarea specificaiilor lor. Astfel, au fost dezvoltate teste care pot fi realizate pe diferite sisteme, permind compararea rezultatelor obinute pe sisteme diferite. De exemplu, n tip ce un procesor Intel Pentium 4 opereaz n general la frecvene mai mari dect AMD Athlon XP, asta nu nseamn n mod automat mai mult putere de calcul,. Cu alte cuvinte, un procesor AMD "mai lent" din punct de vedere al frecvenei de ceas, poate realiza la fel de bine un test de benchmark ca un procesor Intel ce funcioneaz la o frecven mai mare. Benchmark-urile sunt destinate a imita un anumit tip de suprasarcin pe un calculator sau sistem. Benchmarking-ul "sintetic" realizeaz testarea prin programe special create care impun o suprasarcin componentei evaluate. Benchmark-ul "aplicaie" ruleaz un program din lumea real pe sistem. n timp ce benchmark-ul aplicaie ne d o msur mult mai bun a performanelor reale ale sistemelor, benchmark-ul sintetic i are utilitatea n testarea individual a unor componente, cum ar fi hard discuri sau dispozitive de reea. Benchmark-urile sunt importante n special n proiectarea micorprocesoarelor, oferind arhitecturii procesorului abilitatea de a msura i realiza optimizarea deciziilor din proiectarea micro arhitectural. De exemplu, dac un benchmark ne ofer algoritmul cheie pentru o aplicaie, el va conine aspecte ale performanelor sensibile ale acelei aplicaii. Rulnd aceasta ntr-o bucl mult mai strmt pe un simulator ciclic precis, putem obine indicii privind mbuntirea performanelor. Productorii de calculatoare au o lung istorie n ncercarea de a-i seta (proiecta) sistemele pentru a obine performane mai nalte, nerealiste, n testele de benchmark care nu se regsesc i n utilizarea real. De exemplu, prin 1980 unele compilatoare puteau detecta o operaie specific matematic folosit n cunoscutul benchmark n virgul mobil i nlocuiau operaia cu o operaie matematic echivalent care este mult mai rapid. Dar, o asemenea transformare era rareori utilizat n afara benchmark-ului , pn la mijlocul anilor 1990, cnd arhitecturile RISC1 i VLIW2 au evideniat importana tehnologiei compilrii n atingerea performanelor. Benchmarkurile sunt acum frecvent utilizate de dezvoltatorii de compilatoare pentru a mbunti nu numai propriul scor, dar i performanele reale ale aplicaiilor. Productorii raporteaz de obicei doar benchmark-urile (sau aspecte ale acestora) care pun produsul lor ntr-o lumin bun. Este de asemenea cunioscut metoda de a denatura semnificaia benchmark-urilor, doar pentru a pune ntr-o lumin mai bun propriile produse. Luate mpreun, aceste practici sunt numite "benc-marketing". 1.2.2. Provocri Benchmarking-ul nu este uor i deseori implic mai multe runde iterative nainte de a obine concluzii predictibile i utile. Interpretarea datelor benchmark-ului

1 2

RISC = reduced instruction set computer VLIW = Very Long Instruction Word 7

Evaluarea performanelor sistemelor de calcul

este, de asemenea, extraordinar de dificil. Iat cteva din provocrile normale ale benchmarking-ului: productorii au tendina de a potrivi specificaiile produselor dup standardele industriale; benchmark-urile n general nu dau nici o garanie pentru calitatea serviciilor. Exemple de ne-msurare a calitii serviciilor includ: securitatea, disponibilitatea, fiabilitatea, integritatea execuiei, durata de serviciu, scalabilitatea (n special abilitatea de a aduga sau modifica capaciti n mod nedistructiv); n general, benchmark-urile nu msoar TCO3. Specificaiile TCP4 Benchmark se adreseaz parial asupra costului de proprietate prin specificarea faptului c trebuie utilizat o metric pre/performan. Benchmarkul rareori msoar performanele din lumea real a sarcinilor mixate rularea unor aplicaii multiple concureniale ntr-un context multidepartamental / multi-aplicaie. De exemplu, serverul mainframe IBM exceleaz n sarcini mixate, dar standardele industriale de evaluare nu tind s msoare puterea I/O i design-ul mare i rapid al memoriilor de care are nevoie serverul. Multe alte arhitecturi de server dicteaz o funcie fix, un scop unic: server de baze de date, server de aplicaii, server de fiiere, server web; Productorii de benchmark-uri tind s ignore necesitile pentru capacitile de dezvoltare, testare i recuperarea n caz de dezastru. Productorilor le place s se raporteze doar la necesitile restrnse ale capacitilor de producie. Benchmark-urile au probleme n adaptarea la lumea serverelor distribuite, n special datorit sensibilitii topologiei reelelor; Utilizatorii pot avea percepii foarte diferite a performaneei pe care benchmarkul o poate sugera. n particular, utilizatorii apreciaz predictabilitatea servere care ntotdeauna ndeplinesc sau depesc SLA5. Bgenchmark-ul tinde s accentueze un scor (din perspectiva IT). Multe arhitecturi de servere se degradeaz dramatic la un nivel ridicat de utilizare (apropiat de 100%) - ("fall off a cliff" = cdere n pant, brusc), dar benchmark-ul nu ia ntotdeauna n calcul acest factor. Productorii au tendina s publice rezultatele benchmark-ului pentru o utilizare constant de 80% a serverelor, o situaie total nereal, i s nu ne informeze despre ce se ntmpl la suprancrcarea sistemului, cnd vrful de sarcin trece epste acest prag. 1.2.3. Tipuri de benchmark 1. Real program o Software de procesare text; o Unelte software CDA o Aplicaii utilizator (MIS) 2. Kernel o Conine codul cheie; o n mod normal abstract de la programul actual ; o Kernel normal: bucle Livermore;
3 4

TCO = Total cost of ownership TCP Benchmark = Transaction Processing Performance Council 5 SLA = Service Level Agreement 8

Cap 1: Noiuni de baz privind evaluarea performanelor

3.

4.

5. 6.

linpack benchmark (cnine subrutine algebrice lineare scrise n limbajul FORTRAN); 6 o rezultatele sunt prezentate n MFLOPS Toy Benchmark/ micro-benchmark o Utilizatorii le pot programa i utiliza pentru a testa componentele de baz ale calculatorului; o Detecteaz automat parametrii componentelor hardware ale calculatoarelor, cum ar fi: numr de nregistrare, dimensiune cache, ntrzierea memoriei; Synthetic Benchmark o Procedura pentru programarea unui synthetic Bench mark Se culeg date statistice despre toate tipurile de operaii de la programele de aplicaii; Se obine proporia fiecrei operaii Se scrie un program bazat pe proporiile obinute anterior. o Tipuri de Synthetic Benchmark: Whetstone Dhrystone o Rezultatele sunt reprezentate n KWIPS (kilo whetstone instructions per second). Acest test nu este adecvat pentru a msura pileline-ul (conductele) computerelor. I/O benchmarks Benchmark-uri paralele: sunt utilizate pe maini cu procesoare multiple sau sisteme ce onstau din mai multe maini.
o

1.3. Arhitectura calculatoarelor


n viziune clasic, arhitectura calculatorului este vzut c o serie de straturi abstracte: Hardware este un termen utilizat n general Fig. 1.1: O viziune tipic asupra pentru deschierea componentelor fizice ale arhitecturii calculatorului ca o sistemului, serie de straturi. Firmware este un software scris (ars) de productori n componentele hardware (cipuri); Assembler program utilitar folosit pentru traducerea limbajului de asamblare (care este un limbaj low-level pentru programarea calculatoarelor); Kernel reprezint componenta central a oricrui sistem de operare al computerului, el administreaz resursele sistemului i comunicarea dintre componentele hardware i software; sistem de operare reprezint un set de programe care administreaz resursele hardware i software ale unui computer; aplicaii.

MFLOPS = FLoating point Operations Per Second, operaii n virgul mobil pe secund 9

Evaluarea performanelor sistemelor de calcul

n ingineria calculatoarelor, arhitectura calculatoarelor este un design conceptual i structurarea funcionrii fundamentale a unui sistem de calcul. Ea reprezint copia fidel i descrierea funcional a cerinelor (n special viteze i interconexiuni) i designul implementrii pentru diferite pri ale calculatorului, concentrndu-se pe larg asupra modului n care unitatea central de calcul (procesorul) realizeaz funciile sale interne i acceseaz adresele din memorie. Arhitectura calculatoarelor cuprinde cel puin trei ari categorii: arhitectura setului de instruciuni, sau ISA, - este o imagine abstract a sistemului de calcul care este vzut de limbajul main (limbajul de asamblare), i include setul de instruciuni, modul de adresare al memoriei, regitrii procesor i adresarea i formatul datelor; micro-arhitectura, cunoscut ca i organizarea calculatorului, - este de nivel sczut, mai concret, descrierea sistemului care implic cum prile constituente ale sistemului sunt interconectate i cum inter-opereaz ele pentru a implementa ISA. De exemplu, dimensiunea memoriei cache, este o caracteristic organizaional care, n general, nu are nimic n comun cu ISA. designul sistemului, care include toate celelalte componente hardware din calculator, cum ar fi: o sistemul de interconectare: magistrale i comutatoare; o controllerul de memorie i ierarhie; o mecanismul de acces direct la memorie al CPU; o faciliti ca multiprocesarea. Odat ce ISA i microarhitectura au fost specificate, dispozitivul trebuie s fie proiectat n hardware. Acest proces de design, proiectare, este deseori denumit implementare. Implementarea nu este considerat ca fcnd parte din arhitectura calculatorului, ci, mai degrab, din ingineria proiectrii. Implementarea poate fi mprit n trei pri, i anume: implementarea logic n care blocurile definite n microarhitectur sunt implementate ca ecuaii logice; implementarea circuitului n care blocuri de vitez critic, sau ecuaii logice sau pori logice sunt implementate la nivel de tranzistor; implementarea fizic n care circuitele sunt desenate, componente de circuit diferite sunt plasate n planul chipului sau pe plac i sunt trasate conexiunile dintre piese. Pentru procesoare, ntregul proces de implementare se numete CPU design. 1.3.1. Scopurile proiectrii Cele mai comune ine n arhitectura calculatoarelor este realizarea echilibrului dintre cost i performan (ex: vitez), alturi de alte consideraii, cum ar fi: dimensiunea, greutatea, fiabilitatea, setul de faciliti, expandabilitatea i consumul de energie. Costul n general costul este meninut constant, determinat de cerineele de sistem sau comerciale; Performana n general, performana calculatorului este descris n termeni de vitez de ceas (MHz sau GHz). Aceasta se refer la cicluri pe secund ale ceasului procesorului. Dar,
10

Cap 1: Noiuni de baz privind evaluarea performanelor

de multe ori aceast msur este greit neleas, deoarece o main cu o frecven de ceas mai mare nu este obligatoriu s ating performane mai nalte. Drept rezultat, productorii sau ndeprtat de msurarea performanelor prin msurarea frecvenei procesorului. Performanele calculatorului mai pot fi, de asemenea, msurate prin dimensiunea memoriei cache. Drept analogie s luam traficul auto, dac viteza mainii este dat n MHz sau n GHz, lipsa aglomeraiei de pe autostrad este dat de mrimea cache. Nu conteaz ct de mare este viteza unei maini, dac autostrada este aglomerat (cache mic) performanele vor fi reduse. Cu ct viteza este mai mare, cu att mai mare este necesarul de cache. Procesoarele moderne pot executa mai multe instruciuni pe un ciclu de ceas, ceea ce crete dramatic viteza de execuie a unui program. Un alt factor care influeneaz viteza este mixarea unor uniti funcionale, viteza magistralei, disponibilitatea memoriei i tipul i ordinea instruciunilor din programul care ruleaz. Sunt dou tipuri principale de vitez: latena i puterea de trecere (throughput). Latena este timpul dintre nceputul procesului i terminarea lui. Puterea de trecere reprezint cantitatea de munc realizat pe unitate de timp. Latena de ntrerupere7 este garantarea timpului maxim de rspuns a sistemului la un eveniment electronic (ex: cnd HDD termin de mutat datele dintr-un loc n altul). Performana este afectat de o foarte mare plaj de alegeri fcute n proiectare de exemplu, adugarea de cache face latena mai proast (lent) dar crete puterea de trecere. Calculatoarele care controleaz maini (calculatoarele de proces) necesit, de obicei, o laten de ntrerupere sczut. Aceste calculatoare opereaz n timp real i produc eec dac o operaie nu este terminat ntrun anumit interval de timp. Performana unui calculator poate fi msurat folosind alte metrici, dependente de domeniul de aplicaie. Consumul de energie a devenit important n sistemele server i cele portabile. Benchmarking-ul ncearc s ia n considerare toi aceti factori n procesul de msurarea a timpului de execuie a unei serii de programe de test. Cu toate c benchmark-ul ne d puterea, el nu ne poate ajuta n alegerea unui calculator. De cele mai multe ori, msurarea unei maini nseamn mai multe msurtori. De exemplu, un sistem poate realiza rapid aplicaii tiinifice, iar un altul poate rula jocuri video la mod mult mai uor. Schema general a optimizrii este de a cuta costurile diferitor pri componente al calculatorului. ntr-un sistem de calcul echilibrat, rata de transfer a datelor va fi constant pentru toate prile sistemului, i costul va fi alocat proporional pentru a asigura acest lucru. Forma exact a unui sistem de calcul va depinde de constrngerile i scopurile pentru care va fi optimizat. Consumul de energie Consumul de putere este un alt criteriu de design. Eficiena energetic poate fi deseori tratat pentru performan sau eficien economic. Odat cu creterea densitii de energie n circuitele numerice moderne datorat creterii numrului de tranzistori din chip, eficiena energetic a crescu ca importan. Designul procesoarelor moderne, cum este i IntelCore 2 pune un accent mai mare pe creterea eficienei energetice. Astfel, n lumea calculatoarelor capsulate, eficiena energetic a fost i rmne principala int n proiectare, alturi de performan.
latena de ntrerupere - timpul scrus de la generarea unei ntreruperi de ctre un dispozitiv i deservirea acelui disozitiv. 11
7

2. Evaluarea performanelor plcilor de baz


2.1. Plcile de baz: funcionare, istorie
2.1.1. Definiii de baz: chipset-ul Chip-ul reprezint denumirea pentru un circuit integrat, construit pe baz de siliciu, care are un rol bine definit n funcionarea unui echipament electronic. Procesorul, memoria, placa de baz, placa grafic, placa de sunet, toate nglobeaz unul sau mai multe astfel de chip-uri, fiecare avnd rolul su, ce poate fi ori de execuie a anumitor operaii, ori de memorare a unor date, de obicei temporar. Spre exemplu, funcia procesorului este uor de neles: execuia propriu-zis a operaiilor necesare desfurrii activitilor unui computer. Placa grafic deine un chip principal ce efectueaz operaii similare dar optimizate pentru domeniul grafic, att 2D ct i 3D. Memoria nu face altceva dect s stocheze temporar informaii necesare celorlalte echipamente. Am ajuns la placa de baz, al crei rol este mai greu de neles. Muli vor considera c singurul ei rol este acela de a lega componentele ntre ele, aadar ce nevoie mai avem de chip-urile prezente pe ea? n primul rnd, placa de baz nu este pur i simplu un element de legtur ci componenta principal a unui sistem, care coordoneaz toate activitile. Ea joac rol de arbitru i direcioneaz fluxurile de date ntre procesor i memorie, memorie i hard disk, procesor i tastatur i altele asemenea. Nimic nu poate funciona pur i simplu, este nevoie de o component suprem care s tie s foloseasc resursele celorlalte componente dintr-un PC. Un astfel de echipament poart numele de controller. Putem spune c placa de baz este un controller general, diferitele segmente ale ei oferind funcia de controller local. De exemplu, controller-ul de memorie este circuitul care d via memoriei, fr el minunatele memorii DDR PC3200 vor fi alimentate cu energie i nimic mai mult, neexistnd nimeni care s exploateze posibilitile oferite de ele.

(plac de baz pentru procesoare 486)

(plac de baz modern: Epox 4PCA3+)

Controller-ul principal al plcii de baz este denumit chipset, fiind format de obicei din dou chip-uri independente (de aici denumirea de chipset = set de chip-uri). Ele poart numele de northbridge i southbridge (aceasta n ciuda ncercrii unor companii de a le schimba aceste nume deja ncetenite). Sau altfel spus, puntea de nord i cea de sud (evident c nu exist nici o legtur cu punctele cardinale, nordul i sudul fiind alese pentru a sublinia poziiile opuse pe care le au aceste chip-uri, aproape simetrice fa de centrul plcii). Fiecare dintre ele are un rol bine determinat, rol care depinde de la chipset la chipset dar exist multe elemente comune ntre diferitele modele. Numrul tipurilor de chipset-uri aprute de-a lungul istoriei este foarte mare, ns numrul celor folosite ntr-o anumit perioad a evoluiei PC-urilor este relativ mic.
12

Cap 2: Evaluarea performanelor plcilor de baz

Voi folosi n continuare denumirile de chipset, northbridge i southbridge chiar dac ele nu sunt 100% corecte, n primul caz pentru c unele chipset-uri sunt de fapt simple chipuri (nordul se contopete cu sudul), fiind prezent un singur integrat principal pe placa de baz ce joac dublu rol, iar n ultimele cazuri pentru c schimbarea forat a denumirilor de ctre productori (un exemplu fiind Intel) este ntemeiat i relevant. Aceast prim parte a capitolului intenioneaz, pe de o parte, s fac lumin printre utilizatorii de calculatoare care nu cunosc principiile funcionrii plcilor de baz moderne i nici nu sunt la curent cu ultimele evoluii de chipset-uri i, pe de alt parte, s ofere pasionailor o scurt istorie a acestui domeniu. Cum o istorie a modelelor de plci de baz este inutil i practic imposibil de realizat, numrul lor fiind de ordinul miilor, vom parcurge chipset-urile prezente n epoca modern a calculatoarelor, insistnd pe perioada ultimilor 5-6 ani i exemplificnd acolo unde este cazul cu modele de plci care au rmas cu adevrat n istorie. Pentru nceput, vom vorbi despre modelul clasic de chipset, format din northbridge i southbridge, componente ce ndeplinesc anumite sarcini standard: northbridge-ul este rspunztor de comunicarea cu procesorul, cu memoria, cu portul AGP i/sau PCI Express (dac cel puin unul dintre ele exist) iar southbridge-ul cu tot ce nseamn periferic: uniti de stocare (porturile IDE i cel de floppy), slot-urile PCI i ISA i interfeele externe, cum ar fi cea USB, FireWire, reeaua sau sunetul. Comunicarea dintre cele dou componente principale este realizat la o vitez maxim predefinit, care este de regul egal cu cea a bus-ului PCI (133 MB/s), eventual multiplicat de un numr de ori. (Vom vedea mai trziu ce este un bus.) Spre exemplu, comunicarea dintre nordul i sudul chipset-ului VIA KT133A este realizat la viteza bus-ului PCI, la KT266A ea este (cu ajutorul tehnologiei V-Link) de 266 MB/s iar n cazul lui KT400 la 533 MB/s (V-Link 8x). Aceasta nseamn c fluxul de date nu poate depi aceast limit, deci degeaba avei un hard disk Serial ATA cu un transfer de 150 MB/s (iari, maxim) dac exist limitarea de 133 MB/s. n realitate, aceste limite nu influeneaz aproape deloc performana unui sistem, necesarul fiind mai mare dect limita ntr-un numr infim de situaii; dac hard disk-ul dorete s transfere 150 MB/s ntr-o situaie dintr-o mie i nu-i pot fi satisfcui dect 133 MB/s, rezult faptul c viteza sa a fost diminuat cu un procent total nesemnificativ. Productorii de chipset-uri se lupt n aceast pseudo-competiie a bus-urilor, recent depindu-se 1 GB/s. ntradevr, arat bine pe hrtie. Dup cum ai putut observa, fiecare component a sistemului trebuie controlat de cineva. Plcile PCI sunt, la rndul lor, un fel de controllere, ele fiind rspunztoare de activiti conexe, cum ar fi emiterea de sunet n boxe (plcile de sunet), preluarea semnalului din linia telefonic (modemul) sau prelucrarea semnalului TV (TV tuner-ul). Mai mult, unele plci chiar se numesc controllere i ndeplinesc funcia de suport pentru unele componente externe pe care placa de baz nu le cunoate. Spre exemplu, dac placa de baz nu deine integrat suportul pentru interfaa FireWire, o simpl plac PCI poate ndeplini sarcina. Sau, mai exist situaia n care controller-ul nu este nici integrat n chipset-ul plcii de baz, nici prezent sub forma unei plci suplimentare; el este pur i simplu integrat pe plac, sub forma unui chip, fiind considerat un dispozitiv obinuit, ataat adesea la bus-ul PCI. Northbridge-ul este componenta principal a chipset-ului, de el depinznd practic performana sa. Un controller de memorie bun poate oferi mai mult vitez, i
13

Evaluarea performanelor sistemelor de calcul

aceasta ne putem da seama parial doar privind specificaiile. S lum nite exemple: VIA KT266A i KT333. Primul poate lucra cu memorie DDR la frecvena de 133 MHz, al doilea poate crete viteza acesteia la 166 MHz, de unde rezult performane mai bune. Exist i alt situaie, aceea n care specificaiile sunt aceleai dar performanele difer: KT266A este mai rapid dect KT266, dei ambele suport acelai tip de memorie, din cauza optimizrilor interne. Uneori, aceste optimizri depesc n eficien fora brut a creterii frecvenei, cum este i n cazul de fa: saltul de performan de la KT266 la KT266A este mai mare dect n cazul comparaiei KT266A - KT333. Exist mai multe tipuri de controllere de memorie, n funcie de tipul acesteia. Unele pot lucra i cu memorie SDR i cu cea DDR, altele sunt dedicate special celor de tip Rambus, altele ofer tehnici de dublare a vitezei efective (nc o dat fa de DDR); este vorba de tehnologia dual-channel. Iar alte chipset-uri nici nu conin acest controller, el fiind integrat n procesor, precum este cazul procesoarelor din familia AMD64. A doua sarcin principal a northbridge-ului este comunicarea cu procesorul. Aici apar diferenele fundamentale dintre chipset-uri i de aceea exist incompatibiliti ntre anumite chipset-uri i anumite procesoare. Limbajul folosit pentru comunicare trebuie s fie comun i, din cauza faptului c exist mai multe generaii i mai multe companii care produc procesoare, exist i mai multe standarde n ceea ce privete chipset-urile. Astfel, gsim cteva platforme distincte: Athlon XP (Socket A), Pentium 4 (Socket 478, LGA 775), Athlon 64 (Socket 754 i 939) i exemplele pot continua. Pentru fiecare din ele exist o serie de chipset-uri care cunosc limbajul procesoarelor n cauz i astfel pot dota plci de baz corespunztoare acestora. Acest limbaj, care permite comunicarea pe aceeai lungime de und ntre orice dou componente dintrun sistem, se numete bus. Deja se nate o ntrebare fireasc: care este viteza de comunicare dintre northbridge i procesor? Aceast vitez este dat de PSB (Processor Side Bus), variaz n funcie de procesor dar i de setrile plcii de baz i se msoar n MHz. Procesoarele pn la Pentium III aveau acest PSB setat la frecvene ntre 66 i 133 MHz (nu vorbim aici de creterea artificial, adic overclocking). Pentru procesoarele din familia AMD K7 (Athlon, Athlon XP, Duron), el variaz ntre 100 i 200 MHz, n funcie de procesor, frecven care este multiplicat cu 2. n termeni electronici, spunem c informaia este transmis att pe frontul cresctor ct i pe cel descresctor al semnalului, de unde rezult o dublare a vitezei (i nu o dublare a frecvenei), tehnic folosit i la memoria DDR. Departamentele de marketing au profitat imediat de situaie i au afirmat c FSB-ul procesoarelor Athlon este de 200-400 MHz, afirmaie teoretic greit, practic neafectnd cu nimic adevrul palpabil. Pentium 4 folosete un mecanism asemntor prin care multiplic de patru ori PSB-ul, rezultnd 400, 533, 800 i 1066 MHz virtuali n loc de 100, 133, 200 i 266. Bus-urile AGP i PCI Express reprezint a treia sarcin a northbridge-ului. Orice sistem modern deine o plac grafic cu capabiliti 3D, component care comunic cu northbridge-ul prin bus-ul AGP sau PCI Express X16. Frecvena celui AGP este de 66 MHz, egal cu dublul frecvenei PCI, ns ea este multiplicat opional de un numr de ori, corespunztor x-ului indicator: AGP 2x, AGP 4x, AGP 8x, ultimul oferind valoarea impresionant de 2.1 GB/s. Sunt valabile aceleai considerente de la comunicarea dintre
14

Cap 2: Evaluarea performanelor plcilor de baz

cele dou componente ale chipset-ului, aadar necesarul efectiv este n majoritatea cazurilor mult mai mic dect cel oferit de AGP 8x. Drept dovad, micorarea forat a transferului la nivelul lui AGP 2x nu scade performanele cu mai mult de 10-30%. n cazul lui PCI Express, lucrurile stau altfel: att bus-ul X16, necesar plcii grafice (eventual X8 n unele cazuri), ct i cele destinate plcilor obinuite (X1, X4) sunt gestionate de northbridge. Frecvena sa este de 100 MHz, iar rata de transfer n modul 1x este similar lui AGP 1x i dubl fa de PCI. 2.1.2. Memoria, tipuri de memorie Memoria RAM (Random Access Memory) este denumirea generic pentru orice tip de memorie care deine urmtoarele caracteristici: poate fi accesat aleator (nu secvenial, precum benzile magnetice), este volatil (la ntreruperea alimentrii cu energie electric, datele stocate se pierd) i , se prezint sub form de chip-uri (aadar excludem dispozitivele magnetice sau optice, precum hard disk-urile sau CD-urile). Utilitatea memoriei RAM este foarte mare, ea beneficiind n plus fa de alte medii de stocare a informaiilor de o vitez extrem de mare, fiind de mii de ori mai rapid dect un hard disk, de exemplu. Exist dou tipuri principale de RAM: memorie static (SRAM = Static RAM) i dinamic (DRAM = Dynamic RAM), diferenele constnd n stabilitatea informaiilor. Astfel, memoria static pstreaz datele pentru o perioad de timp nelimitat, pn n momentul n care ea este rescris, asemntor unui mediu magnetic. n schimb, memoria dinamic necesit rescrierea permanent, la cteva fraciuni de secund, altfel informaiile fiind pierdute. Avantajele memoriei SRAM: utilitatea crescut datorit modului de funcionare i viteza foarte mare; dezavantaj: preul mult peste DRAM. n realitate, memoria de tip SRAM este folosit cel mai adesea ca memorie cache pe cnd DRAM-ul este uzual n PC-urile moderne, fiind prezent n primul rnd ca memorie principal a oricrui sistem. De acest din urm tip ne vom ocupa n continuare, enumernd tipurile uzuale de DRAM prezente de-a lungul istoriei, toate concepute n scopul creterii performanelor DRAM-ului standard: FPM DRAM (Fast Page Mode DRAM), EDO DRAM (Extended Data Out DRAM), BEDO RAM (Burst EDO DRAM), RDRAM (Rambus DRAM), n prezent impunndu-se SDRAM (Synchronous DRAM), cu variantele DDR SDRAM (Double Data Rate SDRAM) i DDR2 SDRAM. De asemenea, pentru plcile grafice au fost concepute mai multe tipuri de memorie, printre care VRAM (Video RAM), WRAM (Windows RAM), SGRAM (Synchronous Graphics RAM) i GDDR3, ele fiind variante de DRAM (primele dou), SDRAM i respectiv DDR2 SDRAM, optimizate pentru a fi folosite ca memorie video. Ar mai fi de menionat alte dou elemente care influeneaz viteza, stabilitatea i preul memoriilor: funciile ECC i Registered, integrate n unele module de memorie. Cele ECC (Error Correction Code) dein o funcie special care permite corectarea erorilor ce apar pe parcursul utilizrii iar cele Registered (numite i Buffered), dein un buffer (zon de memorie suplimentar) care depoziteaz informaia nainte ca ea s fie transmis controller-ului, permind verificarea riguroas a acesteia. Memoriile Registered sunt mai lente dect cele normale sau ECC i extrem de scumpe, folosirea lor fiind justificat doar n cazuri speciale, cnd corectitudinea
15

Evaluarea performanelor sistemelor de calcul

informaiilor prelucrate i stabilitatea sistemului este vital, de exemplu n cazul serverelor. n general, att timp ct memoria nu este supus unor situaii anormale de funcionare (frecven, tensiune sau temperatur n afara specificaiilor) ea ofer o stabilitate extrem de apropiat de perfeciune, arhisuficient pentru un calculator obinuit. Ne-am referit pn acum la chip-urile de memorie, cnd vine vorba de modulele n sine (plcuele care se introduc n slot-urile plcii de baz), avem cteva modele constructive. Dup perioada de nceput, cnd chip-urile de memorie se nfigeau pur i simplu n placa de baz, primul model uzual a fost SIMM-ul pe 30 de pini, urmat de cel pe 72 de pini. Denumirea de SIMM provine de la Single Inline Memory Module, modulul prezentnd o lime de band de 8 bii pentru prima versiune i de 32 pentru cea de-a doua; dimensiunea fizic a SIMM-ului pe 30 de pini este de dou ori mai mic dect n cazul celeilalte variante. Diferenele de vitez dintre ele corespund perfect perioadei de glorie: dac prima versiune era uzual pe timpul sistemelor 286 i 386, SIMM-ul pe 72 de pini a stat la baza generaiei 486, Pentium i Pentium Pro. Chip-urile folosite au fost de tip DRAM, FPM i, mai trziu, EDO DRAM. Urmaul lui SIMM s-a chemat DIMM, adic Dual Inline Memory Module. Dup cum i spune i numele, el ofer o lime de band de 64 de bii, dubl fa de SIMMurile pe 72 de pini, avnd la baz un fel de dual-channel intern, dac ni se permite comparaia. Numrul de pini a fost de 168 sau de 184 de pini, n funcie de tip: SDRAM sau DDR SDRAM. A existat i un numr limitat de modele de DIMM bazate pe EDO DRAM dar ele nu au avut succes pentru c trecerea de la SIMM la DIMM a coincis cu cea de la EDO la SDRAM. RIMM (Rambus Inline Memory Module) este modelul constructiv al memoriilor RDRAM. Numrul de pini este de 184 (ca i la DDR SDRAM) dar asemnrile se opresc aici, configuraia pinilor i modul de lucru fiind total diferit. Mai amintim de modulele SO-DIMM, destinate calculatoarelor portabile, care dein un numr diferit de pini: 184 pentru SDRAM i 200 pentru DDR SDRAM. Practic vorbind, montarea modulelor SIMM era o operaie greoaie i necesita experien i ndemnare. Odat cu modulele DIMM (i RIMM, care au acelai sistem de prindere) chinul a fost dat uitrii, oricine putnd monta o memorie, fiind necesar doar puin atenie. Montarea invers a unui DIMM (care necesit, totui, destul for) duce ntotdeauna la arderea memoriei. Diferenele de vitez dintre memorii se bazeaz n mare parte pe diferenele de frecvene. S lum cazul memoriei principale, inclus n sisteme ca memorie de lucru. n prim faz, pn la apariia procesoarelor 80486, frecvena sa era egal cu cea a procesorului i a PSB-ului (de ordinul zecilor de MHz), ns n momentul n care procesoarele au atins frecvene de peste 50 MHz, s-a pus problema faptului c nu exist posibilitatea fabricrii (la preuri acceptabile) de memorii la astfel de frecvene. Aa c s-a recurs la un truc: s-a hotrt ca memoria i PSB-ul s lucreze la o frecven mai mic dect cea a procesorului, setndu-se astfel un raport fix ntre PSB i procesor. Astfel, un 486 DX4 la 100 MHz avea un PSB de 33 MHz (memoria rulnd i ea la aceast frecven) iar un Pentium MMX la 233 MHz avea un PSB de 66 MHz. Spunem c procesorul ruleaz asincron fa de PSB, n primul caz cu un multiplicator de 3x iar n al doilea de 3.5x. Nu numai imposibilitatea creterii frecvenei memoriei a dus la
16

Cap 2: Evaluarea performanelor plcilor de baz

aceast situaie ci i limitrile celorlalte bus-uri, la acea vreme ISA, VLB i PCI, care nu suportau frecvene mult mai mari dect cele standard. Observaie: Nu trebuie confundat frecvena PSB cu cea a memoriei, sunt lucruri total diferite, PSB-ul fiind viteza de comunicare dintre procesor i northbridge. ntmpltor, controller-ul de memorie se afla n northbridge i, tot ntmpltor, memoria rula sincron cu FSB-ul. Vom vedea c mai trziu c situaia s-a schimbat. 66 MHz a fost un prag greu de trecut pentru memorie, poate i datorit faptului c aceast frecven corespunde dublului frecvenei bus-ului PCI i egalului frecvenei bus-ului AGP (care a aprut mai trziu), iar pentru a crete frecvena RAM independent de aceste dou bus-uri era necesar implementarea acestei funcii n chipset. Dar poate cel mai important factor a fost instabilitatea preului la memorie, care a oscilat permanent foarte puternic, existnd cazuri n care el a crescut de cteva ori pe parcursul unei singure luni; scderea a fost, desigur, mult mai lent. Trecerea la SDRAM i creterea FSB-ului uzual de la 66 la 100 MHz (odat cu Pentium II Deschutes i K6-2) a facilitat depirea acestei bariere, ajungndu-se rapid la 100 i apoi la 133 MHz (chiar i cu pstrarea FSB-ului la 100 MHz). Urmtorul prag, de 166 MHz, nu a mai fost atins de SDRAM dar nici exclus total, ci mai degrab neglijat datorit apariiei memoriei DDR SDRAM, care dubla limea de band a unui SDRAM. Chiar dac frecvena real era de 100, 133 sau 166 MHz, memoria se comporta aproape identic cu una la frecven dubl i de aceea au fost ncetenite frecvenele improprii de 200, 266 i 333 MHz (memoriile fiind marcate ca DDR200, DDR266 i DDR333 sau PC1600, PC2100 i PC2700, corespunztor limii de band: 1.6, 2.1 i respectiv 2.7 GB/s). Ulterior s-a ajuns la 400 MHz (DDR400, PC3200) i chiar mai sus, amatorii de overclocking dezlnuindu-i pasiunea odat cu module DDR533 (PC4200) sau chiar DDR625 (PC5000), care cost totui o avere. Urmtorul pas a fost DDR2 SDRAM, un standard asemntor cu DDR, dar care permite, la latene mai ridicate, frecvene mai mari. S-a nceput cu DDR2-400 (PC2-3200), urmnd apoi DDR2-533 (PC2-4300), ultima realizare fiind DDR2-800 (PC2-6400). Dei numele ar sugera dublarea vitezei, un modul DDR2 nu este mai rapid dect unul DDR la aceeai frecven, ci dimpotriv: latenele mai ridicate scad uor performana. Avantajul const n posibilitatea creterii frecvenei mult dincolo de DDR400, standardul la care s-a poticnit DDR SDRAM (DDR533 i urmtoarele sunt pseudo-standarde, nefiind ratificate). Pentru plcile grafice, avem GDDR3 SDRAM, fiind anticipat o nou versiune, numit (cum altfel?) GDDR4. Este vorba de o optimizare a standardului DDR2 pentru plcile grafice, la fel cum era SGRAM pentru SDRAM. Ca o mic parantez, am folosit termenul de PSB (Processor Side Bus) care s-a metamorfozat n cazul lui Pentium II n FSB (Front Side Bus). Aceste denumiri au generat i genereaz n continuare confuzii; termenul de FSB a fost introdus special pentru procesoarele al cror cache level 2 era extern procesorului, FSB-ul fiind bus-ul care lega chipset-ul plcii de baz de acest cache. Bus-ul BSB (Back Side Bus) era cel care fcea legtura mai departe, ntre cache-ul L2 i nucleu. Procesoarele cu cache-ul L2 inclus n pastila central au bus-urile FSB i BSB unificate sub denumirea de PSB. Aadar, denumirea de FSB are sens doar cu privire la procesoarele Pentium II, o parte din modelele Pentium III (doar cele cu nucleu Katmai) i unele variante de Athlon, toate avnd la baz platforma Slot 1 (pentru Intel) i
17

Evaluarea performanelor sistemelor de calcul

respectiv Slot A (pentru AMD). Aadar, orice procesor inserabil ntr-un socket, nu are FSB, ci PSB. Dei nu intr n categoria de mai sus, trebuie s menionm n final i un alt tip de memorie: ROM (Read Only Memory). Dup cum i spune i numele, aceast memorie nu poate fi dect citit, nu i scris prin metode obinuite. Distingem i aici mai multe varieti, diferite de ROM-ul standard: PROM (Programmable ROM) - care poate fi scris o singur dat, similar unui CD-R, EPROM (Erasable Programmable ROM) - care poate fi i rescris, similar unui CD-RW i EEPROM (Electrically Erasable Programmable ROM) memorie care poate fi rescris inclusiv prin metode software. Acest din urm tip este folosit ndeosebi n cazul BIOS-urilor diverselor componente (plci de baz, plci grafice), BIOS care este rescris n caz de necesitate (se spune c i se face update). BIOS-ul (Basic Input Output System) reprezint interfaa dintre hardware i software, elementul care face posibil comunicarea dintre un program i o component hard. l putem numi controller la nivel software, fiind n esen un program care traduce comenzile software-ului ntr-un limbaj propriu al componentei respective i invers. Ar putea fi asemnat i cu un driver, dar BIOS-ul lucreaz la un nivel mai low-level, mai apropiat de hardware i deine doar cteva funcii elementare, pe care se va baza driverul. Legat de EPROM i EEPROM, este puin forat denumirea de ROM pentru c, la prima vedere, funcionalitatea unei astfel de memorii este asemntoare memoriei RAM: informaia poate fi alterat. ns modul de construcie i ofer o vitez redus i o face utilizabil doar ocazional i n cantiti mici. 2.1.3. Interfeele interne: ISA, VLB, PCI, AGP etc Revenind la nceputuri, voi detalia istoricul interfeelor destinate dispozitivelor mai mult sau mai puin periferice, precum ISA, PCI, AGP, USB, IDE, Serial ATA i altele. Bus-ul ISA (Industry Standard Architecture) a fost inventat de IBM odat primul IBM PC, aprut la nceputul anilor '80 , calculator ce folosea magistrala de 8 bii specific procesorului 8088. ISA era destinat plcilor de extensie (plci grafice, controllere de hard disk) ce se ataau PC-ului. Odat cu 80286 i cu nevoile tot mai mari de vitez, s-a impus versiunea pe 16 bii a lui ISA, ce consta (fizic vorbind) ntr-o extensie la vechiul ISA, cu care era compatibil, n sensul c o plac de baz compatibil 16-bit ISA suporta plci de extensie 8-bit. Standardul s-a pstrat pn aproape de zilele noastre, chiar i azi mai putnd fi ntlnite plci ISA i plci de baz care s le suporte. Odat cu procesorul 80386DX, s-a pus problema unui nou bus, care s foloseasc din plin posibilitile acestuia, i anume adresarea pe 32 de bii. Astfel s-au nscut o serie de standarde, incompatibile ntre ele, i anume MCA (Micro Channel Architecture), EISA (Extended ISA) i VLB (VESA Local Bus, VESA = Video Electronics Standards Association). MCA a euat din cauza politicii IBM foarte restrictive, care s-a manifestat prin incompatibilitatea bus-ului cu vechiul ISA i prin decizia de a face acest standard proprietar; cu alte cuvinte, IBM era singurul care putea proiecta i fabrica plci de extensie destinate lui MCA. EISA a fost rspunsul lui Compaq la MCA, care a evitat cele dou greeli ale lui IBM dar nu a reuit s se impun
18

Cap 2: Evaluarea performanelor plcilor de baz

datorit preului mare practicat i a performanelor nu tocmai strlucite. A urmat bus-ul VLB ce a fost conceput pentru plcile grafice dar a fost folosit i pentru diverse controllere, fiind mult mai rapid fa de predecesori i avnd compatibilitatea cu ISA asigurat (fizic, plcile VLB aveau un conector suplimentar fa de ISA). Dei a devenit popular n epoca lui 486, odat cu introducerea de ctre Intel a bus-ului PCI (Peripheral Component Interconnect) VLB a deczut ca importan datorit problemelor de compatibilitate cu nou-aprutul Pentium i a altor detalii minore care adunate au determinat impunerea lui PCI pe pia. Acesta, ca i celelalte trei tentative de bus-uri pe 32 de bii (deloc sau doar parial reuite), oferea avantajul utilizrii ntregului potenial al procesoarelor 386 i 486 dar nu i al lui Pentium, care deinea un bus extern de 64 de bii. ns cum necesitile vremii nu au cerut altceva dect un simplu bus PCI pe 32 de bii, acesta a devenit un standard utilizat i n prezent, nu nainte de a deschide calea lui PCI-64, utilizat doar n servere. Pentru calculatoarele obinuite, urmaul lui PCI s-a numit AGP i a fost (i este) destinat doar plcilor grafice. AGP (Accelerated Graphics Port) a sosit mai trziu, n epoca jocurilor 3D, impunerea sa datorndu-se exclusiv nevoii tot mai mari de cretere a numrului de cadre pe secunde afiate n jocuri. n loc s se creasc limea de band, ca n cazul lui PCI-64, a fost crescut frecvena, de la 33 la 66 MHz, efectul fiind similar. Avantajele lui AGP n faa lui PCI sunt numeroase i legate n special de plcile grafice. Spre exemplu, a fost introdus posibilitatea ca chip-ul video s poat accesa memoria sistemului ca memorie video, realizndu-se aa-zisa texturare AGP. Desigur, tehnica este inferioar folosirii de ctre placa grafic a propriei memorii, dar aceasta poate fi ntr-o cantitate mai mic dect este necesar. Extinderea bus-ului AGP a dus la crearea standardelor AGP 2x, AGP 4x i AGP 8x, tehnici speciale permind atingerea unei frecvene virtuale de opt ori mai mari dect AGP-ul standard (numit i AGP 1x), dar care nu au adus mult-ateptatul spor de vitez din simplul motiv c ele nu erau necesare. De remarcat faptul c, odat cu dublarea limii bus-ului la 2x i respectiv 4x, au fost create noi standarde, numite AGP 2.0 i AGP 3.0. Ele modificau diverse aspecte interne (i relativ puin importante) ale bus-ului i scdeau tensiunea de alimentare de la 3.3 la 1.5V i respectiv de la 1.5V la 0.8V - o surs de incompatibilitate ntre unele plci grafice i de baz. Ultima realizare n domeniu se numete PCI Express. Standardul este total incompatibil cu oricare altul, att fizic ct i logic, fiind necesare controllere noi pentru a-l gestiona - practic plci de baz noi, bazate pe alte chipset-uri dect cele cunoscute. Dei n prezent utilitatea sa este legat exclusiv de plcile grafice, ce lucreaz n modul PCI Express X16 (de 16 ori mai rapid dect AGP-ul standard), majoritatea plcilor de baz compatibile PCI Express ofer cteva slot-uri X1 sau X4, n care pot fi introduse unele plci de extensie practic absente de pe pia. Chipset-urile PCI Express nu sunt, n general, compatibile cu AGP, motivul fiind ncercarea productorilor de a impune noul standard n defavoarea celui vechi. ns cu plcile PCI simplu nu exist probleme, ele putnd coexista cu PCI Express (de fapt, de ele este rspunztor southbridge-ul, care este comun tuturor northbridge-urilor, att cu controller AGP ct i cu PCI Express). Un alt avantaj al noului bus const n posibilitatea ca plcile grafice NVIDIA (i n curnd i ATI) s lucreze n mod SLI (Scalable Link Interface), o facilitate multiGPU. Astfel, este posibil existena a dou plci grafice n sistem care s lucreze n mod cooperativ, crescnd substanial performana n jocuri. Tehnologia se afl abia la nceput i nu este foarte popular, nefiind altceva dect o opiune pentru entuziati.
19

Evaluarea performanelor sistemelor de calcul

2.1.4. Interfeele externe: serial, paralel, USB etc Pe lng interfeele care permit conectarea componentelor interne, n spe plcile de extensie, porturile externe permit ataarea de dispozitive exterioare PC-ului care ndeplinesc diverse funcii, de la mouse pn la DVD writer. Porturile serial i paralel sunt prezente n practic toate sistemele, de la apariia PC-ului ncoace, fiind utilizate n principal pentru cuplarea unor dispozitive periferice externe (mouse serial, imprimant, modem, scanner etc). Diferenele dintre ele privesc modul de funcionare: portul serial transmite date pe un singur fir (bit cu bit), fa de cel paralel care transfer datele pe opt linii paralele (byte cu byte). Iniial, portul paralel era capabil de transmisie unidirecional (ntr-un singur sens), aceasta datorit limitrii standardului SPP (Standard Parallel Port); odat cu EPP (Enhanced Parallel Port), problema a disprut iar viteza maxim atins a crescut de la 150 KB/s la 2 MB/s. Nevoia tot mai mare de vitez a adus un nou impediment privind creterea ratei de transfer: utilizarea prea mare a procesorului sistemului. Pentru a se evita inconvenientul a fost introdus standardul ECP (Extended Capabilities Port) care lucra n aa-numitul mod DMA (Direct Memory Access), utilizarea procesorului fiind minim. Pe lng aceasta, EPP a oferit compresie/decompresie n timp real, ceea ce a constituit un ajutor remarcabil pentru dispozitivele ce necesitau rate mari de transfer. Perifericele conectate la portul paralel sunt diverse, cuprinznd n primul rnd imprimantele, scanner-ele, unitile de band dar i altele mai exotice, precum webcamurile. ns odat cu necesitile tot mai mari de la sfritul anilor '90, portul paralel a nceput ncet-ncet s fie dat uitrii, locul su fiind preluat de alte standarde incompatibile cu acesta. Portul serial, datorit vitezei sczute, nu poate fi utilizat dect de componente care nu necesit viteze mari, precum mouse-ul sau modem-ul. Un avantaj al su, de cele mai multe ori ignorat, este posibilitatea de transmitere a datelor la distane mult mai mari dect portul paralel. Putem aduga i numrul de fire de transmisie mai mic (3 n cazul portului serial fa de 19 sau 25 pentru paralel), deci costurile cablurilor sunt mai reduse. Concluzionnd, nu putem pune o relaie comparativ ntre portul serial i paralel pentru c ele au fost concepute pentru utilizri diferite. Ambele se afl n declin, ns nici un alt standard nu a reuit s se impun puternic din cauza costurilor ridicate, cu excepia celui PS/2 - utilizat azi pentru tastatur i mouse. Acesta a fost introdus de IBM n 1987, odat cu seria de PC-uri numit PS/2 (Personal System/2), un eec total pentru Big Blue. ns Intel s-a folosit de standard, el devenind uzual abia odat cu introducerea n 1997 a form factor-ului ATX, despre care vom vorbi mai trziu. Reinem c att mouse-ul ct i tastatura (conectat pn atunci prin standardul AT - compatibil pin la pin cu PS/2, dar de form mai mare) se leag n prezent la computer prin acest port. Un nou standard, pe numele su USB (Universal Serial Bus), a aprut din dorina de a se oferi o interfa universal, capabil s conecteze la PC orice fel de dispozitiv, de la mouse, imprimant, pn la interfa extern de sunet (similar unei plci de sunet dar situat n exteriorul PC-ului), TV tuner, hard disk i unitate optic.
20

Cap 2: Evaluarea performanelor plcilor de baz

Interfaa este plug&play i hot-swappable, ceea ce nseamn c orice dispozitiv va fi recunoscut automat de sistemul de operare i respectiv va putea fi conectat sau deconectat din zbor, fr a fi necesar o repornire. USB s-a impus foarte greu, pe parcursul ctorva ani el progresnd lent din cauza performanelor reduse ale dispozitivelor conectate la acest port, fapt datorat limitrii transferului la 12 Mbps. Spre exemplu, unui CD-ROM 40x i era imposibil s se conecteze la portul USB pentru c ar fi avut nevoie de un transfer de 6 MB/s (48 megabii pe secund), de patru ori mai mult dect limitele bus-ului. De aceea, USB a fost destinat doar dispozitivelor lente (totui mult mai rapide dect portul serial, care era limitat la cteva sute de Kbps). Soluia la problem a fost oferit de USB 2.0, a doua versiune a standardului, ce prevedea viteze de pn la 480 Mbps (60 MB/s, deci i un ipotetic CD-ROM 400x ar face fa). n prezent, majoritatea plcilor de baz suport interfaa USB 2.0 i dispozitivele ce se conecteaz la aceasta sunt din ce n ce mai multe. Totui, cei mai muli utilizatori prefer soluiile comune (dac ele exist), care cost mai puin i ofer aproape aceleai faciliti. Un port cu funcii mai avansate i cu o vechime mai mare este FireWire, numit i IEEE 1394, standard introdus de ctre Apple la mijlocul anilor '80 i oferit apoi ctre IEEE (Institute of Electrical and Electronics Engineers) pentru standardizare, de unde i numele alternativ. n 1995, acest institut lansa specificaiile sale oficiale, oferind trei rate de transfer posibile: 100, 200 i 400 Mbps. Aceasta n perioada n care USB, n prima sa versiune (12 Mbps) era doar n proiect... Totui, scopul lui FireWire este diferit: el dorete s conecteze la computer dispozitive ce au nevoie (i aveau nevoie nc de la acea dat) de viteze foarte mari, precum camerele video digitale, Sony adoptnd rapid standardul. ncet-ncet, FireWire a ctigat popularitate, devenind astzi ceva doar cu puin mai exotic dect USB (nefiind prezent pe orice plac de baz, dar cele high-end sigur l dein). n prezent, utilizarea sa este destul de larg, fiind folosit de dispozitive real-time de editare audio/video, dar i de produse destinate publicului larg, precum scannere, webcam-uri, uniti optice de stocare sau hard disk-uri portabile. Alt interfa ntlnit pe majoritatea plcilor de baz, dar mai rar folosit, este IrDA (Infrared Data Association), care permite schimbul de date wireless (fr fir) cu alte echipamente ce au incorporat o astfel de tehnologie (imprimante, laptop-uri, PDAuri, telefoane mobile, camere digitale etc) sau chiar cu un alt PC. Tot la capitolul interfee wireless mai merit menionat standardul Bluetooth, relativ folosit, dar nc exotic pentru utilizatorii obinuii. Prin intermediul acestuia, PC-urile, PDA-urile, telefoanele mobile, imprimantele i alte dispozitive, pot fi conectate folosind undele radio, pe distane scurte sau medii. Cum subiectul este destul de complex pentru a fi detaliat aici, trecem la capitolul urmtor. 2.1.5. Interfeele pentru dispozitive de stocare Interfeele de conectare a unitilor de disc nu au fost ntotdeauna att de rapide precum sunt astzi. Primul standard, introdus n IBM PC-ul original s-a numit ST-506, fiind dezvoltat n anul 1980 de ctre Seagate. Mai multe sub-standarde au respectat specificaiile ST-506, printre ele numrndu-se MFM (Modified Frequency Modulation, versiunea original), RLL (Run Length Limited, ce cretea densitatea datelor cu 50% i era compatibil cu MFM), ESDI (Enhanced Small Device Interface, ce oferea o rat de
21

Evaluarea performanelor sistemelor de calcul

transfer foarte ridicat pentru acea perioad) i, n final, IDE (Integrated Drive Electronics), numit i ATA (Advanced Technology Attachment). Spre deosebire de standardele iniiale, ESDI i mai ales IDE au integrat pe hard disk o mare parte din funcionalitatea controller-ului acestuia (i e uor s ne dm seama de acest lucru privind partea electronic a oricrui hard disk modern); astfel, viteza de transfer a crescut substanial. IDE aducea o serie de inovaii, fiind practic o versiune foarte sofisticat a lui RLL, oferind, spre exemplu, posibilitatea conectrii a dou hard disk-uri pe acelai cablu n combinaia Master/Slave. Transferul era realizat prin intermediul modului PIO (Programmable Input/Output) - n acest proces fiind angrenat i procesorul - sau DMA (Direct Memory Access), prin care controllerul IDE comunica direct cu memoria, procesorul fiind degrevat de aceast sarcin. Rata maxim de transfer era de 8.3 MB/s. O extensie a lui IDE, EIDE (Enhanced IDE), numit i FastATA sau ATA-2, oferea la mijlocul anilor '90 rate de transfer de pn la 16.6 MB/s, posibilitatea detectrii automate n BIOS a parametrilor hard disk-ului, precum i capaciti mai mari dect limita impus IDE-ul standard - 504 MB. De fapt, denumirile nu sunt perfect sinonime, EIDE i FastATA (numite astfel de Western Digital i respectiv Seagate) fiind versiuni ale standardului ATA-2 ce cuprind i specificaiile ATAPI (Advanced Technology Attachment Packet Interface). Este vorba de posibilitatea conectrii i a altor tipuri de uniti de stocare dect hard disk-urile, precum unitile optice (doar de tip CD-ROM la acea vreme), de band sau de dischete cu capaciti mari. ATA-3, introdus n 1997, nu a adus mbuntiri legate de vitez, ci privind securitatea, un Power Management extins (micorndu-se astfel consumul de putere) i, nu n ultimul rnd, legat de tehnologia SMART (Self Monitoring Analysis and Report Technology), ce permitea monitorizarea permanent a strii de sntate a hard disk-ului. Mai departe, ATA-4 (1998) a introdus modul Ultra DMA/33 (Ultra ATA, UDMA33 sau Ultra DMA 2), renunndu-se la mbuntirea modului PIO, UDMA33 oferind un maxim de 33 MB/s. ATA-5 (UDMA66 sau Ultra DMA 4), ATA-6 (UDMA100 sau Ultra DMA 5) i ATA-7 (UDMA133 sau Ultra DMA 6, srit de unii productori) nu au fcut dect s creasc rata maxim de transfer la 66, 100 i respectiv 133 MB/s, de obicei mai mult dect puteau oferi hard disk-urile acelei perioade. Aadar, marketing similar lui AGP 8x vs. 4x. Totodat, ncepnd cu Ultra DMA/66, numrul de fire ale cablului de date a crescut de la 40 la 80 pentru a se reduce interferenele electromagnetice ce ar putea aprea la viteze att de mari (fiecare al doilea fir era unul de mas, pentru ecranare). n plus, standardul Ultra DMA/100 a oferit i AAM (Automatic Acoustic Management), o facilitate care permite reducerea zgomotului emis de hard disk prin reducerea nesemnificativ a performanelor; totui, nu toate unitile suport AAM. Serial ATA (sau S-ATA) a fost urmtorul pas. Schimbrile palpabile au fost reprezentate de noile tipuri de cabluri, att pentru alimentare ct i pentru date (ultimul mult mai comod de folosit, fiind mai subire, cu doar 7 fire), precum i de eliminarea conceptelor de Master i Slave, fiecare hard disk avnd canalul su dedicat. Un alt avantaj remarcabil este hot-swapping-ul, fiind posibil introducerea/eliminarea hard
22

Cap 2: Evaluarea performanelor plcilor de baz

disk-ului fr a opri PC-ul; practic, orice hard disk normal poate fi acum folosit precum unul portabil. Standardul ATA a fost redenumit retroactiv n Parallel ATA (sau P-ATA), pentru a se putea diferenia uor de S-ATA. Denumirile provin chiar de la modul n care sunt transmise datele: P-ATA folosete mai multe ci pentru transmiterea n paralel a informaiilor (de aici i numrul mare de fire necesar), pe cnd S-ATA efectueaz o transmisie serial. Versiunile curente sunt Serial ATA original (150 MB/s) i Serial ATA II (300 MB/s), dar se ateapt adoptarea n viitor a lui Serial ATA III pentru 600 MB/s. Separat de ATA/IDE i variantele sale, SCSI (Small Computer System Interface - pronunat scazi, n dou silabe i cu accent pe a) a devenit, ncepnd cu mijlocul anilor '80 , un standard foarte utilizat n workstation-uri, servere i, ocazional, n PCurile high-end. Avantajele sunt numeroase (vitez mai mare, ocupare minim a procesorului n timpul transferului, daisy-chaining etc) i nu afecteaz n mare msur utilizatorul obinuit. SCSI este folosit i n alte scopuri, precum conectarea imprimantelor sau a scanner-elor. Orice controller P-ATA/S-ATA/SCSI poate fi integrat pe placa de baz (este cazul P-ATA, cel puin pentru plcile fabricate n ultimii 10 ani, a celor S-ATA pentru mai toate modelele de plci din ultimul an, precum i cazul SCSI pentru plcile de baz de servere), dar se poate gsi i separat, sub forma unei plci de extensie ce se ataeaz prin intermediul unui slot (PCI, eventual VLB sau ISA). n finalul acestui capitol, trebuie s spunem cteva cuvinte i despre unitatea de dischete, al crei controller a trecut prin multe faze, ncepnd cu MFM (controller care putea gestiona att floppy-ul ct i hard disk-ul), el fiind azi integrat pe placa de baz. Cablul de date este asemntor celui IDE, ns cu numai 34 de fire. De notat c unitile floppy se mai pot conecta prin SCSI sau USB

2.2. Testarea plcilor de baz Socket 939


2.2.1. Introducere Platforma Socket 939 nu poate fi dect atrgtoare, performana actual dar mai ales cea viitoare, posibil printr-un upgrade la un procesor mai rapid fiind imboldul care golete magazinele de puinele plci cu 939 de pini. Platforma Socket 939 este una high-end, ce se adreseaz n primul rnd utilizatorilor cu pretenii mari i n acelai timp cu buzunarele ceva mai pline dect ceilali. AMD a lansat primele procesoare AMD64 odat cu platforma Socket 940, nlocuit rapid de cea 754. Procesoarele sunt practic identice, dar cele cu 754 de pini sunt limitate la un controller de memorie single-channel. Cu alte cuvinte, o platform mainstream. Socket 939 este urmaul lui S940, AMD determinnd astfel utilizatorii de Socket 940 s schimbe placa de baz pentru a obine un pin n minus dar compatibilitate cu nou-aprutele modele de Athlon 64 i Athlon 64 FX. Totui, de ce aceast schimbare? Socket 940 necesit memorii de tip registered din cauza motenirii arhitecturii lui Opteron; modelele cu un pin mai puin au scpat de aceast limitare, modulele non-registered (unbuffered) fiind mult mai ieftine. Dual-channel-ul oferit de pinii suplimentari (n comparaie cu 754) readuce n prim-plan o tehnologie att de bine
23

Evaluarea performanelor sistemelor de calcul

gndit nct nu merita s moar: limea de band a memoriei este dublat folosind un mic artificiu, destul de puin costisitor. n continuare se vor prezenta o serie de teste realizate cu placi de baz Socket 939. Produsele testate sunt nzestrate cu slot-uri PCI Express, plcile cu suport AGP urmnd s fac subiectul unor teste viitoare, n caz c se vor gsi pe pia n cantiti suficiente. Oricum, bus-ul AGP este nc suportat de o serie de plci, ns numrul lor este n scdere, n cteva luni - maxim un an - urmnd s aib loc impunerea plcilor grafice PCI Express. Astfel este lsat n urm un bus ce a dominat ultimii 78 ani i care a fost izgonit oarecum pe nedrept, complotul marilor productori neavnd, aparent, o justificare clar. E adevrat, acum putem avea din nou dou plci grafice n sistem, unite prin SLI, performanele obinute fiind foarte mari (la un pre foarte mare), plus alte mici detalii care fac diferena dar nu justific renunarea la un bus ce nu constituia limitarea n calea obinerii de performane maxime. Chipset-ul nForce4 de la NVIDIA se pare c domin plcile PCI Express, cele mai multe produse de pe pia i toate cele testate dotate cu acesta. nForce3 este deja depit datorit suportului pentru AGP i a lipsei unor faciliti incluse n urmaul su. La fel i K8T880 (Pro), doar K8T890 fiind comparabil cu nForce4, dar el nu a fost adoptat la scar larg. n toate variantele sale (simplu, Ultra, SLI i eventual neoficialul 4X) nForce4 ofer o serie de faciliti deosebite, NVIDIA fiind o companie care n ultima vreme a nceput s dea tonul pe piaa plcilor de baz pentru procesoare AMD. Amintim de Serial ATA II (numai n versiunile Ultra i SLI), ce dubleaz limea maxim de band fa de prima versiune de Serial ATA (avantaj total neobservabil n practic) i suport pentru modul SLI (doar n versiunea nForce4 SLI) cu alte cuvinte e posibil conectarea a dou plci grafice PCI Express pentru performane nu chiar duble dar foarte mari. nForce3 deine i el o serie de funcii inovatoare, cum ar fi un Firewall integrat, ns ncepe ncet-ncet s-i resimt btrneea. 2.2.2. Modul de testare nainte de orice, trebuie s stabilim cine sunt utilizatorii n pielea crora am ncercat s intrm, evalund la snge produsele. n primul rnd, este vorba de entuziati, cei ncntai mai degrab de o dotare n plus sau, n egal msur, de opiune ascuns n BIOS care le permite un overclocking superior, dect de un pre mai mic. Calificative precum excelent sau extrem cost i vor costa ntotdeauna foarte mult, aadar dac cititorul este interesat mai degrab de un ECS ieftin, dotat numai cu cteva elemente eseniale i al crui pre nu trece de 50-60 de dolari, ar trebui s parcurg testul nostru cel mult din curiozitate. n lucrare, au fost punctate cu o pondere mai mare caracteristicile pe care un pasionat i le-ar dori la placa sa de baz, precum un port FireWire sau o frecven mare atins prin overclocking. Testul a fost mprit n patru categorii, i anume: performan,
24

Cap 2: Evaluarea performanelor plcilor de baz

faciliti, construcie & ergonomie; documentaie & service. Ponderea performanei a fost relativ mic, de 40%, diferit fa de cele mai multe review-uri ntlnite n diverse reviste sau pe web. Aceasta deoarece am considerat c performana unei plci de baz este extrem de puin important n luarea unei decizii privind achiziionarea uneia pentru c diferenele sunt de ordinul a 1-2%, maxim 3%. De aceea, alii sunt factorii care ar trebui s influeneze un potenial cumprtor. Performana a fost evaluat prin rularea mai multor programe speciale de benchmark, a unora ce au alt scop dar care dein i un modul de testare a vitezei sau pur i simplu prin cronometrarea timpului scurs ntre dou momente ntre care a fost efectuat o anumit operaie. Testele analitice au avut o pondere mic. Astfel, testul de lime de band a memoriei din SiSoft Sandra i cel de laten a memoriei din ScienceMark au contat cu cte 5%. SPECviewperf i 3DMark 2001, dei sintetice, reflect destul de bine activitatea profesionitilor n grafic i a gamerilor, de aceea au contat cu 8 i respectiv 12.5%. Restul testelor au fost practice: arhivarea unor fiiere cu WinRAR (8%), comprimarea unui film cu codec-ul XviD (8%), randarea unei imagini cu PovRay (8%), copierea unor fiiere de pe o partiie pe alta a unui hard disk Serial ATA (8%), testele implicite din 3DMark 2001, FarCry i Unreal Tournament 2004 (12.5% fiecare) i un test special creat n Quake3 care folosete procesorul mult mai mult dect testul implicit (12.5%). De remarcat faptul c testele 3D au contat n total cu 50% din punctaj (excludem de aici SPECviewperf care, dei ruleaz n mod 3D, se adreseaz altei categorii de utilizatori). Facilitile au contat tot cu 40 de procente. Am inclus aici numrul de slot-uri i porturi, complexitatea interfeei de sunet, facilitile din BIOS (n special cele legate de overclocking), precum i software-ul livrat. Menionm pentru cei (ne)interesai de overclocking c opiunile destinate acestei practici, precum i rezultatele testelor realizate n condiii extreme au contat cu 35% din cele 40 de procente ale facilitilor, deci cu 14% la nota final. Mult, puin, rmne s judecai dumneavoastr. Ergonomia i construcia, reunite ntr-o singur rubric, au contribuit cu 15% la rezultatul final. Au fost acordate note att comoditii operrii pe placa de baz, n interiorul carcasei (de exemplu poziia jumper-ilor i a conectorilor), precum i diverselor indicii privind fiabilitatea produsului, lund n seam temperaturile atinse de diversele componente de pe plac i alte aspecte subiective. Este imposibil de evaluat fiabilitatea oricrui produs hardware, fiind necesare luni sau chiar ani pentru ca primul defect s-i fac apariia, precum i un numr mare de produse care s fie supuse testelor. De aceea, punctajul oferit aici a fost destul de mic i n totalitate subiectiv, un rol important jucnd experiena n acest domeniu. n fine, documentaia i service-ul au completat ultimele 5 procente, fiind punctat manualul, garania, precum i posibilitatea de contact online cu productorul.

25

Evaluarea performanelor sistemelor de calcul

2.2.3. Testarea efectiv Sistemul de test a constat ntr-un procesor Athlon 64 3200+ (nume de cod Winchester - 0.09 microni, 2000 MHz, 512 KB L2 cache, 1.4V, frecvena maxim la care rula stabil: 2550 - 2600 MHz la 1.6 1.65V), un kit de memorii Corsair TwinX1024-3200XLPT ce totalizau 1 GB, o plac grafic Gigabyte GV-NX66T128D cu chip GeForce 6600 GT (128 MB, 500 MHz core, 1000 MHz memoria), un hard disk Western Digital Caviar SE (WD800JB) de 80 GB cu 8 MB cache pe Parallel ATA, iar pentru evaluarea performanei controller-ului Serial ATA am montat un Seagate Barracuda 7200.7 SATA cu aceleai specificaii. Driverele au fost cele mai noi oficiale la data nceperii testrii, i anume nForce4 Standalone Kit 6.39 i ForceWare 66.93. Sistemul de operare, desigur, Windows XP SP2. Fiecare plac a fost setat, dup un update al BIOS-ului (dac exista unul mai nou dect cel cu care placa venea), la maximul de performan pe care l puteam obine n condiii de stabilitate perfect. Stabilitatea a fost msurat cu al cincilea test din Memtest86+1, urmat de cteva procente din testul 7. Nu am rulat Prime952 pentru c procesorul nu avea prea mult motive s manifeste instabilitate, iar testele rulate pentru a evalua performana sunt suficient de stresante pentru acesta pentru a se bloca sau a da erori n caz de probleme. Setrile principale de memorie, i anume CAS Latency, tRCD, tRP, tRAS i Command per Clock au fost setate la minimul posibil, de obicei CL2 2-2-5 1T, ns au fost i cazuri n care am rulat n CL1.5 2-2-0 1T. tRC, tRFC, tRRD, tWR, tWTR, tRTW, tREF sunt alte cteva setri, primele dou ieind n eviden prin faptul c au valori mari, de minim 7 i respectiv 9. Rareori am rulat stabil n aceste condiii, valorile normale fiind 9 i respectiv 12. De asemenea, Bank Interleave a fost i el activat. Overclocking-ul a fost testat n dou moduri, n ambele situaii scopul fiind obinerea unui bus HTT maxim (n pai de 5 MHz). Am setat multiplicatorul (dac placa a permis acest lucru) n aa fel nct frecvena final a procesorului s fie cel puin egal cu cea implicit, de 2 GHz, iar celelalte setri au fost puse la minim sau aproape de minim, n aa fel nct ele s nu afecteze stabilitatea (LDT 2x sau 3x, CL3 4-4-8 2T etc). Apoi am setat memoria att sincron cu HTT-ul ct i la un raport de 1:2 fa de acesta. Tensiunea procesorului a fost ajustat la 1.65V (sau cea mai apropiat valoare mai mic de 1.65V pe care o permitea BIOS-ul) - maximul la care putem sta linitii c nu urmeaz o mic explozie n interiorul acestuia. De asemenea, tensiunea memoriei a fost urcat pn la maxim 2.9V iar dac placa permitea setarea voltajului chipset-ului, am realizat i aceast modificare, crescnd valoarea la maxim. Nu am folosit programe de tip A64 Tweaker sau ClockGen pentru a efectua alte setri dect cele ale BIOS-ului sau a ncerca creterea HTT-ului direct din Windows. 2.2.4. Abit AN8 Fatal1ty (nForce4 Ultra) AN8 Fatal1ty poart numele lui Johnathan Wendel, alias Fatal1ty, un gamer care la doar 23 de ani a ctigat numeroase turnee de 3D Shootere (Quake3, Unreal Tournament, Doom3). Placa are ca scop declarat obinerea celor mai mari performane, ns tim cu toii c diferenele dintre plci dotate cu acelai chipset, sau chiar cu chipset-uri diferite, sunt minime (desigur, dac neglijm factorul overclocking). Productorul susine c seria Fatal1ty (deschis cu modelul AA8XE pentru Pentium 4)
1 2

http://www.memtest.org/ http://www.mersenne.org/freesoft.htm 26

Cap 2: Evaluarea performanelor plcilor de baz

este creat special pentru jocuri, att datorit performanelor extreme ce pot fi obinute ct i faptului c placa a fost lipsit de anumite componente pe care gamerii nu le folosesc - fcnd referire, probabil, la absena porturilor serial i paralel. Aadar, avem de-a face cu o campanie de marketing aparent reuit, mai ales dac inem seama de aspectul exterior al produsului, extrem de atrgtor. S vedem ce surprize ne mai rezerv. Cele dou cutii incluse n pachet, cu care Abit ne-a obinuit de ceva vreme, conin diverse accesorii utile plcii. Nu s-a pus att de mult accent pe cantitate, precum vedem la plcile Gigabyte high-end. Astfel, nu avem dect un bracket USB 2.0/FireWire, totaliznd (mpreun cu porturile din back-panel) ase i respectiv trei porturi. ns pe plac avem un singur conector extern de FireWire, ceea ce nu justific cele dou porturi prezente pe bracket.

Cablurile Serial ATA sunt n numr de patru, iar pentru alimentarea hard diskurilor este disponibil un convertor molex SATA, ce conine doi conectori. Cablurile Parallel ATA sunt n numr de unu, ns el iese n eviden prin faptul c este de tip rounded, acoperit cu un plastic transparent, astfel nct cele 80 de fire se afl la vedere. i cablul floppy este rounded, ns de culoare neagr. Un efect deosebit s-ar fi obinut dac i aceste din urm cabluri erau de culoare rou-viiniu, precum cele SATA, PCB-ul plcii, slot-urile PCI i DIMM i cele cteva LED-uri. Dac pn aici nu am gsit nimic ieit din comun, situaia se schimb dramatic odat ce punem ochii pe OTES RAMFlow, un set de dou ventilatoare de 40 mm nglobate ntr-o carcas de plastic i destinate rcirii memoriilor. Ele se aeaz deasupra slot-urilor DIMM, prinzndu-se cu ajutorul a dou cleme, meninnd astfel memoriile la o temperatur la care s suporte un overclocking superior condiiilor normale. Iat c ncet-ncet acele performane extreme promise ncep s-i arate colii...

Rcirea extrem este lucrul de care Abit s-a ngrijit cel mai mult. Tranzistorii de tip MOSFET sunt acoperii de radiatoare, iar dac temperatura acestora depete o anumit limit, spre ele ncep s bat dou ventilatoare Dual OTES tot de 40 mm dar mai adnci dect cele normale, poziionate n locul porturilor PS/2, serial i paralel pe plcile obinuite. De asemenea, rcirea chip-ului principal (nu a chipset-ului, pentru c nForce4 este construit dintr-un singur chip) este, dup spusele lui Abit, eficient, radiatorul fiind realizat din cupru. Practic, este vorba de cooler-ul clasic Abit, ntlnit de exemplu la modelul NF7, doar culoarea roie trdeaz materialul din care a fost confecionat. Nu putem trece mai departe fr a enumera succint celelalte elemente de
27

Evaluarea performanelor sistemelor de calcul

pe plac: un slot PCI Express X16, dou X1, trei PCI, dou porturi IDE aezate culcat (un bravo! la ergonomie), patru Serial ATA 300 coordonate de southbridge-ul integrat n chip-ul central, iar de reeaua Gigabit se ocup un integrat Vitesse. n caz c neglijm alimentrile de ventilatoare deja ocupate (dou cu rcirea surselor de putere, una cu chip-ul nForce4, una opional pentru rcirea memoriilor), gsim doar dou fan headere libere, ceea ce nu prea st bine unui produs Abit, care ne-a obinuit cu patru sau chiar cu cinci astfel de conectori. Dac mufa de floppy nu s-ar fi aflat ntr-o poziie extrem de proast, i anume n spatele ultimului slot PCI, nota la ergonomie ar fi fost mare. Oricum, la acest capitol AN8 st bine, peste medie. Performanele nu au dezamgit, fiind normale pentru o plac bazat pe acelai chipset (sper c mi este permis folosirea n continuare a acestui termen, el specific foarte clar la ce se face referirea dei este impropriu numit astfel). Trecnd la analiza BIOS-ului, primul lucru care iese n eviden este imposibilitatea setrii multiplicatorului. Imposibil i inadmisibil pentru o plac Abit, cu att mai mult cu ct e vorba de una de vrf. n testul de overclocking, placa se oprea fr drept de apel la un HTT de 255 MHz din cauza procesorului care nu reuea s ruleze stabil la frecvene mai mari (reamintesc c este vorba de un Athlon 64 3200+ ce ruleaz stabil la puin sub 2600 MHz, frecvena standard fiind de 2 GHz). Problema poate fi rezolvat cu versiunea beta de BIOS (12 beta 1, varianta iniial fiind 11), ce rezolv problema multiplicatorului. Frecvenele maxime atinse prin overclocking au fost de 310 MHz sincron i 375 MHz cu raport de 2:1 ntre HTT i memorie, valori foarte bune. n acordarea notei sa inut seama doar de funcionarea cu acest BIOS beta deoarece lansarea variantei finale de ctre Abit este iminent. BIOS-ul este foarte bun, dei nu de excepie. Setrile uzuale sunt la locul lor, n meniul SoftMenu, devenit acum Guru. Tensiunea procesorului poate fi ajustat pn la 1.75V, cea a memoriei pn la 2.8V, valori aproape deranjant de comune. Nu aveam pretenia la 4V la memorie, rulm cu Abit, nu cu DFI, dar un 3.2V pentru a hrni memorii precum Winbond BH5 nu ar fi stricat deloc. Voltajul chipset-ului poate urca pn la 1.8V, valoarea cea mai mare ntlnit (pe majoritatea plcilor el se limiteaz la 1.65V). Temperatura cooler-ului de pe chipset nu a fost deloc mic, semn c radiatorul de cupru lucreaz la maximul de care este capabil. Setarea greit a parametrilor sensibili poate duce, desigur, la imposibilitatea pornirii. Placa detecteaz automat aceste situaii, nefiind necesar nici mcar apsarea clasicei taste Insert pentru ca sistemul s POST-eze. n cel mai ru caz, avem la dispoziie LED-urile binecunoscute, ce indic printr-un cod de eroare starea n care sistemul s-a agat. Turaiile celor maxim ase ventilatoare pot fi reglate n fel i chip, existnd posibilitatea setrii unei valori minime de temperatur la care s intre n funciune ventilatorul la o turaie mic (reglabil n voli), ct i o valoare destinat turaiei maxime. Monitorizarea este bun, att pentru temperatur ct mai ales pentru voltaje, fiind prezente i cmpuri rar ntlnite, precum voltajul de standby al chipset-ului. O problem destul de grav am ntlnit-o chiar de la pornirea plcii: dup cteva secunde, ea s-a nchis irevocabil din cauza ventilatorului pentru procesor alimentat din alt conector. Pe lng faptul c suntem obligai s folosim, la prima montare a plcii (sau dup reset-area BIOS-ului) un anume conector, sunt ventilatoare care se alimenteaz din mufa molex i care practic nu pot fi folosite pe aceast plac pn nu i este setat n BIOS opiunea de a nu stinge sistemul dac observ c CPU Fan raporteaz zero turaii. Soft-ul livrat include, pe lng un program de scriere a BIOS-ului din Windows, Abit EQ i OC Guru, utilitare capabile cam de aceleai lucruri ca i meniurile de
28

Cap 2: Evaluarea performanelor plcilor de baz

monitorizare i respectiv overclocking din BIOS. n plus, n cazul lui Abit EQ exist trei preset-uri: Quiet, Normal i Turbo, ce corespund valorilor de 204, 210 i 216 MHz pentru HTT, ajustndu-se n acelai timp i voltajul memoriei i procesorului. ntlnim acelai 204, valoare considerat implicit de anumite plci Abit, precum AV8. De aceea, putem face presupunerea c viitoarele BIOS-urile de AN8 ar putea recurge la aceeai metod, nu foarte ortodox, de a crete performana plcii. Ce lipsete? Dispozitivul extern 3rd Eye, prezent pe multe plci mai slab cotate. Dar dac spm puin, descoperim c exist i modelul cu al treilea ochi, puin mai scump. Concluzie Nu este foarte plcut s afli c placa de baz pe care tocmai ai cheltuit o sum impresionant are un BIOS n stadiu beta, dei marcat ca oficial. Acesta este unul dintre puinele impedimente care pot hotr un entuziast s nu cumpere Abit AN8 Fatal1ty. + potenial mare de overclocking + rcire excelent + LED-uri de diagnosticare + prezentare atrgtoare - BIOS beta - doar 2.8V pentru memorie - pre mare 2.2.5. Abit AN8 (nForce4) Probabil ai remarcat pe parcursul acestei prezentri c uneori m-am referit la plac numind-o AN8 pur i simplu, fr sufixul Fatal1ty. De ce? Pentru c exist i versiunea AN8 simplu, ce nu difer de sora mai mare dect prin culoarea PCB-ului i a slot-urilor, prin inscripionarea diferit a sistemului de rcire a surselor de putere, prin absena modulului de rcire a memoriilor i prin dotarea puin mai obinuit la capitolul cabluri (de exemplu, nu avem cabluri IDE rounded ci normale). i nu n ultimul rnd, prin dotarea cu chipset-ul nForce4 simplu, ce nu dispune de Serial ATA 300, ci de versiunea ce permite un transfer de doar 150 MB/s. Diferena este absolut insesizabil, testele nu au scos-o n eviden. Teste care au demonstrat performane identice i frecvene de overclocking atinse la fel de identice. Preul ei este cu circa 25% mai mic, aadar este foarte discutabil dac achiziionarea versiunii Fatal1ty reprezint o opiune bun.

Concluzie + potenial mare de overclocking + rcire bun


29

Evaluarea performanelor sistemelor de calcul

+ LED-uri de diagnosticare + prezentare atrgtoare - BIOS beta - doar 2.8V pentru memorie 2.2.6. DFI LANParty UT nF4 Ultra-D (nForce4 Ultra) BE6-II, KX7-333, IT7, NF7 - toate sunt modele de plci de baz de la Abit ce ntr-un moment sau altul au fcut istorie, fiind considerate adevrate campioane ale overclocking-ului. Probabil v vei ntreba ce au ele n comun cu DFI-ul despre care vrem sa discutm aici?; ei bine, ele, ca i ultimele modele produse de DFI, poart semntura aceluiai inginer, pe nume Oscar Wu. Aceasta, mpreun cu lista de specificaii tehnice i mai ales cu opiunile foarte ndrznee disponibile n meniul BIOS-ului (pe care le vom detalia mai trziu), ar trebui s spun multe despre cui se adreseaz placa de fa.

La o prim vedere aruncat asupra ambalajului, singura opinie este legat de culorile folosite i de imaginea stilizat ce las impresia unui ambalaj de jucrii. Deschiznd cutia, observm un coninut nu foarte bogat, nsa interesant dac lum n calcul c modelul prezentat aici este cea mai srac variant din oferta DFI a acestei game. Cablurile (dou ATA-133 rounded, dou S-ATA, unul FDD rounded) sunt toate de culoare galben i sensibile la ultraviolete i, mpreun cu combinaia de culori (PCB cafeniu i slot-uri galbene la fel de UV-sensitive) folosit de placa de baz, pot avea un aspect destul de plcut ntr-o carcas cu fereastr. Alturi de aceste cabluri, sunt furnizate un adaptor pentru alimentarea a dou hard disk-uri S-ATA, un cletior pentru manevrarea mai uoar a jumper-ilor, cinci jumperi suplimentari cu mo, trei seturi de jumperi SLI de rezerv i un back-panel ce asigur compatibilitatea configuraiei mufelor la orice carcas. De asemenea, n cutie se mai gsesc un manual nu foarte bogat, ns cu informaii suficiente pentru ca instalarea s decurg fr probleme, CD-ul cu drivere i utilitare, un pliant ce prezint tehnologia CMOS Reloaded, o dischet cu driverele de RAID Silicon Image (inutil, deoarece controller-ul Sil3114 se afl numai pe modelele high-end), precum si exoticul modul audio Karajan, care dei nu e dect un simplu codec ALC850 pe opt canale ce se monteaz pe un PCB separat, se presupune c ofer o mbuntire calitativ a semnalului fa de implementarea obinuit onboard.

30

Cap 2: Evaluarea performanelor plcilor de baz

Trecnd la analizarea aspectului plcii, observm poziionarea mai deosebit a slot-urilor de memorie i a procesorului, probabil n efortul de a reduce lungimea traseelor bus-ului HyperTransport; un vot n plus pentru inginerii DFI, pentru c au depus efortul de a modifica att de radical PCB-ul de referin NVIDIA. Analiznd sistemele de rcire, observam c att tranzistorii ce deservesc sursa de alimentare a procesorului, ct i cei pentru RAM i chipset, sunt dotai cu radiatoare de dimensiuni impresionante, din aluminiu, ce promit o funcionare stabil a respectivelor module n condiii extreme. Punnd i cooler-ul de pe chipset sub lup, cooler ce are dimensiuni peste medie i beneficiaz de un ventilator Mag-Lev (teoretic de cteva ori mai fiabil dect cele ball bearing si n acelai timp mai silenios), i adugnd la aceasta faptul c sunt prezente nu mai puin de 4 (patru!) mufe de alimentare pentru placa de baz (ATX 2.0, +12V, molex HDD + mufa FDD), nu putem trage dect o concluzie: placa e proiectat s gzduiasc componente ce consum foarte multa putere. Overclocking anybody? Majoritatea conectorilor au o amplasare bun, singurul care aduce o penalizare mai serioas este unul din cei de alimentare, i anume cel cu mufa de FDD, plasat foarte aproape de centru; existena lui acolo este justificata dac ne gndim la eficien maxim, pentru c livreaz curentul foarte aproape de consumator, eliminnd astfel pierderile suplimentare prin traseele de pe PCB-ul plcii de baza. Un alt lucru care merit cu siguran atenia e prezena a dou slot-uri PCI Express X16, iar alturi de ele existena unor seturi de jumperi ce se pot seta pe Normal sau SLI, ntocmai ca la modelele ce suport modul SLI. Mai mult, AnandTech3 a sesizat acum ceva timp c chipset-urile nForce4 Ultra i nForce SLI sunt unul i acelai, diferena constnd doar n prezenta unei puni conectate pe chipset (similare celei ntlnite la procesoarele Athlon), ce permite identificarea chipset-ului ca avnd sau nu posibiliti de SLI. DFI-ul a suportat cu succes modificarea (ce poate fi realizat cu un creion, cu substan electroconductoare sau chiar cu pistolul de lipit - nerecomandat celor care nu au priceperea necesar), funcionnd perfect cu dou plci grafice Leadtek 6800 n mod SLI, sistemul overclock-at depind bariera celor 19.000 de puncte in 3DMark03. Back-panel-ul e special, gzduind nu mai puin de ase mufe USB, dou RJ-45 (LAN Gigabit), una FireWire, ase jack-uri audio, dou conectoare de tip RCA (intrarea, respectiv ieirea SP/DIF), precum i obinuiii conectori PS/2 pentru tastatur i mouse. Se observ eliminarea conectorului pentru portul paralel, n timp ce cel serial precum i unul suplimentar FireWire i patru USB pot fi conectate intern pe placa de baz, dei conectorii de extensie lipsesc. Ultimul lucru legat de layout ce merit menionat este prezena switch-urilor de Power i Reset precum i a unui speaker direct
3

http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2322 31

Evaluarea performanelor sistemelor de calcul

pe placa de baza, pe care am avut ocazia s le apreciem n timpul testelor, placa avnd funcionalitate deplin fr a necesita folosirea unei carcase. Mai departe, descoperim un BIOS extrem de bogat care, pe lng numrul foarte mare de setri legate de memorie, permite reglarea tensiunii Vcore (pentru procesor) pn la 2.1V, VDD (chipset) pn la 1.8V, LDT (HyperTransport) pn la 1.5V i, cel mai impresionant, Vdimm (cea a memoriei) pn la 4V. Dei aceast din urm setare e util doar n cazul n care sunt folosite memorii cu anumite chip-uri Winbond ce rspund dar mai ales rezist la asemenea valori, notm nc un punct n plus pentru DFI din partea entuziatilor. Toate setrile legate de overclocking sunt strnse ntr-o singur categorie a BIOS-ului, numit Genie BIOS - i cnd zic toate nu m refer doar la memorie i voltaje, ci i la posibilitatea de a dezactiva anumite device-uri on-board ce ar putea limita overclocking-ul extrem (porturi S-ATA, on-board LAN etc) - de unde putem afla tensiunile critice i, foarte interesant, avem posibilitatea de a rula Memtest86+ imediat dup POST (test ce este integrat n chip-ul de BIOS). Ambalajul de jucrii conine, se pare, i ceva jucrii de oameni mari. Un lucru de asemenea special este CMOS Reloaded, ce const n posibilitatea de a stoca patru configuraii ale BIOS-ului, ce se pot ncrca mai trziu prin simpla apsare a unei taste; alturi de modul Safe Boot selectabil printr-un jumper (pentru a nu fi necesar s resetm BIOS-ul), este o unealt foarte util n cazul overclocking-ului sau al testrii componentelor. Trecnd mai departe la msurarea performanelor, am observat un comportament excelent, placa stabilind referina pentru celelalte incluse n test, mai ales datorit faptului c a suportat setri ale memoriei mai agresive dect n cazul celorlalte modele. Astfel, setrile CAS i TRAS au mers coborte pn la unele valori mai neobinuite, i anume 1.5 i respectiv 0, n timp ce la celelalte modele testate nu am reuit sa le coborm n condiii de stabilitate mai jos de 2, respectiv 5. De asemenea, tRC, tRFC si tRRD au cobort pn la 7-9-0, comparativ cu 9-12-2 la celelalte. Cea mai mare diferen de performan a avut loc n compresia WinRAR, unde placa a punctat cu 1.5% mai bine dect urmtoarea clasat. Overclocking-ul este ns capitolul unde DFI arat cu adevrat tot ce poate. Fornd memoriile Corsair la latene crescute, am reuit s le mpingem pn la o frecven stabil de 315 MHz, destul de impresionant avnd n vedere c ele sunt certificate la o frecven de lucru de 200 MHz (cu latene mult mai strnse ns). Cel mai impresionant lucru a fost HTT-ul atins, i anume 445 MHz, folosind un divizor 2:1 pentru memorie; astfel, placa a dovedit c poate rula stabil la o frecven aproape de dou ori i jumtate mai mare fa de specificaii. Software-ul inclus pe CD-ul cu drivere const ntr-un program de monitorizare (ITE SmartGuardian) ce permite i controlul turaiei ventilatoarelor n funcie de temperaturi, soft-ul NVIDIA nTune precum i un alt utilitar numit ITE SmartSpeed. Acesta conine, pe lng funcionalitatea lui ITE SmartGuardian, i posibilitatea setrii tensiunilor Vcore, Vdimm si VDD, precum i un overclocking limitat. Aceast din urm funcie este total nereuit, posibilitile de supratactare fiind practic nefuncionale, aceasta pe lng greelile evidente de limb englez din program. Per total, micul productor DFI reuete s se prezinte cu o ofert excepional, singurele categorii care ar putea fi mbuntite fiind legate de documentaie i de funcionalitatea software-ului; avnd ns n vedere c target-ul produsului se afl mai degrab n zona power-user, aceste lipsuri sunt ca i inexistente.

32

Cap 2: Evaluarea performanelor plcilor de baz

Concluzie Performana i posibilitile deosebite de overclocking fac din DFI LANParty UT nF4 Ultra-D ctigtorul testului nostru, chiar i n competiie cu modelele high-end de la productori consacrai. Titlul de XF Award l-a primit cu greu din cauza absenei de pe piaa romneasc la data efecturii testelor. + overclocking extrem atins n practic + BIOS special conceput pentru overclocking + numeroase setri de memorie + poate fi transformat uor pentru lucrul n mod SLI - documentaia i software-ul las de dorit 2.2.7. Gigabyte GA-K8NXP-SLI (nForce4 SLI) Plac creat special pentru a oferi maximul de performan dintr-un sistem de gaming, este dotat cu dou slot-uri PCI Express X16, GA-K8NXP-SLI impresioneaz n primul rnd prin dotare i, de ce nu, prin aspectul estetic de excepie. Mai nti sare n ochi cutia dubl fa de cea a unei plci normale, n interiorul pachetului aflndu-se dou cutii mai mici, pline cu jucrii. n prima gsim (enumerate ntr-o ordine aleatoare) o foaie ce face reclam la cooler-ul 3D Rocket, creat tot de Gigabyte (un model foarte reuit), un manual bine scris, unul destinat chip-ului Sil3114 (hint: Serial ATA, RAID 5), un ghid de instalare rapid sub form de pliant, scris n cteva limbi, un abibild Gigabyte... i cam att cu maculatura. Lucrurile mai serioase se concretizeaz prin nu mai puin de opt cabluri Serial ATA i patru cabluri convertoare molex alimentare SATA (cu cte doi conectori pe fiecare cablu) i numai un cablu Parallel ATA. Cu alte cuvinte, fiecare hard disk Serial ATA ce poate fi utilizat mpreun cu aceast plac de baz nu va avea nevoie de nici un cablu suplimentar fa de cele livrate.

n cealalt cutie avem deja obinuitul DPS (Dual Power System) cu care ne rsfa Gigabyte de circa doi ani ncoace, precum i o plac al crui nume spune totul: 802.11 Wireless LAN Card. S nu uitm nici de cele trei bracket-uri USB (ase porturi n total, fr a le meniona pe cele patru de pe plac), unul servind i conectrii a dou dispozitive FireWire. Analiznd acum placa, observm cele dou slot-uri PCI Express, fiecare putnd suporta o plac grafic performant. Modul SLI este reflectat de un mic card, asemntor modulelor SO-DIMM, ce permite selectarea modului de operare: SLI sau Normal. Cu alte cuvinte, 1x PCI Express 16x sau 2x PCI Express 8x - evident c dac cea de-a doua plac lipsete, vom alege prima variant. DPS este, dup cum spuneam anterior, o plac suplimentar (dotat i cu sistem de rcire separat) ce se aeaz ntr-un slot special (asemntor ca i construcie cu vechiul ISA, dar mult mai mic dect acesta), ce conine o surs de putere suplimentar,
33

Evaluarea performanelor sistemelor de calcul

util n caz de stres maxim (overclocking, temperaturi mari, consum foarte mare din partea procesorului). Practic, am observat c aceasta preia cea mai mare parte din sarcina surselor de putere deoarece tranzistorii de tip MOSFET prezeni pe placa de baz au rmas reci, cei de pe DPS fiind fierbini.

Analiznd mai departe, mai reperm dou slot-uri PCI Express X1, aezate alternativ cu cele X16, precum i dou PCI normal. Interfeele de uniti de stocare sunt n numr de zece, dou Parallel i opt Serial-ATA, de patru din acestea din urm ocupndu-se chipset-ul (pardon, chip-ul), restul cznd n sarcina unui controller separat, de la Silicon Image. Fiecare controller este capabil de funcia RAID, ultimul permind i RAID 5. Back-panel-ul este asemntor cu cel clasic, conectorul serial fiind nlocuit de o intrare i o ieire SPDIF, iar conectarea la reea este servit de dou interfee capabile de 1 Gbps, chip-urile rspunztoare fiind produse de Marvell i Vitesse. Este ciudat alegerea a dou chip-uri diferite destinate acestui scop, ns opiunea productorului nu poate fi privit dect ca un plus, utilizatorul avnd acum de unde alege. Ergonomia. Aproape nimic de reproat, minusurile fiind de neles avnd n vedere numrul de componente care au ncput pe plac. Spaiu n jurul procesorului? Este. Spaiu ntre placa grafic i DIMM-uri? Este. Plasare potrivit a conectorului de alimentare? Este. Ce nu prea este e spaiul dintre slot-urile PCI Express, slot-ul X1 dintre cele dou plci grafice fiind practic inutilizabil pentru c plasarea unei plci n acesta ar crea probleme grave rcirii plcii grafice din vecintate. BIOS-ul plcii este excelent, cel puin dup apsarea tastelor Ctrl+F1, operaie necesar pentru a putea accesa opiunile ascunse i destinat utilizatorilor experimentai. Gsim astfel posibiliti de overclocking practic nelimitate, de la banala setare a busului HTT (era s spun FSB) pn la reglaje fine ale memoriei. Numrul de setri legate direct sau indirect de memorie este de 12, putnd fi ntlnite o serie de timing-uri care lipsesc cu desvrire n BIOS-urile plcilor ieftine. Tensiunile, att pentru memorie ct i pentru procesor, pot fi ajustate pn la maxim 2.8V i respectiv 1.75V, ceea ce nu mai reprezint nimic deosebit. Deosebit este posibilitatea de overclocking a plcii grafice. Da, ai citit bine, placa poate seta din BIOS frecvenele VPU-ului i a memoriei plcii (plcilor) video n procente, plaja de valori fiind ntre 100% i 255%. Performanele atinse au fost foarte bune, dei nu cele mai bune. Prin setarea unor latene foarte agresive pentru memorie, am obinut o instabilitate exemplar. Schimbnd valorile la unele mai de bun sim dar n continuare foarte agresive, am sczut performana extrem de puin, dar sistemul a rulat stabil. (Reamintesc faptul c testul de performan a fost rulat cu o singur plac grafic. Prezena celui de-al doilea slot PCI Express X16 a contat doar la capitolul dotare.) Overclocking-ul a produs mari dureri de cap. Dei frecvenele atinse au fost de 315 MHz asincron i 265 MHz sincron (destul de modeste, sub preteniile pe care le
34

Cap 2: Evaluarea performanelor plcilor de baz

aveam de la o astfel de plac), am fost lovit de diverse probleme de stabilitate n condiii uneori hilare. De exemplu, am reuit s aduc placa n situaia de a nu trece de POST la un HTT mai mare de 213 MHz i aceasta n condiiile n care, peste cteva ore, la exact aceleai setri, am obinut 315 MHz. Altfel spus, placa a funcionat haotic n condiii de stres, la un moment dat la circa dou din cinci porniri intrnd n funciune Dual BIOSul, fiind detectat coruperea BIOS-ului. Alarmele erau n mod clar false, astfel c am dezactivat opiunea Auto Recovery (practic, am dezactivat funcionalitatea Dual BIOSului) i am putut realiza testele. Nu se poate pune problema calitii slabe a componentelor de pe plac, temperaturile atinse nefiind foarte mari (mai puin temperatura DPS-ului care a ajuns la valori deranjante odat cu setarea unei tensiuni mari pentru procesor), iar condensatorii Nichicon ce nvluie socket-ul procesorului sunt considerai ca avnd o fiabilitate peste medie, putnd rezista vreme ndelungat la temperaturi mari. De asemenea, nsi prezena unei surse de putere suplimentare prin prezena DPS-ului crete n mod teoretic fiabilitatea produsului, precum i ansele de reuit ale unui overclocking extrem. Aadar, vina nu se poate spune a cui e. Cert este c alte exemplare ale acestui model au rulat fr probleme la un HTT mai mare i este posibil ca acest exemplar s fi avut unele probleme, eventual versiunea BIOS-ului (F6, ultimul disponibil la data testrii) s creeze probleme. Oricum, aceasta este fraza clasic pe care orice tester o afirm n situaii de acest gen, drept urmare impresia subiectiv asupra posibilitilor de overclocking ale plcii de fa - i lund n calcul experienele similare pe plci mai vechi ale aceluiai productor - nu este pozitiv. n rest, productorul taiwanez a fost la nlime. Dotrile extravagante, chiar dac au anse mici s fie folosite n practic, ofer o aur de supremaie, placa fiind printre cele mai bine dotate plci pe care am avut ocazia s le testez. Concluzie Cu puin atenie suplimentar la detalii, Gigabyte ar putea accede la fotoliul de lider al plcilor de baz destinate entuziatilor, deinut n prezent de alte nume sonore pe care v lsm plcerea s le descoperii mai departe n acest capitol. Pn atunci, nota 10 la dotare i doar not de trecere la overclocking. + dotare excelent + accept dou plci grafice n mod SLI + setri bune de overclocking n BIOS + Dual BIOS - lips aproape total a monitorizrilor n BIOS - overclocking-ul efectiv a creat mari probleme 2.2.8. Gigabyte GA-K8NF-9 (nForce4-4X) O variant pentru buget redus a plcii descrise anterior este GA-K8NF-9. Bazat pe un PCB foarte asemntor, deosebirile privesc n primul rnd absena celui de-al doilea slot SLI (ce este nlocuit de unul PCI normal), iar chipset-ul din dotare este nForce4-4X. Chipset ce nu exist n documentele NVIDIA (Gigabyte este singurul productor care l utilizeaz) i care nu reprezint dect o revizie mai veche a lui nForce4 (A2 fa de A3) care suport un bus HyperTransport de maxim 800 MHz (fa de 1000 MHz pentru variantele clasice). Diferenele de performan sunt absolut neglijabile n sistemele obinuite, drept dovad placa a fost la fel de rapid ca i
35

Evaluarea performanelor sistemelor de calcul

K8NXP-SLI. n plus, a rulat aparent stabil la un LDT de 5x (deci 1000 MHz), e drept, fr s fie conectate la plac prea multe dispozitive i fr a se efectua teste riguroase.

De asemenea, dotarea plcii nu este nici pe departe att de extravagant ca cea a suratei mai mari. Lipsesc patru din cele opt porturi Serial ATA, placa DPS, unul din cele dou BIOS-uri, iar conectorii de ventilatoare sunt n numr de doi (nelund n seam cel destinat chipset-ului rcit acum pasiv, n format cu dou fire). BIOS-ul este identic cu excepia opiunii de overclocking a plcii grafice, frecvenele acesteia nemaiputnd fi ajustate n procente, ci doar pe baza a dou preset-uri: Fast i Turbo. Frecvenele maxime ale bus-ului HTT au fost urcate ceva mai sus dect n cazul plcii anterioare, problemele ntlnite la K8NXP-SLI neaprnd. Totui, 320 MHz asincron i 280 sincron nu impresioneaz pe nimeni care a pus mna pe plci mai bune, dar sunt nite valori excelente pentru un produs value. Concluzie Una peste alta, GA-K8NF-9 i merit banii, fiind un model destul de ieftin i care dispune de faciliti remarcabile. Chiar dac nu avem dou interfee LAN sau opt conectori SATA, nici nu avem nevoie de aa ceva. Cine? Noi, cei care nu suntem dispui s pltim dublu pentru astfel de faciliti. + setri bune de overclocking n BIOS + overclocking bun atins n practic + pre foarte atractiv - lips aproape total a monitorizrilor n BIOS 2.2.9. Rezultate comparative n continuare se prezint, comparativ, rezultatele obinute cu diferite progrme de testare, a plcilor de baz.
Placa de baz Activitate /program testare - punctaj testat SiSoft Science Copiere Sandra Mark fiiere DFI 5647 42,8 355 Abit AN8 5632 42,8 358 Gigabyte 5636 43,3 356 Arhivare WinRAR 255 261 259 PovRay 842 837 841 Codare XviD 478 480 481

SiSoftSandra (Unitatea de msur: puncte; mai mare = mai bine) Testul sintetic de lime de band a memoriei din SiSoft Sandra a confirmat ceea ce bnuiam, avnd n vedere setrile efectuate n BIOS i rezultatele obinute n celelalte teste: placa de la DFI ofer un plus de performan datorit latenelor mai mici ale memoriei. Science Mark (Unitatea de msur: nanosecunde; mai mic = mai bine)
36

Cap 2: Evaluarea performanelor plcilor de baz

Testul de laten a memorie din ScienceMark nu ne-a oferit nici un rezultat relevant; ne ateptam la altceva. Copiere fiiere (Unitatea de msur: secunde; mai mic = mai bine) La copierea fiierelor, un test al controller-ului Serial ATA, diferenele au fost mici, innd cont c el este acelai la toate cele trei plci. Arhivare WinRAR (Unitatea de msur: secunde; mai mic = mai bine) Comprimarea cu WinRAR a scos la iveal cele mai mari diferene: Abit AN8 a fost cea mai lent plac din test, DFI-ul lund un avans de peste dou procente fa de aceasta. PovRay (Unitatea de msur: secunde; mai mic = mai bine) Randarea unei imagini n PovRay depinde aproape n totalitate de procesor, drept pentru care placa DFI a stors doar un 0.6% n faa lui Abit. Codare XviD (Unitatea de msur: secunde; mai mic = mai bine) Scoruri foarte apropiate la codarea unui film folosind XviD, placa DFI fiind n continuare n frunte. 2.2.10. Concluzii Este greu de tras linia i fcut totalul dup doar cinci plci testate, mai ales cnd dou dintre ele sunt variante mai srace ale modelelor de vrf. Practic, am avut n test trei plci de baz. DFI LanParty UT nF4 Ultra-D este fr discuie ctigtorul testului. Ea s-a comportat excelent, o dovad n plus c DFI este un productor care poate accede uor la trofeele cele mai mari din domeniul overclocking-ului, orientarea firmei schimbnduse total n ultima perioad. i, s nu uitm, versiunea testat nu este cea mai dotat plac a productorului taiwanez, iar preul este foarte tentant. Abit s-a prezentat exemplar prin AN8, att cu, ct i fr sufixul Fatal1ty. Acesta din urm ncarc substanial preul, oferind un plus de faciliti pe care, cel mai probabil, nu le vei folosi, sau care nu v vor ajuta prea mult. Dotarea i overclocking-ul sunt foarte bune, ns la aceiai bani se pot gsi produse care nu poart tampila Abit i care pot oferi satisfacii similare. Gigabyte a ocupat ultimele dou locuri. Dac la dotare este de neegalat (SLI, opt porturi Serial ATA i alte minunii), restul facilitilor nu au excelat, modelul GAK8NXP-SLI fiind un produs mediu pentru categoria sa. Ct despre codaa clasamentului, GA-K8NF-9, ea reprezint fr discuie best buy-ul acestui test, dovedind c nu avem nevoie de o gaur n buget de 200$ pentru a obine o plac bun.

37

3. Evaluarea performanelor procesoarelor


3.1. Arhitectura lui Pentium 4 Prescott
3.1.1. Introducere Ultima realizare de la Intel, ce poart aceeai denumire comercial ca i predecesorii si, Pentium 4, este cunoscut sub numele de cod Prescott. Dac AMD prefer denumiri legate de cai pentru a-i promova CPU-urile (Morgan, Palomino, Thoroughbred sunt rase de cai) iar VIA folosete termeni cu rezonan religioas (Nehemiah, Joshua, Ezra), Intel prefer nume de localiti sau regiuni geografice din America (Willamette i Coppermine sunt ruri, Northwood este denumirea atribuit mai multor localiti), Prescott fiind att o pdure, un orel n Arizona cu o populaie de cteva zeci de mii de locuitori, ct i un nume, marele fizician englez Joule avnd numele complet de James Prescott Joule. Cam att cu povetile, s trecem la lucruri serioase. Modificrile aduse de Intel arhitecturii vechiului Pentium 4 (cod Willamette sau Northwood) nu sunt att de marcante ca n cazul trecerii de la Pentium III la Pentium 4 ns putem spune c, din anumite puncte de vedere, ele se aseamn cu precedentul salt de tehnologie. Arhitectura NetBurst a fost pstrat, deci vom avea n continuare un procesor ce ruleaz cu un PSB efectiv ncepnd cu de patru ori mai mare dect frecvena de baz, i anume 4x200=800 MHz, frecven cunoscut de la ultimele modele de Northwood, ajungndu-se la modelele ulterioare la 4x266=1066 MHz. Simplificnd, schimbrile aduse de ctre Prescott se bazeaz pe ncercarea productorului de a crete performana n primul rnd prin creterea frecvenei; pentru aceasta, au fost necesare unele schimbri interne care au dus inevitabil la scderea vitezei comparativ cu alte procesoare la aceeai frecven. Cu alte cuvinte, Northwood este mai rapid dect Prescott la aceeai frecven n anumite aplicaii, la fel cum Pentium III Coppermine era mai rapid dect Pentium 4 Willamette dac se comparau dou CPU-uri rulnd la tacturi similare. Nu trebuie s v ngrijorai: Intel a fcut tot posibilul pentru a minimaliza efectele ncercrii oarecum forate de cretere a frecvenei. Astfel, dimensiunea cacheului L2 a fost dublat, o serie de uniti ale procesorului, precum cache-ul i unitatea pentru numere ntregi au fost optimizate, iar cteva instruciuni suplimentare au extins setul SSE2, el devenind acum SSE3. n acelai timp, numrul de stagii ale conductelor de prelucrare (aa numitele pipeline-uri) a fost crescut n continuare, el ajungnd la peste 30 (10 la Pentium III, 20 la Pentium 4 Willamette i Northwood). Aceast modificare, mpreun cu creterea latenei cache-ului, ofer noi orizonturi privind potenialul de a atinge frecvene uriae, de ordinul a 5 GHz. Nu este nevoie de prea mult imaginaie pentru a afla motivul acestor schimbri, el fiind unul comercial: mai muli megahertzi nseamn pentru cei mai muli mai mult performan, fapt ce se dovedete a fi din ce n ce mai fals. Vom explica n continuare majoritatea schimbrilor aduse de Prescott lui Pentium 4 Northwood, explicnd (cel puin sumar) toate noiunile care ar putea produce dificulti n urmrirea textului pentru un cititor nceptor.
38

Cap 3: Evaluarea performanelor procesoarelor

Cteva cuvinte despre tehnologia de fabricaie. Numrul de microni ntlnit n specificaiile oricrui procesor se refer la distanele dintre tranzistorii procesorului. Cu ct acestea sunt mai mici, cu att se mrete potenialul creterii frecvenei de tact. Aceasta este teoria clasic, ce tinde s nu mai fie valabil din cauza atingerii unor distane critice: 0.13 microni pentru Pentium 4 Northwood i 0.09 microni (90 nanometri) pentru Prescott. Pe de o parte, tranzistorii pot lucra mai rapid, pe de alt parte apar fenomene nedorite, n special datorit dimensiunii foarte mici a pastilei, devenind necesare unele schimbri de ordin intern. Astfel, tehnologia Strained Silicon rezolv parial neajunsurile datorate arhitecturii pe 0.09 microni a lui Prescott. 3.1.2. Gestionarea memoriei principale i secundare S comentm puin memoria cu care lucreaz ultimele procesoare Intel. Dup cum se tie, northbridge-ul, pentru majoritatea chipset-urilor destinate lui Pentium 4, deine integrate n primul rnd controller-ul de memorie i cel pentru bus-ul AGP sau PCI Express X16. Controllerul de memorie influeneaz puternic performana, el avnd posibiliti de a lucra cu memoria SDRAM, DDR SDRAM, DDR2 SDRAM sau RDRAM (Rambus). Toate chipset-urile uzuale folosesc memoria n mod dual-channel (care n principiu dubleaz performana acesteia dac sunt folosite dou sau mai mult module de memorie ntr-o anumit combinaie), o valoare normal ca lime de band fiind cea de 6.4 GB/s (DDR400 n mod dualchannel). Pentru ca aceast vitez teoretic s afecteze puternic performana este nevoie ca datele furnizate de procesor s ajung n memorie la timp, ceea ce nseamn c, prin intermediul PSB-ului (care este n esen viteza de comunicare dintre CPU i northbridge), s fie furnizai memoriei cte 6.4 GB ntr-o secund. Exact aceasta este limea de band a PSB-ului de 800 MHz. i nu este vorba de 800 MHz reali, ci de 200 MHz multiplicai de un numr de patru ori, folosindu-se o tehnic asemntoare cu dublarea ratei de transfer la PSB-urile procesoarelor Athlon i la memoriile DDR. Astfel, circulaia fluxului de date procesor-northbridge-memorie se desfoar cu viteza de 6.4 GB/s, de dou ori mai mult dect pentru un Athlon XP cu PSB de 400 MHz (2x200). n varianta de PSB 533, acest flux circul cu doar 4.3 GB/s, o frecven a memoriei mai mare de cea corespunztoare lui PC2100 (DDR266) dual-channel neaducnd creteri majore de performan, motivul fiind explicat mai sus. Prescott ruleaz la un PSB de 533, 800 i 1066 MHz; n schimb, Northwood beneficiaz doar de 400, 533 i 800 MHz. Totui, majoritatea modelelor de Prescott nu depesc dect prin overclocking cei 800 MHz, ele fiind similare din acest punct de vedere celor mai recente procesoare Northwood. Cache-ul este o zon de memorie intermediar care stocheaz informaiile mai des folosite, crescnd foarte mult (de mii de ori) performana unui procesor, aceasta
39

Evaluarea performanelor sistemelor de calcul

datorit faptului c, n cele mai multe cazuri, datele i instruciunile nu sunt folosite o singur dat ci de un numr foarte mare de ori ntr-un interval scurt. Exist cel puin dou nivele de cache: level 1 (L1) i level 2 (L2), primul nivel fiind mai aproape de nucleul procesorului i avnd astfel o eficien mai mare. La majoritatea procesoarelor de azi, el este mprit ntr-o seciune pentru date i una pentru instruciuni. Pentru procesoarele AMD, cele dou zone sunt de capacitate identic i totalizeaz 128 KB, ns Pentium 4 a adus o nou organizare a cache-ului, existnd o seciune de date de doar 8 KB i una de instruciuni, numit Execution Trace Cache, care stocheaz aceste instruciuni ntr-o form deja decodat, capacitatea fiind de 12.000 de micro-operaii (micro-ops); acest tip de cache depete ca eficien unul obinuit de 8 KB. n cazul lui Prescott, cache-ul pentru instruciuni a rmas acelai iar cel de date a fost crescut la 16 KB, acest lucru avnd un impact direct asupra performanei; el este nc extrem de mic comparat cu procesoarele AMD, care dein un cache total (date + instruciuni) de 128 KB. Totui, acest trace cache este vital pentru un procesor cu un pipeline lung, cum este Pentium 4, un cache convenional chiar i mult mai mare ar fi putut dezavantaja procesoarele Intel. n plus, L1 cache-ul lui Prescott a fost puternic optimizat, avnd un hit rate (probabilitatea ca informaiile cerute s se afle n cache) mai mare dect la predecesori. Cache-ul L2 este de asemenea o zon de memorie care stocheaz date temporare, ns rolul su este diferit, n funcie de relaia sa cu L1. n momentul umplerii cache-ului L1 este solicitat nivelul al doilea, n care sunt depuse informaiile mai rar folosite, s le numim reziduale (desemnate conform unui algoritm numit LRU Least Recently Used), urmnd ca datele considerate mai importante s fie aduse n spaiul liber creat n L1. Dac informaia copiat anterior din L1 n L2 redevine util, ea este readus n L1, consumndu-se din nou timp preios (se creeaz alt informaie rezidual ce este copiat n L2, crendu-se loc n L1 pentru noua informaie preioas, fost rezidual). De ce nu este prelucrat direct n L2? Pentru c sunt anse foarte mari ca informaia s fie necesar de un numr mare de ori, fiind mai eficient copierea ei ntr-o zon de memorie mai rapid dect meninerea sa ntr-una lent. Aceast relaie dintre cele dou nivele de cache o numim exclusiv. O alt metod elimin necesitatea transferului ntre L1 i L2 datorat celei dinti situaii expuse mai sus. Aceasta datorit faptului c L2 conine, pe lng informaiile reziduale, i imaginea complet a nivelului 1 de cache, nemaifiind necesar copierea informaiei din L1 a datelor considerate inutile pentru moment. n acest caz, avem de-a face cu o relaie inclusiv ntre cele dou nivele. O consecin direct este faptul c o relaie inclusiv implic o dimensiune a L2 cache-ului mai mare dect cea a nivelului 1. n plus, dimensiunea total a cache-ului este mai mic dect suma celor dou componente ale sale. Mai exact, cache-ul total este egal cu L1 + (L2 L1) = L2. Avantajul vitezei a decis compania Intel s implementeze acest tip de cache n toate procesoarele sale ncepnd cu Pentium Pro i terminnd (deocamdat) cu Prescott. Dimensiunea cache-ului L2 este de 256 KB la primul Pentium 4 (Willamette), 512 KB la Northwood i 1 MB la Prescott. Dup cum v-ai dat seama, n privina lui L1 se merge pe ideea de vitez mare i dimensiune mic, el fiind folosit mult mai intens dect L2. Pentru acesta din urm se prefer o vitez mai redus dar o dimensiune mai mare, L2 fiind de zeci de ori mai ncptor dect L1. Relaia exclusiv este caracteristic procesoarelor din familia K7 (Athlon) pe Socket A i AMD64, care au o dimensiune a cache-ului L1 comparabil cu cea a lui L2 dar eficiena acestuia din urm este destul de redus. Chiar dac avem de-a face cu o
40

Cap 3: Evaluarea performanelor procesoarelor

dimensiune dubl fa de predecesor, att (parial) pentru L1 ct i pentru L2, noul model de Pentium 4 are o laten mai mare a cache-ului. Motivul este faptul c ambele nivele de cache ruleaz la frecvena intern a procesorului. Cu alte cuvinte, frecvenele uriae pentru care este proiectat Prescott trebuie s fie suportate i de cache, iar pentru aceasta sunt necesari timpi mori suplimentari sau costuri de fabricaie mai mari. Intel a preferat prima variant.
Tehnologie Cache L1 Cache L2 Laten cache L1 Laten cache L2 Tip cache Willamette Northwood Prescott AMD K7 0,18 0,13 0,09 0,250,13 8KB+12Kops 8KB+12Kops 16KB+12Kops 128 KB 256 KB 512 KB 1 MB 256 KB 2 2 4 3 19 inclusiv 19 inclusiv 28 inclusiv 20 exclusiv AMD64 0,130,09 128 KB 512KB1MB 3 13 exclusiv

3.1.3. Latena Latena reprezint timpul (msurabil n cicluri de tact) scurs de la solicitarea unei operaii pn la executarea efectiv a acesteia. Pentru cache-ul L1, acest numr este de dou cicluri la Pentium 4 Northwood i de patru cicluri la Prescott. Nivelul doi de cache deine o laten de 19 cicluri pentru Northwood i 28 pentru Prescott. Cu toate acestea, avantajul (parial pentru L1, total pentru L2) dublrii cache-ului este probabil superior dezavantajului scderii eficienei sale. Aceasta se datoreaz frecvenei mari a procesorului, deoarece importana unui cache mare crete odat cu creterea diferenei dintre viteza CPU-ului i cea a memoriei. S vedem i de ce. Dac un procesor poate face multe, un singur lucru nu poate: s stocheze date (excluznd cache-ul). Pentru aceasta, este nevoie de memoria sistemului. Spre exemplu, dac procesorul are de adunat 1000 de numere, el le va solicita pe rnd, primind informaiile i oferind imediat rezultatul cerut. Dar ce se ntmpl cnd n algoritm apare, dup terminarea adunrii, solicitarea de a refolosi cel de-al 537-lea numr din irul de 1000? Procesorul ar trebui s cear memoriei elementul cu numrul de ordine 537. ns cte cicluri de tact trec de la efectuarea cererii pn la obinerea informaiei? Dac procesorul ruleaz la peste 3 GHz iar memoria la cteva sute de MHz, este uor de neles c soluia aceasta pune procesorul n situaia de a atepta rezultatul n loc s execute alte operaii, ceea ce duce, evident, la scderea performanelor. Situaia real este alta: al 537-lea numr se afl n cache, alturi de celelalte elemente ale irului i de multe alte informaii recent utilizate, durata obinerii valorii acelui element fiind astfel mult mai mic. Probabilitatea ca o instruciune sau o variabil recent folosit s fie din nou necesar ntr-un interval scurt este foarte mare. Cu ct frecvena procesorului este mai mare, cu att diferena dintre viteza acestuia i cea a memoriei crete i, pe de alt parte, cu att procesorul va solicita mai rapid informaii. Dac cache-ul nu este suficient de mare, acesta se va umple rapid i procesorul va trebui s cear memoriei ceea ce i dorete. Pentru a se evita aceast situaie, a crei frecven de apariie crete odat cu creterea frecvenei procesorului,
41

Evaluarea performanelor sistemelor de calcul

trebuie crescut dimensiunea cache-ului. Din pcate, aplicaiile de azi sunt mai sensibile la creterea latenei cache-ului dect la creterea dimensiunii sale, astfel c, cel puin din punct de vedere al cache-ului level 2, Northwood este mai rapid dect Prescott. Ce limbi vorbete? O alt caracteristic a lui Prescott (dar i a altor procesoare din familia P4) este HyperThreading-ul. Acesta reprezint, n esen, un set de instruciuni capabil s simuleze funcionarea procesorului n mod dual, software-ul comportndu-se ca i cum n sistem ar fi prezent, fizic, un al doilea CPU. S-a dovedit faptul c dou sarcini diferite, cum ar fi dou aplicaii sau dou thread-uri (ramuri) ale aceleiai aplicaii lucreaz mai rapid n acest mod, cu un minim de suport att hardware ct i software, motivul fiind faptul c multe zone ale procesorului nu sunt folosite la adevratul potenial cnd execut o singur sarcin. De aceea, Intel a implementat tehnologia HyperThreading n ultimele procesoare Northwood, precum i n majoritatea modelelor de Prescott. ns sporul maxim de vitez se obine doar atunci cnd aplicaiile sunt optimizate pentru acest mod de lucru, n caz contrar putnd fi sesizate chiar i scderi de performan. Dei aceast tehnologie nu este specific doar lui Prescott, am descris-o pentru a putea fi neles paragraful urmtor. De remarcat ns c exist versiuni de Prescott fr aceste instruciuni. n 1997, Intel a introdus instruciunile MMX (MultiMedia eXtensions), cu scopul de a accelera aplicaiile multimedia optimizate pentru acestea. MMX a fost extins cu SSE (Streaming SIMD Extensions), apoi cu SSE2 odat cu Pentium 4 iar Prescott a introdus SSE3, ce cuprinde un numr mic de instruciuni n comparaie cu precedentele versiuni, nefiind dect o completare a acestora. Nu este deloc o exagerare s afirmm c SSE3 conine ceea ce Intel a uitat s implementeze n SSE i SSE2. SSE3 ofer avantaje minore diverselor sarcini ale aplicaiilor multimedia, cum ar fi compresia video. Pe lng cele 11 instruciuni diverse, destinate operaiilor cu numere complexe, conversiei integer-FPU i altele, ultimele dou optimizeaz modul de operare HyperThreading dar necesit suport din partea sistemului de operare. Ateptm cu interes dezvoltarea software-ului care s profite de SSE3, Intel punnd la dispoziie versiunea a opta a compilatorului propriu de C++, care tie de SSE3. Sporul de performan adus ar putea atinge 10 procente, SSE3 nefiind altceva dect unul din numeroasele avantaje minore ale lui Prescott, ns sub care dac tragem linie obinem ceva remarcabil. Asta dac ar fi vorba doar de avantaje... 3.1.4. Conductele Poate cel mai important aspect legat de noul Prescott este dat de pipeline (n traducere - conduct). Acesta reprezint suma unor etape pe care instruciunile trebuie sa le parcurg pn la obinerea rezultatului final. Pipeline-ul este mprit n stagii, fiecare avnd o sarcin bine definit. Iat un exemplu de pipeline simplu, fiecare stagiu ocupnd exact timpul unui ciclu de tact. stagiul 1: fetcher pregtete urmtoarea instruciune stagiul 2: decoder decodific urmtoarea instruciune stagiul 3: ALU execut instruciunea stagiul 4: retire unit aduce rezultatul napoi n memorie
42

Cap 3: Evaluarea performanelor procesoarelor

Desigur, toate aceste operaii puteau fi executate neorganizat, ns pentru un pipeline cu patru stagii avem patru operaii care sunt realizate simultan n locul uneia singure. i nu trebuie neles faptul c fiecare pipeline este legat de aceeai instruciune, ci dimpotriv. Spre exemplu, fetcher-ul pregtete instruciunea de desenare a unei ferestre, decoder-ul este ocupat cu decodificarea unei instruciuni de desenare a unui caracter n acea fereastr, ALU-ul calculeaz poziia icon-ului n interiorul ferestrei iar retire unit-ul returneaz memoriei rezultatul copierii unor fiiere n background. Desigur, fiecare instruciune trebuie s treac prin toate etapele pipeline-ului dar nu e necesar ca la un moment dat pipeline-ul s fie plin cu aceeai instruciune. n caz c nu exist simultan mai multe instruciuni de prelucrat (situaie practic imposibil pentru c procesorul are permanent ceva de lucru), doar un singur stagiu al pipeline-ul va fi ocupat, ceea ce ne ofer o vitez identic cu cea observat n execuia secvenial. Pipeline-ul a fost gndit tocmai pentru a oferi posibilitatea execuiei simultane a mai multor instruciuni i, n cazul ideal, performana este multiplicat de un numr de ori dat de lungimea pipeline-ului. Astfel, dac procesorul are de executat 100 de operaii, fiecare necesitnd cte patru stagii, vor fi necesare doar 100 de cicluri de tact n locul a 400, pe fiecare ciclu fiind executate cte patru operaii. Din pcate, situaia ideal nu este ntlnit niciodat pentru c instruciunile depind unele de altele mai mult dect pare la prima vedere. S presupunem c plecai de acas cu maina personal i la jumtatea drumului v dai seama c nu mai avei benzin. Cum nu este nici o benzinrie prin zon i cum nimeni nu se ofer s v tracteze, trebuie s ateptai pe cineva s v aduc benzina. Drept urmare, vei atepta cteva ore n trafic, incomodndu-i pe ceilali oferi, eventual v vei retrage la marginea drumului pentru a evita neplcerile pricinuite. i cu ct drumul pe care l avei de parcurs este mai lung, cu att cresc ansele s rmnei fr combustibil. Acelai lucru se ntmpl i cu o instruciune dac ea nu poate fi executat dect dup ce primete de la alta un rezultat: ea va rmne blocat n pipeline pn cnd primete unda verde sau va fi eliminat din pipeline, execuia ei fiind amnat i lsnd loc altor instruciuni care pot fi executate la acel moment. Este evident c ansele ca acest eveniment s aib loc cresc odat cu creterea numrului de stagii, tot mai multe instruciuni fiind blocate n trafic. Situaia descris duce la apariia timpilor mori, n care procesorul nu se nclzete i de care se poate profita, crescndu-i-se frecvena. Un procesor care i propune s ating performana maxim la o frecven dat va realiza un compromis ntre avantaje i dezavantaje, fiind dotat cu un numr relativ redus de stagii. Dac scopul este atingerea de frecvene mari, neinndu-se seama de performan, atunci se va realiza un procesor cu un numr imens de stagii al pipelineului, procesor care s zac nefolosit o bun parte din timp, ceea ce va duce la scderea drastic a vitezei raportat la frecven. Exact acest lucru a realizat Intel, care a crescut numrul de stagii odat cu apariia primului Pentium 4 (Willamette): 20 fa de 10 la Pentium III. Rezultatul a fost evident: cu toate mbuntirile aduse de noua arhitectur (PSB 400 fa de 133, SSE2 i altele), un Pentium 4 la 1.5 GHz era depit deseori de un Pentium III la 1 GHz, semn c dezavantajul datorat pipeline-ului lung nu este compensat de frecvena ridicat. O situaie similar o ntlnim i la Prescott, al crui numr de pipeline-uri a ajuns la 31 de stagii. Totodat, avem i avantaje: un cache dublu, instruciuni SSE3, etc, elemente concepute s afecteze pozitiv viteza, dar pe alte ci. Totul pentru a se putea atinge frecvene mari, de ordinul a 4-5 GHz, frecvene irezistibile pentru orice cumprtor neavizat.
43

Evaluarea performanelor sistemelor de calcul

Un procesor clasic execut fiecare instruciune n ordinea fireasc, ateptnd terminarea fiecreia pn s treac la execuia celei urmtoare. Un procesor inteligent se bazeaz pe faptul c timpii mori pot fi folosii pentru execuia urmtoarei instruciuni. Ce se ntmpl atunci cnd instruciunea curent depinde de cea precedent, fiind necesar obinerea rezultatului de pe urma execuiei acesteia? Un caz clasic este acela al unui bloc if-then-else din cadrul oricrui limbaj de programare. Pentru execuia unei anumite ramuri trebuie executat instruciunea if, dup care se ia o decizie: se merge pe ramura A sau B. Exemplu:
if x=y then { ramura A } else { ramura B }

Cu ajutorul unitii de predicie (branch predictor), procesorul va executa, bazndu-se pe experienele precedente, ramura care are ansele cele mai mari s fie adevrat, fr a evalua condiia x=y. Cu ct algoritmul prediciei este mai bun, cu att acurateea ei este mai mare iar cazurile n care este aleas ramura greit sunt mai rare. (Nu trebuie neles faptul c, la alegerea ramurii greite, rezultatul furnizat va fi incorect; situaia doar va genera timpi suplimentari.) Pentru Prescott, Intel a mbuntit predicia, motivul fiind faptul c un pipeline mai lung avea nevoie stringent de acest lucru. Modificrile sunt minore dar importante i de natur calitativ, nu cantitativ. i anume, nu a fost mrit Branch Target Buffer-ul (spaiul de memorie din procesor destinat depozitrii aciunilor precedente, pe baza crora algoritmul s prevad aciunile viitoare) ci algoritmul a fost optimizat. O alt unitate a procesorului este scheduler-ul. Acesta, ca i branch predictor-ul, este conceput pentru a crete eficiena CPU-ului, pentru a-l determina s lucreze la potenialul maxim de care dispune. De data aceasta nu este vorba de ramuri cu instruciuni ce vor fi probabil executate ci de unele care vor intra sigur n execuie. Procesoarele moderne dein mai multe uniti independente care ndeplinesc aceeai sarcin (spre exemplu, toate modelele de Pentium 4 dein trei uniti de calcul cu numere ntregi ALU), ns fr acest scheduler (to schedule = a programa, cu sensul de a stabili ceva la un anumit moment), nu ar fi activ dect o singur unitate la un moment dat. S presupunem c avem de efectuat trei adunri, toate urmnd a fi executate de cte o unitate ALU. Dar ce ne facem cnd instruciunile depind una de alta, precum se poate vedea n exemplul urmtor: 1. a = 1 + 2 2. b = a + 4 3. c = b a Este clar c numai dup execuia primei instruciuni va putea fi executat cea dea doua i numai dup execuia primelor dou va putea fi executat cea de-a treia. Ceea ce nseamn c o singur unitate ALU din cele trei va fi folosit, procesorul rulnd la o treime din potenial. Aici intervine scheduler-ul, care programeaz execuia altor instruciuni, nelegate de cele de mai sus, dnd astfel cte o sarcin fiecrei uniti ALU. Prescott a necesitat modificri i n aceast privin, pentru a compensa creterea numrului de stagii al pipeline-ului. Cum arhitectura curent nu permite o modificare puternic a acestei uniti, schimbrile au fost minore.

44

Cap 3: Evaluarea performanelor procesoarelor

3.1.5. Calculul matematic Numrul de uniti a rmas acelai ca la precedentele modele de P4. Segmentul ALU (Arithmetic and Logic Unit), cel care se ocup cu calcule legate de numere ntregi, a rmas divizat n trei segmente care pot prelucra datele i instruciunile independent, conform celor descrise n paragraful anterior. Dou dintre ele lucreaz la o vitez dubl fa de restul unitilor (sunt double pumped), de aceea operaiile se execut foarte rapid. Odat cu Prescott, Intel a ncercat s elibereze al treilea ALU (cel lent) de sarcinile pe care oricum le ndeplinea cu greutate, oferind unitilor ALU double pumped mai multe sarcini. Astfel, operaiile de tip shift i rotate erau executate de ALU-ul lent, acum ele au fost preluate de celelalte dou mai rapide. Un exemplu practic de mbuntire este acela n care sunt aplicate unui numr binar operaii de multiplicare cu 2 (10 binar), caz tipic de shift n care este suficient deplasarea cu cte un pas a fiecrui bit. De asemenea, nmulirile sunt acum realizate de unitatea FPU (Floating Point Unit), care chiar dac teoretic este mai lent dect ALU-ul, este specializat n astfel de operaii i poate furniza rezultatele mai rapid. 3.1.6. Tensiunile Se tie c prin creterea fineii tehnologiei se pot obine, pe de o parte temperaturi de rulare mai sczute i, pe de alt parte, frecvene mai mari de funcionare. S ne amintim de P4 Willamette (0.18 microni) care se oprea fr drept de apel la 2 GHz pe cnd Northwood (0.13 microni) a atins 3.4 GHz. Mai mult, necesarul de tensiune de funcionare scade, de la 1.75V pentru Willamette s-a ajuns la 1.5V pentru Northwood, iar Prescott coboar pn la 1.287V. Pe de alt parte, arhitectura intern influeneaz puternic factorii putere disipat i temperatur de funcionare, deci ar fi greit s afirmm c, indiferent de alte considerente, un CPU construit pe baza unei tehnologii mai fine i rulnd la un voltaj mai mic va fi mai rece. Ca s nu o mai lungim, Prescott este un procesor mai fierbinte dect se dorea a fi, care consum mult. La 3.4 GHz, un Northwood disip 89W fa de 103W n cazul lui Prescott. Chiar dac acesta din urm este special conceput pentru frecvene mari, este nevoie de msuri speciale de precauie: n primul rnd, datorit consumului excesiv, plcile de baz trebuie s suporte acest consum, n al doilea rnd sistemul de rcire trebuie s fie foarte bine pus la punct. n fine, Prescott este compatibil cu standardul VRM 10.0 (VRM = Voltage Regulator Module), ceea ce i confer cteva avantaje, printre care posibilitatea selectrii tensiunii n pai mai mici (0.0125V fa de 0.025V la predecesori) i Dynamic VID, adic posibilitatea ca procesorul s-i schimbe tensiunea on the fly, nu doar din BIOS, cu utilitate evident n cazul sistemelor mobile. Dezavantajul: toate plcile de baz trebuie s suporte acest standard, deci plcile vechi nu au nici o ans s lucreze cu Prescott. 3.1.7. Ambalarea Dei nu are legtur cu arhitectura lui Prescott, menionm c Intel a introdus un nou mod de a mpacheta procesorul, denumit LGA775, socket-ul purtnd denumirea de Socket T. n trecut, modul PGA a dominat modelele acestei companii, reprezentat
45

Evaluarea performanelor sistemelor de calcul

de Socket 478. Principiul, folosit la toate procesoarele de la 80386 pn n prezent, era clar: spatele chip-ului cuprindea un numr mare de pini care erau inserai ntr-un socket, realizndu-se astfel contactul. Noul mod de mpachetare LGA (Land Grid Array) elimin aceti pini (cel puin partea vizibil a acestora), contactul realizndu-se prin alturarea direct a procesorului de socket. Astfel, ndoirea sau ruperea pinilor nu mai poate avea loc, n schimb socket-ul poate fi deteriorat destul de uor prin montarea repetat a procesoarelor. Odat cu apariia acestui mod de mpachetare, Intel a schimbat i modul de a marca produsele sale. Dac concurentul su, AMD, folosete de mult vreme alt unitate de msur (rating-ul) pentru a caracteriza procesoarele, Intel a utilizat pn acum modul consacrat, i anume specificarea frecvenei de funcionare. Recent, aceast politic a fost schimbat, locul frecvenei fiind luat de un numr; de exemplu, Pentium 4 550 desemneaz un P4 ce ruleaz la 3.40 GHz. Modelele cu sufixul J (de exemplu 550J) beneficiaz de tehnologia antivirus XD (eXecute Disable), cunoscut i ca EDB (Execute Disable Bit) sau NX (No eXecute), care asigur o minim protecie mpotriva celor mai uzuali virui. Practic, sistemul de operare (Windows XP SP2, de exemplu) se folosete de aceast funcie a procesorului pentru a marca diferite segmente de memorie ca fiind neexecutabile. Astfel, doar codurile marcate n mod explicit ca executabile pot fi rulate, viruii bazndu-se, n general, tocmai pe aceast slbiciune a sistemului, de a putea rula orice cod din orice zon de memorie. Tehnologia a fost pn acum implementat de Intel doar n modelele pe 64 de bii (Itanium), iar AMD a fost mai sprinten, fiind prima companie care a introdus ntr-un procesor de larg consum aceast tehnic. 3.1.8. Versiuni de Prescott-uri Exist pn n prezent cteva revizii ale lui Prescott, denumite stepping-uri, diferenele dintre acestea fiind minore sub aspectul funcionalitii i inexistente cnd vine vorba de performane. Prima revizie (uzual - deoarece au existat i reviziile A0 i B0 dar informaiile despre acestea sunt practic inexistente), C0, suferea de boli ale copilriei, procesoarele ce purtau acest nsemn fiind extrem de fierbini i producnd diverse neplceri. Astfel, cei care doreau s ating maximul de performan prin overclocking erau dezamgii, noul P4 neputnd face fa temperaturilor mari. Mai mult, plcile de baz cu regulatoare de tensiune mai slabe nu fceau fa curenilor mari, consumul de putere putnd depi 100W, stresnd n acelai timp i sursa sistemului. De asemenea, o mai mare atenie trebuia acordat fluxului de aer din carcas, procesorul fiind acum o surs enorm de cldur, putnd afecta buna funcionare a sa i a componentelor din jurul su dac nu erau luate msuri de precauie. Tocmai de aceea, Intel a specificat n mod expres temperatura maxim ambiant la care procesoarele sale pot lucra: 38 de grade. Intel a remediat problema i a introdus a doua revizie, denumit D0, mbuntind eficiena funcionrii tranzistorilor care, odat cu trecerea la o tehnologie de fabricaie tot mai mic, generau pierderi de putere (power leakage). Cea mai nou revizie, numit (cum altfel?) E0, mbuntete i mai mult caracteristicile termice ale procesoarelor ns de data aceasta sporul este minor. Aspectele mai importante ale lui E0 constau n primul rnd n adugarea de faciliti suplimentare, cum ar fi Execute disable sau XD - tehnologia antivirus de care vorbeam mai devreme, Enhanced Halt State - facilitate care permite ajustarea tensiunii de
46

Cap 3: Evaluarea performanelor procesoarelor

alimentare a procesorului n mod dinamic, scznd-o n momentul n care nu este nevoie de putere de procesare, fapt ce conduce la un consum de putere i cldur degajat mai sczute i Thermal Monitor 2 - funcie prin care se poate ajusta frecvena procesorului n cazul n care temperatura sa depete pragul maxim admis aceasta spre deosebire de senzorul termic iniial, care punea procesorul pe tu n totalitate ori de cte ori temperatura depea limita. Pe lng toate acestea, n aceeai perioad cu introducerea noii revizii, Intel a adugat n procesoarele sale suport pentru EM64T (Extended Memory 64-bit Technology), motiv pentru care majoritatea chip-urilor E0 dein EM64T. Aceasta din urm reprezint rspunsul lui Intel la tehnologia AMD64 care deja ncepuse s prind pe pia server-elor, ce oferea n plus regitri i mod de adresare pe 64 de bii. Aceast arhitectur este compatibil cu cea AMD64 i incompatibil cu cea pe care Intel a promovat-o mult timp prin seria de procesoare Itanium, IA64. Practic, EM64T este o extensie a setului IA32, toate procesoarele compatibile EM64T putnd rula fr probleme aplicaii IA32, pe cnd procesoarele Itanium ruleaz extrem de lent codul pe 32 de bii deoarece IA64 reprezint o arhitectur complet nou. Intel a inut mult timp secret acest supliment, aproape sigur prezent dar dezactivat nc de la prima revizie a lui Prescott, motivul principal fiind promovarea de ctre al su concurent a aceleiai tehnologii, iar setul de instruciuni made in Santa Clara se numea, de civa ani, IA64. Pe cnd EM64T nu este dect o copie a instruciunilor dezvoltate de texani, fiind pentru prima dat cnd gigantul californian a realizat o clon a unei tehnologii AMD. Ne putem pune ntrebarea de ce Intel a implementat n procesoarele sale aceast tehnologie care nu-i aparine, istoria spunnd c tendina este invers, AMD copiind sau urmnd s copieze fiecare set de instruciuni Intel, ncepnd cu MMX i terminnd cu SSE3. Rspunsul este legat de software-ul conceput pentru AMD64, ce a devenit din ce n ce mai rspndit, existnd versiuni ale sistemelor de operare destinate acestei arhitecturi att de Windows XP i 2003 Server ct i de Linux (n diverse distribuii, precum Red Hat, SuSE, Fedora Core, Gentoo, Mandrake etc). 3.1.9. Alte procesoare din familia P4 Celeron este numele comercial al unui procesor n mare parte identic cu versiunea de prim rang dar care sufer de anumite limitri. Scopul este evident: costuri mai sczute, deci acoperirea unei categorii din pia dornic de un pre foarte mic, pentru care performanele conteaz mai puin. Primul Celeron a aprut la nceputul anului 1998, fiind o variant de Pentium II cu performane ceva mai mici. Nu vom insista asupra acestei perioade ci vom meniona c Celeron a fost omniprezent pe pia de atunci i pn n prezent. Dei arhitectura sa a suferit schimbri majore, fiecare model de Celeron a avut la baz nucleul fratelui mai mare. n privina versiunii care se trage din Pentium 4, limitarea a fost legat de trei aspecte: n primul rnd, cache-ul L2 a fost redus la 128 KB (fa de 256 KB pentru P4 Willamette i 512 KB pentru P4 Northwood), acest lucru afectnd puternic performanele. Chiar dac diferena nu pare colosal, trebuie inut cont c prima parte a acestui cache afecteaz cel mai mult viteza de lucru; astfel, creterea de la 256 la 512 KB conteaz mult mai puin dect creterea de la 128 la 256 KB. Al doilea factor este frecvena PSB. Primele versiuni de P4 (Willamette) rulau cu acest bus la 400 MHz iar a doua versiune, P4 Northwood, l-a crescut la 533 i apoi la 800 MHz. ns Celeron a rmas la 400 MHz, ceea ce reprezint a doua limitare, totui
47

Evaluarea performanelor sistemelor de calcul

nu att de drastic n comparaie cu cea descris anterior. Al treilea factor, i puin important, este absena funciei HyperThreading. Celeron a existat att n versiune cu nucleu Willamette ct i Northwood. Specificaiile sale fiind similare (afar de tehnologia folosit 0.18 i respectiv 0.13 microni), performanele au fost identice la frecven identic, adic relativ slabe n comparaie cu Pentium 4 sau chiar cu versiunea low-end de la AMD, i anume Duron. Astfel, Celeron a cptat o reputaie negativ, fiind recomandat doar utilizatorilor care doresc neaprat un procesor Intel dar dispun de fonduri limitate. Celeron D este numele noului Celeron, avnd la baz nucleul Prescott. Aceasta nseamn c toate aspectele enunate mai devreme care privesc Pentium 4 Prescott, l privesc i pe Celeron D. Diferenele fa de acesta constau, n principal, n absena a trei sferturi din cache-ul L2, dimensiunea sa fiind de 256 KB, dublu fa de Celeron-ul vechi. n plus, PSB-ul a fost limitat la 533 MHz (fa de majoritatea P4 Prescott-urilor care lucreaz la 800 MHz), dar cu 33% mai mult dect la Celeron. Drept urmare, performanele sporite fa de varianta veche transform acest Celeron D ntr-un procesor ct se poate de decent pentru orice aplicaie. Pentium 4 Extreme Edition i-a fcut apariia datorit nevoii lui Intel de a concura (a se nelege cel puin a egala, de preferin a depi) cel mai rapid procesor de la AMD, i anume Athlon 64 FX-51. Acesta dispunea de avantaje minore dar observabile n cifre n cadrul diverselor teste realizate de reviste i site-uri. i aici un avantaj de 2-3%, dei nesemnificativ n realitate, poate decide succesul sau insuccesul unui produs. Aadar, Intel a introdus un model de Pentium 4 cu un al treilea nivel de cache, acesta avnd o dimensiune de 2 MB. Desigur, acest L3 a contat extrem de puin n materie de performan dar a fcut diferena; preul, n schimb, a fost stabilit la nite valori exorbitante, de unde i succesul foarte redus al acestui model. Arhitectura lui P4EE a fost preluat de la Gallatin, un Northwood uor modificat. n plus, a fost introdus i o versiune cu un PSB de 1066 MHz, ea reprezentnd la data lansrii singurul model de Pentium 4 care rula la aceast frecven de bus. 3.1.10. Concluzii Pentru cei care nu au avut rbdare s ne urmreasc pn aici, vom recapitula noutile aduse de Prescott: tehnologie de 0.09 microni (90 nm) Strained Silicon; pipeline crescut cu circa 50%, ceea ce determin o scdere masiv de performane dar i un potenial crescut privind frecvena de funcionare; cache pe de o parte mbuntit, prin dublarea seciunii de date a nivelului 1 i n totalitate a nivelului 2 i prin creterea eficienei sale, pe de alt parte suferind de handicapul creterii latenei; branch predictor-ul i scheduler-ul mbuntite, rezultnd o predicie i o execuie a instruciunilor mai eficient; totui este vorba de optimizri strict necesare unui pipeline att de lung; optimizarea execuiei anumitor operaii, precum nmulirile; 13 instruciuni noi, cuprinse n setul SSE3, care pot aduce avantaje minore n anumite aplicaii, cu sprijinul acestora; tehnologiile antivirus XD i EM64T, implementate doar n ultimele modele.

48

Cap 3: Evaluarea performanelor procesoarelor

3.1.11. Anex: Chipset-uri pentru Pentium 4 Nu putem spune c exist anumite chipset-uri specifice lui Prescott pentru c orice chipset uzual lucreaz fr probleme cu noul P4 i totodat toate chipset-urile nouaprute, lansate n preajma apariiei lui Prescott lucreaz fr probleme cu procesoarele mai vechi. Singura condiie este ca chipset-ul s dein suport pentru un PSB cel puin egal cu cel al procesorului. Astfel, un P4 la 2.4 GHz cu FSB 800 nu poate fi montat pe o plac de baz cu chipset Intel 845PE, care nu suport (cel puin oficial) aceast frecven de bus. Anumii productori au depit specificaiile chipset-ului, garantnd funcionarea plcilor lor la un PSB superior celui suportat de chipset. ns, vorbind din punctul de vedere al chipset-ului, doar Intel 848P, 865 (n versiunile PE, G i GV), 875P, 910GL, 915 (P, G, GV) i 925 (X i XE) suport acest PSB (s ne reamintim faptul c majoritatea modelelor de Prescott ruleaz la un PSB de 800). n plus, Intel 925XE suport suplimentar i PSB-ul de 1066 MHz de care dispune modelul de Pentium 4 Extreme Edition la 3.46 GHz. Putem observa mai sus dou generaii de chipset-uri: 8xx i 9xx. Primele, aprute n prima parte a anului 2003, erau adaptate la procesoarele acelei perioade, oferind dotri precum AGP 8x i USB 2.0, dual-channel DDR, uneori RAID i Serial ATA, dotri demne de a fi menionate, la acea vreme, pe ambalajul oricrui produs. Urmtoarea generaie, n special familiile 915 i 925 au oferit faciliti noi, precum PCI Express, DDR2, faciliti utile anilor 2004 i mai ales 2005.

3.2. Arhitectura procesoarelor AMD64 3.3. Trecut i prezent


Competiia procesoarelor din urm cu civa ani era mult diferit fa de cea actual. Revistele de specialitate abundau de materiale care prezentau pe cteva pagini cum noile (pe vremea aceea) AMD K6 i Cyrix 6x86 zdrobeau (pe ici pe colo doar n punctele eseniale) performana Pentium-urilor, criteriul de stabilire al performanei fiind doar frecvena acestuia. Situaia s-a schimbat n timp, viteza brut a procesorului pierznd mult din importan. Dac acum cinci ani vedeam ncrcarea Windows-ului de dou ori mai rapid pe un procesor la 500 MHz dect pe unul la 200MHz, odat cu atingerea barierei de 1GHz, procesorul a ncetat s mai reprezinte punctul de atracie. Aceasta pentru limitarea n privina jocurilor, cele mai avide de performan, a nceput s fie dat de placa grafic. Astzi degeaba ne scldam cu 3.8 GHz dac rulm Half Life 2 pe un Radeon 9200 pe 64 de bii. Procesorul a rmas important doar pentru crcotai, fani Intel sau AMD, care susin cu trie ori c produsele de la Intel sunt mult superioare celor AMD (i acest "mult" este nelipsit), ori invers. Tocmai pentru aceast categorie se duce btlia ntre cele dou companii, cel puin cea vizibil prin marketing, ele fcnd tot posibilul pentru a-i satisface fanii. Fiecare schimbare de arhitectur, micorare de proces de fabricaie, adugare de cache, noi nume de ci, cretere n frecven, trebuie anunat cu surle i trmbie de-o parte i de alta. Dar din ce n ce mai puini cumpr procesoare de dragul tehnologiilor, nimic nu mai este ca nainte. Trebuia s se ntmple ceva...

49

Evaluarea performanelor sistemelor de calcul

i s-a ntmplat! AMD a amanetat herghelia1 pe o tehnologie nou, pe 64 de bii. Iniial, dei departamentul de marketing a lucrat serios la imaginea noii progenituri, nimeni nu a zis nimic. Revistele i site-urile de profil au publicat tirile corespunztoare i... att. Aceasta pentru c Opteron, cci acesta este numele su, era creat pentru un domeniu destul de ciudat al computerelor: server-ele de mare performan. Abia la aproape un an distan au ieit la lumin nite procesoare utilizabile de ctre oamenii obinuii: Athlon 64, Athlon 64 FX i, mai trziu, Sempron. Nucleul s-a numit K8 (n contrast evident cu precedentele K6 i K7 - Athlon). Numele de cod au purtat denumirea general Hammer, versiunile iniiale fiind Sledgehammer (Opteron) i Clawhammer (Athlon 64). Dup nume (K8), ne putem da seama c AMD a ntors foaia i vrea s ne rsfee cu ceva complet nou. S vedem prin ce se difereniaz de arhitectura K7. Este discutabil care dintre instruciunile pe 64 de bii i integrarea controllerului de memorie este mai important. Dac primul aspect este legat n viitor, extinderea setului IA32 la cel denumit acum AMD64 ducnd la crearea unui potenial suplimentar de performan i nimic mai mult, controller-ul de memorie (pn acum prezent n northbridge-ul plcii de baz) scap sistemul de o gtuire extrem de deranjant. n rest, modificrile sunt minore, implementarea instruciunilor SSE2 sau creterea uoar a numrului de stagii ale pipeline-ului sunt schimbri fireti pentru care nu s-a fcut prea mare tam-tam. 3.3.1. Cei 64 de biii S ncepem cu nceputul. Am spus mai devreme c cei 64 de bii nu afecteaz n mod esenial performana. Cel puin nu n acest moment. Pentru a justifica afirmaia, vom face o cltorie n istorie, mai exact n 1985, cnd Intel lansa primul procesor pe 32 de bii, 80386. El era dotat cu un set nou de instruciuni, capabil s acceseze pn la 4 GB de memorie (fa de cei 16 MB ai celor pe 16 bii) i s ofere performane de invidiat dac era folosit la potenialul su maxim. Soft-urile uzuale pe 32 de bii au nceput s rsar abia la nceputul anilor 90, iar prima tentativ de sistem de operare pe 32 de bii a fost Windows 95, un adevrat talme-balme de cod pe 16- i 32-bit. Windows NT exista de ceva vreme pe pia dar el era adresat celor care azi folosesc procesoare Opteron, aa c nu poate intra n discuie. Abia Windows 2000 i mai ales Windows XP, ce sunt programate complet pe 32 de bii, au devenit sisteme de operare uzuale, la nu mai puin de 15 ani de la lansarea primului procesor capabil (teoretic, nu i din punct de vedere al vitezei) s le utilizeze. Nu este deplasat s anticipm un fenomen asemntor cu privire la instruciunile pe 64 de bii. Ele sunt prezente de ceva timp - dar sub o cu totul alt form - n procesoarele Intel Itanium, destinate server-elor; ele, spre deosebire de cele AMD64, nu lucreaz nativ cu cod IA32. Exist totui o veste bun: deja o serie de sisteme de operare utilizeaz la maxim noile procesoare AMD, precum Windows XP x64 Edition sau o serie de distribuii de Linux. Mai mult, i Intel a adoptat recent aceste instruciuni, denumind setul EM64T.
1

http://www.xf.ro/content-62-page1.html 50

Cap 3: Evaluarea performanelor procesoarelor

Nu trebuie ns s ne bucurm prea mult pentru c schimbarea nu poate avea loc de la o zi la alta i va trece mult timp pn ce vom vorbi de aceste sisteme de operare la fel cum vorbim azi de cele pe 32 de bii care sunt prezente n marea majoritatea sistemelor de calcul moderne. Cei 64 de bii au reprezentat n primul rnd un instrument de marketing pentru AMD, nicidecum o necesitate a momentului. Trebuie s privim instruciunile AMD64 ca pe o extensie la setul IA32, nu ca pe un nlocuitor. Procesorul este capabil s comute ntre legacy mode i long mode n funcie de necesiti, la fel cum 80386 putea comuta ntre modul real i cel protejat. Practic, este vorba de nite regitri suplimentari inclui n nucleul procesorului, care pot efectua operaii cu numere pe 64 de bii (pn la 2 la puterea 64). Astfel, pot fi prelucrate simultan de dou ori mai multe date, traficul dintre procesor i celelalte componente desfurndu-se mult mai fluent. (Observaie: tehnic vorbind, programatorul are la dispoziie 5 moduri: legacy 16-bit mode, legacy 32-bit mode, compatibility 16-bit mode, compatibility 32-bit mode i 64-bit long mode, ns descrierea lor n detaliu nu face subiectul cursului de fa.). De asemenea, dublarea numrului de regitri i practic triplarea spaiului de memorare a acestora (msurabil n bii 3072 fa de 1280) conduce la posibilitatea meninerii de date n procesor pentru mai mult timp, fiind mai rar necesar schimbul cu memoria principal. De remarcat urmtorul fapt: K8 nu va rula mai rapid (dar nici mai lent) dect K7 codul pe 32 de bii sau, dac performanele vor diferi, ele se vor datora altor motive dect prezena noului set de instruciuni. n legacy mode, K8 este transformat ntr-un procesor normal, capabil s execute instruciunile precum orice procesor pe 32 de bii. S lum un exemplu: algoritmii de criptare. Unii necesit operaii cu numere pe 64 de bii. Folosind o main 32-bit, este imposibil obinerea direct a unui rezultat, singura metod de calcul fiind crearea unui algoritm care s realizeze acest lucru, similar celui aplicat de om pentru orice adunare sau nmulire. (v mai aducei aminte de 75-18; le punem unul sub altul; 5-8 nu se poate, mprumutm o zece; 15-8=7; la cifra zecilor ne mai rmne 6; 6-1=5, deci rezultatul e 57 ?). Orice procesor pe 64 de bii poate realiza dintr-un foc operaia, economisindu-se mult timp. Memoria maxim adresabil a crescut i ea de la 64 GB la procesoarele IA32 cu PAE (Physical Addressing Extensions) activat la 1 TB. E drept, e puin probabil ca acum un server s necesite att de mult memorie, dar cei 64 GB precedeni se aflau n mod sigur la limit. 3.3.2. Memoria gestionat direct din procesor O alt noutate adus de generaia K8 este faptul c de acum nu chipset-ul va mai fi rspunztor de memorie ci nsui procesorul. Memoria, ca orice entitate din interiorul sistemului de calcul, trebuie s fie gestionat de un controller care s realizeze comunicarea dintre aceasta i elementul central, procesorul. Pn acum, northbridge-ul integra acest controller ns, din raiuni de vitez, procesorul a preluat sarcina. Comunicarea dintre memorie i procesor se realiza prin bus-ul denumit pn acum PSB sau (incorect dar ncetenit) FSB, ce reprezenta una dintre gtuirile principale de care sufereau procesoarele rapide. Totui, s nu ne bucurm prea mult de noua reuit a celor AMD i s prezentm i dezavantajele. De fapt dezavantajul: cel care decide ce tip de memorie poate fi folosit n sistem este procesorul. Dac el deine un controller DDR SDRAM, atunci va fi imposibil asortarea lui cu una de tip DDR2
51

Evaluarea performanelor sistemelor de calcul

sau RDRAM, de exemplu. Astfel, upgrade-ul este mai problematic, de schimbarea procesorului depinznd schimbarea memoriei i invers. Limea bus-ului dintre procesor i controller-ul de memorie a rmas aceeai ca la vechile sisteme: 64 sau 128 de bii, n funcie de tipul controller-ului integrat: singlesau dual-channel. Frecvena ns a crescut la valori impresionante, ea fiind acum egal cu frecvena procesorului. S lum ca exemplu trei procesoare: unul K8, unul K7 i altul Pentium 4 ce ruleaz la 2.4 GHz, ultimele dou avnd un PSB de 200 MHz reali. Arhitectura K7 beneficiaz de bus-ul EV6, ce dubleaz frecvena, PSB-ul efectiv fiind de 400 MHz. n cazul lui P4, situaia este mai fericit, bus-ul Quad Pumped ridicnd aceast frecven la 800 MHz efectivi. K8 se va situa mult deasupra ambilor concureni, bus-ul dintre procesor i controller-ul de memorie rulnd la 2400 MHz, depind de 6 i respectiv 3 ori arhitecturile celorlalte dou CPU-uri. Comunicarea dintre controller i memorie se desfoar la aceeai vitez, i anume la frecvena memoriei, i pe 64 sau 128 de bii, n funcie de numrul de canale. Exist un aspect ciudat dar foarte important pentru cei interesai de overclocking (dar nu numai) care trebuie explicat n acest context. n sistemele obinuite, memoria ruleaz la o frecven egal cu frecvena PSB nmulit cu un raport fix de numere mici. De exemplu, pe o platform K7 cu un chipset nForce2, dac avem un PSB de 400 MHz, memoria va rula, spre exemplu, la 1:2, 5:12 sau 2:6 din aceast frecven, adic 200, 166 i respectiv 133 MHz teoretici (sau 1:1, 5:6 sau 2:3 n cazul n care considerm frecvenele efective, de 400, 333 i 266 MHz). Motiv: controller-ul de memorie trebuie s lucreze n strns legtur cu PSB-ul, la fiecare n bii primii de la memorie trebuind s transmit m bii ctre procesor, i invers unde n i m sunt direct proporionali cu frecvena memoriei, respectiv a bus-ului PSB. Ce ne facem cnd controller-ul este integrat n procesor? El va primi de la acesta n bii i va transmite mai departe m, ns raportul trebuie s fie unul de numere mici. Raiuni tehnice mpiedic rapoarte gen 2:29, cum ar fi necesar dac procesorul ar rula la 2900 MHz iar memoria n DDR400. Astfel, s-au ales nite divizori ntregi, frecvena memoriei fiind 1:15, cea mai apropiat valoare de 2:29 (adic 1:14.5) inferioar acesteia. De ce inferioar? Pentru c nu se poate permite memoriei s ruleze la o frecven superioar celei dorite, din motive evidente. Astfel, n exemplul nostru, memoria va rula la doar 193.33 MHz n loc de cei 200 solicitai. 3.3.3. HyperTransport Comunicarea dintre procesor i chipset se realizeaz prin bus-ul HyperTransport (pe care l vom numi n continuare HT), numit iniial LDT (Lightning Data Transport). Bus-ul nu este conceput special pentru aceast platform, el fiind unul universal, ce servete, de exemplu, i la comunicarea dintre southbridge-ul i northbridge-ul chipsetului nForce2 (deci n cadrul platformei K7!). n cazul nostru, bus-ul este o component a PSB-ului, dar cea care afecteaz cel mai puin performana i care depinde exclusiv de chipset. De aceea, dei exist o btlie pe via i pe moarte privind cine scoate cel mai rapid HyperTransport, trebuie tiut c acest lucru nu afecteaz aproape deloc viteza de lucru. Dei el este conceput pe doar 32 de bii (16 bii pentru transmisie, 16 pentru recepie cazul cel mai frecvent) la o frecven de tipul 800 sau 1000 MHz, e suficient s ne gndim c limea de band obinut este de 800 MHz x (32/8) bytes = 3.2 GB/s, adic puin peste valoarea lui AGP 8x dar sub cea oferit de PCI Express X16. Un HT de 1 GHz (prin cei 4 GB/s) se apropie de cei 4.3 GB/s ai lui PEG x16. Ceea ce nseamn c nu vom putea folosi la ntreaga capacitate o plac grafic PCI
52

Cap 3: Evaluarea performanelor procesoarelor

Express. Reprezint acest lucru un dezavantaj? Cu siguran nu, jocurile de azi nefiind limitate aproape deloc de o lime de band echivalent cu AGP 4x (circa 1 GB/s). Bus-ul HT realizeaz legtura i cu celelalte componente, de exemplu controllerul IDE, cel USB 2.0 sau chiar cel SCSI. Nu putem nega dezavantajul ce rezult de pe urma folosirii acestui bus, dar el este extrem de mic, lucru reflectat de un test ce poate fi realizat de ctre oricine: cele mai multe plci de baz permit ajustarea frecvenei HT i un scurt 3DMark rulat la mai multe frecvene ne poate lmuri c diferenele sunt infime. Revenind la controller-ul de memorie, trebuie spus c sistemele obinuite nu sunt afectate foarte mult de prezena acestuia n procesor: latenele reduse nu au crescut niciodat la valori impresionante performanele. Sporul adevrat apare n sistemele multiprocesor unde, spre deosebire de alte platforme, limea de band dintre procesor i controller-ul de memorie nu este mprit n mod egal ntre procesoare. Fiecare procesor are acum maxim trei legturi (Hyper Transport Links): una prin care este legat de chipset (prezent i la sistemele cu un singur procesor) i altele dou prin care putea lua legtura cu alte dou procesoare. Iat, de exemplu, schema de interconectare ntre 8 procesoare, figura 3.1: n plus, interconectarea dintre procesoare este supus specificaiilor NUMA (Non-Uniform Memory Access) prin care se asigur posibilitatea oricrui procesor de a accesa orice zon de memorie, spre deosebire de tehnica shared, unde fiecare procesor avea alocat o zon specific de memorie, neputnd adresa una ce aparinea altui CPU. 3.3.4. Cache-ul La AMD64, aceast memorie intermediar este stratificat pe dou nivele integrate n CPU, ca la orice procesor modern. Relaia dintre ele este exclusiv, ca i la generaia anterioar, ceea ce Fig. 3.1: Schema de interconectare ntre 8 procesoare. nseamn c nivelul al doilea de cache nu include i o imagine a celui dinti (n contrast cu relaia inclusiv ntlnit la Pentium 4). Astfel, eficiena nivelului doi este mai redus datorit unui transfer mai frecvent dintre L1 i L2. Viteza comunicrii dintre cele dou nivele a fost dublat, de aici rezultnd nc un plus de performan fa de arhitectura K7. Tot legat de cache, notm o cretere a numrului de intrri n TLB (Translation Lookaside Buffer) pentru ambele nivele de cache. Desigur, trebuie s explicm ce este acest TLB. Gestionarea memoriei de ctre procesor este realizat n dou moduri: adresare real i adresare virtual. Uneori este mai util ca adresarea s se fac relativ la alt locaie dect la mod absolut, adic preciznd distana de la alt adres i nu pe cea de la punctul zero. TLB este o mic zon de memorie integrat n nucleul procesorului care
53

Evaluarea performanelor sistemelor de calcul

face legtura dintre cele dou tipuri de adresare (cu ajutorul ei se poate transforma o adres virtual ntr-una real i invers). Dimensiunea cache-ului a suferit i ea modificri. Dac primul nivel a rmas la 128 KB, nivelul al doilea a fost crescut la 512 KB sau 1 MB, n funcie de modelul procesorului. Se spune c creterea de la 256 KB la 1 MB afecteaz cu 15% performana, dei aceast cifr poate prea unora destul de optimist, aceasta datorit eficienei mai sczute a nivelului doi comparativ cu Pentium 4. Ct despre latena cache-ului, pentru nivelul unu ea a rmas aceeai, dar pentru cel de-al doilea a fost micorat. Situaia e foarte interesant, Prescott are pipeline i latene crescute fa de predecesor pentru a-i putea crete frecvena, pe cnd K8 are aproape acelai pipeline iar latena a sczut, ceea ce poate constitui o barier n goana dup gigahertzi. Desigur, AMD tie mai bine ce face... 3.3.5. Conductele i predicia La procesoarele AMD, pipeline-ul este mprit n dou segmente: unul pentru ALU i unul destinat FPU-ului. Exist un segment comun, de 6 stagii, care nu a fost afectat de nici o schimbare n cazul lui K8, el cuprinznd fetch (preluarea instruciunii) i decode (decodificarea acesteia). Prelucrarea efectiv este realizat n alte stagii, la K7 n numr de 4 (pentru ALU) i respectiv 9 (pentru FPU). La K8, aceste ultime stagii au fost crescute cu cte 2, numrul total devenind 12 fa de 10 (pentru ALU) i 17 fa de 15 (pentru FPU). Dup cum spuneam i n subcapitolul anterior, dedicat lui Prescott, un pipeline prea lung afecteaz negativ performana dar crete posibilitatea atingerii de frecvene mari. De asemenea, nu este de dorit nici un pipeline foarte scurt pentru c astfel nu mai poate fi executat n paralel un numr prea mare de instruciuni. AMD a crescut cu 2 numrul de stagii din cauza reproiectrii blocului de predicie (branch predictor), anticiparea instruciunilor devenind acum cu 510% mai precis, precum i datorit mbuntirii spaiului din scheduler destinat unitii ALU. De ce creterea pipeline-ului a fost datorat mbuntirii celor dou uniti? Cu ct prezictorul este mai eficient, cu att exist anse mai mici ca ramura curent de execuie s fie incorect, urmnd golirea pipeline-ului. De aceea, AMD a considerat c pipeline-ul poate fi crescut, ansele de alegere greit a ramurii fiind suficient de reduse astfel nct creterea lungimii sale s fie considerat un avantaj. Acelai lucru se poate spune i despre scheduler, care trimite ctre fiecare unitate de prelucrare instruciunile cuvenite. Cu ct acesta poate reine mai multe instruciuni, cu att ele vor fi executate mai eficient. La K8, spaiul acestuia a crescut substanial, de trei ori. Observaie. Un pipeline foarte lung, avnd un branch prediction cu un hit-rate de 100% precum i un scheduler foarte ncptor va oferi numai avantaje n termeni de performan. Lungimea mare a pipeline-ului nu trebuie privit ca o sperietoare. Numai ca pentru un pipeline lung s nu afecteze negativ viteza sunt necesare un branch prediction i un scheduler pe msur, iar acestea nu pot fi mbuntite la infinit. 3.3.6. Motentirea de la Intel n primul rnd, SSE2. Setul de instruciuni introdus odat cu primul Pentium 4 este, n sfrit prezent i n CPU-urile AMD. Situaia este oarecum amuzant, ambii productori schimbnd ntre ei tehnologii (Intel a preluat de la texani setul AMD64). Dei instruciunile de acest tip nu sunt liceniate n nici un fel, o regul dedus
54

Cap 3: Evaluarea performanelor procesoarelor

experimental spune c niciodat cel care copiaz nu va obine, legat de acele instruciuni, performanele concurentului su. Aa se face c noua generaie de procesoare de la AMD obine performane teribil de mici prin SSE2. ntr-o situaie asemntoare s-a aflat i Intel la lansarea lui P4 (Willamette, primul model), unitatea FPU fiind mai lent dect cea din Pentium III, programele inteligente care foloseau instruciuni SSE n locul celor FPU obinnd performane mult crescute. Sau, dac ne adncim i mai mult n istorie, gsim un K6-2 cu al su FPU de 2-3 ori mai lent dect cel din procesoarele Intel similare. ns setul 3DNow!, folosit cu totul i cu totul ocazional n programele acelor vremuri, salva onoarea firmei AMD, dei utilizatorii nu prea beneficiau de acesta. Revenind n prezent, avnd n vedere c procesoarele K8 au ntrziat nepermis de mult, unii au presupus c AMD pur i simplu nu a mai avut timp s optimizeze SSE2-ul, aplicaiile ce se folosesc de el fiind deseori mai lente dect cele ce se bazeaz pe clasicul FPU. Ce am mai vzut la Intel i ateptm implementat i n procesoarele concurenei? Thermal throttling, SSE2 optimizat, SSE3 (inclus deja n ultimele stepping-uri de K8) i, de ce nu, HyperThreading. Legat de ultimul aspect, AMD a achiziionat licenele necesare pentru aceast tehnic, dar nu se ntrevede nici un model care s beneficieze de ea. AMD este o companie mic (n comparaie cu ali gigani din lumea IT, printre care se afl i Intel), deci orice implementare care cost mult e calculat la snge. AMD nui poate permite prea multe eecuri, nainte de fiecare lansare a unei noi generaii ea avnd dificulti mari financiare: nainte de lansarea lui K6 era n pragul falimentului, nainte de lansarea lui K7 avea serioase probleme financiare (ultimele modele de K6 nefiind prea reuite) iar nainte de K8 mergea n pierdere. Un ultim lucru care merit menionat este protecia antivirus NX (No Execute) despre care am discutat la capitolul destinat lui Prescott i care de altfel este prezent n ultimele versiuni ale acestuia. AMD s-a aflat n faa lui Intel de aceast dat, oferind nc de la primul procesor K8 aprut (Opteron) aceast protecie. 3.3.7. Modele de K8, tehnologii de fabricaie i platforme Primele variante de K8 au fost destinate server-elor i au purtat numele de Opteron. Controller-ul de memorie integrat era de tip dual-channel iar memoriile necesare erau de tip registered. Cele patru versiuni disponibile, dei aparent identice, erau capabile s ruleze n sisteme de un singur, dou, patru i respectiv opt procesoare, ele identificndu-se printr-un numr de tip 1xx, 2xx, 4xx i 8xx. Spre exemplu, Opteron 246 rula la 2 GHz i putea funciona n sisteme dual-procesor. Numele de cod a fost Sledgehammer iar platforma utilizat Socket 940. Odat cu apariia modelelor desktop, destinate tuturor utilizatorilor, AMD a portat o versiune a lui Opteron n sisteme mai cumini dar destinate entuziatilor. Astfel s-a nscut Athlon 64 FX, un procesor extrem de scump pentru aproape oricine (costa peste 1000$ la lansare). n plus, fiind practic un Opteron din seria 1xx redenumit, necesita i memorii registered, extrem de scumpe i cu puin mai lente dect cele normale (unbuffered). Notarea lui Athlon 64 FX a fost destul de ciudat, modelele purtnd numele FX-51, FX-53, FX-55 etc.
55

Evaluarea performanelor sistemelor de calcul

Pentru utilizatorii care ineau seama i de bugetul alocat, Athlon 64 simplu a oferit satisfacii similare, diferena de performan fa de FX fiind minim. Athlon 64 a fost vduvit de o parte din pini, numrul lor fiind redus la 754, iar controller-ul de memorie integrat rula pe un singur canal, memoria L2 cache rmnnd la 1 MB. Pentru denumirea modelelor, AMD s-a folosit de rating-ul cunoscut de la Athlon XP, referina fiind procesoarele Intel Pentium 4. Astfel, un Athlon 64 3200+ este (teoretic) la fel de rapid ca un Pentium 4 la 3.2 GHz. Northwood sau Prescott? Nu rspundem la ntrebri filozofice... Noul core, NewCastle, exista att n versiuni single- ct i dual-channel, diferena fa de Clawhammer privind dimensiunea cache-ului: doar 512 KB. Acest lucru nu a constituit un dezavantaj, frecvena superioar compensnd minusul cu pricina. De exemplu, Athlon 64 3200+ n versiunea Clawhammer (1 MB cache) avea o frecven de 2 GHz, pe cnd cea NewCastle (512 KB) de 2.2 GHz. Platforma Socket 754 a fost pstrat, fiind ns considerat din ce n ce mai low-end. Socket 940 a fost nlocuit cu Socket 939, modelele ce se inserau n acest socket beneficiind de un controller de memorie ce lucra cu memorii unbuffered n dualchannel. Toate nucleele amintite erau create n tehnologia de 0.13 microni (130 nm). Trecerea la 0.09 microni (90 nm) a fost iminent, fiind necesar pentru atingerea de frecvene superioare. Aa s-a nscut nucleul Winchester, aproape identic ca funcionalitate cu NewCastle, dar mai rece, creat numai pentru platforma 939 (care de altfel are i un viitor asigurat). Totui, el s-a dovedit a fi un semi-eec din punct de vedere al overclocking-ului, procesul de fabricaie nematurizat punndu-i amprenta asupra frecvenelor atinse. De remarcat i controller-ul de memorie uor mbuntit al noului core. Recent, AMD a introdus nou noi nuclee pe 0.09 microni: Venice i San Diego, cu 512 i respectiv 1 MB de cache, implementnd instruciunile SSE3, un controller de memorie optimizat i un potenial crescut de atingere a frecvenelor mari. Pentru Socket 754, AMD a introdus cteva versiuni de Sempron, diferenele fa de Athlon 64 privind cache-ul: 128 sau 256 fa de 512 KB sau 1 MB (controller-ul de memorie fiind, evident, single-channel), precum i setul de instruciuni pe 64 de bii absent. Mai exact dezactivat i imposibil de activat. Rating-ul su a fost stabilit n funcie de Celeron D, modelul 3100+ rulnd la 1.8 GHz, ca i Athlon 64 2800+, dar acesta din urm avea un cache level 2 dublu. De reinut faptul c modelele inferioare lui Sempron 3100+ sunt concepute pentru platforma Socket A, ele neavnd nimic n comun (afar de nume) cu cele S754. n fine, menionm c tehnologia de fabricaie a lui K8 a unor modele a suferit o modificare important: introducerea SOI (Silicon-On-Insulator) care, pe scurt, ofer anse suplimentare creterii frecvenei procesorului, dar despre care nu vom vorbi n detaliu aici. 3.3.8. Concluzii AMD a schimbat multe odat cu K8. Puine dac ne referim strict la arhitectura intern dar multe dac lum n calcul adaosurile: controller-ul de memorie integrat i instruciunile pe 64 de bii. Dac al doilea aspect nu aduce beneficii prea mari, primul ajut substanial la creterea performanei, excluznd astfel din ecuaie o puternic limitare de care sufereau vechile K7, limitare care uneori nu putea fi suprimat nici mcar odat cu creterea foarte mare a frecvenei de tact. Limitare care nu era prezent
56

Cap 3: Evaluarea performanelor procesoarelor

la procesoarele Pentium 4, probabil din cauza PSB-ului foarte mare (de ordinul a 800 MHz fa de maxim 400 la K7) care compensa latenele suplimentare datorate prezenei externe a controller-ului n cauz. Cu alte cuvinte, puteam crete orict frecvena unui Athlon XP, efortul necesar atingerii vitezei unui Pentium 4 sau Athlon 64, n unele - i destul de puine - aplicaii urmnd o curb exponenial ascendent. n testele n cauz, un Athlon XP supus unui overclocking puternic i rulnd la 2.6 GHz era cu doar puin mai rapid dect unul la 2 GHz; n schimb, un Athlon 64 la 2.6 GHz nu are probleme n a afia rezultate oarecum proporionale cu cel la 2 GHz, nefiind att de limitat de factori externi precum un controller de memorie. Acestea fiind zise, s facem un rezumat al facilitilor oferite de noile procesoare AMD: tehnologie de 0.13 (130 nm) i apoi de 0.09 microni (90 nm) SOI; controller de memorie integrat, ce deine principalul merit al creterii performanelor; instruciuni AMD64, slab folosite pentru moment; instruciuni SSE2 (introduse pentru prima dat n Pentium 4), implementarea lsnd de dorit la capitolul vitez; pipeline uor crescut odat cu un branch prediction i o unitate scheduler mbuntite; cache crescut iniial la 1 MB, revenindu-se ulterior la 512 KB, cel de 1 MB fiind destinat modelelor high-end; protecie antivirus NX, similar celei XD de la Intel. Anex: Chipset-urile destinate procesoarelor din familia AMD64 Dac la Prescott lucrurile erau mai simple, piaa fiind mprit n Intel i alii, n cazul lui AMD exist doi mari juctori: NVIDIA i VIA. Pentru prima dat, NVIDIA folosete un singur chip, unind northbridge-ul (vduvit de controller-ul de memorie) cu southbridge-ul, denumirea de chipset devenind astfel improprie (ntlnim expresia single-chip core-logic). Exist dou familii de nForce pentru procesoarele AMD K8, i anume nForce3 - cu suport AGP 8x, i nForce4 - cu suport PCI Express. Dac seria nForce3 150 nu are n dotare dect simpla interfa ATA 133, nForce3 250 ofer att porturi Parallel ATA ct i Serial ATA. Mai mult, nForce4 Ultra introduce Serial ATA II, dublnd limea de band disponibil pentru unitile de stocare (nForce4 simplu se limiteaz la un Serial ATA I), ns impactul asupra performanelor este cvasi-zero. n fine, nForce4 SLI ofer posibilitatea conectrii n acest mod a dou plci grafice PEG X16 pentru maximizarea performanei 3D. De partea cealalt, VIA ne ofer pentru platforma AGP un K8T800 simplu i unul Pro, diferenele dintre ele constnd n viteza HyperTransport, precum i n viteza de comunicare dintre northbridge i southbridge, precum i K8T890 pentru PCI Express, a crui rspndire nu este mare. Menionm c ntre chipset-uri mai exist diverse diferene la nivelul HyperTransport, att ca lime a bus-ului (8 bii sau 16 bii) ct i ca lime de band (ntre 600 i 1000 MHz). n sistemele obinuite aceste elemente influeneaz att de puin performana nct competiia este doar una de marketing (similar celei dintre AGP 4x i 8x, de exemplu). Viitorul ne va oferi multe surprize, cea mai ateptat fiind legat de DDR-2 i de modelele cu dou nuclee. Legat de primul aspect, acest lucru depinde de procesor i
57

Evaluarea performanelor sistemelor de calcul

doar AMD este cel care poate decide; cu siguran, atunci cnd se va simi nevoia, vom avea parte i de noul standard implementat n viitoarele Athlon 64. Ct despre dual-core, ele au frecvene mai sczute dect modelele cu un singur nucleu, performanele urmnd s fie, ns, superioare.

3.4. Procesoare Dual-Core


Cipurile dual-core, proiectate pentru a sustine dou nuclee distincte, ofer practic dou uniti centrale de procesare integrate ntr-o singur bucat de silicon. Pe scurt, n baza testelor PC World dintre Intel Pentium 840 Extreme Edition i AMD Athlon64 X2, ctigtor este procesorul celor de la Advanced MicroDevices, care surclaseaz toate procesoarele Intel existente. Interesant de aflat este: pentru cat timp? Procesorul AMD Athlon 64 X2 4800+, ce lucreaz la o frecven de tact de 2,4 GHz pe o arhitectur de 90 nm, are 1 MB de memorie cache L2 pe fiecare nucleu. Magistrala sistemului funcioneaz la 2.000 MHz datorit tehnologiei HyperTransport. Conectarea la sistem se face prin intermediul unui Socket 939. Procesorul consum maximum 110 W, beneficiind i de tehnologia Coolnquiet, care ajusteaz puterea consumat n funcie de activitatea desfurata de procesor. Lansate n iunie anul curent, procesoarele Athlon 64 X2 pe 64 bii propulseaz deja serverele dual-core Opteron i staiile de lucru. Intel nu s-a lsat mai prejos i a lansat procesorul Intel Pentium 840 Extreme Edition. Este implementat pe o arhitectura de 90 nm, funcionnd la o frecven de tact de 3,2 GHz. Ca i competitorul direct, are cte 1 MB de memorie cache L2 pe fiecare nucleu. Front Side Bus-ul acestui procesor atinge 800 MHz, conectndu-se pe socket LGA 775. Interesant este ca pe lng tehnologia Dual-Core, acest model este dotat i cu funcia Hyper Threading. Astfel, avnd n vedere c fiecrui procesor fizic dintre cele dou de pe capsula i sunt alocate dou procesoare logice prin HT, rezult ca noul model de la Intel poate executa nu mai puin de patru procese n paralel. Computerele cu procesoare dual-core au nceput s apar deja pe pia n diferite variante. Pentru o mai uoar trecere ntre generaiile de procesoare, la platformele AMD exist posibilitatea de upgrade a existentului Athlon 64 din PC doar printr-un simplu upgrade de BIOS. Pe de alta parte, Intel nu ofer aceeai flexibilitate, pentru trecerea la tehnologia Intel Dual-Core fiind necesar achiziia unei noi placi de baz. Testele indic faptul c indiferent de constructorul ales, Intel sau AMD, cipurile Dual Core beneficiaz de performane ridicate atunci cnd ruleaz mai multe aplicaii simultan. Vom analiza n continuare tehnologiile i proprietile specifice fiecrui productor pentru a ne face o idee de ansamblu asupra modurilor de implementare a procesoarelor dual-core.

58

Cap 3: Evaluarea performanelor procesoarelor

3.4.1. Tehnologia Intel dual-core Intel Un procesor dual-core Intel are dou nuclee de execuie separate pe acelai cip care ruleaz la aceeai frecven. Ambele nuclee mpart acelai package fizic i aceleai interfee cu chipset-ul i memoria. Totui, ele pot opera ca nuclee distincte de execuie. Procesarea dual-core este una dintre metodele de a furniza performana n timp ce se balanseaz cerinele de putere i const n adugarea mai multor resurse procesorului i nu n creterea frecvenei acestuia (fig. 3.2).

Fig.3.2: Procesor dual-core: se observ paralelismul n execuia proceselor.

Fig.3.3: Procesor dual-core cu tehnologie Hyper Threading 4 procese pot rula simultan.

Fig.3.4: Procesor cu tehnologie Hyper Threading execuie simultan a dou procese. O staie de lucru bazat pe un procesor dual-core Intel extinde capabilitile PCului i asigur un mai mare grad de procesare simultan, un utilizator putnd, de exemplu, s randeze i s editeze o secven video n acelai timp. Ca o analogie, imaginai-v o autostrad cu patru benzi: pe ea trec pn la de doua ori mai multe maini fr a obliga fiecare main s mearg de doua ori mai repede. Procesorul Intel dual-core este o evoluie a tehnologiei Hyper Threading. Att tehnologia HT, ct i un procesor dual-core permit rularea mai multor aplicaii concepute pentru a exploata procesele multiple, dar dual-core aduce mai multe resurse i putere de procesare n cadrul PC-ului. n alte cuvinte, procesarea dual-core face acelasi lucru ca i Hyper Threading, doar c mai repede, avnd o putere de calcul mai mare.

Fig.3.4: Procesor cu un singur nucleu procesele sunt rulate secvenial.

59

Evaluarea performanelor sistemelor de calcul

n viitor, Intel va lansa procesoare ce vor mbina cele dou tehnologii, HyperThreading i Dual-Core, pentru a asigura rularea n paralel a unui numr maxim de patru procese diferite. Acest lucru va duce, pe lng dublarea teoretic a vitezei, la o explozie a numrului aplicaiilor concepute s ruleze pe sistemele multi-core. 3.4.2. Tehnologia Dual-Core AMD AMD continu drumul inovaiilor introducnd tehnologia dual-core (dual socket) pentru piaa PC. Procesoarele dual-core Opteron pentru staii de lucru extind arhitectura Direct Connect a AMD, conectnd dou uniti centrale de procesare (CPU) ntr-un singur circuit integrat, mbuntind per total performantele sistemului i eficiena acestuia. Procesoarele AMD Operton single-core i dual-core cu arhitectura Direct Connect i HyperTransport Technology permit tranziia uoar la tehnologia pe 64 bii fr a sacrifica performanta pe 32 bii. Un lucru mbucurtor pentru fanii AMD este c tehnologia dual-core este extrem de uor de implementat prin urmtoarele considerente principale: procesorul dual-core conine dou uniti centrale de procesare ntr-un singur circuit integrat, fiecare nucleu avnd propria memorie cache L2 de 1 MB; se conecteaz pe socket-urile existente cu 940 de pini pentru procesoarele AMD Opteron; un update de BIOS este tot ceea ce este necesar pentru a obine un sistem compatibil de a rula cu procesoare dual-core; cele dou nuclee CPU se descurc cu aceeai memorie i cu tehnologia HyperTransport disponibile pentru procesoarele single-core. Procesoarele AMD Opteron dual-core prezint, de asemenea, avantajele arhitecturii unui procesor cu un singur nucleu. Aceste avantaje cuprind urmtoarele tehnologii: Direct Connect Arhitecture - ajut la mbuntirea performanei sistemului i a eficienei prin conectarea direct a procesoarelor, controllerului de memorie i a dispozitivelor de intrare-ieire ale procesorului. HyperTransport Technology - asigur interconectare cu lime de band scalabil ntre procesoare, subsitemele periferice i alt chipset. AMD PowerNow! Technology cu Optimized Power Management (OPM) asigur necesarul de putere de calcul n funcie de cerine, rezultnd un raport performan-putere optimal. S analizm, ns, cum se vor comporta noile cipuri n PC-urile noastre: Cretere de viteza Sistemul de referina pe care s-au efectuat testele a rulat Windows XP Pro. Acesta a venit configurat cu 1 GB de memorie DDR 400, un hard disc de 10.000 rpm i o placa video nvidia GeForce 6800 Ultra cu 256 MB de memorie DDR3. Mainria AMD Athlon64 X2 a reuit un scor de 116 puncte n WorldBench 5, cu mult mai bun dect cele 95 de puncte obinute de procesorul dual-core Pentium 840 Extreme Edition. Unitatea AMD a artat un real plus de putere n poriunea de multitasking a lui PC WorldBench 5. Timpul de doar 6 minute i 44 de secunde a fost cu 3 minute i 42 de secunde mai bun dect media dintre dou sisteme Athlon 64 FX 55 i cu aproape 3 minute mai bun dect Pentium 840 EE dual-core. n WorldBench 5, unitatea dual-core
60

Cap 3: Evaluarea performanelor procesoarelor

produs de Intel, a artat mbuntiri comparativ cu acelai sistem, dar echipat cu un procesor Pentium 4 seria D la 3,2 GHz (ambele cu Hyper-Threading activat). Despicnd firul n patru, mai aflam un lucru interesant: n testele de anduran i de stabilitate, procesorul 840 al lui Intel rmne ferm pe poziie, chiar i dup multe zile de lucru intens, n timp ce Athlon-ul 4800+ ncepe s aib probleme. La acest capitol putem acorda o bil alb lui Pentium 840 EE, care se potrivete ca o mnu serverelor i staiilor de lucru folosite cu aplicaii puternice. Este adevrat c procesorul produs de Intel consum mai mult curent electric, dar de aici provine i plusul de stabilitate att de necesar multor utilizatori. Ce se poate face concret cu procesoarele dual-core? Pentru a plasa procesoarele dual-core ntr-un context potrivit, trebuie s reconsiderm modul de lucru cu computerul. Sistemele cu dou procesoare logice sunt perfect potrivite pentru a face operaiuni multiple, simultan, fr ca utilizatorul s observe scderi de performan. Imaginai-v cum ar fi s jucai un joc 3D sofisticat n timp ce arhivezi fiiere audio. Chiar dac decizi s mai introduci o operaiune dificil, cum ar fi compresia de volume mari de fiiere, abilitatea de a juca shooter-ul 3D nu va fi redus. Dac se introduce a patra comand consumatoare de resurse de ctre sistem, atunci se va reduce n mic msur timpul total de execuie a proceselor, dar nu se va observa un impact major asupra rspunsurilor directe date de sistem. Intel deja introduce procesoarele dual-core bazate pe sistemul Pentium D, iar PC-urile propulsate de acestea vor fi considerabil mai ieftine dect cele cu Pentium 840 EE. Dei scumpe, procesoarele dual-core dovedesc performane simitor mbuntite. AMD i continu n salturi drumul ctre inimile gamer-ilor nnebunii de gigaherti, n timp ce Intel prefer sa urce cu pai mruni, siguri i stabili.

3.5. Test de procesoare


Importana unui procesor (CPU) ntr-un sistem de calcul este printre cele mai mari. Teoretic, vorbim despre componenta central a PC-ului, creierul su, unitatea care coordoneaz toate activitile i fr de care nimic din ceea ce vedem pe monitor nu s-ar putea realiza. Aadar, o modificare a nivelului su de performan va conduce la schimbarea dramatic a vitezei de lucru, productivitii i satisfaciei. Nu trebuie neglijat, ns, importana memoriei (mai ales din punct de vedere cantitativ), a plcii grafice i a altor componente de baz. De fapt, n primul rnd conteaz sarcinile pe care le dm PC-ului, n funcie de ele putndu-se deduce nivelul de performan necesar din partea fiecrei componente. De exemplu, un mptimit al jocurilor va avea nevoie n primul rnd de o plac grafic performant (cu un GeForce 6200, de exemplu, nu se va putea atinge un framerate minim decent n ultimele apariii), apoi de un procesor performant; abia n ultimul rnd conteaz ali factori, precum o cantitate de memorie mai mare de 1 GB sau un hard disk rapid. n schimb, un profesionist al graficii (2D) nu se va folosi de puterea 3D a plcii grafice, n schimb va avea nevoie de un procesor ct mai rapid i de o cantitate de memorie de minim 2 GB pentru a-i face treaba n condiii bune.

61

Evaluarea performanelor sistemelor de calcul

n continuare se prezint rezultatele unor teste care se doresc a fi un ghid al momentului cu privire la achiziionarea unui procesor, fie pentru un sistem nou, fie n cazul unui upgrade. Se urmrete s se acopere toate domeniile de utilizare a PC-ului, prin prezentarea unui numr mare de teste, cuprinznd att jocurile i partea de multimedia/entertainment ct i aplicaiile profesionale. Au fost introduse att teste analitice (jocuri reale, codare audio/video, arhivare), ct i sintetice (3DMark, SuperPI), pentru o evaluare din dou perspective: cea real - perceptibil n practic, i cea teoretic - att de popular printre entuziati i cei care doresc s doboare recorduri. i, de ce s nu recunoatem, testele sintetice reflect n mare msur comportamentul n utilizarea real. Platformele alese au fost n numr de trei: LGA775, Socket AM2 i Socket 939, toate prezente pe pia n acest moment, dei Socket 939 se pare c n curnd va iei din scen. LGA775, numit i Socket T, a aprut n urm cu peste doi ani, fiind dedicat exclusiv procesoarelor Intel. Aceasta a nlocuit vechiul Socket 478 i a introdus pentru prima dat acest Land Grid Array (LGA) - un tip de mpachetare diferit de cel clasic: pinii nu se afl pe procesor, ci pe placa de baz, CPU-ul coninnd doar contactele necesare pentru a se face legtura cu pinii. Criticat n primul rnd pentru faptul c pinii situai n socket pot fi ndoii sau chiar distrui relativ uor, LGA775 a cptat - vrndnevrnd - o popularitate mare printre utilizatori, devenind singura soluie pentru platforma Intel. Socket AM2 desemneaz penultimul socket introdus de AMD, El se deosebete de cel anterior, Socket 939, printr-un pin suplimentar, precum i prin dispunerea diferit a celorlali. Este evident faptul c AMD a decis acest lucru pentru a crea o incompatibilitate forat, dar necesar pentru introducerea noilor sale procesoare cu suport DDR2: controller-ul de memorie fiind situat n procesor, un CPU Socket AM2 introdus ntr-o plac de baz cu suport DDR nu ar fi funcionat, i nici reciproc. Socket 939 a fost, timp de doi ani, referina pentru platforma AMD64. Dei mbuntirile aduse de Socket AM2 sunt minore, procesoarele S939 sunt pe cale de dispariie din magazine, dar n acelai timp foarte populare printre utilizatori. Arhitecturile testate sunt n numr de trei: Intel NetBurst, Intel Core i AMD64. Intel NetBurst reprezint o arhitectur aspru criticat, dar care a dominat lumea procesoarelor Intel n ultimii ase ani. Ea a fost introdus odat cu Pentium 4 i a succedat-o pe cea P6 (Pentium II/III), avnd ca principale caracteristici creterea de patru ori a limii de band a bus-ului PSB (el fiind numit acum Quad Pumped) i restructurarea cache-ului level 1. Mai trziu i fr legtur direct cu arhitectura, Intel a introdus o serie de inovaii n procesoarele acestei serii, precum tehnologiile HyperThreading i EM64T (aceasta din urm fiind mprumutat de la AMD64), precum i includerea a dou nuclee ntr-un singur CPU. Critica principal adus a fost
62

Cap 3: Evaluarea performanelor procesoarelor

datorat consumului extrem de ridicat i a performanei mici per clock (performana la o frecven dat), fapt datorat pipeline-ului2 extrem de lung; spre exemplu, un Athlon 64 la 2 GHz depea cu mult un Pentium 4 la aceeai frecven; interesant este faptul c i vechea arhitectur de la Intel, P6, ntrecea unele modele de Pentium 4 chiar i la o frecven mai ridicat (de exemplu, Pentium III la 1 GHz vs. Pentium 4 la 1.3 GHz). Succesul lui NetBurst a fost datorat numelui Intel, marketing-ului agresiv, dar i faptului c procesoarele din aceast serie puteau, ntr-adevr, s ating frecvene deosebit de ridicate - apropiindu-se de 4 GHz i depind chiar cu mult aceast valoare prin overclocking-ul extrem. Platforma Intel Core a fost introdus n acest an de ctre Intel, ea reprezentnd o revenire n prim-plan a arhitecturii P6, aflat la baza procesorului Pentium III. Arhitectura a fost folosit chiar i n vremurile de apogeu ale lui Pentium 4 n persoana lui Pentium M (nume de cod Dothan), un procesor foarte popular pentru platformele mobile. Ca fapt divers, Pentium M a ptruns i n domeniul desktop datorit adaptorului Socket 479-478, care a dat natere celei mai performante i mai reci combinaii posibile pentru un PC, el oferind o performan per clock superioar chiar i unui Athlon 64 FX. n ceea ce privete arhitectura Core, practic Intel a preluat scheletul lui Dothan i i-a adus numeroase mbuntiri pentru a o face competitiv acestei perioade. Instruciunile SSE3, EMT64 i VT sunt considerate de muli bling-bling-uri accesorii inutile, ns nu se tie niciodat cnd este nevoie de ele. Au mai fost motenite unele inovaii aduse de NetBurst (dar fr legtur cu arhitectura n sine), precum bus-ul Quad Pumped. Performana per clock a devenit foarte ridicat, depind-o pe cea a concurenilor de la AMD, iar procesoarele rezultate au, spre deosebire de cele AMD64, rezerve foarte mari de atingere a frecvenelor ridicate. S-ar prea c diferena de performan se datoreaz n mare parte i cache-ului de 4 MB de tip inclusiv, mprit ntre cele dou nuclee. Pe baza acestei arhitecturi a ieit la lumin, de curnd, i primul CPU cu patru nuclee: Core 2 Extreme QX6700 (nume de cod Kentsfield). AMD64, dei un simplu update al vechiului AMD K7 (Athlon, Athlon XP), a introdus cteva mbuntiri cheie, cea mai important fiind includerea controller-ului de memorie n procesor. Dei s-a insistat mult pe instruciunile, regitrii i ntreaga arhitectur pe 64 de bii, utilitatea acestui add-on este momentan extrem de redus, dat fiind lipsa de popularitate a sistemelor de operare i a aplicaiilor care s utilizeze cod 64-bit. Oricum, cine i cumpr procesoare AMD64, nu o face din cauza celor 64 de bii, ci datorit performanei sporite de mutarea controller-ului de memorie din placa de baz n procesor, ceea ce reprezint, n continuare, principalul avantaj al procesoarelor AMD, fr de care ele nu ar fi fcut fa concurenei. Acest lucru a adus i cteva dezavantaje, unul dintre ele fiind resimit chiar acum, la apariia lui Socket AM2: odat cu schimbarea tipului de memorie, trebuie nlocuit i procesorul, i placa de baz. Descrierea configuraiilor care au stat la baza testului Placa grafic folosit a fost un NVIDIA GeForce 7900 GTX produs de EVGA, tactat la 710/1800 MHz, frecvene ridicate fa de cele standard (650/1600 MHz) n ideea de a nu avea plafon n performan grafic - lucru practic imposibil pentru anumite procesoare, care ar fi fost satisfcute doar de o configuraie SLI. (Desigur,
Pipeline - reprezint suma unor etape pe care instruciunile trebuie s le parcurg pn la obinerea rezultatului final 63
2

Evaluarea performanelor sistemelor de calcul

frecvenele au fost testate minuios, astfel nct placa a rulat perfect stabil i fr artefacte n aceste condiii.) S-a renunat la mperecherea a dou plci grafice pentru acest test deoarece ar fi putut aprea probleme serioase cu driverele n anumite cazuri, cel puin pe platforma Intel. Ca pas firesc de urmat, am sczut detaliile i rezoluiile pn am ajuns la un punct unde coborrea sub o anumit limit deja ar fi fost irelevant (nimeni nu mai folosete rezoluii precum 800 x 600 sau 640 x 480 cu un Core 2 Duo, spre exemplu). Sistemul de operare a fost Windows XP Professional SP2, iar setrile plcii grafice din drivere au fost cele implicite, pentru o evaluare ct mai apropiat de condiiile utilizrii de zi cu zi.

Ca plci de baz, pentru platforma Intel sa ales un DFI Infinity 975X/G (chipset Intel 975X) deoarece, n momentul n care s-au rulat testele, era practic cea mai performant plac disponibil. Layout-ul este unul simplu, ce nu exceleaz prin nimic, dar ca performan surclaseaz alternativele de la Asus i Gigabyte. Voltajele generoase, att pentru procesor ct i pentru memorii, au nlturat ndoielile pe care leam avut n legtur cu ea. Pentru procesoarele AM2 sa folosit o plac Abit AN9 32X (chipset nForce 590 SLI), ce ofer premisele unui overclocking ridicat. n fine, pentru Socket 939, sa dispus de un btrn Abit AN8 (chipset nForce 4), cu setri moderate de overclocking, dar cu performane de top. Memoriile folosite au fcut parte dintr-un kit Corsair CM2X512-8000UL, module echipate cu chip-urile Micron D9 fatbodies; ele au rulat la frecvene impresionante, cu latene extrem de mici: pn la 800 MHz am rulat cu CL3 2-2-7, n cazul platformei Intel. Pentru platforma Socket 939 (DDR) am dispus de un kit OCZ PC4400 Gold Limited Edition (chip-uri TCCD), fr performane deosebite, dar arhisuficiente pentru nevoile noastre. Sursa a purtat numele Antec Phantom 500W, ea fiind dotat cu dou rail-uri independente de 12V de 16A i respectiv 17A i dovedind voltaje stabile, cu variaii minime, chiar i la stresul enorm exercitat de o platform de ultim generaie overclockat aproape de limit. Rcirea a fost asigurat de un cooler Scythe Ninja Plus, un monstru care ar nspimnta utilizatorul obinuit. El a reuit s rceasc pasiv toate procesoarele pe care le-am avut n teste. Evident, la frecvene implicite. 3.5.1. Testarea propriu-zis n general, performana unui procesor este evaluat utiliznd diverse aplicaii care calculeaz ori timpul necesar efecturii unei operaii, ori cte operaii sunt efectuate ntr-un interval de timp prestabilit. Operaiile (benchmark-urile) n cauz ncearc s reflecte, pe ct posibil, comportamentul practic al procesorului, simulnd activitatea
64

Cap 3: Evaluarea performanelor procesoarelor

utilizatorului. Aadar, nici un benchmark nu este perfect, ci depinde att de aplicaia folosit de ctre utilizator, ct i de operaiile realizate n cadrul acelei aplicaii. Testele care folosesc aplicaii reale se numesc teste analitice, iar cele care raporteaz rezultatele unor programe create special pentru a evalua performana sunt testele sintetice. Clasificarea este oarecum convenional, ntruct numeroase teste sintetice folosesc aplicaii ce au la baz motorul unor software-uri clasice; de exemplu, 3DMark se bazeaz pe engine-uri reale de jocuri, diferenele de comportament dintre benchmark i jocurile propriu-zise fiind nesemnificative. Benchmark-ul sintetic 3DMark 2001 a fost folosit deoarece este pn acum singurul test care solicit semnificativ toate componentele vitale ale unui sistem (CPU, memorie RAM, plac grafic, surs). Grosso-modo, putem spune c testul Car Chase depinde de procesor, Dragothic de procesor i placa video, Lobby de memorie (latene i lime de band), iar Nature este intens grafic. Tocmai de aceea sa preferat compararea framerate-ului n toate testele, n defavoarea scorului final. Din 3DMark03 sa selectat pentru testarea procesorului numai GT1 (Wings of Fury), testul fiind comparabil ca pondere a procesorului cu primele trei teste din 3DMark2001. Din 3DMark05 s-au selectat testele de baz, care ofer un scor final, dar s-au reinut, de asemenea, rezultatele din fiecare test. n cazul lui 3DMark06, s-au utilizat numai testele pentru CPU deoarece celelalte sunt foarte intens solicitante pentru placa grafic, iar aceasta plafoneaz performana ntr-un mod ce face imposibil deducerea influenei procesorului asupra rezultatului final, deci, practic, diferenierea procesoarelor. Tot la capitolul performan 3D, s-au introdus o serie de jocuri reale, fie complete sau demo-uri ale acestora create special pentru testare: F.E.A.R., Quake 4, FarCry, GunMetal i X3. Pentru evaluarea vitezei de randare n aplicaii de grafic profesional, sa avut la dispoziie SPECviewperf, alturi de CineBench, PovRay i Photoshop CS2 (aplicarea filtrului Radial Blur asupra unei imagini). Pentru testarea n aplicaii multimedia, sa codat un scurt film n format original DVD (MPEG-2 la 720 x 480) folosind codec-ul DivX 6.3, precum i un fiier audio (Dream Theater - Octavarium, de pe albumul cu acelai nume) cu mai multe encodere lossy i lossless, rezultnd fiiere n formatele MP3, MPC, Vorbis, AAC, FLAC i APE. n fine, ultimele trei teste au constat n folosirea benchmark-ului din WinRAR, a aplicaiei ScienceMark (pentru diverse simulri tiinifice), precum i clasicul SuperPI, care efectueaz att de inutilul calcul cu milioane de zecimale al numrului pi. Explicaii n cazul jocurilor 3D, creterea rezoluiei (sau creterea nivelului de anti-aliasing - are un efect similar) conduce la un stres suplimentar din partea plcii grafice i, eventual, a memoriei sistemului. n alctuirea scenelor, procesorul calculeaz n principal wireframe-ul3 obiectelor, altfel spus coordonatele punctelor ce le definesc, urmnd ca mai apoi placa grafic s le umple cu culoare i s le aplice diverse efecte. Este evident faptul c un obiect va fi calculat ntr-un mod similar, indiferent dac rezoluia este 640 x 480 sau 1600 x 1200, fiind aplicate aceleai formule de calcul pentru definirea poligoanelor i funciilor matematice care le creeaz. Aadar, pentru
3

http://en.wikipedia.org/wiki/Wire_frame_model 65

Evaluarea performanelor sistemelor de calcul

evaluarea performanei pure a unui procesor, este de dorit folosirea unei rezoluii ct mai mici, pentru ca placa grafic s termine ntotdeauna calculele naintea procesorului, ea neconstituind astfel un factor limitativ. Altfel st treaba cnd vine vorba de nivelul de detalii ale unei scene, scderea sau creterea lui reflectndu-se ntr-o solicitare mai intens a procesorului i/sau plcii grafice, de la caz la caz, n funcie de ce reprezint pentru fiecare aplicaie/joc schimbarea acestui nivel. De exemplu, nivelul maxim poate nsemna folosirea un poligon regulat cu 100 de laturi pentru nfiarea unui cerc, pe cnd un nivel mai sczut poate reduce acest numr la 50, realismul scenei devenind altul - caz n care procesorul are mai puin de lucru. Dar, la fel de bine, reducerea nivelului de detalii poate desemna o filtrare mai sumar a texturilor, ele devenind mai puin clare - caz n care placa grafic este degrevat de o parte dintre sarcini. n aceste condiii, de ce nu sa folosit rezoluia minim permis (uneori chiar 320 x 240), mpreun cu nivelul minim de detalii, pentru a fi siguri c placa grafic nu limiteaz n nici un fel performana? Pentru c orice test trebuie s aib o aplicabilitate practic, s reflecte comportamentul real al unui utilizator; or, nimeni nu i chinuiete ochii ntr-o rezoluie mai sczut de 1024 x 768 dac i cumpr o plac grafic de ultim generaie - cum este cea folosit n testul nostru. 3.5.2. Procesoare testate:

3.5.2.1. Socket 939


Athlon 64 3500+ Venice (2.2 GHz, 11 x 200, 512 KB cache L2); A treia variant de Athlon 64 pentru Socket 939, dup ClawHammer i Winchester, Venice aduce n prim plan un controller de memorie mbuntit (puin mai lent dect cel inclus n Winchester, dar mai compatibil), temperaturi mai joase ca predecesorii si i potenial de overclocking mai ridicat. Revizia E3, prezent n testul nostru, a oferit, teoretic, un potenial de overclocking mai ridicat dect cea ulterioar, E6. Aceasta din urm a dezamgit entuziatii, necesitnd voltaje mari pentru a atinge frecvene ct de ct ridicate. Testarea a avut loc la setrile: 2200 MHz, PSB 200 MHz, DDR400, CL2 2-2-5 1T (Athlon 64 3500+) 2500 MHz, PSB 250 MHz, DDR500, CL2.5 3-3-7 1T 2000 MHz, PSB 200 MHz, DDR400, CL2 2-2-5 1T (Athlon 64 3200+) Athlon 64 X2 4600+ Manchester (2.4GHz, 12 x 200, 2 x 512 KB cache L2); Dual-core de la AMD, nucleul Manchester este de fapt rezultatul alipirii a dou nuclee de tip Venice. Performanele sunt specifice unui CPU dual-core, mai ales n aplicaiile optimizate pentru multiprocesor. Testarea a avut loc la setrile: 2400 MHz, PSB 200 MHz, DDR400, CL2 2-2-5 1T (Athlon 64 X2 4600+) 2750 MHz, PSB 250 MHz, DDR500, CL2.5 3-3-7 1T

3.5.2.2. Socket AM2


Sempron 2800+ Manila (1.6 GHz, 8 x 200, 256 KB cache L2); Mezinul familiei AM2 urc generos n frecven mulumit cache-ului minuscul (dar suficient pentru aplicaiile nepretenioase), memoriilor excelente i plcii de baz
66

Cap 3: Evaluarea performanelor procesoarelor

excepionale. Nucleul Manila este un nucleu Orleans (A64 AM2) cu cache-ul redus la 256 KB. Testarea a avut loc la setrile: 1600 MHz, PSB 200 MHz, DDR2-667, CL3 3-3-7 1T (Sempron 2800+) 2880 MHz, PSB 360 MHz, DDR2-960, CL4 3-3-8 2T Athlon 64 X2 4200+ Windsor (2.2 GHz, 11 x 200, 2 x 512 KB cache L2); Dual-core-ul pentru platforma AM2, nucleul Windsor nu reprezint o inovaie, ci doar o cuplare a dou nuclee Orleans. Comportamentul n teste este decent, dei am fi preferat ca urcarea n frecven s se fac cu o cretere mai mic a tensiunii. Testarea a avut loc la setrile: 2200 MHz, PSB 200 MHz, DDR2-800, CL4 3-3-8 1T (Athlon 64 X2 4200+) 2750 MHz, PSB 250 MHz, DDR2-834, CL4 3-3-8 1T 2000 MHz, PSB 200 MHz, DDR2-800, CL4 3-3-8 1T (Athlon 64 X2 3800+)

3.5.2.3. Socket T (LGA775)


Intel Celeron D 336 Prescott (2.8 GHz, 21 x 133, 256 KB cache L2); Ruca cea urt a lui Intel, Celeron, nu a dezamgit, dovedind prin overclocking performane decente pentru zona n care se afl i pentru preul pe care l are. Testarea a avut loc la setrile: 2800 MHz, PSB 133 MHz, DDR2-533, CL3 2-2-7 (Celeron D 336) 4305 MHz, PSB 205 MHz, DDR2-617, CL3 2-2-7 Intel Pentium 4 531 Prescott (3 GHz, 15 x 200, 1 MB cache L2); Considerat de muli o relicv vie a arhitecturii NetBurst, procesorul de fa este unul decent, dei temperaturile atinse i-ar face pe muli s nnebuneasc, mai ales dac i doresc sisteme silenioase. Performana sa este una bun, ns fr a excela. 3000 MHz, PSB 200 MHz, DDR2-667, CL3 2-2-7 (Pentium 4 531) 3825 MHz, PSB 255 MHz, DDR2-680, CL3 2-2-7 Intel Pentium D 945 Presler (3.4 GHz, 17 x 200, 2 x 2 MB cache L2); Performanele foarte bune caracterizeaz acest procesor, datorit cache-ului mricel i mai ales a faptului c avem de-a face cu un procesor cu dou nuclee. 3400 MHz, PSB 200 MHz, DDR2-667, CL3 2-2-7 (Pentium D 945) 4250 MHz, PSB 250 MHz, DDR2-667, CL3 2-2-7 Intel Core 2 Duo E6300 Allendale (1.86 GHz, 7 x 266, 2 x 1 MB cache L2); Mezinul familiei Core 2 Duo, 6300 dovedete o putere de calcul ieit din comun i se ia la trnt voinicete cu Pentium D 945. i are numai 2 MB de cache level 2 i frecven net inferioar acestuia. 1866 MHz, PSB 266 MHz, DDR2-667, CL3 2-2-7 (Core 2 Duo E6300) 3010 MHz, PSB 430 MHz, DDR2-646, CL3 2-2-7 Intel Core 2 Duo E6700 Conroe (2.66 GHz, 10 x 266, 2 x 2 MB cache L2); Englezul spune save the best for last. Noi nu spunem nimic, ci v invitm doar s studiai graficele testelor, deoarece ele vorbesc de la sine.
67

Evaluarea performanelor sistemelor de calcul

2666 MHz, PSB 266 MHz, DDR2-667, CL3 2-2-7 (Core 2 Duo E6700) 3450 MHz, PSB 345 MHz, DDR2-690, CL3 2-2-7

Observaii: sa folosit frecvena de 2 GHz pentru Venice cu scopul de a simula comportamentul lui Athlon 64 3200+, un procesor de referin pentru platforma Socket 939; sa folosit frecvena de 2 GHz pentru Windsor pentru a simula comportamentul lui Athlon 64 X2 3800+, cel mai lent CPU dual-core de la AMD; n cazul lui Sempron AM2, setarea memoriei a fost DDR2-667 datorit compatibilitii oficiale restricionate la aceast frecven, dei nu au fost probleme n rularea la DDR2-800; aparent, limitarea overclocking-ului la Sempron 2800+ (la 80%!) a fost datorat plcii de baz, procesorul putnd urca la o frecven i mai mare; pentru platforma Intel, nu (mai) exist setarea Command Per Clock (1T/2T), rulndu-se implicit cu valoarea 2T, ns procesoarele Intel se pare c nu depind n mod vital de latena 1T; n cazul lui AMD, creterea la 2T determin o scdere masiv de performan;

Diferenele dintre procesoare au fost marcante n toate testele, cu excepia lui Nature - primul test popular ce a folosit funcia Pixel Shader introdus odat cu generaia GeForce 3 i n cazul cruia, la cinci ani de la apariie, plcile grafice moderne determin n continuare o limitare a framerate-ului. Altfel ar fi stat situaia ntr-o configuraie multi-GPU. Rezultatele sunt exprimate n numr de fps.

68

Cap 3: Evaluarea performanelor procesoarelor

Alegerea unui procesor a fost ntotdeauna o decizie grea. Aici nu exist cel mai rapid, ci cel mai potrivit, n cele din urm fiind o decizie subiectiv.

69

4. Evaluarea memoriilor
4.1. Introducere
Un test de memorie nu este simplu de realizat. Puini se ncumet, puini reuesc. Spre deosebire de alte teste, acesta nu este unul care s reflecte cu acuratee comportamentul produselor, precum st treaba la plci de baz sau plci grafice. De ce? Pentru c numrul parametrilor care trebuie luai n calcul este cu cel puin un ordin de mrime mai mare. Unii ar spune c e simplu: setezi frecvena, micorezi latenele, eventual creti tensiunea la maxim i vezi la ct ruleaz stabil. Fals. Un test riguros ia n calcul i parametrii cei mai puini uzitai. Drive Strength, tRFC, tRWT, tREF... i lista lor ar putea umple o pagin. Testarea i metoda prezentate n curs reprezint un compromis, testarea nu este att de riguroas pe ct s-ar fi putut realiza, din cauza timpului enorm care ar fi fost necesar acestui demers. Fr a exagera ctui de puin, un test de memorii perfect riguros ar trebui s dureze circa trei luni de munc intensiv. Nu s-au efectuat testele dect sumar pe o a doua plac de baz, nu s-au luat n considerare dect parial latenele secundare, s-au testat doar 30 de produse (cu toate c s-ar fi putut procura mai multe) i nu s-au introdus n concurs dect kit-uri de 1 GB (cte dou module de 512 MB). Tocmai de aceea testul nu trebuie considerat ceva exhaustiv, ci n primul rnd un ghid care s deschid gusturile celor pasionai, s lmureasc unele aspecte delicate legate de memorii i abia apoi s ofere un ghid de cumprare celor interesai. Momentan, ne aflm ntr-o perioad de trecere de la standardul DDR la cel DDR2. Totui, platforma AMD se folosete intensiv memorii DDR, iar sistemele bazate pe procesoarele companiei texane sunt preferate de foarte muli, dac nu de cei mai muli entuziati de la noi, cu att mai mult cu ct chipset-urile au cptat o anumit maturitate, iar multe plci de baz ofer o configurabilitate foarte bun. E suficient s comparm BIOS-ul unei plci high-end cu chipset Intel cu cel al unei plci nForce4 (n ediia pentru AMD): trei sau patru setri de memorie versus minim 10, uneori 20 sau 30. De asemenea, mentalitatea cumprtorului a suferit schimbri semnificative n ultima perioad. Acum, el nu mai pune problema la modul vreau s-mi iau o memorie de 512 MB, ci vreau s-mi aleg o memorie care merge n latene strnse i n frecven mare. Chiar dac sporul de performan nu este senzaional, latenele pot face diferena dintre un sistem rapid i unul care sufer de pe urma unei limitri ce putea fi evitat. Mai problematic este aspectul frecvenelor; de exemplu, cine posed un Athlon 64 3200+ care, supus overclocking-ului, ruleaz n 2700 MHz, va avea nevoie de o memorie pe msur, care s satisfac foamea de lime de band a procesorului, i anume una care s reziste cu succes la 270 MHz. Dac nu, frecvena ei va trebui sczut iar penalizarea de performan va fi destul de mare. Aadar, nu exist memorie ideal. Fiecare utilizator i va stabili propriile standarde n funcie de diveri factori, dintre care amintim: frecven, latene, performan brut, rspuns la tensiune i, de ce nu, aspect.
70

Cap 4: Evaluarea memoriilor

Mai mult, ar putea conta i aplicaiile rulate: ce este mai convenabil, un Athlon 64 chinuit la 2600 MHz cu memoria rulnd sincron (260 MHz) sau unul la 2750 MHz chinuit i mai mult, cu memoria asincron (230 MHz)? Cine se joac va prefera prima opiune, cine codeaz filme va merge pe a doua. Aspectele abordate n acest material sunt diverse. Vei afla care sunt, ce nseamn i cum trebuie setate latenele memoriei, precum i modul de comportare al celor mai importante module de pe pia, alturi de modul lor de procurare.

4.2. Standarde, HTT, frecvene, limi de band


Standardul DDR SDRAM a adus mbuntiri minore de ordin tehnologic fa de vechiul SDRAM, ns a dublat performana. Datele sunt transmise att pe frontul cresctor, ct i pe cel descresctor al semnalului, rezultnd o lime de band de dou ori mai mare, i asta la aceeai frecven. n rest, avem principii similare standardului SDRAM, i care se regsesc i la recentul DDR2. Nu vom intra prea mult n detalii, ntruct am mai scris despre memorii n capitolul 2.1.2, ci ne vom limita la descrierea funcionrii memoriei DDR SDRAM - pe scurt, DDR. Fizic vorbind, modulele DDR prezint 184 de pini (fa de 168 pentru SDRAMul clasic i de 240 pentru DDR2). Aspectul lor este asemntor, cele SDRAM prezentnd dou crestturi, fa de celelalte dou tipuri care dispun de una singur. Desigur, plcile de baz dispun de slot-uri specifice n care modulele vor fi inserate, n funcie de tipul acestora; aadar, nu vom putea introduce o memorie DDR2 ntr-un slot DDR, orict de asemntoare ar fi ele. Limea de band oferit de DDR este egal cu frecvena sa nmulit cu 2, i apoi cu 8, unitatea de msur fiind GB/s (gigabyte pe secund). Astfel, o memorie DDR400 va transmite (aproximativ) 3,2 GB/s ctre controller-ul de memorie, elementul central de gestiune a acesteia. De ce cifrele 2 i 8? Pentru c avem de-a face cu memorii DDR, ce dubleaz limea de band, iar la fiecare ciclu de tact sunt transmii cte 8 bytes (64 de bii), aceasta fiind limea consacrat a bus-ului. n cazul controller-elor de memorie dual-channel, numrul lor crete la 16 bytes (128 de bii) per ciclu, ns sunt necesare (cel puin) dou module de memorie, de preferin identice. Standardele DDR aprobate de JEDEC - autoritatea n domeniu care ratific diversele standarde de memorie, sunt PC1600, PC2100, PC2700 i PC3200, frecvenele corespunztoare fiind de 100, 133, 166 i respectiv 200 MHz, deseori fiind referite ca DDR200, DDR266, DDR333 i DDR400 din cauza raportrii la SDRAM: o memorie DDR266 (PC2100) este de dou ori mai rapid dect una SDRAM PC133, chiar dac ambele ruleaz la 133 MHz. Cu toate acestea, diveri productori au impus anumite pseudo-standarde, care s satisfac nevoile n cretere ale utilizatorilor. Dac platformele Intel au trecut la DDR2, cele AMD sunt n continuare fidele standardului DDR i solicit o lime de band tot mai mare. Marketing-ul joac un rol esenial aici, diferenele palpabile dintre o memorie la 600 MHz i una la 400 MHz fiind minime datorit latenelor mai crescute la frecvene mari. n mod uzual, frecvena memoriei nu poate depi frecvena bus-ului procesorului (HTT, ex-FSB = viteza de comunicare dintre procesor i chipset-ul plcii de baz), care n mod implicit este de 200 MHz. Modelele recente de procesoare Athlon 64 (precum cele cu nucleu Venice sau San Diego) pot folosi un divizor maxim de 250:200, adic 5:4, ntre memorie i HTT. Atunci ce sens are s depim limea de band oferit de memoriile ce ruleaz la 250 MHz (DDR500)?
71

Evaluarea performanelor sistemelor de calcul

Soluie se gsete ntotdeauna. Aici ea poart numele de overclocking: bus-ul HTT poate fi crescut cu oarecare riscuri la 300 MHz sau chiar mai sus (micornd n acelai timp multiplicatorul acestuia, astfel nct produsul final s nu depeasc 5 x 200), limitarea constituind-o acum placa de baz, eventual controller-ul de memorie al procesorului. De exemplu, un bus HTT de 300 MHz va putea profita de o frecven a memoriei de pn la 375 MHz (DDR750), o valoare practic imposibil de atins. Dar nu ne oprete nimeni s setm divizorul la 1:1, rezultnd un frumos DDR600. Ca s fie mai clar, un HTT crescut nu afecteaz cu nimic performana (din moment ce frecvena final a acestuia nu poate depi 1000 MHz - e totuna dac avem 5 x 200 sau 4 x 250), dar arhitectura procesoarelor AMD64 nu permite o frecven a memoriei mai ridicat dect produsul dintre HTT i 5:4 (1,25). Totui, dac cretem HTT-ul la 300 MHz nu se mrete i frecvena final a procesorului? Cum va rezista un Athlon 64 de la 2 la 3 GHz? Simplu: prin scderea multiplicatorului (operaie posibil la toate procesoarele AMD, cu un suport minim din partea plcii de baz); n cazul de mai sus l vom reduce de la 10x la 7x, rezultnd o frecven final de 2100 MHz, uor de suportat de ctre orice procesor. Plcile de baz nu accept uor frecvene mari ale HTT-ului: unele se plafoneaz la 220 MHz, altele suport i peste 300 MHz cu anumite setri. Mai mult, dac rulm asincron (nerecomandat dar posibil) - deci frecvena memoriei va fi egal cu HTT-ul nmulit cu un numr fracionar (de exemplu 1:2), putem atinge HTT-uri de peste 400 MHz! Putem jongla cu divizorul dintre HTT i memorie astfel nct s obinem performanele optime. Uneori, datorit latenelor mai sczute, o frecven mai mic a memorie ar putea completa perfect nevoile de calcul, astfel nct rularea asincron la un raport 333:400, adic 5:6, ar putea fi avantajoas. 4.2.1. Latene Numite i timing-uri, acestea reflect ndeaproape performana memoriei. Practic, latenele sunt nite numere ce reprezint cicluri de tact dintre diferite stadii de prelucrare a informaiilor de ctre memorie. Cu ct acestea sunt mai mici, cu att performanele vor fi mai mari, dar cu att cresc i ansele ca memoria s nu le suporte. Latenele se pot regla din BIOS-ul plcii de baz (dac acesta dispune de o astfel de facilitate) sau prin intermediul diverselor utilitare, precum SysTool sau A64Tweaker. Logica de baz a latenelor va fi explicat n capitolul urmtor (test plci grafice) i v invitm s o (re)citii; n continuare, vom completa acele explicaii i ne vom referi la latenele ce pot fi setate de ctre utilizator, detaliind semnificaia acestora. Fiecare bank al memoriei (un bank fiind o grupare de mai multe chip-uri - de multe ori logic) const, n realitate, ntr-o matrice uria, pentru accesarea unei informaii fiind necesar localizarea unei celule. n acest scop, au loc cteva procese fundamentale: CAS (Column Address Strobe) i RAS (Row Address Strobe), fiecare fiind dedicat selectrii coloanei, respectiv liniei din matrice. RAS-ul const n cteva etape, prin care informaia este citit sau scris: Active (activeaz rndul), Read (citete informaia), Write (scrie informaia); Precharge (terge informaiile i face pregtirile
72

Cap 4: Evaluarea memoriilor

pentru reluarea ciclului), dei nu face parte din ciclul RAS, este strns legat de acesta din motive evidente. ntre Active i Read/Write are loc i selectarea coloanei prin intermediul lui CAS, astfel nct la nceputul demarrii citirii sau scrierii s existe informaia legat de coordonatele celulei accesate. Limitarea timpilor necesari desfurrii acestor operaii este efectuat prin setarea latenelor. Dac acestea sunt prea mici, memoria va pierde informaii i vor aprea erori (de la blocaje, erori de program i ecrane albastre n Windows pn la imposibilitatea de a intra n POST). tCL (CAS Latency), dei era latena de baz n cazul memoriilor SDRAM, importana acesteia a sczut mult la DDR SDRAM. Ea reprezint timpul minim n care se desfoar selectarea coloanei prin intermediul procesului CAS. Valorile uzuale sunt de 2, 2.5 i 3, cele mai rapide memorii suportnd valoarea 2 la 200 MHz, 2.5 la 250 sau chiar 300 MHz. Valoarea 3 nu este acceptat de unele module, indiferent de frecven, ns la altele ea este strict necesar pentru atingerea de frecvene mari. De asemenea, valoarea de 1.5, suportat de unele plci de baz, nu creeaz probleme de stabilitate dar nici nu ofer vreun avantaj; n schimb, cele de 1, 3.5, 4 i 4.5 sunt practic inutile i, de cele mai multe ori imposibil de setat. tRCD (RAS to CAS Delay) limiteaz timpul dintre RAS i CAS sau, altfel spus, timpul dintre comenzile Active i Read/Write. Ea este cea mai important laten pentru memoriile DDR deoarece afecteaz cel mai mult performana. Memoriile ieftine lucreaz cu valori de 3 sau chiar 4, pe cnd cele mai rapide ofer un tRCD de 2 la 200 MHz, 3 la 250 MHz i 4 la 300 MHz. tRP (RAS to Precharge Delay) se refer la timpul de desfurare al comenzii Precharge, adic refacerea celulelor pentru reluarea ciclului. Importana ei este mai redus dect cea a lui tRCD i comparabil cu tCL. Valorile uzuale sunt de 2, 3 i 4; memoriile performante accept tRP = 2 la 230 250 MHz, apoi 3 la 300 MHz, pe cnd cele lente lucreaz cu 3 i 4 la 200 MHz. tRAS (RAS Active Time sau Active to Precharge Delay) este o laten foarte interesant, care iese din tiparele obinuite. Ea oglindete timpul dintre comanda Active i cea Precharge, limitnd practic ntregul proces RAS. Deoarece ea include att tRCDul ct i tCL-ul, o valoare mai mic dect suma acestora dou nu va avea nici un efect. Pentru performane optime se recomand o valoare cu 1 sau 2 mai mare dect suma celor dou - aceasta deoarece, n mod paradoxal, o valoare prea mic poate chiar reduce (nesemnificativ) performana. Valorile uzuale sunt cuprinse ntre 5 i 11, fiecare productor prefernd o anumit combinaie pe care o consider ideal. Numere mai mici de 5 nu sunt suportate oficial (tRCD + tCL + 1 nu poate fi mai mic de 5), dar unele plci permit setarea acestora pe riscul utilizatorului (risc de performane sczute, rareori de instabilitate). Per total, impactul asupra performanei i stabilitii este neglijabil. Trgnd linie, observm c memoria lucreaz ntr-un mod relativ simplu: se selecteaz un bank, apoi un rnd i o coloan, se citete sau scrie informaia i se fac pregtirile pentru reluarea ciclului. Selectarea unui rnd nu trebuie s dureze mai puin dect specific valoarea tRCD, selectarea unei coloane se supune indicaiilor lui tCL, timpul de accesare + citire/scriere + pregtire pentru pregtire nu trebuie s fie mai redus dect indic tRAS-ul, iar pregtirile pentru ciclul urmtor nu trebuie s fie mai scurte dect ne spune tRP-ul. Dei nu este legat strict de memorie, ci de controller, setarea Command Rate (CMD) este, de departe, cea mai important. Numit n diverse moduri (CPC, 2T
73

Evaluarea performanelor sistemelor de calcul

Timing, Command per Clock), ea semnific timpul scurs de la selectarea bank-ului memoriei pn la nceperea trimiterii comenzilor ctre acesta. Valorile posibile sunt 1T i 2T (notate exact astfel). Orice platform ar trebui s suporte 1T pentru un maxim de dou module de 1 GB. Pentru a nota timing-urile principale ale unei memorii, vom folosi notaia CL tRCD-tRP-tRAS CMD, de exemplu CL2 2-2-5 1T sau CL2.5 3-3-7 2T. Dac setarea CMD este omis, se va presupune implicit c ea este 1T. Pe lng aceste latene principale, exist cteva ce au o importan mai redus i pe care le-am descris n continuare, pe scurt. Menionm c ele sunt valabile n primul rnd pe platforma nForce4, dei cele multe dintre ele pot fi aplicate i altor chipset-uri sau chiar altor tipuri de memorii (SDRAM sau DDR2 SDRAM). tRC (Row Cycle Time) are o importan semnificativ i reflect ntregul ciclu de parcurgere al unui rnd, aadar RAS (reflectat de tRAS) + Precharge (reflectat de tRP). n mod evident, valoarea minim este egal cu suma dintre tRAS i tRP (de obicei nici nu pot fi setate valori mai mici de 5 + 2), ns unele memorii au nevoie de mai mult. tRFC (Row Refresh Cycle Time) este timpul minim dintre dou operaii de Refresh aplicate aceluiai bank, adic de remprosptare a informaiilor, element vital n cazul oricrei memorii DRAM. Valoarea minim este n general de 9, ns unele memorii au nevoie de mai mult, mai ales la frecvene mari. Impactul asupra performanei este neglijabil. tRRD (Row to Row Delay) limiteaz timpul dintre RAS i RAS pentru acelai bank. Opiunea rareori are un rol de luat n seam, valoarea clasic fiind 2. La nevoie, ea poate fi crescut la 4 dar uneori poate fi sczut chiar la 0; impactul asupra performanei se las ns ateptat. tWR (Write Recovery Time) reflect timpul dintre finalizarea unei operaii de scriere i operaia de Precharge. Importana setrii este redus, valorile posibile fiind de 2 sau 3. tWTR (Write to Read Delay) se refer la timpul dintre o operaie de scriere i una de citire n cadrul aceluiai bank. Valoarea de 1 ofer cea mai bun performan la citire, ns cea de 2 este uneori util pentru creterea stabilitii la frecvene mari. tRTW (Read to Write Delay) este similar lui tWTR, dar limiteaz timpul scurs dintre o operaie de citire i una de scriere. Valoarea optim este 1, ns cea de 4 este indicat pentru anse mai mari de stabilitate. Dac tCL este setat altfel dect 2, s-ar putea s fie necesar i un tRTW de minim 2. tREF (Refresh Period) conine o setare uor de neles dar dificil de setat optim. Este vorba de timpul la care memoria este remprosptat; valorile mari ofer o mai bun performan n detrimentul stabilitii, iar valorile foarte mici (sub 2000) o reduc n mod exponenial. 3120 pare a fi valoarea optim, ce ofer un compromis bun ntre performan i stabilitate. tWCL (Write CAS Latency) indic o setare de CAS specific operaiei de scriere. Cum singura setare posibil pare a fi cea de 1, nu este cunoscut impactul su asupra performanei. Dei nu este o laten, setarea DRAM Bank Interleave are un impact semnificativ asupra performanei. Dac o dezactivm, diferite bank-uri ale memoriei nu vor putea fi accesate sau remprosptate alternativ, ci doar simultan, ceea ce nseamn
74

Cap 4: Evaluarea memoriilor

c nu vom putea folosi mai multe bank-uri n paralel, performana scznd corespunztor. Majoritatea acestor latene sunt obinute de ctre placa de baz pe baza citirii SPD-ului (Serial Presence Detect), o tabel nglobat n fiecare modul de memorie, ce cuprinde diverse alte informaii pe lng aceste timing-uri, cum ar fi productorul memoriei. n momentul pornirii sistemului pentru prima dat, placa de baz citete aceste valori i le seteaz, cel puin pn la intervenia utilizatorului care le poate ajusta dup cum dorete. Teoretic, e vorba de latenele la care productorul garanteaz funcionarea memoriilor, ns practic muli dintre acetia seteaz valori mai relaxate, pentru mai mult siguran. Acestea fiind zise, putem enuna o regul foarte important n cazul memoriilor: toate memoriile de aceeai capacitate, ce ruleaz la aceleai latene i dein acelai numr de bank-uri (sunt ori single-sided, ori double-sided), vor obine performane identice n toate testele. Testele realizate au vizat comportamentul diferitelor setri, instrumentele de lucru fiind o plac de baz DFI UT LanParty Ultra-D, un procesor Opteron 146 (2 GHz, frecven real setat: 200.9 MHz), o plac grafic Gigabyte GV-RX85X256V-B (Radeon X850 XT PE) cu Catalyst 5.11 instalat. Memoriile au format un kit dualchannel de 1 GB i au rulat n DDR400, modulele fiind double-sided. Setarea de baz a fost CL2 2-2-5 1T, iar celelalte latene au fost reduse la minim, cu excepia celor suportate neoficiale i considerate neuzuale. Astfel, tRC a luat valoarea 7, tRFC 9, tRRD 2, tWR 2, tWTR i tRWT 1. Ultimele trei teste au constat n reducerea multiplicatorului procesorului la 9, rezultnd o frecven de aproximativ 1800 MHz (n timp ce memoria a rmas constant), precum i n scderea frecvenei memoriei la 166 i respectiv 133 MHz (procesorul a rmas constant). n final, am ales cteva combinaii uzuale ale latenelor, pentru a releva impactul asupra performanei generat de creterea simultan a acestora. S-a folosit att un demo personalizat pentru Quake 3, care a stresat puternic procesorul i memoria, precum i mai puin cunoscutul program de benchmark RealStorm Bench 20041, ce randeaz scene 3D folosindu-se exclusiv de puterea procesorului.

http://www.realstorm.com/ 75

Evaluarea performanelor sistemelor de calcul

76

Cap 4: Evaluarea memoriilor

77

Evaluarea performanelor sistemelor de calcul

4.2.2. Concluzii Din rezultatele obinute mai sus putem trage cteva concluzii, cu meniunea c acestea ar putea diferi n cazul folosirii altei platforme (alt plac de baz, eventual chipset diferit). tCL = 2.5 afecteaz relativ puin performana; n schimb, setarea la 3 o reduce simitor. tRCD = 3 este cauza unei scderi semnificative de vitez, iar tRCD = 4 depete cu puin ca importan tCL = 3. tRP = 3 sau 4 este o setare ce are un impact minor, dar neneglijabil. Command Rate = 2T omoar dintr-un foc viteza, aducnd-o la nivelul lui tRCD = 4. tRAS are o importan total nesemnificativ; totui, este recomandat o valoare egal cu suma dintre tCL, tRCD i 1. Creterea lui tRC genereaz o scdere minor de performan, dar care nu merit neglijat. Cele mai multe memorii suport valori mici, drept urmare ncercarea merit fcut. Importana lui tRFC este complet nesemnificativ, similar lui tRAS. Doar setarea lui tRRD la 4 a limitat viteza, cu toate c extrem de puin. tWR, tWTR i tRWT au avut o importan neglijabil, dar pot face diferena ntr-un test de performan. Micorarea cu 200 MHz a frecvenei procesorului a avut un impact mai pronunat dect orice nsumare a setrilor. Scderea frecvenei memoriei la 166 MHz a depit ca importan setarea Command Rate = 1T, tRCD = 4 sau tCL = 3 ns, cu siguran, nu i suma acestora.

4.3. Modul de testare


Memoriile DDR testate au venit ori n kit-uri de 1 GB, ori separat, n module de cte 512 MB. Diferene practic nu exist (dect, cel mult, legate de pre), orice modul modern este capabil s ruleze n mod dual-channel fr probleme. Ca platform de testare, sa folosit un procesor Opteron 146 (nume de cod Venus sau San Diego - discutabil, 2 GHz, 0.09 microni) n format Socket 939. Chiar dac numele de Opteron este asociat mai degrab serverelor, trebuie tiut c versiunile pe Socket 939 au preuri foarte convenabile i sunt compatibile cu practic toate plcile de baz recente. Performanele unui astfel de procesor sunt comparabile cu cele ale unui Athlon 64 3500+, el dispunnd de frecvena lui 3200+ dar i de o cantitate dubl de cache L2. Sa fcut aceast alegere ntruct sa dorit s fim limitai ct mai puin de controller-ul de memorie, care la revizia Winchester era undeva n vecintatea stadiului de catastrofal. Placa de baz utilizat n primul rnd a fost un DFI UT LanParty Ultra-D cu chipset nForce4 Ultra. Deasupra memoriilor am aezat un ventilator AeroCool X-Flow, n general la turaie minim (2200 rpm), doar pentru determinarea frecvenei maxime fiind folosit la maxim (3800 rpm, zgomot de Airbus). Alternativ, sa folosit i o plac Abit AN8 SLi Fatal1ty, ce a edificat unele probleme ntlnite pe DFI (i care s-au dovedit a fi legate de compatibilitate). BIOSurile au fost ultimele oficiale: N4D623-3 (23-06-2005), respectiv 18 (18-10-2005).
78

Cap 4: Evaluarea memoriilor

Avantajul plcii DFI const n stabilitatea mare la frecvene ridicate, exemplarul testat urcnd pn la 320 MHz folosind BIOS-ul standard; probabil c, dac am fi recurs la BIOS-uri speciale, am fi atins valori mai mari pentru anumite tipuri de memorii. Setrile efectuate n BIOS au fost alese astfel nct frecvena procesorului s nu fie mai mic dect cea implicit. La ce folos s folosim memoria la 320 MHz cnd procesorul ruleaz la numai 1600 MHz? De asemenea, multiplicatorul HTT a fost astfel ales nct produsul s nu fie mai mare dect valoarea implicit, de 1000 MHz. S-au selectat patru praguri: 200, 250, 275 i 300 MHz, la care sa msurat latenele minime principale: tCL, tRCD, tRP, asociate unor latene secundare alese astfel nct ele s nu afecteze stabilitatea i folosind, de preferin, Command Rate 1T. Timing-ul tRAS a fost ales n funcie de tRCD (nu i de tCL, pentru simplificare): 5 pentru tRCD = 2, 7 pentru tRCD = 3 i 8 pentru tRCD = 4. n final, s-au urcat latenele la CL2.5/3 4-4-10 1T, precum i alte cteva timinguri secundare, obinnd astfel frecvena maxim la care memoriile ruleaz cu o performan decent. Desigur, cu 7-7-15 2T am fi obinut frecvene mai mari, dar la o lime de band prea mic. Frecvene de peste 300 MHz au fost obinute aproape exclusiv pe platforma DFI. Abit-ul a refuzat categoric orice frecven de peste 296 MHz la o pereche de module normale (double-sided). Revenind n detaliu la latene, pentru DDR400 am ales la tRC valoarea de 10, pentru DDR500 11, pentru DDR550 i DDR600 12, iar pentru frecvena maxim, 14. Chiar dac practic toate memoriile suport valoarea 7, am ales una standard i uzual. tRFC a parcurs drumul 12-14-15-15-17, tRRD 2-2-2-2-4, tWR 2-2-2-2-3, tWTR 1-1-1-1-2, tRWT 3-3-3-4-4, iar tREF 3120-3120-3120-3120-2064. Placa Abit a avut probleme cu tRWT, pe care l-a setat la 4 indiferent de dorina noastr. Modelul de la DFI conine i alte cteva setri interesante, ele fiind reglate, pe ct posibil, pe valoarea Auto. Nu le vom detalia aici, cu excepia celor legate de Drive Strength, o opiune extrem de util dac dorim atingerea frecvenelor maxime. Practic, este vorba de ajustarea amplitudinii semnalului dintre memorie i controller, influenarea acesteia avnd consecine directe asupra stabilitii. Diferene aparent minore, precum revizii diferite ale plcilor de baz, au o influen direct asupra valorilor optime. De asemenea, tipul chip-urilor ce doteaz memoriile conteaz enorm; aici cea mai bun soluie nu st n recomandri, ci n invitaia de a ncerca. Dureaz cteva ore pentru a gsi optimul, iar satisfacia este garantat pentru pasionai. Pentru a evalua stabilitatea am folosit versiunea 1.65 a popularului Memtest86+2, cu care am rulat de trei ori testul #5, o dat #8 i cteva procente din #7 (din motive de timp) apoi o versiune pentru Windows3, unde ne-am limitat la 40%, cu excepia frecvenei maxime, unde am parcurs ntreg testul. Nu afirmm c o asemenea testare este suficient pentru a declara o memorie perfect stabil, dar a fost cel mai bun compromis pe care l-am putut realiza. Ultimul aspect discutat este tensiunea memoriei. Un voltaj crescut poate aduce stabilitate sporit n overclocking, dar crete n acelai timp cldura degajat. Uneori, dup o jumtate de or este necesar scderea lui pentru a atinge rezultatele optime, chiar dac n primele minute o tensiune crescut pare a oferi mai mult stabilitate. i aceasta indiferent ct de bun este rcirea.
2 3

http://www.memtest.org/ http://hcidesign.com/memtest/download.html 79

Evaluarea performanelor sistemelor de calcul

O regul empiric spune c dac memoria rspunde la voltaj (adic se comport mai bine la o tensiune mrit) atunci l putem crete n continuare; condiia este s avem o rcire bun. Totui, nu recomandm valori mai mari de 3V dect n cazul celor care tiu cu adevrat ce fac.

4.4. Chip-uri de memorie


Pentru muli, o memorie se evideniaz (pe lng frecvene i latene) prin productor. n general, afirmaia este fals, singurii factori care conteaz cu adevrat sunt chip-urile (peste 90% din importan) i PCB-ul. Acesta din urm a purtat, de obicei, semntura cunoscutei companii BrainPower4, renumit pentru produsele sale de calitate. n imaginea alturat avem cteva exemple de inscripionri, prin care un PCB poate fi identificat ca BrainPower. Dup cum spuneam, tipul chip-urilor din dotare determin ntreg comportamentul unei memorii, abia diferena dintre produsele cu aceleai chip-uri fiind fcut de elemente auxiliare, precum PCB-ul i eventual radiatoarele ce acoper memoria. Exist puine modele populare de chip-uri, ele fiind descrise n continuare. Ne vom referi doar la situaia n care folosim dou module de 512 MB, situaia fiind diferit pentru 256 MB sau 1 GB deoarece o cantitate mai mare de memorie streseaz mai mult controller-ul, rezultnd frecvene maxime mai reduse; desigur, i reciproca este adevrat, recordurile fiind obinute ntotdeauna cu 2 x 256 MB. Foarte frecvent este procesul de remarcare a chip-urilor, acestea avnd inscripionat productorul modulului, i nu fabricantul real al integratelor. Cumprtorul este astfel derutat, chiar dac memoriile nu sunt acoperite cu radiatoare. Samsung TCCD reprezint, probabil, cele mai bune chip-uri DDR. Ele sunt depite pe alocuri n materie de latene, dar sunt singurele care depesc considerabil frecvena de 300 MHz (DDR600). Timing-urile la care lucreaz stabil sunt CL2 2-2-x sau 2-3-x pentru DDR400, CL2 sau CL2.5 3-3-7 pentru DDR500, CL2.5 3-3-x, pn la CL2.5 4-4-x pentru DDR550 i CL2.5 4-3-x sau 4-4-x pentru DDR600. Ele rspund la un voltaj de pn la 2.8V, ns uneori pot urca pn la 3V (rareori mai mult) cu un impact mic asupra frecvenelor maxime. Cele mai multe rezist la cel puin 310 MHz i se pare c nu agreeaz setarea CL3, cu care pot genera erori la frecvene mari. Dezavantaj: pre ridicat. Winbond UTT au fost memorii excepionale n trecut, mai ales n versiunea BH5; cu timpul, popularitatea lor a sczut. Avantajul lor st n faptul c nu sunt afectate aproape deloc de latene, majoritatea oferind cel puin 240 MHz cu CL2 22-x (spre deosebire de TCCD-uri, care se opresc la 215 - 225 MHz). Alt caracteristic a Winbond-urilor, n general, este tensiunea mare la care rspund, ce poate urca pn la 4V! Puine plci de baz permit aa ceva, mai ales c un TCCD la 4V s-ar evapora instantaneu. Totui, unele UTT-uri creeaz probleme i la 3.2V. Pentru DDR400 CL2 2-2-x sunt suficieni i 2.7V, situaie n care nu avem nevoie de rcire suplimentar.
4

http://brain-power.net/menus.php?name=Company&c_lang=english 80

Cap 4: Evaluarea memoriilor

Preul relativ redus este nc un atu al acestor chip-uri. Micron 5B G ofer performane de invidiat, rulnd fr probleme la CL2 2-2-x n DDR400, ntre CL2.5 2-2-x i CL3 3-2-x n DDR500 i n CL3 3-3-x mai sus, pn n zona lui DDR600. Pe lng frecvenele ridicate atinse (totui, ceva mai reduse dect la TCCD), avem i avantajul unor latene decente; practic, ele nu au nevoie de setarea 4 pentru tRCD i tRP, ns se simte afinitatea lor pentru CL3. Ele rspund la tensiuni de circa 3V, dar au nevoie de rcire activ chiar i la 2.85V, n caz contrar riscnd supranclzirea, urmat de apariia erorilor. Aceste chip-uri sunt ntlnite, n general, pe modulele provenite de la Crucial, o divizie a companiei Micron Technology. Preul nu este tocmai redus, dar nici exagerat. Micron 5B C nu se bucur de aceleai avantaje: ating n jur de 240 - 250 MHz cu CL3 3-3-x, dar n DDR400 au un comportament bun: CL2.5 2-2-x. De asemenea, ele rspund la voltaj, chiar i puin peste 3V. Aceste chip-uri se gsesc pe memorii ieftine, la preuri convenabile. ProMos 5B se comport foarte bine, atingnd frecvene apropiate de Micron 5B G: 270 - 290 MHz cu CL3 4-3-x i CL2.5 3-3-x pentru frecvene de 200 - 250 MHz. Diverse tipuri de chip-uri Infineon pot fi ntlnite ndeosebi pe memoriile DDR400 ieftine, ce suport de obicei CL2 3-3-x sau 3-2-x, dar rareori ating 250 MHz. Nu obinuiesc s rspund la un voltaj de peste 2.8V dect ocazional. Numeroase memorii testate au manifestat un comportament similar, rulnd cu CL2 3-3-x n DDR400, atingnd aproximativ 240 245 MHz i refuznd categoric CL3. Ele au avut chip-urile marcate n diverse moduri: G.Skill, Kingmax, PQI, Princeton, Sycron etc. Bnuiala noastr se ndreapt ctre Infineon B5. De asemenea, dou alte module au avut un comportament similar, dar au avut o afinitate special pentru CL3, iar n DDR400 au rulat la CL2 3-2-x; de asemenea, ele au avut probleme de compatibilitate cu placa de baz de la DFI, pe Abit simindu-se n largul lor. Pe acestea le-am identificat ca Infineon CE-5. Dei nu suntem siguri c Samsung TCC4 au stat la baza unui kit din test, comportamentul este asemntor cu informaiile gsite pe Internet. Ele se pot luda cu un comportament foarte slab, atingnd 210 - 225 MHz la latene CL3 3-3-x, iar n DDR400 nu depesc CL2.5 3-3-x. Afar de acestea, exist diverse chip-uri ale cror comportament nu l-am putut testa. Printre ele se numr Hynix D43 i D5, ambele cu un comportament satisfctor: 260 - 290 MHz cu timing-uri CL3 4-4-x, respectiv CL2.5 4-4-x. Samsung TCC5 i TCCC ofer performane total diferite; dac TCC5 sunt versiuni puin slabe de TCCD, TCCC-urile ating 250 - 260 MHz cu CL3 4-4-x, iar la 200 MHz nu suport dect CL2.5 3-3-x. Samsung UCCC pot fi ntlnite doar pe module de 1 GB i ruleaz la 260 - 280 MHz cu latene destul de relaxate. 4.4.1. A-Data Vitesta DDR500 Dei majoritatea modulelor ce poart acest nume dein chip-uri Hynix, cele testate (ce nu fac parte din vreun kit, fiind vndute separat) sunt dotate cu Samsung TCCD. Surprinztor
81

Evaluarea performanelor sistemelor de calcul

este preul foarte redus pentru performanele oferite, performane similare celorlalte memorii ce au n dotare aceleai chip-uri. Modulele sunt acoperite cu radiatoare roii de aluminiu, iar PCB-ul este de asemenea rou, fiind produs de BrainPower. Ele sunt certificate CL3 4-4-8 la 250 MHz i CL2.5 4-4-7 la 200 MHz, cel puin dac privim SPD-ul. Se pare c latena CL3 este o reminiscen de la implementrile cu Hynix, din moment ce chip-urile TCCD nu numai c rareori sunt avantajate de aceasta, dar de obicei obin i performane mai slabe n compania ei. Ce-i drept, nu la 250 MHz, unde nu exist probleme. Testele au artat un comportament meritoriu. Am remarcat CL2 2-2-5 n DDR400 (peste jumtate dintre TCCD-uri reuesc aceast setare), CL2 3-3-7 n DDR500 (CL2 este chiar dificil de obinut), iar n frecven au urcat pn la 312 MHz, o valoare mai degrab mediocr printre memoriile TCCD. Concluzie Performanele foarte bune, n prima jumtate a modulelor dotate cu chip-uri TCCD, alturi de preul extraordinar de mic constituie avantaje indiscutabile ale acestui produs. Totui, dac nu avei posibilitatea s verificai chip-urile din dotare (lucru posibil doar prin testarea efectiv), s-ar putea ca memoriile de fa s nu v mulumeasc dect parial. + performane excelente + pre foarte convenabil + radiatoare din aluminiu - nu toate exemplarele se vor comporta la fel de bine - latene prea relaxate nscrise n SPD 4.4.2. Corsair TWINX1024-3200C2PT rev 4.2 Revizia 4.2 a modelului 3200C2PT de la Corsair vine cu chip-uri TCCD, aezate pe un PCB BrainPower. Iari avem de-a face cu o memorie foarte ieftin, care i face toi banii, cu toate c este certificat doar DDR400 CL2 (SPD-ul indic doar CL3 3-3-8). Comportamentul nu a fost impresionant pentru un kit cu TCCD-uri, ci impresionant n sine, dac ne raportm la pre. Nu au fost probleme n DDR400 pentru CL2 2-2-5, dar DDR550 i DDR600 au fost obinute cu ceva efort, i doar la latene CL2.5 44-8 i respectiv CL3 4-4-8 din cauza tensiunii de alimentare mici pe care memoriile au suportat-o. Practic, pentru CL2.5 n DDR600 avem nevoie de un minim de voltaj crescut, ns C2PT-urile s-au plafonat la 2.7V, orice ncercare de a crete tensiunea peste aceast valoare soldndu-se cu numeroase erori. Setarea CL3, chiar dac nu este pe placul chip-urilor din dotare, dac totui poate fi prins, se mulumete cu o tensiune mai mic. Dei nu putem garanta acest lucru, problema ar putea fi datorat plcii de baz, care face mofturi cu anumite memorii la voltaje mari. Frecvena maxim a fost de 314 MHz - nici bun, nici rea, dar foarte ridicat dac ne uitm la zona de pre din care face parte kit-ul. Concluzie Per total, un produs foarte bun i ieftin, cu mici probleme pentru un entuziast extrem, dar suficient de bun pentru a fi luat n calcul de ctre toate celelalte categorii
82

Cap 4: Evaluarea memoriilor

de utilizatori. Din pcate, aceast versiune se afl spre sfritul vieii, reviziile 5.x, ce sunt mai uor de gsit, fiind considerabil mai slabe. + performane foarte bune + pre redus + radiatoare din aluminiu - probleme la tensiune peste 2.7V - nu ruleaz cu latene strnse la frecvene mari - latene prea relaxate nscrise n SPD 4.4.3. Corsair TWINX1024-3200C2PT rev 5.2 Noua revizie de 3200C2PT se poate luda cu un comportament total diferit fa de cea anterioar. Chip-urile din dotare sunt ProMos, probabil din seria 5B. Din pcate, DFI LanParty a ntmpinat dificulti n combinaie cu acestea, maximul atins fiind de doar 238 MHz, departe de potenialul kit-ului. Cu Abit AN8 nu au fost probleme - 286 MHz cu CL3 4-3-8, adic mai mult dect satisfctor. n schimb, setarea CL2 nu a fost acceptat de Abit n DDR400, cu toate c pe DFI am atins CL2 3-3-7. Latenele la 250 MHz au fost CL2.5 3-3-7, iar la 275 MHz CL3 4-3-8, adic la mic distan de comportamentul TCCD-urilor; totui, nici nu s-a pus problema de DDR600. SPD-ul este... amuzant pentru o memorie al crei nume indic foarte clar CL2: CL3 3-3-8 pentru DDR400, CL2.5 3-3-7 pentru DDR333 i CL2 2-2-6 pentru DDR266. O particularitate a chip-urilor ProMos este legat de setarea tWTR (Write to Read Delay), care nu este acceptat la valoarea 1 dect la frecvene reduse (n jur de 200 MHz), dei toate celelalte memorii nu au avut probleme de acest gen. Setarea afecteaz foarte puin performana, deci nu este cazul s ne ngrijorm. Ct despre tensiune, nu am obinut nimic n plus la peste 2.75V. La 2.8V au aprut erori, semn c chip-urile ProMos nu sunt tocmai indicate supravoltrii. Concluzie Preul este corect, iar frecvenele atinse potrivite pentru o memorie de mijloc. Sperm din partea productorilor de plci de baz - i n special din partea lui DFI - o rezolvare ct mai rapid a problemelor de compatibilitate, ce pot ifona n mod incorect imaginea acestui produs. + frecven maxim ridicat + radiatoare din aluminiu - probleme serioase de compatibilitate cu DFI LanParty - probleme minore de compatibilitate cu Abit AN8 4.4.4. Corsair TWINX1024-3200XLPT rev 1.2 Vrful de gam al celor de la Corsair, seria 3200XLPT, a strlucit din toate punctele de vedere. Bazat pe clasicele chip-uri TCCD, modulele i-au ntrecut concurenii n majoritatea testelor, atingnd CL2 3-3-7 n DDR500, CL2.5 3-3-7 n DDR550 i CL2.5 4-3-7 n DDR600. Acest comportament flawless a fost completat de frecvena maxim de 320 MHz (posibil mai mare, dac placa de baz ar fi permis, am fi aflat), alturi de un rspuns la voltaj de pn la 3V! De asemenea, frecvena de 226 MHz atins cu timing-urile CL2 2-2-5 a fost mai ridicat dect concurentul direct, G.Skill Extreme Performance FF, motiv pentru care putem declara acest kit ca fiind cel mai bun produs bazat pe chip-uri TCCD. E drept,
83

Evaluarea performanelor sistemelor de calcul

orice memorie cu Winbond UTT va rula n CL2 2-2-5 la frecvene mai mari, dar de la nite TCCD-uri nu se poate cere mai mult dect ofer 3200XLPT. SPD-ul este nscris corect, iar preul mare, dar corespunztor calitii produsului. Concluzii Cine este n cutarea celor mai bune memorii cu chip-uri TCCD (practic, a celor mai potente memorii n materie de frecven), s-ar putea s fi gsit alegerea ideal. + performane maxime pentru TCCD + rspuns n voltaj pn la 3V + radiatoare din aluminiu - pre ridicat, dei perfect justificat 4.4.5. Corsair TWINX1024-3200C2PRO rev 4.1 Interesante ca aspect, excelente din punct de vedere al performanei, kit-ul 3200C2PRO se deosebete de celelalte prin prezena LED-urilor ce indic activitatea. Practic, atunci cnd memoriile sunt folosite intens, aceste lumini umplu memoria, crend un efect vizual deosebit. De asemenea, design-ul modulelor este ieit din comun, ele fiind ceva mai nalte dect memoriile obinuite, i aici ar putea mici probleme la montarea pe anumite plci de baz, n cazul n care cooler-ele se bazeaz pe o nlime standard a modulelor de memorie. Pe lng aceste considerente, performanele au fost foarte bune, kit-ul avnd la baz aceleai chip-uri TCCD. SPD-ul indic un obositor CL3 3-3-8, ns nu au fost probleme pentru rularea cu CL2 2-2-5 n DDR400. n rest, nu au am observat diferene fa de alte memorii de acelai tip, poate cu excepia frecvenei de 318 MHz, foarte apropiat de maximul posibil. Mici probleme de sensibilitate la tensiune au aprut, dar ele nu au fost nici pe departe att de grave ca n alte cazuri. Concluzie Kit-ul 3200C2PRO primete nota 10 la capitolul design, n rest rezultatele fiind excelente pentru orice utilizator. Dac studiem i preul, observm c el nu este foarte ridicat. + performane foarte ridicate + LED-uri de activitate, design atrgtor + radiatoare din aluminiu - latene prea relaxate nscrise n SPD 4.4.6. Corsair TWINX1024-4400C25PT rev 1.1 nc un Corsair cu TCCD, nimic spectaculos - s-ar zice. Dei aa este, n mare parte, observm faptul c aceste module sunt certificate pentru a rula n DDR550 CL2.5 4-4-8. Aadar, cei neinteresai de aspecte precum chip-uri din dotare sau revizii, vor putea achiziiona fr grij 4400C25PT pentru a le tacta garantat la 275 MHz. Latenele specificate sunt mai relaxate dect cele atinse de noi, la frecvena nominal obinnd CL2.5 3-3-7. Probleme cu voltajul mare au existat, dar ele s-au manifestat doar la frecvene ridicate. Maximul atins a fost de 316 MHz, o valoare bun.
84

Cap 4: Evaluarea memoriilor

SPD-ul nu a concordat cu rezultatele obinute, fiind indicat doar frecvena de 200 MHz pentru latenele CL2.5 4-4-8. n schimb, noi am atins CL2 2-2-5. Ce putem reproa acestui kit este preul, puin mai ridicat dect cel al kit-ului 3200XLPT, ceea ce ni s-a prut nejustificat. XLPT-urile ofer alte cteva avantaje (minore, ce-i drept, i care ar putea depinde de la exemplar la exemplar), dar e puin probabil s existe cndva module XLPT care s nu suporte 250 MHz cu CL2.5 4-4-8, motiv pentru care dintre cele dou produse recomandm categoric kit-ul 3200XLPT. Concluzie Dei sunt module de mare performan, apropiindu-se de maximul pe care l-am putut obine n materie de frecven, preul - dei nu exagerat - este mai ridicat dect cel al altor produse similare, posibil mai bune. + performane foarte ridicate + radiatoare din aluminiu - mici probleme la creterea tensiunii - valori relaxate nscrise n SPD

4.5. Concluzii
Am parcurs mpreun treizeci de perechi de memorii ce poart marca unora dintre cele mai cunoscute companii ale domeniului. Dintre toate, s-au remarcat modulele cu chip-uri Samsung TCCD i ndeosebi Corsair TWINX1024-3200XLPT rev 1.2 i G.Skill Extreme Performance F1-4800DSU2-1GBFF, care au obinut performane maxime. Remarcabil a fost i prestaia modulelor A-Data Vitesta DDR500, ce ofer performane apropiate la un pre extrem de mic, ns nu putem ti ce se ascunde n spatele radiatoarelor: Samsung TCCD sau Hynix. Trei produse au oferit funcii suplimentare de afiare. Dou dintre ele - Corsair TWINX1024-3200C2PRO rev 4.1 i Crucial Ballistix Tracer PC4000 posed LEDuri pentru indicarea activitii, iar Corsair Xpert TWINXP1024-3200XL rev 1.2 deine suplimentar un senzor pentru monitorizarea temperaturii i alte cteva funcii interesante. n plus, toate trei s-au comportat bine, ceea ce este normal - funciile suplimentare nu sunt implementate dect pe modelele high-end. n gama ieftin am avut numeroase produse ce purtau diverse brand-uri. Dintre ele s-au remarcat Corsair VS1GBKIT400 cu chip-uri ProMos, precum i G.Skill Normal Series F1-3200PHU2-1GBNT cu Infineon. Din pcate, compatibilitatea chipurilor ProMos cu platforma DFI a lsat de dorit, motiv pentru care am premiat modelul de la G.Skill, mai slab dar mai compatibil. Odat cu apariia Socket AM2, memoriile DDR vor fi date uitrii, locul lor urmnd s fie luat de DDR2 - standardul care domin n prezent piaa Intel. Totui, pn atunci mai e vreme lung, impunerea total a lui DDR2 urmnd s survin dup mai muli ani. Aadar, nu ncercai s realizai un upgrade forat doar de dragul de a folosi o tehnologie de viitor! V asigurm c platforma DDR merit nc toat atenia.

85

5. Evaluarea plcilor grafice


5.1. Introducere
Se spune c pentru a juca ultimele apariii n domeniu e nevoie de o plac grafic de ultim or. n general, afirmaia este fals: preul pltit pe aceast component nu trebuie s fie ct cel al unui ntreg sistem pentru a se obine performana dorit. Dac banii nu reprezint deloc o problem, se gsesc plci cu rcire cu ap la preuri de ordinul a 1000 de euro, cu potenial mare de overclocking i, n jocurile obinuite, cu circa 50% mai rapide dect o plac ce cost de cinci ori mai puin. Iar acei 50% se traduc prin posibilitatea de a (nu) juca n rezoluii mai mari i/sau cu nivelul de detalii foarte ridicate. Nimic mai mult. n plus, trecerea este, de obicei, insesizabil, ochiul uman se poate adapta foarte uor la o calitate cu puin mai sczut, iar adevraii gameri nu se uit la detaliile graficii. Ei pur i simplu joac. Campionii shooter-elor se folosesc de rezoluii mici (uneori 640x480) i de un nivel minim de detalii, motivul fiind obinerea numrului maxim de fps. Desigur, majoritatea utilizatorilor au jocurile ca pasiune, fie ea mai mare sau mai mic i, n consecin, vor opta pentru rezoluii ntre 1024x768 i 1280x1024, cu detaliile la (sau spre) maxim, dar fr nivele exagerate de anizotropie1 i anti-aliasing. Cum plcile de baz cu suport pentru bus-ul PCI Express sunt din ce n ce mai populare, achiziionarea unei plci grafice pe AGP nu este recomandat dect celor care tiu c vor rmne la actuala platform cel puin un an de acum nainte. Astfel, am studiat piaa romneasc i am ajuns la concluzia c plcile grafice care satisfac cel mai mult nevoile unui juctor normal (nu ocazional sau profesionist, dar nici maniac al imaginilor de cristal) sunt cele bazate pe chip-ul GeForce 6600 GT. S vedem ce nseamn GeForce 6600 GT. Seria GeForce 6 de la NVIDIA se compune din trei familii: GeForce 6800, 6600 i 6200. Din punct de vedere al performanei, diferenele depind, n principal, de trei factori: frecvenele (dou - una pentru chip i una pentru memorie), numrul de pipeline-uri (tot dou - unul de pixel, cellalt de vertex) i lrgimea bus-ului memoriei. GeForce 6600 GT deine opt pipelineuri de pixel (fa de 8, 12 sau 16 la seria 6800, dar 4 la 6200) i trei de vertex (4, 5 sau 6 la 6800 i tot attea ct are 6200). Bus-ul memoriei este de 128 de bii, la jumtate fa de 6800, n timp ce, la unele modele de GeForce 6200, el este de 64 sau chiar 32 de bii (dar, pe de alt parte, 6200 nzestrat cu tehnologia TurboCache care poate folosi memoria sistemului ca memorie video). Cel mai interesant aspect este legat de frecvene. Versiunea GeForce 6600 simplu nu ofer dect 300 MHz pentru core, valoarea fiind apropiat de cea a suratelor pe 256 de bii (GeForce 6800), ns 6600 GT deine 500 MHz, mai mult dect orice model de 6800. Cauza st n procesul de fabricaie: 0.11 fa de 0.13 microni, existnd astfel posibilitatea atingerii de frecvene mai mari. Tactul memoriei este de 550 MHz la 6600 i de 1000 MHz (sau 900 la versiunea pe AGP) n cazul lui 6600 GT. i tipul ei difer: GDDR n prima situaie, GDDR3 n cea de-a doua (practic, GDDR3 este un DDR2 optimizat pentru operaii grafice, performana sa fiind similar cu cea a unui
Proprietate a unei substane de a prezenta caracteristici fizice variate n funcie de direcia de msurare i de observare (definiie DEX). 86
1

Cap 5: Evaluarea plcilor grafice

GDDR tactat la aceeai frecven - ns GDDR-ul nu are nici o ans de a atinge 1 GHz). Trgnd linie, observm cteva avantaje de partea lui 6600 GT n comparaie cu seria 6800. S lum ca exemplu GeForce 6800 simplu, cel mai lent din serie (excluznd neserioasa variant LE). Plcile ce l ncorporeaz beneficiaz de memorie tactat la 700 MHz, n timp ce chip-ul ruleaz la 325 MHz. Aadar, cu 175 MHz mai puin la core i cu 300 MHz mai puin la memorie. Dac inem cont de faptul c lrgimea bus-ului memoriei este dubl la 6800, obinem o lime de band echivalent cu cea a unei frecvene de 1400 MHz pe 128 de bii (256-bit @ 700 MHz <=> 128-bit @ 1400 MHz). Aadar, avem i un avantaj, i un dezavantaj. Dar dac adugm nc patru pipeline-uri de pixel, obinem justificarea pentru care GeForce 6800 cost cu circa 50% mai mult dect un 6600 GT: performane cu 2050% mai mari, n funcie de rezoluie i setri, dintre care un procent de 2025% este datorat exclusiv pipeline-urilor suplimentare. Privind facilitile, familia GeForce 6 ofer aceleai funcii de baz, printre care se numr ceea ce NVIDIA numete CineFX 3.0 (Pixel i Vertex Shader 3.0, fa de 2.0 la generaia a cincea a lui GeForce) i IntelliSample 3.0 (Full-Scene Anti-Aliasing i Anisotropic Filtering cu performane superioare celor ntlnite la IntelliSample 2.0, ce nzestra seria GeForce FX). Dei relativ neinteresante, enumerm i alte funcii prezente: accelerare hardware MPEG-2 (DVD, HDTV) i Windows Media 9, i dou RAMDAC-uri integrate - ce ruleaz la 400 MHz i ofer posibilitatea prezenei a dou ieiri video, dintre care una de tip digital (DVI); rezoluia maxim este de 2048x1536 la 85 Hz. Toate plcile din test au dispus de dou ieiri, dintre care cel puin una de tip DVI (destinat anumitor modele de monitoare LCD). Unele plci au oferit, prin intermediul unui chip extern (produs de Philips), dou ieiri digitale. Desigur, n cazurile n care ieirea normal (D-Sub) era absent, era livrat i un adaptor pentru ca placa s poat fi folosit n combinaie cu monitoarele clasice. De asemenea, intrrile Video-In i Composite-In au fost prezente la anumite produse, ele fiind declarate VIVO, dar i preul a crescut n consecin. Un ultim aspect discutat aici este legat de dimensiunea memoriei. Unii productori nu realizeaz sau nu vor s realizeze faptul c 256 MB de memorie la un 6600 GT este frecie la picior de lemn. Sporul de vitez este foarte redus, rare fiind cazurile n care performana crete cu mai mult de 5% i foarte multe cele n care ea nu crete deloc. Cei 128 MB suplimentari nu ar fi o problem dac preul nu ar fi urcat de acest aspect; cu alte cuvinte, pentru 5% de performan n 1% din cazuri se pot plti n plus cteva zeci de dolari.

5.2. Frecvene i latene


5.2.1. Frecvene NVIDIA specific pentru chip-ul GeForce 6600 GT frecvene de 500 MHz pentru nucleu i de 1 GHz pentru memorie. Aceasta nu nseamn c ele sunt btute n cuie, diveri productori vnznd plci cu frecvenele mrite. Se cheam overclocking din punct de vedere al chip-ului, nu i din punct de vedere al plcii. Altfel spus, NVIDIA nu garanteaz funcionarea n acei parametri, fabricantul ns da. i acesta din urm este cel care acord garania.
87

Evaluarea performanelor sistemelor de calcul

Deseori, creterea frecvenelor este nsoit de creterea preului i de ataarea unui sufix denumirii produsului. Astfel, Gainward i-a denumit versiunea overclock-at GLH (Goes Like Hell), iar Leadtek Extreme Edition. Uneori, ele reprezint modele selecionate, alteori doar plci comune cu tactul crescut. Frecvenele pot fi ajustate n continuare de ctre utilizator prin intermediul aplicaiilor specializate sau chiar din drivere, operaiune descris n seminar. Sa preferat utilitarul RivaTuner2 i am considerat ca frecvene maxime valorile la care nici ATITool3 (pe durata unui minut i jumtate, dup ce placa a fost nclzit n prealabil) i nici jocurile/benchmark-urile rulate nu au generat artefacte4 vizibile. Prin aceasta nelegem artefacte care pot fi detectate de o persoan experimentat, ce are privirea aintit asupra monitorului pe toat durata testului. Pentru nceput, s-a efectuat o filtrare preliminar cu ajutorul lui ATITool. Dup experimente repetate sa ajuns la concluzia c testul din jocul FarCry este extrem de solicitant pentru GPU, fiind prima aplicaie care genereaz anomalii vizuale, chiar i atunci cnd toate celelalte teste ruleaz fr probleme. Mai exact, apa din deprtare (unde Pixel Shader-ul lucreaz din plin) prezint unele dreptunghiuri n plus. Frecvena maxim a memoriei video obinut cu ATITool a fost ntotdeauna cea corect. Dac ATITool nu genereaz artefacte, nici celelalte teste nu o vor face, sau sunt anse foarte mici s o fac. V putem asigura c testele de overclocking au fost realizate n condiiile precizate mai sus, testarea nefiind exhaustiv dar nici superficial. Temperatura ambiant din timpul testelor a fost de aproximativ 25-28 de grade Celsius. Pe lng frecvene, un factor care influeneaz n mai mic msur viteza este reprezentat de latene. S vedem ce nseamn acestea. 5.2.2. Latene Memoria DRAM are nite principii de funcionare bine definite. Informaia nu este citit/scris pur i simplu, ca i cum un om ar citi o carte sau ar scrie un text pe o foaie de hrtie. Exist anumii timpi de ateptare ntre diversele operaii pe care memoria va trebui s-i respecte, indiferent dac etapa anterioar a fost sau nu completat. S presupunem c pe tot traseul Bucureti - Ploieti - Braov - Cluj-Napoca - Oradea se afl cte o persoan care va porni ctre oraul urmtor la ore prestabilite pentru a-i nmna celeilalte o scrisoare, ntocmai ca o tafet. Exist, ns, o diferen important fa de tafeta clasic: indiferent cnd sosete omul cu scrisoarea, cel care preia tafeta va trebui s plece la ora indicat. Dac omul din Ploieti ajunge n Braov la ora 8:01, iar indicaiile spun c omul din Braov trebuie s plece mai departe la 8 fix, atunci scrisoarea va fi pierdut i ntreg lanul se va distruge. Invers, dac omul din Ploieti ajunge la Braov la ora 7:59, minutul diferen este un timp mort, dar tafeta este predat. La fel funcioneaz i memoria. Dac etapa X nu este ndeplinit n timpul predefinit (msurabil n cicluri de tact), informaia pe care etapa Y trebuie s o preia va fi distrus. n cazul memoriei sistemului, un singur bit omis va compromite, cel mai probabil, stabilitatea sistemului, aprnd ecrane albastre sau resetri. n cazul memoriei plcii grafice, problema se va manifesta prin apariia artefactelor. Cum ciclurile de tact
http://www.guru3d.com/index.php?page=rivatuner http://www.techpowerup.com/downloads/Tweaking/ATITool 4 artefacte = Imagine fals aprut n preparatele histologice produs artificial sau datorit unor defecte de fixare ori de colorare. 2. (Cib.) Semnal parazit supus unei informaii, n semnificaia creia joac un rol nul sau negativ. 88
3 2

Cap 5: Evaluarea plcilor grafice

sunt mai lungi la frecvene mai mici (frecvena nsi reprezint numrul de cicluri de tact ce au loc ntr-o secund, deci 1 GHz nseamn un miliard de cicluri pe secund), este evident faptul c latene mai mari nseamn anse mai mari de preluare corect a tafetei, i deci de o imagine clar, fr probleme. Optimizarea latenelor memoriei nseamn reducerea la minim a acelor timpi mori. n cazul ideal, exact n momentul n care operaia X este completat, operaia Y i ncepe activitatea. Practic, productorii las o marj de eroare, introducnd aceti timpi suplimentari tocmai pentru c plcile difer de la exemplar la exemplar i este posibil ca o memorie s fie mai sprinten dect alta din cauze de natur electric; prin setarea acelorai latene, toate memoriile vor avea aceeai performan, indiferent de viteza lor intern. ns prin intervenia utilizatorului, latenele pot fi reduse la minimul acceptabil, la fel cum frecvenele pot fi crescute (prin overclocking) la maximul posibil. Reglarea latenelor unei plci grafice nu este o operaie att de facil ca n cazul setrii memoriei sistemului. Aici nu exist un BIOS Setup, n care se intr cu tasta Del i se seteaz tot ce se poate seta. Aici avem doar mijloace rudimentare, precum editorul de BIOS NiBiTor i utilitarul de setare a latenelor nTimings. n lipsa unei documentaii oficiale n acest sens, programele de acest tip sunt realizate empiric de ctre amatori, avnd numeroase necunoscute. Totui, este foarte probabil s ne putem face treaba cu ele. Astfel, nTimings poate seta latenele n timp real i astfel putem evalua stabilitatea imediat, folosind funcia de detecie a artefactelor din ATITool. Dup ce am stabilit aceste latene, este bine s rulm cteva jocuri sau teste 3D (precum 3DMark), pentru a verifica suplimentar stabilitatea memoriei, mai exact lipsa artefactelor. Rezultatul final? Performana va crete cu cteva procente preioase. Dac utilitarul RivaTuner este instalat n directorul C:Program Files&$92;RivaTuner (i nu altundeva!), prin acionarea butonului Show GPU registers vom vizualiza latenele curente. Avem trei rubrici, fiecare coninnd opt numere. Pentru toate plcile testate (i dotate cu memorii GDDR Samsung de 1.6 sau 2 ns), latenele implicite au fost 060F1B15 - 09010509 - 20250407. Pentru a nu intra n detalii, ncercai mai nti s reducei latena 6 din primul grup la 5 sau chiar 4 (conteaz mult la performan); 0F poate fi adus fr probleme la 00, iar ultimele dou, 1B i 15, ar putea fi reduse la 13 cu 10, eventual chiar mai puin (toate cele trei setri afecteaz extrem de puin performana). Din grupul al doilea, numrul 1 poate fi redus la 0, iar prima apariie a lui 9 poate fi sczut (cu mari riscuri de artefacte) la 8. Din ultima categorie, 202 poate fi transformat sigur n 000 (dei latenele sunt complet nedocumentate i nu par s afecteze viteza n vreun fel), iar 5, 4 i 7 ar putea fi aduse la 4, 3 i respectiv 6 (cu meniunea c acel 7 transformat n 6 afecteaz mult performana, dar setarea sa este dificil). ncercai s editai cifrele direct pentru c programul este foarte primitiv i deine un bug la acionarea butoanelor. Latenele ideale le putei descoperi singuri. Pentru alte plci dect cele cu memorii de acest tip, este foarte probabil ca latenele s fie altele i placa s se comporte diferit la scderea lor. Dac ai obinut o configuraie a latenelor, este necesar rescrierea BIOS-ului plcii grafice pentru ca setrile s devin permanente. Operaia este lipsit de riscuri (dureaz 10-15 secunde i, afar de cazul n care curentul se ntrerupe n acel moment, nu avei de ce s v temei). Va trebui s creai o dischet de boot, mpreun cu utilitarul
89

Evaluarea performanelor sistemelor de calcul

nvflash5 (NVIDIA Firmware Update Utility), urmnd a executa de pe dischet comanda nvflash --save bios.rom, crendu-se astfel un fiier care va conine BIOS-ul original al plcii. Copiai fiierul pe hard disk sau chiar pe un CD (o dischet se poate defecta foarte uor) - el este vital pentru revenirea la situaia iniial n caz de nevoie. Boot-ai apoi n Windows i deschidei fiierul cu NiBiTor. n tab-ul Timings, vei cuta latenele originale (060F...), n cazul nostru fiind gsite la categoria Timingset 7. Reglai-le dup cum dorii, salvai fiierul (s zicem bios_nou.rom) napoi pe dischet i boot-ai de pe ea, urmnd s rescriei BIOS-ul dnd comanda nvflash bios_nou.rom. Dac programul refuz scrierea, ncercai comanda nvflash -4 -5 -6 bios_nou.rom. Tot cu NiBiTor se poate regla frecvenele de funcionare. Ele pot fi setate i din drivere sau din RivaTuner (cu aplicare direct la pornirea sistemului de operare), ns dac le scriei n BIOS, ele devin permanente i independente de software. Cum orice plac din generaia GeForce FX sau GeForce 6 deine dou frecvene de funcionare, una pentru modul 2D i alta pentru cel 3D, valorile care intereseaz sunt ultimele, deci alegei opiunea corect. Nu uitai, la frecvene mai mari se pot seta latene mai puin mici, aadar mai nti stabilii frecvena maxim de overclocking i abia apoi trecei la capitolul latene. Dac vei considera c dup overclocking placa este prea fierbinte, umblai doar la frecvene, pentru c reducerea latenelor nu afecteaz n nici un fel temperatura plcii. Observaie: anumite plci dein BIOS-uri incompatibile cu NiBiTor - cel puin cu versiunea 2.1. Cauza este aceeai lips de documentaie, utilitarul fiind creat prin metode empirice. Astfel, una dintre plcile testate a avut nscrise frecvenele de 65536 i 255 MHz. Nu ncercai s modificai aceste valori pentru c riscai s defectai BIOS-ul. Rescrierea unui BIOS scris greit se face simplu dac avei o plac grafic PCI la ndemn: setai n BIOS-ul plcii de baz ca pornirea s se fac utiliznd placa PCI (opiunea va fi Init Display First sau ceva asemntor). Apoi inserai n sistem ambele plci (cea PCI Express i cea PCI) i boot-ai de pe discheta cu utilitarul de scriere a BIOS-ului. Acum putei urma metoda clasic; programul nvflash va detecta faptul c n sistem se afl i o plac PCI Express (cu BIOS defect) i i va rescrie corect BIOS-ul. Dac ai lucrat corect i curat, nu vei avea probleme. nainte de a vinde sau a returna placa la magazin (n cazul defectrii), este bine s-i rescriei BIOS-ul cu cel original. Cu toate acestea, XF nu poate fi fcut rspunztor pentru defectarea sau pierderea garaniei unei componentei hardware cauzat de urmarea sfaturilor incluse n acest curs. Dac nu avei cunotinele necesare efecturii acestor modificri sensibile, considerai aceast seciune a cursului pur informativ. Toate plcile au fost testate att n condiii normale (frecvene i latene implicite), ct i dup ce s-a crescut frecvenele la maxim i respectiv s-a sczut latenele la minim. Sistemul de test a fost constituit dintr-un procesor Athlon 64 3200+ Winchester, o plac de baz Abit AN8 (nForce4), memoriile Corsair TwinX1024-4400C25PT fiind setate n CL2 2-2-5 1T; software folosit: Windows XP SP2, ForceWare 71.84.

http://www.xf.ro/downloads/nvflas.rar 90

6. Evaluarea hard discurilor


6.1. Introducere
Hard discul sau discul dur este un dispozitiv non-volatil pentru stocarea datelor. Stocarea se face pe o suprafa magnetic dispus sub forma unor platane. n general sunt utilizate ca suport de stocare extern principal pentru calculatoare personale, dar i pentru anumite aparate electronice (DVD Playere, MP3 playere). Dac la nceputuri capacitatea unui hard disc nu depea 20 MO, astzi, un hard disc obinuit poate depi 500 GO.

Fig. 5.1: Hard Disc Seagate Barracuda ATA

Fig. 5.2: Seciune transversal prin suprafaa magnetic n lucru. n acest caz datele binare sunt codate folosind modulaia n frecven.

6.2. Structur i funcionare


Un hard disc este format din: o plac de control logic; un numr de platane (de obicei 2 sau 3), mprite n piste, cilindrii i sectoare; capete magnetice de o parte i de alta a platanelor legate printr-un bra metalic; un sistem electro-mecanic de blocare a capetelor pe pista de stop (landing-zone); un motor electric pas-cu-pas. Fiecare platan (disc) are doua fee i este divizat ntr-un numr de piste, fiecare pist fiind divizat n sectoare. Platanele sunt astfel aranjate nct pista 0 de la platanul 1
91

Evaluarea performanelor sistemelor de calcul

s fie exact deasupra pistei 0 de la platanul 2. Pentru a accesa o pist oarecare pe unul din platane, braul care susine capetele va muta capetele spre acea pist. Deoarece aceast metod necesit doar un singur mecanism de poziionare, simplific design-ul i coboar preul. Totui, pentru aceasta trebuiesc mutate toate capetele pentru a accesa o singur pist. Deci, pentru a citi date de pe pista 1 de pe platanul 1, apoi pista 50 pe platanul 3 si apoi iar pe pista 1 de pe primul platan, ntregul bra cu capete trebuie mutat de doua ori. Pentru a muta un bra ca acesta trebuie un timp semnificativ comparativ cu timpul de transfer. Pentru a minimiza acest lucru, trebuie prevenit ca datele sa fie mprtiate pe mai multe piste. O metod de a optimiza timpul de acces este ca un grup de date care sunt accesate secvenial s fie scrise pe o singur pist. Dac datele nu ncap pe aceeasi pist, atunci este optim s fie scrise pe aceeai pist, dar pe un platan diferit. Prin aceast metod, braul nu mai trebuie s execute micri. Doar capul de citire i scriere cel mai apropiat trebuie s fie selectat pentru a efectua operaia de citire. Selectarea capetelor este mult mai rapid dect micarea fizic a braului care susine capetele pentru a schimba pistele. Se mai folosete termenul de cilindru pentru a descrie multiplele platane suprapuse. Un cilindru se refer la toate pistele care au acelai numr de pist, dar care sunt localizate pe diferite platane. 6.2.1. Transferul datelor la memorie Modalitatea n care datele sunt transferate n memorie determin viteza efectiv a combinaiei controler - hard disc. Sunt folosite patru metode: Programmed I/O - Cu aceasta metod, porturile controlerului au grij att de comenzile drive-ului ct i de transferul de date ntre controler i memorie. Se folosesc comenzile IN i OUT ale limbajului de asamblare. Aceasta nseamn c fiecare octet este transferat prin intermediul procesorului. Aici, viteza datelor va fi limitat la cea a bus-ului PC i la performana procesorului. Memory Mapped I/O - Procesorul poate procesa datele provenite dintr-un controler de disc mult mai repede dac sunt stocate ntr-o regiune fix de memorie. Segmentul localizat deasupra memoriei video RAM este folosit n general cu acest scop. Datele sunt transferate cu ajutorul instruciunii de transfer (mov n cazul arhitecturii x86). Este mai rapid dect metoda precedent. DMA - Folosind DMA (Direct Memeory Access), un dispozitiv poate transfera datele direct n memorie. Procesorul nu particip la acest transfer. Pentru a folosi DMA, un program trebuie s i precizeze controlerului DMA mrimea n bytes a pachetului de date ce urmeaz a fi transferat dintr-o locaie ntr-alta. Totui, controlerul DMA ntr-un PC este inflexibil i lent. Controlerele DMA opereaz la 4 MHz, n concluzie sunt extrem de lente. Busmaster DMA - Folosind aceast metod, controlerul hard-discului deconecteaz procesorul de la bus i transfer datele n memorie singur. 6.2.2. Interfee i controlere ESDI Controlerul ESDI a fost dezvoltat dup controlerul ST506, i a fost unul din primele controlere de hard discuri pe calculatoare x86. Acest tip de controler a fost folosit n modelele IBM PS/2. Pentru c separatorul de date i controlerul lucreaz n paralel, rata de transfer este aproximativ 10 megabii/secund la modelele iniiale, respectiv 15, 20 megabii la cele recente. Hard discurile ESDI stocheaz informaii despre formatul fizic i adresele sectoarelor defecte i poate transmite aceste informaii
92

Cap 6: Evaluarea hard discurilor

controlerului, pentru identificare i corectare de erori. Nu mai este utilizat dect pe scar redus. SCSI Controlerele SCSI (Small Computer System Interface) sunt folosite n special n sistemele care au nevoie de performan i stabilitate ridicat (servere, staii de lucru performante). ATA/PATA (IDE/EIDE) Controlerul IDE (Integrated Drive Electronics), cel mai folosit n calculatoarele personale de astzi folosete un singur cablu de 40 pini care combin funciile unui cablu de date i al unuia de control care conecteaz discul IDE direct la magistrala (busul) de sistem. Controlerele IDE au abilitatea de a emula orice format de disc. Din cauza consumului redus de energie, este una din soluiile folosite pentru calculatoarele portabile. Controlerul IDE permite legarea pe acelai cablu a dou hard discuri sau a unui hard disc i al unei uniti optice n sistem master/slave. Aceast arhitectur a dus la incompatibiliti ntre uniti n anii '90, care ns au fost rezolvate. SATA Controlerele SATA plaseaza fiecare disc pe propriul canal (cu un set propriu de porturi intrare/ieire). Astfel se elimin problemele cauzate de arhitectura PATA. USB/Firewire(IEEE 1394) Exist i discuri portabile care folosesc interfaa USB sau Firewire pentru a transmite datele. De obicei discurile acestea sunt ansambluri formate dintr-un disc IDE sau SCSI, un controler pentru acestea i un controler USB/Firewire.

6.3. Caracteristici

Capacitatea (msurat n gigaoctei) - n general fabricanii folosesc ca unitate de msur multiplii din SI ai octetului (putere de 10), pe cnd multe sisteme de operare (Windows, unele distribuii de Linux, MacOS folosesc msurtoarea n multiplii binari). Dac primul hard disc avea 5 MO, astzi capacitile hard discurilor pot depi 500 GO. Dimensiunea fizic, msurat n oli (inch). Astzi hard discurile au fie 3.5" (pentru PC-uri), fie 2.5" (pentru laptopuri - mai mici, utiliznd mai puin curent electric dar mai scumpe i mai ncete). Exist i discuri de 1.8", pentru playere MP3 (precum Apple iPod), care pe lng mrimea redus, sunt mai rezistente la ocuri. Durabilitate (exprimat n timp mediu ntre erori - MTBF). Discurile SATA 1.0 au viteze de 10.000 rpm i un MTBF de 1 milion de ore sub un ciclu de utilizare de opt ore. Alte discuri permit pn la 1.4 milioane de ore sub un ciclu de 24 de ore. Numr de operaii de intrare ieire permise Consum de curent Nivel de zgomot Timpi de transfer i timpi de acces.

93

Evaluarea performanelor sistemelor de calcul

6.3.1. Optimizarea timpilor de cutare Ordinea optim de executare a comenzilor primite de hard disc pentru a reduce latenele de cutare este ordinea care minimizeaz micarea mecanic. O analogie destul de sugestiv ar fi un ascensor. Dac toate opririle ar fi executate n ordinea n care s-au apsat butoanele, liftul ar funciona ntr-o manier foarte ineficient i ar pierde foarte mult timp pentru a circula ntre diferitele locaii. Orict pare de incredibil, majoritatea hard discurilor existente pe piaa de desktop-uri n ziua de astzi funcioneaz n acest mod ineficient. Ascensoarele au evoluat pn la stadiul de a "nelege" c reordonarea locaiilor va avea ca efect un mod de funcionare mai economic i mai rapid. Odat cu apariia modului de transfer Serial ATA, nu numai c este posibil reordonarea comenzilor dintr-un anumit punct de start, dar schema este dinamic. Acest lucru se traduce prin faptul c la orice moment de timp pot fi adugate la coada de ateptare a comenzilor (queue) cerine de execuie adiionale. Acestea pot fi ncorporate ntr-un thread n desfurare sau pot fi amnate pentru urmtoarea serie de execuie a comenzilor. Traducnd aceste lucruri n tehnologie HDD, reducerea micrii mecanice ntrun drive poate fi realizat prin existena unei cozi de comenzi i prin reordonarea acestora pentru a oferi datele cerute ntr-o manier eficient. Ct timp drive-ul execut o comand, o nou comand poate intra n aceast coad de ateptare, iar dac ea va putea fi procesat cel mai eficient din punct de vedere mecanic, atunci va fi urmtoarea comand care va fi executat. Totui, simpla reordonare a comenzilor bazat pe locaia de destinaie a capului de citire/scriere deasupra platanului nu este cea mai eficient soluie. La fel ca n cazul liftului, care nu se va opri brusc atunci cnd o persoan apas butonul unui etaj pe lng care tocmai a trecut, HDD-urile vor folosi algoritmi compleci pentru a determina cea mai bun comand pe care s o execute n continuare. 6.3.2. Optimizarea latenelor de rotaie Timpul de rotaie reprezint durata necesar pentru ca blocul logic de nceput al datelor cerute s se roteasc pn cnd ajunge sub capul de citire scriere, dup ce, n prealabil, acesta s-a poziionat pe pista corespunztoare. n cel mai ru caz posibil, platanul ar trebui s parcurg o rotaie complet pn cnd aplicaia ar putea accesa datele cerute. Acest timp depinde, bineneles, de viteza de rotaie a hard discului. O viteza de rotaie a platanelor mai mare este o modalitate n care se pot reduce latenele de rotaie. Totui, creterea acestei viteze implic un cost adiional substanial. Timpii de rotaie pot fi minimizai, de asemenea, prin alte dou moduri de abordare. Primul este reordonarea comenzilor ntr-un mod astfel nct latena de rotaie s fie minimizat. Aceast optimizare este similar cu cea din cazul timpilor de cutare. Al doilea mod de optimizare implic folosirea unei funcii denumite "out-oforder data delivery". Aceasta presupune ca braul s nu acceseze neaprat blocul logic de nceput al datelor cerute, ci s citeasc din orice poziie aflat n interiorul zonei de date corespunztoare. Astfel, drive-ul ncepe s citeasc datele cerute imediat cum s-a poziionat pe pista corespunztoare i adaug datele lips (cele aflate ntre blocul logic de nceput i cel de la care s-a nceput efectiv citirea) la sfritul aceleiai rotaii.
94

Cap 6: Evaluarea hard discurilor

Folosind tehnologia "out-of-order data delivery", n cel mai ru caz, transferul va fi complet n maxim o rotaie a platanului. Fr implementarea acestei funcii, cel mai ru "scenariu" implic un timp de o rotaie, la care se adaug durat de timp necesar pentru a citi blocurile logice de date cerute. 6.3.3. Tehnologia NCQ Native Command Queuing (NCQ) este o tehnologie realizat pentru a crete performanele hard discurilor SATA. Ea a fost dezvoltat de Intel i Seagate odat cu apariia modului de transfer SATA pentru dispozitivele de stocare. Bineneles, NCQ asigur performane mai bune i eficien prin intermediul unei reordonri eficiente a comenzilor. n plus, exist trei noi capabiliti care sunt ncorporate protocolului Serial ATA pentru a mbunti performanta NCQ: Race-Free Status Return Mechanism, Interrupt Aggregation i First Party DMA. Nu vom intra n detalii despre modul n care hard discurile "echipate" cu tehnologia NCQ realizeaz aceast mult dorit reordonare a comenzilor pentru a mari performanele. Ideea de baz este c Native Command Queuing "se simte" atunci cnd mai multe comenzi sunt lansate ctre drive, acesta reordonndu-le pentru a reduce att timpul de cutare, ct i pe cel de rotaie. Pentru ca NCQ s fie activat, trebuie s fie suportat i activat de controllerul SATA i de hard disc, bineneles. Metoda de activare variaz n funcie de controller. Pe unele plci de baz cu chipset Intel, spre exemplu, aceast tehnologie necesit activarea opiunii Advanced Host Controller Interface (AHCI) din BIOS i instalarea aplicaiei Intel Application Accelerator. Pe piaa hard discurilor ne putem atepta n viitorul apropiat la o "afluen" a dispozitivelor nzestrate cu aceasta tehnologie. Acest lucru este subliniat i de recentul anun de achiziie a companiei Maxtor, unul dintre productorii importani din domeniu, de ctre Seagate. ns, Seagate nu este singurul care a nceput implementarea acestei tehnologii, ceilali productori nefiind mai prejos. Beneficiile principale ale NCQ: Race-Free Status Return Mechanism - aceast funcie permite ca starea oricrei comenzi s fie comunicat sistemului. Nu este nevoie de o compatibilitate special cu sistemul gazd pentru ca aceast comunicare s aib loc. Interrupt Aggregation - n general, drive-ul lanseaz cereri de ntrerupere (interrupt requests) de fiecare data cnd termin de efectuat o comand. Cu ct sunt mai multe astfel de cereri de ntrerupere, cu att mai mare este sarcina de procesare a sistemului gazda. Tehnologia NCQ permite ca numrul mediu de cereri de ntrerupere per comand s fie mai mic dect 1. Dac hard discul efectueaz mai multe comenzi ntr-un interval scurt de timp (lucru des ntlnit n majoritatea computerelor), cererile de ntrerupere individuale pot fi "combinate". n acest caz, controllerul sistemului gazd proceseaz doar o cerere de ntrerupere pentru mai multe comenzi.
95

Evaluarea performanelor sistemelor de calcul

First Party DMA - Native Command Queuing are un mecanism care i permite drive-ului s i configureze modul de operare DMA (Direct Memory Access) pentru a transfera datele fr o intervenie software din partea sistemului gazd. Acesta este mijlocul prin care drive-ul poate n mod efectiv s reordoneze comenzile, din moment ce poate selecta buffer-ul de transmisie la propria iniiativ.

6.3.4. Hard discuri...puin mai silenioase Noile hard discuri Samsung SpinPoint S166 7200 rpm sunt ultra silenioase i de mare viteza, pretinde compania, emind 24 dB in stare idle i 27.5 dB atunci cnd citesc/scriu date. Aceste coordonate le fac ideale pentru a fi ncorporate n calculatoarele office, precum i n electronicele destinate consumatorilor, precum DVR sau orice alt echipament ce are nevoie de stocare i va fi utilizat ntr-un mediu silenios. Primele dou modele prezint capacitate de 60 Gb i 160 Gb, beneficiind att de interfaa 3.0 Gbps Sata ct i PATA. Alte specificaii: include 8 Mb memorie cache, mbuntirea capului de citire a datelor, o mai bun rezisten la ocuri i un nou controller ce ofer viteze mai bune de transfer i un consum redus de curent electric. Ultima tehnologie dezvoltat de Samsung n cadrul SpinPoint S166 Series adaug un surplus de atractivitate unei audiene mai largi, reducnd i mai mult nivelul acustic i mbuntind vitezele de transfer ale datelor, a declarat TJ Lee, vice preedinte n cadrul diviziei Samsung Electronics. 6.3.5. Criptare nativ pentru hard discuri Seagate Technologies a anunat disponibilitatea primului hard disc destinat laptop-urilor ce beneficiaz de capabiliti de criptare native, destinate protejrii datelor n cazul n care dispozitivele sunt furate sau pierdute. Seagate Momentus 5400 FDE.2, cu algoritmi de criptare AES pe 128 de bii, poate fi totodat achiziionat cu software-ul de management Wave Systems Embassy Trust Suite de la Wave Systems, ce permite administratorilor IT s controleze criptarea datelor i parolele la nivel enterprise. Acesta este un drive standard ATA ce este criptat n permanen. Se comport ca un hard disc obinuit, nu i-ai da seama de vreo diferen, a declarat Lark Allen, vice preedinte executive n cadrul companiei Wave Systems. Dei exist o mulime de tehnologii de criptare bazate pe software, drive-ul Seagate Momentus este primul care include o soluie de criptare firmware, mult mai ieftin dect software-ul de criptare i fr s consume din ciclurile procesorului, a declarat Melissa Johnson, seful departamentului de marketing n cadrul Seagate. Hard discul are 5400 RPM i poate fi achiziionat n 3 versiuni diferite, n funcie de capacitate: 80 GB, 120 GB i 160 GB. Facilitatea de criptare va spori preul acestui cu aproximativ 25% fa de costul unui hard disc standard. ASI Computer Technologies a anunat ca va distribui primul laptop care va conine noul hard disc Seagate. Compania a declarat ca a ales propriul notebook
96

Cap 6: Evaluarea hard discurilor

Centrino de 15 inci pentru a gzdui hard discul, deoarece acesta este livrat deja cu opiuni speciale de securitate precum un cititor de amprente. 6.3.6. Hard discuri liliputane Toshiba a anunat c a fabricat un hard disc de 1,8 inci cu o capacitate de stocare de 100 de GB, cea mai mare din aceasta clas de hard discuri. Noul dispozitiv, MK1011GAH utilizeaz tehnologie PMR (perpendicular magnetic recording) i un cod de erori mbuntit pentru a asigura cea mai mare densitate virtual dintre toate hard discurile de pe pia: 240,8 MB pe milimetru ptrat. Toshiba va ncepe producia de mas pentru acest hard disc din ianuarie 2007. mpachetarea capacitilor uriae n hard discuri din ce n ce mai mici este o cerin obligatorie pentru a ine pasul cu tehnologiile avansate din piaa PC-urilor i pentru a ntmpina cu succes cererile pentru medii digitale ce suport capaciti de stocare din ce n ce mai mari. Lansarea acestei bijuterii vine s suporte dezvoltarea viitoarelor generaii de calculatoare mobile, oferindu-le utilizatorilor funcionaliti mbuntite. Totodat, Toshiba a mbuntit consumul de curent la 0.003W/GB, asigurnd astfel un mediu de lucru mult mai prietenos. De asemenea, noul dispozitiv respect directiva european RoHS din iulie 2006.

97

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 1

1 Metodologia de evaluare pentru plci de baz


1.1 Obiective: Cunoaterea metodologiei pentru testarea i evaluarea plcilor de baz ale computerelor. 1.2 Introducere Metodologia de testare este destul de complicat, astfel nct se va ncerca descrierea pe scurt a procesului de evaluare. Dup cum probabil tii exist cteva segmente de pia, un anumit produs adresndu-se numai unuia dintre aceste segmente. S-a mprit piaa n patru categorii. De obicei majoritatea companiilor media i de cercetare mpart piaa n doar trei segmente, dar noi am ales un model pe patru nivele (ca cel TCP/IP) deoarece este mai uor de testat n aceste condiii. Cele patru segmente sunt: segmentul inferior de pia. Perifericele i componentele hardware pentru computere care costa mai puin de 600$. De obicei cel mai important aspect pe aceast pia este preul, dar trebuie luai n considerare toi ceilali factori. segmentul de pia mediu. Perifericele i componentele hardware pentru computere care cost ntre 600$ i 1500$. Majoritatea utilizatorilor cumpr computere n acest segment de pia. segmentul superior de pia. Hardware i periferice pentru computere care costa mai mult de 1500$. Majoritatea firmelor mici utilizeaz servere i echipament de reea din acest segment de pia. Cel mai bun exemplu: plcile de baza dual procesor care au preul destul de ridicat i ofer o performan la fel; Professional computer hardware - preul nu conteaz, ci numai performana. Din cadrul acestei categorii fac parte un numr limitat de produse, standarde de firm, servere pentru reele de mare performan, etc. Acest segment de pia nu va fi descris n acest seminar. Cel mai bun exemplu: Majoritatea serverelor rack mountable. Chiar dac acestea nu sunt foarte scumpe se adreseaz utilizatorilor profesioniti. Am hotrt s utilizam sisteme de testare diferite pentru fiecare segment de pia. Vom discuta despre specificaii mai trziu, acestea nu sunt foarte importante, amintii-v doar c ceea ce este astzi nou s-ar putea ca luna viitoare s fie depit. Mult mai important este metodologia, aa c acesta este subiectul principal al acestui seminar. Sistemele de testare vor fi depite n cteva luni, dar acest lucru nu conteaz atta timp ct pstrm metodologia de testare. Am reuit s definim 5 pai n cadrul metodologiei de testare. Exist i un al aselea pas, dar acesta reprezint prerea echipei de testare. Procesul de testare al unei plci de baz este cel mai complex i exist produse care pot sri peste anumite seciuni din metodologie. Paii care fac parte din metodologia de testare se aplic n cazul fiecrui segment de pia fr diferen. Exist produse la care se aplic numai anumii pai datorit unor motive logice, dar exist i anumii pai obligatorii ntr-o sesiune de testare obiectiv.
98

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 1

1.3

Cei cinci pai n evaluarea obiectiv n cele ce urmeaz va vom prezenta cei cinci pali din metodologia de evaluare. Fiecare pas este alctuit din mai multe pri i majoritatea acestor pai se aplica tuturor produselor (marcat cu obligatoriu). 1. Identificarea produsului. Identificarea produsului - Productorul, modelul, versiunea, firmware, data lansrii pe pia, lotul. Este posibil s nu fie toate disponibile pentru toate produsele. Obligatoriu Situaia pe pia, identificarea pieei. - segmentul int, momentul n care produsul a fost / va fi prezentat pe pia, oferta concurenilor. Obligatoriu Prezentarea produsului. - Acest pas include verificarea ambalajului i comentarii despre campania de publicitate realizat de ctre compania productoare. Documentaia. - Unul din paii principali. Vom analiza documentaia din punctul de vedere al unui amator i din perspectiva unui inginer. De exemplu manualele multor plci de baz descriu instalarea n detaliu, dar nu descriu bine setrile din BIOS. Obligatoriu Layout-ul produsului. - Privim produsul cu atenie i descriem design-ul / layout-ul. Acest pas este foarte important deoarece n majoritatea cazurilor layout-ul influeneaz paii urmtori. Obligatoriu Calitatea componentelor. - Multe produse hardware sunt bine prezentate, dar calitatea componentelor este mediocr. O atenie deosebit trebuie acordat prii electronice / mecanice. 2. Instalarea produsului / compatibilitatea Instalarea normal a unui produs. - Instalam produsul n aceleai condiii ca un utilizator final. Cercetm problemele care ar putea aprea n timpul instalrii. Orice aciune atipic la instalarea produsului va fi raportat. De asemenea n aceast seciune vom discuta despre drivere. Obligatoiru Compatibilitatea produsului cu platformele software. Unele produse nu sunt compatibile cu anumite platforme. De exemplu un Winmodem nu ar trebui s mearg sub Linux cu toate c pe net exist drivere scrise de teri care asigur funcionarea. Noi testm produsul numai cu sistemele de operare (de exemplu) suportate de produs. Dac exist produse similare pe pia care suport o gam mai larg de platforme atunci vom nota acest lucru. Obligatoriu Compatibilitatea produsului cu alte dispozitive hardware. Este imposibil s testezi compatibilitatea cu toate dispozitivele hardware din lume. Majoritatea laboratoarelor care testeaz i aprob hardware utilizeaz numai "cele mai populare dispozitive". Din punctul nostru de vedere aceasta va fi seciunea cea mai dificil i care va lua cel mai mult timp. De exemplu vom testa o plac de baz cu cteva dispozitive USB, module de memorie, procesoare, placi video, de sunet, SCSI i plci de reea. Obligatoriu 3. Caracteristicile produsului Caracteristicile promovate de marketing / Caracteristicile reale. Verificm caracteristicile promise ale produsului. Bineneles c majoritatea
99

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 1

caracteristicilor sunt deja cunoscute utilizatorilor. Verificam funcionalitatea caracteristicilor promise i a celor reale. Obligatoriu Caracteristicile unice ale produsului. Exist productori care ofer clienilor caracteristici unice pe pia. De exemplu Abit SoftMenu nu mai este o caracteristica unic, ci o caracteristic promovat de departamentul de marketing, din momentul ce exist i ali productori care ofer caracteristici comparabile. Obligatoriu Utilitatea caracteristicilor oferite. n decursul timpului am vzut o mulime de funcii inutile la unele produse hardware ale unor productori cunoscui. De exemplu funcia numita "Voice Diagnostic" care este disponibil la multe plci de baz i care n acest moment este o funcie absolut stupid. Testnd o mulime de plci de baz cu aceast funcie vei constat c nu vei nelege nici mcar un singur cuvnt din ce spunea vocea suava care anun o problema. Discutam despre mbuntiri. Comparam cu caracteristicile oferite de ctre concuren, poate exist caracteristici a cror prezen ar fi de dorit, dar care nu exist la versiunea testat. Discutam despre ce ne-ar place s vedem la versiunile viitoare ale produsului. Obligatoriu Capacitatea produsului de a se adapta la schimbri / Durata de via. n general MTBF-ul majoritii produselor este mai mult dect suficient. Determinm intervalul de timp n care poi utiliza produsul fr s apar schimbri arhitecturale. Amintii-v numai c plcile de baz Slot nu mai pot fi utilizate n acest moment. Este greu s prezici aceste schimbri, dar putem afla care sunt planurile productorilor. Obligatoriu

4. ncrederea ntr-un produs Ct de demn de ncredere este un produs n condiii normale de exploatare. n cazul unei plci de baz aceasta poart numele de stabilitate. Obligatoriu Ct de demn de ncredere este un produs n condiii extreme (teste care depesc specificaiile). Majoritatea plcilor de baz ofer funcii de overclock-are, dar acestea nu sunt nici recomandate, nici suportate de ctre productori. Plcile de baz care i dovedesc stabilitatea n condiii de overclock-are sunt i mai stabile n condiii normale. 100 ore de teste burn-in. Orice produs sau orice component electronic se poate strica n primele ore de funcionare. Cazurile n care produsele nu mai funcioneaz dup cteva sptmni nu sunt foarte frecvente. Suportul oferit de compania productoare: drivere, update-uri, website i suportul online, garania. Este foarte important ct de rapid poate o companie s ofere suport pentru clienii si. Garania este de asemenea important deoarece exist produse la care o perioad de garanie mai ndelungat este bine-venit. Suportul nu este totul, update-uri la software sunt vitale n meninerea sistemului la zi i fara bug-uri. Obligatoriu 5. Performana Performana testat cu benchmark-urile care folosesc aplicaii. Testele cu benchmark-uri ca Ziff Davis Content Creation Winstone 2001, Bapco SysMark 2001. Obligatoriu Performana testat cu ajutorul benchmark-urilor sintetice. Unul dintre cele mai respectate teste din aceasta categorie este SiSoft Sandra.
100

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 1

Performana n aplicaii. Aceste teste se bazeaz pe aplicaii des folosite. De obicei se msoar timpul de care are nevoie un produs pentru a finaliza o serie de comenzi. Comparaia cu alte produse. Se compar produsul cu alte produse de pe pia i se determin poziia acestuia pe pia. Obligatoriu

6. Prerea evaluatorului Opiunile existente pe pia. Discutam i comparm respectiva plac de baz cu alte plci de baz de pe pia. Sfaturi care privesc achiziionarea. Ce prere au specialitii de IT despre achiziionarea unei astfel de plci. Nota final. Nota final se bazeaz pe paii anteriori. Este extrem de important i trebuie s discutam despre acest subiect n detaliu. 1.4 Consideraii finale / Nota final Trebuie s ne reamintim mereu ca nu suntem n cutarea produsului perfect. Produsul perfect nu exist, dar exist produse aproape perfecte, iar noi verificm ct de aproape de perfeciune este un produs. Punctm comportamentul produsului n fiecare seciune cu unul pn la cinci puncte. Un produs poate "pica" n cadrul unei seciuni (ex: ncrederea n produs); aceasta nseamn c produsul are probleme serioase. Cnd un anumit produs a trecut de o seciune primete un punctaj. S vedem care sunt aceste punctaje: mai puin de dou puncte - Are probleme serioase n aceast seciune. Acest produs este jalnic i nu este recomandat. ntre dou i trei puncte - Am avut cteva probleme cu acest produs. Dac are punctaje bune n celelalte seciuni, poate fi o soluie. ntre trei i patru puncte - Un produs mediu care s-a comportat dup cum era de ateptat. Peste patru puncte - Calitate deosebit, una dintre cele mai bune alegeri de pe pia

Exist de asemenea o not final care, n principiu, este suma punctajelor obinute n cadrul fiecrei seciuni, cu cteva excepii: 1. Dac un produs obine mai puin de trei puncte ntr-o seciune nu va obine sub nici o forma mai mult de 18 puncte, chiar dac obine 5 n toate celelalte seciuni! Puin posibil. 2. Putem aduna/scdea dou puncte din suma total n funcie de impresia noastr general.

Interpretarea notei finale: mai puin de 15 puncte - un produs mizerabil. Nici s nu v treac prin cap s-l cumprai! ntre 15 - 18 puncte - Un produs mediu, l putei cumpra, dar exist soluii mai bune pe pia. Trebuie luat n considerare i preul. ntre 18 - 22 puncte - O alegere bun, merit investiia mai mult de 22 puncte - unul dintre cele mai bune de pe pia, cumprai-l i nu vei regreta.
101

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

2 Evaluarea plcilor de baz dual core


2.1 Obiective: Seminarul i propune evaluarea i compararea mai multor plci de baz ce suport procesoare Intel Pentium din familia D.

Suntem deja mai mult dect familiarizai cu procesoarele dual core pe care marii productori de astfel de componente le-au lansat i pe piaa autohtona. Performana de care aceste procesoare dau dovad este de necontestat, mai mult dect att, posibilitatea de a avea multi procesor pe acelai cip integrat este o soluie la care muli dintre noi se gndeau s apeleze. Marele avantaj al acestei tehnologii este acela c n situaiile n care sunt rulate pe sistemul de operare mai multe aplicaii odat, sarcinile sunt mprite ntre cele dou nuclee ale procesorului. Consideraii tehnice Realizarea unui upgrate care s presupun ca platform noile procesoare dual core de la Intel presupune cunoaterea ctorva detalii, care vor fi prezentate n continuare. Odat cu lansarea seriei Pentium D au fost necesare i cteva modificri n ceea ce privete chipset-ul care are n grija procesorul dual core. La momentul actual sunt doar trei chipset-uri la care se poate opta n cazul platformelor cu CPU Intel Pentium D: 945P, 945G i mai noul 955X. Facilitile pe care acestea le ofer se extind pn la interfee S-ATA mai performante, plci audio cu opt canale sau dual LAN pe band Gigabit i interfaa PCI Express. Unul dintre dezavantajele acestor platforme, n privina gamerilor, este faptul c acestea nu suport conectarea n mod SLI a dou plci nVIDIA (cazul chipset-urilor Intel). ns, dac lum n calcul faptul c procesoarele dual core sunt destinate rulrii mai multor aplicaii n acelai timp, n privina jocurilor nu avei nevoie de o astfel de platform. Cu toate acestea, apariia noilor chipset-uri de la nVIDIA - 7800GTX, respectiv ATI - 1800, credem c opiunea multi GPU rmne o alternativa foarte scump. n 2.2

102

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

privina memoriilor compatibile, acestea pot fi doar DDR II la frecvene de pn la 800 MHz (valabil pentru chipset-urile 955X). Pe lng acestea, posibilitatea de a alege noile suporturi Serial ATA II reprezint un avantaj fantastic att pentru soluiile server, ct i pentru aa- numiii power users, cei n cutare de un computer foarte performant. La acestea se adaug suportul RAID de la matrice n configuraie 0 pn la 5 cu un transfer mediu de aproximativ 3 Gb/s. Apropierea de conceptul digital home este realizat de integrarea unor plci de sunet cu opt canale, alternativ ce va permite s conectai un sistem de boxe 7,1 sau 5,1. 2.3 Procedura de testare S-a plecat de la ideea c dincolo de jocuri, aceste platforme sunt destinate, n primul rnd, aplicaiilor office, grafic workstation sau server. De aceea, s-a ales n testele efectuate mai mult programe care reflect performanele computerului n aplicaii cum ar fi: arhivare de fiiere, codare video sau interoperabilitate placa de baza - procesor. Platforma de test: CPU: Intel Pentium 4 D 3 GHz Memorie: 2x1024MB DDR II SDRAM Kingmax 533 MHz Placa Video: Gigabyte Radeon X800 XL PCIe 256MB GDDR3 Hard disc: Western Digital JB 200 GB, 8 MB cache ATA100 Sursa de putere: Zalman 400 W PC Mark 2005: Noul software dezvoltat de cei de la Futuremark destinat evalurii ntregului sistem a ajutat foarte mult n aprecierea performantelor per ansamblu a platformei de test. Setrile cu care am pornit benchmark-ul au fost cele default, numrul de subteste fiind maxim. WinRAR 3.50: S-a considerat c arhivarea de fiiere reprezint un lucru destul de important la ora actual, lund n considerare faptul c noi toi suntem n cutare de un transfer ct mai rapid al fiierelor: fie pe mail, fie pe reea sau inscripionare pe CD/DVD. Arhiva sa constituit dintr-un folder iniial cu dimensiunea de 100 MB i un numr de 3.600 de fiiere. Lame mp3 Encoder: Nu foarte popular n ceea ce privete codarea n format mp3, din cauza n primul rnd absenei unei interfee prietenoase, Lame mp3 encoder a fost utilizat n mod default pentru un fiier de test cu o dimensiune de 100 MB. 3D Mark 2005: Performanele video ale platformei au fost testat cu popularul 3D Mark 2005, test ce a rulat pentru setrile default: rezoluie 1024x768@ 32bit, 4x Anisotropic filter i fr Full Scene Anti-Alasing.
103

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

SISoft Sandra 2005: Test de referin n materie de performan a componentelor, SiSoft Sandra a rulat doar pentru testul CPU Multimedia Benchmark. Programul ne ofer scoruri pentru Testul de numere Integer (ntregi) i Floating point (calcule n virgul mobil). Auto Gordian Knot (Xvid 1.0.3 encoder): Testul de codare video a fost fcut cu Auto Gordian Knot pentru codec video Xvid 1.0.3, Audio AC3. Fiierul de test a fost un fragment de DVD (.vob) cu dimensiunea iniial de 200 MB. Fiierul de ieire a fost setat la dimensiunea de 100MB. Plci de baz testate ABIT AW8-MAX Echipat cu ultimul chipset destinat procesoarelor dual core, AW8-MAX este o plac ce se claseaz ca performane peste linia median a topului realizat. Scorurile mari nregistrate n teste au convins att n privina performanei per ansamblu - i cnd ne referim la asta ne referim n primul rnd la PC Mark 05, ct i la capitolul manipulare a fiierelor. La fel ca i celelalte concurente, FSB-ul de care beneficiaz acest produs atinge limita de 1066 MHz, frecvena maxim pentru memoriile compatibile pe aceast platform fiind de 800 MHz. Caracteristic chipset-ului 955X de la Intel, facilitile adiionale cum ar fi a doua plac de reea sau controlerul audio cu opt canale sunt lucruri cu care ne-am obinuit deja. ASUS P5WD2 Premium Ctigtorul testului din cadrul seminarului nostru, P5WD2 Premium, s-a dovedit a fi o platform complet - att din punct de vedere al performanei, ct i n privina dotrilor sale. Scorul cel mai ridicat n testul 3D Mark05 duce imediat cu gndul la faptul c placa de baz se adreseaz n primul rnd mptimiilor jocurilor i apoi celorlalte categorii de cumprtori. Sub capota aceluiai chipset 955X de la Intel, care d dovad de o fiabilitate bun i, n acelai timp, i de inovaii n direcii precum storage (SATA II) sau audio (compatibilitate cu sisteme audio 7,1). Gigabyte GA-9I955X Royal Principalul rival al ctigtorului, GA-8I955X Royal este o platform care se dorete a fi un suport pentru performane extreme. Bus-ul memoriei de 888 MHz, ajutat de suportul DDR II i FSB-ul la 1066 MHz, au reuit s ofere rezultate mai mult dect satisfctoare n testele rulate. n privina dotrilor suplimentare lucrurile stau la fel ca la celelalte plci de baz cu chipset-uri 955X: suport RAID 0,1,5, plac audio cu opt canale i Gigabit LAN. MSI Neo 945P i Platinum 954P Gemenele MSI din acest test s-au comportat exemplar n aplicaiile rulate, mai ales dac lum n calcul c sunt cu un pas n urma plcilor care beneficiaz de mai noile chipset-uri 955X. Cu toate acestea, specificaiile tehnice nu sunt cu mult inferioare: acelai FSB 1066 MHz ca la concurente, suport pentru memorii DDR II i compatibilitate S-ATA II. Absena conectorilor FireWire nu reprezint un dezavantaj major dac lum n calcul performanele actuale ale porturilor USB ver2.0.
104

2.4

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

MSI 955X Platinum Candidatul MSI la categoria chipset 955X versiunea Platinum beneficiaz de caracteristici ntlnite la aproximativ toate celelalte concurente, ns scorurile pe care aceasta le-a nregistrat pe parcursul testrii au demonstrat c produsul se vrea a fi n primul rnd unul care s impresioneze prin performan. Timpul destul de scurt nregistrat pentru codarea unui fiier video la standard Xvid/AC3 arat faptul c interconectarea ntre componentele de baz este foarte bine coordonat, testul implicnd att procesorul, ct i memoria, placa audio i placa video. Foxconn 955X7AA Dac punctarea la acest test ar fi fost dat doar de rezultatele n benchmark-uri, cu siguran modelul 955X7AA de la Foxconn ar fi urcat vertiginos pe prima poziie. Cu toate c bus-ul maxim pentru plac este de doar 667 MHz, performanele de care a dat dovad platforma ne fac s credem c la urm materia prim - n spe chipset-ul nu reprezint totul. Cel mai mare scor n PC Mark 2005 i, de asemenea, cel mai sczut timp la arhivarea datelor v pot face s v orientai pentru o astfel de plac de baz dac suntei o persoan care nu se gndete n primul rnd la jocuri. ASUS P5LD2 Deluxe Echipat cu un chipset 945P, P5LD2 Deluxe se vrea a fi (probabil) o plac middle-range, dar putem spune c dup rezultatele pe care aceasta le-a nregistrat n teste, categoria n care se integreaz ine s se apropie de cea de vrf. Opional, la acest produs putei achiziiona n interiorul pachetului i o plac WiFi-TV, soluie aleas de productor pentru a atrage i o parte dintre clienii n cutare de sisteme digital home. Platforma nu beneficiaz dect de o singur plac de reea gigabit i doar un slot adiional PCX. ASUS P5ND2 Sli Destinat n primul rnd mptimiilor jocurilor, P5ND2 Sli este o plac de baz ce se axeaz pe performana sistemului n aplicaii multimedia. Chipset-ul care echipeaz platforma este unul nForce 4 Sli, capabil s ofere un FSB de 1066 MHz, suport DDR II 667, RAID 0,1,5 sau ieire audio pe opt canale. Rezultatele n benchmark-urile sintetice categorisesc n mod clar segmentul n care acest produs se integreaz, i anume n cel al gamerilor. Gigabyte GA-8N-Sli Cea de-a doua plac ce suport modul Scalable Link Interface (SLI) s-a comportat ceva mai bine la capitolul benchmark-uri sintetice, scorurile obinute fiind ceva mai ridicate dect la modelul SLI venit de la ASUS. Chiar dac posibilitatea de extindere la cea de-a doua plac grafic pe care aceste platforme o ofer este una profitabil din punct de vedere al performanei, credem totui c sunt puini cumprtori de pe piaa noastr care ar opta pentru o astfel de soluie. Remarcabile rmn performanele plcii de baz n ciuda suprasolicitrii sale cu mai mult de o placa video. ABIT AL8 Cunoscui mai ales datorit capacitilor fantastice de overclocking, cei de la ABIT nu au reuit s impresioneze cu modelul AL8, acesta nregistrnd scoruri
105

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

ngrijortor de sczute la mai toate testele pe care le-a rulat. Dotat cu un chipset 945P, potenialii cumprtori se pot bucura de suportul DDR II, FSB 1066 MHz, plac audio cu opt canale i interfee S-ATA. ASRock 775Dual-880Pro Nu tiu ci dintre voi cunoatei att de bine brand-ul ASRock, ns dincolo de performanele precare pe care aceast plac a reuit s le ofere, posibilitatea de a monta la alegere un procesor AMD sau unul Intel pe aceast platform, este de admirat. (Procesorul AMD se moteaz cu ajutorul unei placi special concepute ce se conecteaz lng slotul PCIe x16.) Am rmas plcut impresionat s observ c n anumite teste 775Dual-880Pro a reuit s bat competitori cu un nume mai puternic. Concluzii Chiar dac "era" procesoarelor dual core abia a nceput, productorii de plci de baz nu au ntrziat s-i fac simit prezena n toate segmentele de cumprtori. Produsele prezentate n acest seminar au dat dovad de performane ridicate, diferenele dintre acestea nefiind extraordinar de mari. 2.5

106

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

3 Realizarea overclock-ingului la plcile grafice


Generaliti despre overclocking-ul la plcile grafice Ca i n cazul procesoarelor, plcile grafice pot fi supuse operaiunii de overclocking, adic creterea frecvenelor pentru obinerea de performane superioare celor implicite. Ce gamer nu-i dorete performane mai mari dect cele oferite de sistemul su dac realizeaz c nu poate juca jocul preferat la framerate-ul dorit, la rezoluia sau setrile de calitate preferate? Din pcate, i aici apar riscuri legate de temperaturi ridicate, deci este necesar o rcire corespunztoare, nu neaprat suplimentar. O rcire inadecvat poate duce la arderea GPU-ului, caz extrem de rar fiindc mai toate plcile recente beneficiaz de rcire activ i/sau exist un minim de airflow n carcas. Fr a mai vorbi de protecie la supranclzire. O frecven prea mare duce de cele mai multe ori la blocaje sau un comportament necorespunztor prin apariia de artefacte, astfel c un utilizator neiniiat, care s-a jucat cu nite setri, poate contribui la umplerea departamentelor de service ale firmelor de calculatoare pentru probleme inexistente, singurul lucru care trebuie fcut fiind reducerea frecvenelor. Att chip-ul ct i memoria plcii pot fi supratactate deoarece fiecare dintre ele beneficiaz de o anumit frecven de funcionare (ca i n cazul procesoarelor sau a modulelor de memorie) care influeneaz n mod direct - dar nu exclusiv - performana. Overclocking-ul este util n momentul n care deinei o plac uor overclock-abil. De multe ori, productorii reduc artificial frecvena celor dou componente pentru a nu afecta vnzrile modelelor mai scumpe, sau pur i simplu pentru c chipul respectiv nu a rezistat la frecvenele fratelui su mai mare dar poate rezista unei frecvene superioare celei la care este marcat. S lum ca exemplu chip-ul GeForce3 Ti200, cel mai lent chip din seria GeForce3. Frecvena GPU-ului este de 175 MHz fa de 240 pentru modelul superior bazat pe aceeai arhitectur i produs n aceeai perioad, GeForce3 Ti500. Practica a demonstrat c n majoritatea cazurilor ambele chipuri suport o frecven maxim de circa 250-260 MHz din simplul fapt c procedeul de fabricaie este identic; ns sunt cunoscute situaii n care un Ti200 nu a suportat nici mcar frecvena lui Ti500, adic 240 MHz, fapt ce explic marcarea sa ca Ti200. Dar poate c el ruleaz perfect la 235 MHz, i din start putem spune c s-au pierdut 60 MHz, ce se traduc poate prin 30-40% n performana real. Frecvena maxim a chip-ului depinde n mare msur de sistemul de rcire. Acesta este compus de obicei dintr-un radiator i un ventilator, ultimul putnd lipsi. Contactul dintre radiator i chip este realizat n cazul ideal prin pasta termoconductoare, ns muli productori ignor avantajul acesteia i folosesc un adeziv oarecare, slab conductor termic. n cazul memoriei, problema st cu totul altfel: fiecare productor i doteaz placa n funcie de model sau chiar de stocul de memorii disponibil la acel moment (acest ultim caz ntlnindu-se ndeosebi la productori de categoria a doua). Astfel, dac un Radeon 9550 beneficiaz din start de memorii ce ruleaz la 400 MHz, frecvena maxim ce poate fi atins poate varia de la model la model sau de la exemplar la exemplar, diferenele putnd fi foarte mari.
107

3.1

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

i comportamentul la overclocking difer fa de GPU. Dac n cazul acestuia din urm, o frecven prea mare duce de obicei la blocaje, o memorie va trece de regul mai nti prin stadiul de a prezenta artefacte vizuale, vizibile att n 2D ct mai ales n 3D, care culmineaz, ntr-adevr, cu blocaje. ns putem considera c un singur bit scris incorect n memoria plcii, ce genereaz astfel un pixel de o culoare incorect, reprezint o malfuncionalitate. Utilitarul Artifact Tester1 este destinat detectrii acestor artefacte, ns are dezavantajul de a rula n mod 2D, deci nu utilizeaz nici funciile 3D ale chip-ului grafic, nici ntreaga memorie video. n schimb, ATITool2 ofer informaii mult mai precise legate de prezena artefactelor, testul inclus fiind unul foarte riguros i relevant. Un set de radiatoare lipite pe memorii poate duce la scderea temperaturii i, cel puin teoretic, la un potenial de overclocking mai ridicat. Pe lng acest factor, dac avei n minte overclocking-ul la achiziionarea unei plci, ar fi bine s v interesai asupra timpului de acces al memoriei folosite, informaie ce ar trebui s apar n ofert sau n specificaiile produsului. Chiar i fr aceast informaie, n cazul n care memoriile nu sunt acoperite, de obicei avei posibilitatea s descifrai timpul de acces. n imaginea de alturi este reprezentat un astfel chip de memorie, iar din caracterele nscrise pe el se poate citi la urm valoarea de 3.6 ns, ce corespunde unei frecvene de aproximativ 275 MHz (550 MHz DDR). Formula de calcul este simpl: 1000/timp de acces=frecven, eventual nmulit 2 pentru c a afla valoarea efectiv, nu real. Aadar, un GeForce FX5500 sau un Radeon 9500 ar corespunde cel mai bine frecvenei, ns dac aceast memorie este prezent pe un Radeon 9550 (cu frecvena implicit de 400 MHz), rezult un produs cu un potenial de overclocking ridicat. Exist i situaia contrarie, cnd o plac este dotat cu memorii mai slabe dect ar trebui, fiind ntlnite de exemplu plci GeForce4 MX440 cu memorii de 6 (333 MHz) sau chiar 7 ns (286 MHz) n locul celor de 5 ns (400 MHz), rezultnd frecvene inferioare specificaiilor. Inutil de menionat c plcile respective nu respect specificaiile NVIDIA i performana lor este mult redus. Nu trebuie uitat un aspect important: latenele memoriilor. Ca i n cazul modulelor obinuite de memorie, nu doar frecvena conteaz ci i timing-urile. Avem o serie ntreag de posibiliti, ce includ att setrile clasice (CAS Latency, TRP, TRCD, TRAS) ct i altele mai puin obinuite. Utilitarele ATITool (pentru ATI), RaBiT3 (pentru ATI) i NiBiTor4 (pentru NVIDIA) permit ajustarea acestora n mod real-time, ultimele dou chiar i permanent, prin rescrierea BIOS-ului plcii. Pot exista cazuri n care o frecvene redus combinat cu nite latene mai mari ofer mai mult performan dect situaia contrarie. Cine are timp i rbdare, poate testa combinaia optim pentru placa sa. Trebuie inut cont c rescrierea BIOS-ului plcii poate anula garania acesteia, pe lng riscurile de rigoare (de multe ori, nici scrierea unui BIOS editat ca la carte nu garanteaz funcionarea ulterioar a plcii cu acel BIOS). O situaie mai rar ntlnit dar mult mai spectaculoas o reprezint setarea de ctre productorul plcii a unor frecvene peste cele recomandate de productorul chipului. De exemplu, n loc de 250 MHz core i 400 MHz memoria, Abit a setat frecvenele lui Radeon R9550 XTurbo-Guru la 300/500 MHz, oferind astfel un
1 2

http://www.xf.ro/downloads/ArtifactTester2.zip http://www.techpowerup.com/atitool/ 3 http://downloads.guru3d.com/download.php?det=872 4 http://www.mvktech.net/component/option,com_remository/Itemid,26/func,selectfolder/cat,92/ 108

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

overclocking din start. Dar i un produs standard poate atinge aceste frecvene, astfel c se poate pune ntrebarea: Ce rost are s dau mai muli bani pe o plac overclock-at din fabric dac pot face acelai lucru i singur?. Rspunsul const att n garantarea de ctre productor a frecvenelor respective, ct i nzestrarea plcii (uneori) cu o rcire mai bun i/sau cu memorii mai rapide. n exemplul nostru, placa atinge frecvene de peste 450 MHz pentru chip i de peste 700 MHz n cazul memoriei, cele mai multe plci din aceeai familie eund. De asemenea, unii fabricani reproiecteaz arhitectura plcii folosind un design propriu sau unul mprumutat de la alte modele. De exemplu, plcile Albatron GeForce4 Ti4200 din seria Turbo sunt construite pe baza design-ului plcilor Ti4400 i Ti4600, pe 8 straturi fa de 6, oferind cel puin n teorie un potenial de overclocking mai ridicat. Ce mi trebuie pentru overclocking? Simplu! ar spune unii. Setez din programul de overclocking frecvenele maxime la care totul merge ok i cu asta basta. Lucrurile nu stau chiar aa... Dac avem un sistem de rcire precar, nu avem nici o ans n overclocking. Elementele eseniale pentru o rcire bun sunt, n ordine: eficiena radiatorului, eficiena ventilatorului, prezena radiatoarelor pe memorii i , contactul dintre radiator/radiatoare i chip/chip-uri. Acesta din urm trebuie s fie realizat cu ajutorul unei paste termoconductoare; dac dorii s aflai dac productorul v-a rsfat cu o substan de contact de calitate, trebuie s desfacei sistemul de rcire al chip-ului, riscnd astfel s pierdei garania. Mai mult, GPU-urile moderne dein o pastil similar procesoarelor Athlon XP, ea riscnd s se ciobeasc. Trebuie, aadar, avut foarte mult grij, o pastil ciobit nseamn de foarte multe ori o plac grafic defect. Totui, dac ai desfcut sistemul de rcire i nu suntei mulumit de el, curai cu grij urmele vechiului adeziv i aplicai cu grij pasta de bun calitate (de exemplu Arctic Silver 5), nici prea mult dar nici prea puin, avnd grij ca ea s acopere ntreaga pastil sau ntregul chip n caz c nu avem de-a face cu o pastil. Clemele de prindere trebuie s exercite o presiune mare (dar nu exagerat) asupra chip-ului, mai ales dac suntem n cazul pastilei. Aadar, dac ele slbesc peste msur datorit manipulrii neglijente, exist anse chiar s ardei placa! n cazul memoriilor, dac ele sunt dotate cu radiatoare, problema este mai complicat. Ele nu au, de obicei, un sistem de prindere bazat pe uruburi i n lipsa acestuia au nevoie de un adeziv puternic pentru a rmne lipite pentru o bun perioad de timp. n plus, importana rcirii memoriilor este mai redus, deci putei s le lsai linitit n pace. n schimb, dac dorii ataarea unor radiatoare, trebuie aplicat o substan termoadeziv, care joac att rol de past termoconductoare ct i de adeziv. Ventilatorul poate fi sau poate deveni, dup o perioad de uzur, zgomotos i ineficient. nlocuirea lui nu este deosebit de dificil, trebuie doar s gsii unul care s se potriveasc din punct de vedere al dimensiunilor. Putei merge mai departe i s schimbai ntreg sistemul de rcire cu unul pasiv, un exemplu fiind produsele Thermaltake, dar n acest caz va trebui s renunai cel puin parial la overclocking.
109

3.2

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

Procedura de realizare a overclocking-ului Este necesar cel puin un utilitar care ori s activeze opiunile existente n drivere cu privire la acest aspect (dar ascunse din motive lesne de imaginat), ori s realizeze el nsui overclocking-ul. Pentru plcile NVIDIA, ultimele drivere ForceWare ne vin n ajutor, ele deinnd (dup deblocarea opiunii n cauz, de exemplu prin intermediul lui NVTweak5) o funcie de overclocking automat. Alte utilitare bune sunt PowerStrip6 (ce are avantajul recunoaterii unui numr foarte mare de plci), RivaTuner7, iar pentru plcile ATI s-au impus RadLinker i ATITool. O funcie deosebit a acestuia din urm este posibilitatea testrii apariiei artefactelor n mod 3D, pe lng prezena funciei de overclocking automat. De asemenea, ATITool permite setarea timing-urilor memoriei.

3.3

Dup ce ne-am hotrt asupra soft-ului, urmeaz s cretem cele dou frecvene progresiv, cu cte 5, 10 MHz sau chiar mai mult, dup bunul plac. De remarcat c memoriile plcilor din ziua de azi sunt de obicei DDR, deci avem dou frecvene, cea real i cea efectiv - de dou ori mai mare. La plcile cu chip-uri NVIDIA, referirea se face de obicei prin cea efectiv, la plcile Radeon invers. Unele soft-uri de overclocking nu permit dect o plaj de frecvene bine determinat. Uneori, ele pot fi pclite pentru a afia mai mult, alteori nu, fiind vorba pn la urm de o protecie - dup cum bine spunea cineva - anti-prost. ns tendina este de a se elimina aceste limitri; de exemplu, RadLinker nu manifest deloc problema, singura limitare fiind cea hardware, dar ea este de obicei de ordinul miilor de MHz, de departe imposibil de atins n practic. Impedimente posibile: n primul rnd, unele plci ATI sunt protejate la overclocking. Mai exact, plcile cu chip-uri precum Radeon 9000, 9200, 9500, 9550, 9600 sau 9700 nu permit realizarea overclocking-ului, driverele blocnd aceast practic. Motivele sunt evidente: chip-urile enumerate au un potenial de overclocking foarte ridicat, fiind variantele cele mai lente din serie i productorul canadian s-a temut c acest lucru ar putea afecta vnzrile suratelor mai rapide (de obicei marcate cu sufixul Pro). Soluii exist din plin. Cea mai hardcore este rescrierea BIOS-ului cu unul modificat special n acest sens. Cea mai normal dar mai sigur este folosirea unor drivere modificate (precum sunt cele Omega sau cele soft-modded8, care nu difer de cele originale dect prin absena proteciei sus-amintite). De asemenea, sunt disponibile patch-uri anti-protecie, precum cel livrat de RivaTuner sau cel inclus n ATITool. RivaTuner permite dou metode, una presupunnd modificarea driverelor (ceea ce presupune recunoaterea de ctre utilitar a driverului - cele mai noi versiuni de Catalyst
5 6

http://downloads.guru3d.com/download.php?det=911 http://www.entechtaiwan.net/util/ps.shtm 7 http://www.guru3d.com/index.php?page=rivatuner 8 http://www.techpowerup.com/softmod/downloads.php 110

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

s-ar putea s nu fie recunoscute), iar cealalt modificnd o locaie de memorie n care este stocat informaia despre protecie. ATITool deine i el o funcie n acest sens, aa cum se poate vedea n imagine.

111

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

3.4

Cnd i cum apar artefactele? n domeniul overclocking-ului, totul trebuie n primul rnd gndit. E drept, nu totul este logic (cel puin conform standardelor noastre ale logicii), de aceea pe lng a gndi trebuie s existe i a experimenta. Pe ct posibil fr aciuni ireversibile, care s ne goleasc buzunarele sau s ne pun n valoare talentul de convingere a vnztorului c nu eu sunt de vin!!!. Artefactele sunt elemente parazite de imagine, care o deterioreaz progresiv odat cu creterea frecvenei sau (n mai mic msur) a temperaturii. Practic, este vorba de rateuri ale unor operaii, similare celor petrecute n cazul procesorului sau a memoriei sistemului. Dac n cazul memoriei de sistem un bit greit transform (de cele mai multe ori) o instruciune n alta, urmnd o avalan de rezultate false care culmineaz rapid cu blocri, memoria video nu reine instruciuni ci informaii grafice (de exemplu culorile pixelilor). Memoria grafic este scris atunci cnd este nevoie. n caz contrar, ea pstreaz informaiile scrise anterior n aceasta. E drept c memoria, ca orice memorie de tip DRAM, trebuie remprosptat periodic, dar practica a demonstrat c o operaie de scriere de informaii noi ntr-o memorie care nu funcioneaz corect produce mult mai multe erori dect o operaie de remprosptare a informaiilor deja existente. n imagine de mai jos avem o plac grafic a crei memorie tocmai a fost supus unui overclocking dur, ea rulnd n mod implicit la 200 MHz i oferind un potenial de overclocking de 250 MHz. Ei bine, am setat 350 MHz, drept pentru care am fost ntmpinai de efectele care s vd. Fereastra utilitarului ATITool am micat-o puternic, memoria plcii necesitnd o rescriere repetat. Cu ct micam mai mult fereastra, cu att artefactele creteau - e normal, o imagine corupt e corupt din nou i din nou... Cealalt fereastr nu a fost clintit din loc, artefactele fiind astfel mult mai puine. Concluzia care trebuie tras este c o prim verificare a rezultatului unui overclocking este micarea puternic a unei ferestre. O rezoluie de 1024x768 de pixeli cu adncimea de culoare de 32 de bii ocup 3 MB de memorie video, aceasta pentru c fiecare pixel al imaginii pe care o avei acum n fa trebuie stocat n memoria plcii grafice. Cum avem 1024x768, adic 786432 de pixeli, nmulim aceast valoare cu numrul de bytes necesari pentru memorarea unui pixel, adic 32/8=4 bytes, rezultnd exact 3 MB. Acum, apelnd la aceeai logic intuitiv, putem s ne dm seama c nu toat memoria unei plci este la fel de rezistent la overclocking. Anumite chip-uri care o alctuiesc pot fi mai sensibile sau numai anumii tranzistori dintr-un chip pot ceda. De aceea, este clar c cei 3 MB pe care i privim n mod obinuit nu pot garanta funcionarea corect a memoriei la o anumit frecven, orict de mult am agita ferestrele. Aadar, este cazul s cretem rezoluia. Cea mai mare valoare ce poat fi atins cu monitoarele obinuite este de 2048x1536, acum
112

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

avnd ocupai 12 MB. Total insuficieni, dar nu stric o ncercare nainte de a trece la pasul urmtor.

Att Artifact Tester ct mai ales ATITool pot detecta erorile ce apar datorit overclocking-ului. ns nici un soft nu poate nlocui testele de ore sau zile petrecute n compania jocurilor preferate, mai ales c respectivele utilitare folosesc o zon mic de memorie pe care o testeaz. Pentru a afla ct mai exact frecvena maxim de funcionare, trebuie s facem n aa fel nct toat memoria, sau cea mai mare parte din ea, s fie ocupat. Vom seta att o rezoluie mare ct i o setare ct mai nalt de FSAA. Dac placa este suficient de lent pentru a nu putea randa jocuri sau teste noi, vom folosi teste/jocuri mai vechi, mergnd pn la a rula 3DMark 2000 sau Quake3 n 1600x1200 cu FSAA maxim sau, dac se poate, 2048x1536. De asemenea, nivelul de detalii al texturilor reglabil din joc are un rol esenial n ocuparea unei cantiti mai mari de memorie video. Nu ne rmne dect s petrecem ceva timp n jocuri sau, dac avem rbdare, cu ochii zgii n
113

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

3DMark i s cutm artefacte. De cele mai multe ori, dac dup 10 minute de teste nu am gsit nimic, este destul de probabil s nu gsim niciodat. nc un aspect important: deseori, la plcile mai fierbini, dac alegem o frecven mare la care avem probleme, dup care o coborm, e posibil s avem n acest caz false probleme datorate ineriei termice. Aadar, va trebui s lsm placa la frecvene mici pentru a se rci, eventual vom face o pauz de cafea i ne vom uita la telenovela preferat n timp ce calculatorul st nchis. Lucru valabil i pentru overclocking-ul GPU-ului. De asemenea, sunt cazuri n care un overclocking prea dur la memorie duce la persistena artefactelor pn la urmtorul restart, eventual pn la urmtoarea nchidere/deschidere a sistemului. n cazuri extreme, apar i blocaje. Nu trebuie reacionat nici n sens invers: o frecven prea redus (setat temporar pentru rcire sau pentru c pur i simplu nu avem nevoie de 3D i ne dorim o plac rece) poate genera artefacte, blocaje sau alte probleme. n general, o valoare minim sigur este cea de 150 MHz (300 MHz DDR), sub care pot aprea (n caz c stabilitatea se menine) scderi de performan n lucrul 2D! S exemplificm. Iat nite artefacte uoare (civa pixeli de pe cer colorai eronat) obinute cu aceeai memorie ca n testul anterior (200 MHz implicit, 250 MHz maxim), setate la 310 MHz.

Odat cu creterea rezoluiei i cu setarea FSAA, artefactele au crescut n intensitate, rezultnd aceast imagine

114

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

n care doar partea de sus a fost randat corect. Probabil nite bii cheie (n funcie de care se decidea randarea complet a scenei) au fost distrui, rezultnd aberaia n cauz. De subliniat c aceste imagini sunt nite instantanee, urmtorul cadru fiind afiat corect sau cu alte erori de imagine, memoria video refiind umplut cu informaie i ali bii fiind nregistrai greit. Mergnd pn la capt (prin setarea frecvenei de 350 MHz), am obinut un talme-balme total.

115

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

Nu trebuie omis faptul c anumite drivere cauzeaz n unele jocuri fenomene asemntoare cu artefactele, de cele mai multe ori fiind vorba de texturi ce par s lipseasc din locul n care ar trebui s se afle sau de iluminri incorecte. Uneori problemele in de joc i nu de driverul plcii grafice, alteori chiar i driverele plcii de baz joac un rol. Iat cum arat textura podelei din Unreal Tournament pe unele plci ATI cu ultimele drivere Catalyst dac jocul este setat s ruleze prin OpenGL.

Din alte unghiuri, ea este vzut corect, fr acele pete. Motivul este incompatibilitatea dintre ultimele drivere i un joc aprut cu muli ani n urm, ce folosete experimental modul OpenGL. Dup cum am mai spus, att GPU-ul ct i memoria pot genera artefacte, aadar cum ne dm seama cine e de vin? O prim regul, la fel de empiric precum toate din acest capitol, spune c n 99% din situaii artefactele apar de la memorie, GPU-ul genernd n primul rnd blocaje. Graie lui VPU Recover, plcile ATI beneficiaz de posibilitatea ca n momentul apariiei unei erori s fie repuse frecvenele implicite, neexistnd nici un blocaj complet. Aceasta n teorie. i n cazul plcilor NVIDIA, de multe ori apsarea Ctrl+Alt+Del dezghea core-ul plcii, dnd o ans recuperrii sesiunii curente de Windows. Iat, totui, nite artefacte generate de GPU.

116

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

Observm cei doi muni triunghiulari care nu au ce cuta n scen. Spre deosebire de artefactele de memorie, ei nu au fost nite instantanee ci au rmas n scen pn cnd au ieit din cadru, fiind tratai ca nite obiecte reale ale scenei. Chip-ul grafic i-a inventat din cauza unei erori cauzate de frecvenele prea ridicate. Un test foarte stresant pentru GPU este Wings of Fury din 3DMark03. Dei bazat doar pe DirectX 7, el solicit la maxim chip-ul grafic, fiind primul test de stabilitate care trebuie luat n seam (pe lng, poate testul de scanare a artefactelor oferit de ATITool, dar care funcioneaz doar pe anumite plci). Dup toate setrile efectuate, nu stric lsat o noapte ntreag un test precum 3DMark n modul loop. Dac diminea gsii demo-ul rulnd fr probleme, se poate spune c overclocking-ul a reuit.

117

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

4 Evaluarea display-urilor
4.1 Generaliti n plin er a dezvoltrii tehnologiei informaiei, persoana care dorete s "in pasul" cu vremurile trebuie s se "echipeze" cu cel puin un televizor, daca nu chiar un computer i o legtura la Internet. Pe de alt parte, se spune c o imagine face ct o mie de cuvinte. Nimic mai adevrat. Este dovedit faptul c informaia se reine cel mai bine atunci cnd o receptm vizual. Vom aborda n acest seminar noile tehnologii i tendine ce se manifest n privina display-urilor, n domeniul tehnologiei informaiei. Nu ne vom referi la toate dispozitivele de afiare a informaiilor existente peste tot n jurul nostru, chiar dac tim sau nu s interpretm ceea ce ne "spun" (afiajele electro-mecanice de la autobuze care indic linia, display-urile ncorporate n aparatura medical etc.). Ne vom limita la categoria ecranelor de tip "flat panel", care vor revoluiona n viitorul deloc ndeprtat viaa oamenilor. Este destul de greu s oferim o definiie riguroas pentru display-urile de tip "flat panel", dar nu cred c exist vreo persoan care s nu fi vzut mcar o dat n via un astfel de ecran. Iniial, acestea au fost proiectate pentru utilizarea n cadrul laptopurilor, dar caracteristicile i avantajele lor le-au propulsat n faa ecranelor clasice cu tub catodic (CRT - Cathode Ray Tube). Ecranele de tip "flat panel" cuprind o varietate larg de tipuri constructive i tehnologice. Clasificndu-le dup tipul de refresh pe care l necesit, avem: Display-uri cu refresh continuu: LCD (Liquid Crystal Display) Plasma DLP (Digital Light Processing) LCOS (Liquid Crystal On Silicon) OLED (Organic Light-Emitting Diode) ED (Surface-conduction Electron-emitter Display) FED (Field Emission Display) NED (Nano-Emissive Display) Display-uri bistabile (hrtie electronic): e-ink Gyricon Magink

Dintre toate tipurile de display-uri "flat-panel" enumerate sunt disponibile comercial doar ecranele cu plasm, LCD, DLP, LCOS i OLED. n 2006 se atepta lansarea pe pia a display-urilor SED. Ecranele FED i NED sunt doar n faza de prototip, ncepnd cu luna noiembrie 2005. Vom trece n continuare n revist cteva detalii despre fiecare dintre aceste tehnologii..
118

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

PLASMA Un display cu plasm este un ecran flat-panel n care lumina este creat de particule fosforescente care sunt excitate de o descrcare de plasm ntre dou suprafee plate de sticl. Descrcarea gazoas conine un amestec total inofensiv de neon i xenon. Totui, ce reprezint aceasta "plasm"? Elementul central dintr-o lumin fluorescent este plasma, un gaz alctuit din ioni i electroni care "plutesc" liber. n condiii normale, gazul este alctuit n principal din particule nencrcate cu vreo sarcin. Dac se aplic un curent electric prin aceast plasm, particulele ncrcate negativ sunt atrase de partea ncrcat pozitiv a plasmei i invers. n aceast nvlmeal, particulele se ciocnesc n mod constant unele de altele, fapt ce determin excitarea atomilor de gaz din plasm. Astfel, se elibereaz fotoni de energie n spaiu, lund natere lumina fluorescent. Display-urile de acest tip au fost lansate pe pia pentru prima data n 1997 de compania Pioneer i au ajuns s fie preferate n momentul de fa n cadrul televiziunii de nalt definiie (HDTV). Trebuie spus ca un display cu plasm consum la fel de mult curent electric ca i unul cu tub catodic, raportat la aceeai suprafa a ecranului. Deocamdat, ns, preul este destul de restrictiv, dar aa cum se ntmpl n industria IT, progresul tehnologic aduce cu sine i reducerea preurilor, astfel c este foarte posibil ca display-urile cu plasm s nlocuiasc vechile ecrane cu tuburi catodice. Oled Un display OLED funcioneaz pe baza principiului electroluminiscenei. Elementul de baz al unui afiaj OLED este luminoforul organic, care determin aproape toi parametrii pixelului de pe ecran. Nu vom intra n amnunte constructive. Pe piaa din Romnia, ecranele OLED se ntlnesc n cazul unor MP3-playere (ex.: Apple iPod, Philips) i a unor modele de telefoane mobile (ex.: Samsung). Dlp Digital Light Processing este o tehnologie dezvoltat de compania Texas Instruments, acesta fiind n continuare singurul productor al acestor ecrane. Un display DLP se compune, n principal, dintr-o surs de lumina alb, un cip DMD, o lentil de proiecie i ecranul propriu-zis. Imaginea este creat de mici oglinzi microscopice dispuse ntr-o matrice pe un cip din material semiconductor, cunoscut i sub numele de Digital Micromirror Device (DMD). Fiecare oglind reprezint un pixel din imaginea reconstituit. Oglinzile se pot poziiona n dou feluri: atunci cnd sunt "oprite", ele sunt aliniate la orizontal i determin apariia pixelilor negri pe ecran. ns, cnd cineva pornete sistemul, oglinzile ncep s se mite nainte i napoi de cteva mii de ori pe secund. Ele reflect lumina printr-o lentil de proiecie direct pe ecran. Cu ct o oglind este mai mult pe poziia de "pornit", cu att pixelul va fi mai luminos. Acesta este mecanismul de creare a nuanelor de gri. Culoarea este adugat prin intermediul unei "roti de culoare" (color wheel), care este de fapt o roat transparent cu segmente roii, verzi i albastre (RGB) care se nvrtete. Lumina care trece prin fiecare seciune i schimb culoarea n mod corespunztor. Procesorul sistemului sincronizeaz roata de culoare cu oglinzile. Fiecare pixel de lumin de pe ecran este rou, verde sau albastru la orice moment de timp. Tehnologia se bazeaz pe capabilitatea ochiului uman de a amesteca culorile pixelilor pentru a forma culoarea corespunztoare imaginii. De exemplu, pentru un
119

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

galben, DMD va reflecta lumina de la segmentele roii i cele verzi ale roii de culoare, ignornd segmentul albastru. Astfel, un display DLP este capabil sa "creeze" 16 milioane de culori. O bil neagr pentru aceasta tehnologie este efectul de curcubeu, care apare tocmai datorit mecanismului vizual de amestecare a culorilor. Desigur, intensitatea acestuia variaz de la om la om, pentru eliminarea lui folosindu-se roi de culoare care se rotesc cu viteze mai mari i cu mai multe segmente colorate. Trebuie spus c exista i display-uri DLP care folosesc trei surse de lumin, colorate fiecare n cate una dintre culorile de baza: R (rosu), G (verde) i B (albastru). Se elimin astfel roata de culori i efectul de curcubeu i se creste calitatea imaginii. LCOS Liquid Crystal on Silicon este o tehnologie "micro-display" aplicat n general n cazul televizoarelor cu proiecie. Este asemntoare cu tehnologia reflectiv folosita n cazul DLP i folosete cristale lichide n locul oglinzilor individuale. Micarea oglinzilor este nlocuit n acest caz cu starea de polarizare a cristalelor lichide. Acestea i schimb orientarea la aplicarea unui curent electric, permind reflectarea luminii sau blocnd-o. Un microdispozitiv LCOS este alctuit din mai multe straturi, dintre care unul reflectiv i, deasupra, un strat de cristale lichide. Funcionare: pe scurt, lumina alb emis de surs este trecut printr-o lentil de condensare care o focalizeaz i o direcioneaz spre un separator, care transform raza de lumin alb n trei raze corespunztoare celor trei culori principale: rou, verde i albastru. Apoi, aceste raze vin n contact cu cele trei microdispozitive LCOS. Lumina reflectat de acestea este trecut printr-o prism care combin cele trei culori, aceasta direcionnd i raza printr-o lentil de proiecie, care mrete imaginea i o afieaz pe ecran. Cteva dintre dezavantajele acestor sisteme includ: - lipsa capabilitii de producere a culorii negre, ceea ce duce automat la un contrast sczut, precum i dimensiunile destul de mari n comparaie cu ecranele LCD sau cele cu plasm. Totui, problema efectului de curcubeu din cazul DLP a fost rezolvat la display-urile LCOS. Pe plan local, acest tip de display a nceput s ptrund timid, productorul reprezentat n Romnia cel mai bine fiind Canon. SED Surface-conduction Electron-emitter Display este o tehnologie de afiare "flat panel" care folosete emitori de electroni de conducie superficial pentru fiecare pixel. Acetia emit electroni care excit un strat de fosfor de pe panoul de afiaj, acelai principiu de baz prezent i n cazul ecranelor cu tuburi catodice. Aceasta presupune c display-urile SED vor combina aspectul i dimensiunile ecranelor LCD cu ratele mari de contrast, refresh-ul i calitatea superioar a imaginii ntlnite la CRT-uri. Toshiba i Canon au anunat un acord de colaborare avnd ca scop producia n scop comercial a display-urilor SED pn la sfritul anului 2005, dar se pare c primele ecrane SED vor fi disponibile totui din 2006. FED Field Emission Display este un tip de display "flat panel" care folosete straturi de fosfor ca medii de emisie. Inventatorul acestei tehnologii este indianul Harjinder Kamboja. Foarte similare cu CRT-urile, FED-urile au ns doar civa milimetri grosime, iar n locul folosirii unui singur tun de electroni, ele utilizeaz o reea de
120

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

vrfuri metalice fine, denumite i nanotuburi de carbon, care sunt cele mai eficiente emitoare de electroni cunoscute vreodat). NED Nano-Emissive Display are la baz tot principiul tubului catodic. Prototipul testat public de Motorola n 2005 este un tub catodic subire i plat cu mii de tunuri de electroni la fiecare pixel. Prototipul poate reda toate culorile spectrului, are o luminozitate puternic i se ncadreaz cu uniformitatea i puritatea culorilor n standardele unui produs comercial. Punctul cheie este abilitatea celor de la Motorola de a "produce" nanotuburi de carbon direct pe substratul de sticl al ecranului. n trecut, aceste nanotuburi erau lipite sau imprimate pe o suprafa, dar calitatea afiajului era dezamgitoare. Hrtia electronic Fr ndoial, aceasta este cea mai spectaculoas tehnologie care a aprut n ultimii ani i care este, n momentul de fa, disponibil pe pia. Cine s-ar fi gndit acum muli ani c vom putea folosi hrtia ca un ecran? Ei bine, prima ncercare dateaz nc din anii '70 i a fost realizat de specialitii de la centrul de cercetare Xerox din Palo Alto. n anii '90 i alte companii au mbriat aceasta tehnologie, dezvoltnd-o pentru scopurile proprii. Sony a anunat de curnd disponibilitatea pe piaa a modelului Sony Reader, un succesor al lui LIBRIe, care folosete tehnologie de hrtie electronic dezvoltat de Philips. Cerneala electronic (cunoscut i sub denumirea de e-ink, hrtie electronic sau e-paper) este o tehnologie de afiare proiectat s "imite" cerneala obinuita pe hrtie. Spre deosebire de ecranele "flat panel" care folosesc o surs de lumin pentru a ilumina pixelii, hrtia electronic reflect lumina ca o hrtie obinuita i este capabil s stocheze text i imagini un timp indefinit fr s consume electricitate sau s foloseasc putere de procesare. Acestea sunt necesare doar pentru a schimba sau a terge imaginea. Hrtia electronic este, de asemenea, mai uoar, mai durabil i mult mai flexibil dect alte tehnologii de afiare. i datorit faptului c reflect lumina, ea poate fi citit din orice unghi. Aplicaiile n care se va dovedi cu siguran util includ crile electronice, capabile s stocheze versiuni digitale ale multor opere, cu o singur carte afiat pe pagini la un moment dat. Posterele electronice i materialele publicitare n magazine i pe drumuri au fost deja demonstrate. Avantajele ecranelor flat-panel fata de cele cu tub catodic: dimensiuni mai mici; luminozitate mai bun; forma plat a ecranului ce elimin distorsiunile (dei exist i ecrane CRT plate); consum redus de energie. Avantajele i dezavantajele display-urilor OLED AVANTAJE: straturile organice i de plastic ale unui OLED sunt mai subiri, mai uoare i mai flexibile dect straturile cristaline dintr-un LED sau LCD; substratul unui dispozitiv OLED poate fi flexibil; display-urile OLED sunt mai luminoase dect cele LCD datorit faptului c suportul de sticl necesar acestora din urm absoarbe o oarecare cantitate de lumin;
121

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

nu este necesar o iluminare din spate a ecranului, elementele OLED genernd ele nsele lumina; fabricarea ecranelor OLED este mai uoar, chiar i n mrimi mari; unghiuri de vizualizare foarte bune, de aproximativ 170 de grade. DEZAVANTAJE: durata de viata a elementelor albastre OLED este n acest moment de numai 1.000 de ore, ceea ce este mult prea puin pentru cerinele actuale; procesul de fabricaie este nc destul de costisitor; apa constituie un pericol pentru ecranele OLED, pentru c le afecteaz funcionalitatea. Avantajele i dezavantajele ecranelor DLP AVANTAJE: imagini clare, lipsite de jitter (interferene); adncime a culorii bun; grosime mai mic dect a ecranelor CRT; sursa de lumin poate fi schimbat, fapt ce duce la o durat de via mai mare dect n cazul CRT sau a Plasmelor. DEZAVANTAJE: efectul de curcubeu; grosime mai mare dect n cazul LCD sau a ecranelor cu plasm; zgomotul ventilatorului de rcire.

4.2

Testarea Diplay-urilor TFT LCD Ecranele cu cristale lichide normale, precum cele ntlnite n cazul calculatoarelor de buzunar, conin elemente de imagine separate - se poate aplica o tensiune peste un segment fr a interfera cu celelalte segmente ale ecranului. Aceast soluie nu este practic pentru un display de dimensiuni mari (cu muli pixeli), pentru c necesit milioane de conexiuni - cte dou pentru fiecare culoare primar (rou, verde i albastru) a fiecrui pixel Pentru a rezolva aceast problem, pixelii sunt adresai pe linii i coloane, fapt ce reduce numrul de conexiuni pn la ordinul miilor. Dac pe toi pixelii de pe un rnd este aplicat o tensiune pozitiv i dac pe toi pixelii de pe o coloan este aplicat o tensiune negativ, atunci pixelul de la intersecia liniei cu coloana are cea mai mare tensiune aplicat i este activat. ns i aici exist o problem - toi pixelii de pe aceeai coloana i de pe aceeai linie sunt 'excitai" cu o fraciune din tensiunea aplicat, astfel nct nu sunt activai complet li tind sp fie mai puin luminoi. S-a ajuns astfel la soluia aplicrii unui tranzistor fiecrui pixel, care permite controlul individual. Fiecare pixel este un mic condensator cu un strat transparent de oxid n fa, un strat transparent n spate i un strat izolator de cristale lichide ntre acestea. Layout-ul circuitului este foarte similar aceluia folosit n cazul memoriei DRAM, dar toat structura este realizat pe sticl.
122

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

Datorit costului imens al fabricilor TFT, numrul productorilor de astfel de ecrane nu este prea mare. Toate tipurile de monitoare TFT moderne sunt "ludate" cu parametri foarte buni, ns metodele de msurare permit productorilor s-i prezinte produsul n cea mai bun lumin. Numeroasele convenii i simplificri introduse n procesul de evaluare au un rol crucial de multe ori. Dup cum vom observa, concluzia testelor este clar - nu exist un monitor LCD "all-purpose" (care poate fi folosit cu succes n orice mprejurare). n timp ce monitoarele CRT de nalt calitate pot fi utilizate pentru jocuri, aplicaii office i procesare de imagini, display-urile LCD sunt de obicei specializate pe cte una dintre aplicaiile enumerate. 4.2.1 Procedura de testare a monitoarelor LCD Testul de monitoare LCD se desfoar dup o metodologie n care se urmrete testarea efectiv a aspectelor cele mai importante funcionale ale unui astfel de dispozitiv. Per ansamblu, s-au punctat trei lucruri: testul propriu propriu-zis de calitate a imaginii (60%), caracteristicile tehnice (30%) i, ergonomia (10%), Din adunarea acestor note (cu ponderile corespunztoare) obinndu-se scorul final. Astfel, orice persoan care i-a stabilit prioritile cu privire la un monitor LCD (aspectele care conteaz mai mult) se poate ghida dup acestea, aprecierea din aceast lucrare fiind una global. De exemplu, dac pe cineva nu-l intereseaz capitolul ergonomie, poate s verifice scorurile de la primele doua categorii i s decid modelul pe care eventual dorete s-l achiziioneze. Calitatea imaginii a fost apreciat folosind programele Nokia Monitor Test 2.0 i Monitor Test 2.2, dar i un trailer al unui film cunoscut, pentru a putea vedea comportarea monitoarelor n cazul secvenelor video foarte dinamice i claritatea acestora. Aspectele punctate au fost: existena i intensitatea efectului de Moire (apariia unor interferene suprtoare n cazul dungilor foarte subiri sau a caroiajelor foarte fine) la aplicarea din program a unor modele cu dungi subiri verticale i orizontale; existena unor defecte de convergen a ecranului atunci cnd se aplic diverse mire de verificare; persistenta pixelilor - se poate aprecia aproximativ timpul de reacie al monitorului la micarea unor ptrate albe pe fond negru cu diferite viteze; claritatea imaginii - un monitor TFT ar trebui s ofere o imagine foarte clar n aproape orice condiii; existena efectului de zooming - semnific micarea spre margine a unui cadru alb pe fond negru la aplicarea unui fond alb n interiorul cadrului; interferenele care apar i intensitatea lor - acestea sunt cauzate de sensibilitatea monitorului la radiaiile electromagnetice din exterior.

123

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

Caracteristicile tehnice punctate au fost: timpul de rspuns al monitorului, care este definit ca fiind timpul de aprindere i de stingere al unui pixel de la negru la alb i napoi la negru. Acest timp este foarte important, el determinnd n mare msura comportarea monitorului n diverse aplicaii; rata de contrast a monitorului - exprim n ce msur un obiect poate fi distins fa de un alt obiect din fundal; cu ct contrastul este mai mare, cu att imaginea va fi mai clar luminozitatea fiecrui model de monitor - exprim nivelul de lumin emis de monitor i influeneaz, de asemenea, calitatea imaginii; unghiul de vizualizare - cu ct se apropie de valoarea de 180 de grade, cu att este mai asemntor, din acest punct de vedere, cu monitoarele clasice CRT; certificarea internaional - exprim ce standarde de protecie mpotriva radiaiilor respect fiecare monitor; s-au luat n calcul doar standardele TCO; conectivitatea - n ziua de astzi, un simplu conector VGA analog (D-Sub) nu este de ajuns pentru a profita din plin de capabilitile de procesare a plcii video i de calitatea imaginii ce poate fi afiat de monitor.

ERGONOMIA n fine, acesta este un capitol din ce n ce mai important pentru unii utilizatori. Notarea aspectelor care in de ergonomie s-a fcut dup: posibilitatea ajustrii ecranului n nlime; posibilitatea pivotrii ecranului (rotire la 90 de grade sau chiar mai mult); posibilitatea rotirii suportului, pentru a crete gradul de confort al utilizatorului; dimensiuni i greutate. 4.2.2 Cum s alegem un monitor Dac v-ai hotrt s achiziionai un monitor, ar trebui s v gndii nainte cu ce tip de aplicaii l vei folosi. Dorii s v uitai mai mult la filme? Sau vrei s ncercai ultimele jocuri lansate? Lucrai mai mult la birou n aplicaii office? n funcie de rspunsurile la aceste ntrebri vei putea alege monitorul LCD potrivit pentru nevoile dv. Iat n continuare un mic "ndrumar". Dac filmele sunt preferatele casei i dorii s le vizionai n cel mai bun mod posibil, trebuie s v orientai dup monitoare LCD cu: diagonala mare - cel puin 19 inci (aproximativ 48 cm); timp de rspuns acceptabil - cel mult 12 ms; rata de contrast mare - cel puin 600:1; luminozitate mare - cel puin 330 cd/m2; eventual modul de tuner TV ncorporat - pentru a putea viziona i filmele transmise de posturile de televiziune; conectivitate ct mai variat, pentru a putea conecta eventual i camere foto digitale, camere video etc.; ergonomie bun - pentru a v fixa monitorul n poziia cea mai bun pentru dv. Ar trebui s se poat ajusta nlimea i s se roteasc suportul.

124

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

Pasionaii de jocuri PC ar trebui s se uite n primul rnd la monitoarele care au, orientativ, urmtoarele caracteristici: timp de rspuns mic - cel mult 8 ms; rata de contrast mare - cel puin 600:1; luminozitate mare - cel puin 330 cd/m2; certificare internaional ct mai bun - TCO 03. n fine, pentru cei care lucreaz mai mult cu aplicaii office i navigheaz pe Internet, recomandm monitoarele TFT cu: certificare internaional ct mai bun - TCO 03; porturi USB ncorporate (eventual), pentru un acces mai comod i mai rapid la diversele echipamente ce se pot conecta prin intermediul acestor porturi (camere foto, video, telefoane mobile, stick-uri de memorie etc.; ergonomie bun - pivotarea la 90 de grade este foarte util mai ales n cazul editoarelor de texte. Bineneles, este de la sine neles c toate aceste caracteristici trebuie s fie nsoite de o calitate ct mai bun a imaginii, aa ca atunci cnd l cumprai este bine s aruncai o privire comparativ asupra monitoarelor expuse n stand, dac acest lucru este posibil. Dac nu, mcar o privire individual asupra modelului la care v-ai hotrt.

125

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

5 Metodologia de realizare a overclocking-ului la procesoarele Intel


Introducere Overclockingul reprezint procedeul prin care o component hardware este forat s funcioneze peste parametrii dai de productor, de exemplu creterea frecvenei de tact procesorului fr ca acest lucru s duc la instabilitatea sistemului. Ca o parantez se poate spune c odat cu dezvoltarea tehnicii n domeniul semiconductorilor, productorii de procesoare blocheaz posibilitile utilizatorilor de a obine frecvene mai mari dect cele nscrise pe procesoare, motivele sunt multe dar se pare c cel mai important dintre ele ar fi diferena de pre care trebuie s se justifice prin calitile procesorului n special prin frecvena la care ruleaz acesta. Noiunea de overclock apare de fapt nc din procesul de producie al procesoarelor, prima treapta n fabricarea unui procesor este wafer-ul (un disc subire din siliciu) pe care se aplic structurile care determina configuraia viitoarelor procesoare, astfel c pe un asemenea wafer se delimiteaz mai multe chipuri a cror frecven nu se cunoate pn n momentul n care sunt separate, asamblate i testate. Dup cum v imaginai pe un wafer se afl procesoare care n ciudata faptului c au aceeai structur pot rula la frecvene diferite fr s duca la instabilitatea sistemului. n momentul n care acestea sunt testate se stabilete frecvena de lucru a fiecrui procesor astfel nct acesta s ruleze corect chiar i n condiii n care nu se asigur o rcire corespunztoare ori tensiunea de alimentare nu este stabil. Un asemenea procesor trebuie sa ruleze fr probleme minim 10 ani, din acest motiv productorii marcheaz frecventa la care chipul a funcionat bine n condiiile date mai sus. n aceste condiii concluzia este clar, chipurile nu sunt marcate cu frecvena maxim la care pot funciona fr probleme, se las un spaiu de siguran pentru ca acestea s funcioneze corect i n condiii extreme. n ultima vreme, overclock-ul este o practic tot mai des ntlnit, unii zic c deja a devenit un sport naional, i personal chiar cred acest lucru. Datorit acestui fapt, muli utilizatori doresc s-i overclockeze procesorul dar nu au suficiente cunotine n acest domeniu i din acest motiv apar foarte des topic-uri de genul "Overclock, little help?". ATENIE : Autorul acestui seminar nu se face responsabil pentru orice pagub, pierdere de date sau orice alte inconveniente produse sistemului dvs. folosind tehnicile prezentate aici. V mulumesc pentru nelegere. 5.2 FSB la Intel Spre deosebire de Athlon64, Intel a pstrat controllerul de memorie n cipset, nu n procesor, deci pentru cei obinuii cu vechea magistrala FSB am o veste bun: Intel a pstrat-o. Aceasta este o magistral care conecteaz procesorul de memorii prin intermediul northbridge-ului (n care se afl controllerul de memorie). Pentru a face un overclock bun la Intel, trebuie s nelegem cum este generat frecvena procesorului. Ea este obinut prin nmulirea frecvenei FSB-ului cu multiplicatorul procesorului. Frecventa FSB-ului este de 100Mhz la primele pentium4, apoi 133 la Northwood
126

5.1

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

(urmtoarea generaie de p4) i la unele Prescott-uri (n special Celeroan), de 200 la Prescott i la Core 2 Duo 4300 i de 266 la Core 2 Duo. Acum poate o s v ntrebai un lucru: Cum are Core 2 duo numai 266 c eu tiu c are 1066, i la fel i Prescott are 800Mhz?. Frecvena asta mic este frecvena real a FSB-ului, care este quad-pumped adic trimite date de 4 ori ntr-un ciclu de ceas i de aici frecvena efectiv este de 4 ori mai mare: 400 pentru fsb real de 100; 800 pentru fsb real de 200 i aa mai departe. La generarea frecvenei procesorului se nmulete frecvena real a FSB-ului nu cea efectiv. De ex: un Prescott la 3000Mhz are fsb real de 200Mhz i multiplicatorul de 15, astfel c 200*15=3000. Overclock-ul la Intel se face de cele mai multe ori prin ridicarea frecvenei FSB-ului, deoarece multiplicatorul este aproape ntotdeauna blocat din fabric. Practic tehnica de overclock la Intel este destul de simpl, paii care trebuie urmai fiind uori. n primul rnd, dac avei procesor Core 2 Duo dezactivai toate opiunile de la CPU, mai puin Execute Disable Bit. Frecvena FSB-ului se incrementeaz n pai mici (din 5 n 5 Mhz e bine) i de fiecare dat cnd ai urcat cte o treapt, salvai setarea, i testai stabilitatea sistemului cu programe speciale de benchmark, de ex: Prime95, StressPrime2004, Orthos, SuperPI, S&M. Din frecvena FSB-ului deriv i celelalte frecvene ale sistemului, cum ar fi cea a memoriilor (tratata mai jos), cea PCI, AGP, i PCI-Express. Dac placa de baz permite, frecvenele acestea trebuie blocate la valorile lor stock, altfel vei fi puternic limitat n overclock de ele. Valorile stock sunt urmatoarele: 33Mhz pt PCI, 66Mhz pt AGP, 100Mhz pt PCI-Express i tot 100Mhz i pt porturile SATA. Frecventa memoriilor, comarul divizorilor i al latentelor Aa cum am menionat mai sus, n momentul ridicrii frecvenei FSB-ului va crete i frecvena memoriilor. Diferena major dintre Intel i AMD64 este c la AMD64 frecvena procesorului se mprea cu un anumit divizor pentru a obine frecventa memoriilor, dar la Intel frecvena procesorului nu are nimic de-a face direct cu frecvena memoriilor, ci frecventa FSB este cea care determin frecvena memoriilor i divizorii (de fapt sunt nite raporturi) se aplica la FSB. De ex s lum un procesor cu FSB de 1066Mhz. Nu se lucreaz cu 1066 ci cu frecvena real adic 1066/4~266Mhz. Dac se folosete un raport de FSB:RAM=1:1 atunci ramii, fiind double-pumped vor rula ~533Mhz. Dac setam un raport de 4:3 atunci folosind puina matematic RAM=FSB*3/4 care ne d RAM~200Mhz, deci 400Mhz frecvena efectiv. n funcie de ce memorii dispunei i de ct de mult suport ele frecvena peste stock, facei un calcul i setai divizorii potrivii pentru ca memoriile s ruleze la frecvene stabile. Desigur placa de baza nu permite s setai chiar orice valoare la divizori deci din acest punct de vedere avem un dezavantaj, dar spre deosebire de AMD, permite rularea memoriilor mai rapid dect FSB-ul prin setarea unui raport supraunitar, dar acest lucru nu aduce mai nimic n plus la performan. De fapt la Intel, spre deosebire de AMD64, n general, memoriile mai rapide nu aduc un spor foarte mare de performan, deoarece, dac dispunem de nite memorii foarte rapide se va mari limea de band ntre memorii i northbridge dar acest lucru nu ajut prea mult deoarece ntre procesor i northbridge tot mic rmne. 5.3

127

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

Ca s nelegei cum s umblai cu latentele trebuie nti s nelegei ce sunt ele de fapt. Pentru aceasta, haidei s facem o analogie cu un concurs de atletism. Gndiiv la cursa cu tafet, acolo fiecare atlet trebuie s alerge o distan i apoi s predea tafeta. Fiecare atlet alearg distana ntr-un timp anume. Dac unul alearg ntr-un timp mai lung dect de obicei, nu-i nici o problem, ceilali ateapt dup el, iar tafeta ajunge la destinaie. n schimb dac unui atlet i se impune s alerge distana mai repede dect poate atunci el nu ajunge la succesorul su, acesta pleac fr tafet i tot procesul se duce de rp. Astfel se ntmpl i la memorii, ele au nite laente stock. Dac setam unele mai mari, scade performana dar stabilitatea rmne. Dac setam unele mai mici atunci s-ar putea s le suporte dac sunt memorii bune, iar dac nu le suport atunci se compromite stabilitatea i sistemul fie d Blue Screen, fie nu booteaz deloc. Sunt patru latene mai cunoscute, deci mai importante. Memoria este structurat ca o matrice. Latenele sunt: CAS (cL): aceast laten se refer la timpul necesar din momentul cererii unei operaii de citire i pn n momentul n care sunt trimise datele ; RAS-to-CAS (tRCD): aceast laten se refer la timpul care trece din momentul n care un rnd este activat i pn cnd este executat prima operaie de citire sau scriere ; RAS precharge (tRP): este timpul din momentul trimiterii unei comenzi precharge pentru a nchide un rnd i pn n momentul n care urmtoarea comand activ poate fi executat; Active-to-precharge delay (tRAS): Aceast laten se ntinde peste civa pai n activitatea memoriei. Aceasta se refer la numrul minim de cicluri de ceas care trebuie s treac de la o comand activ pn la una precharge. Mai este i Command Rate-ul. Acesta este timpul din momentul n care un chip este selectat i pn n momentul n care se poate executa prima comanda activ. Cred c este clar, c cu ct sunt latentele mai mici cu att performana memoriei este mai mare. La memoriile DDR latenele obinuite ntlnite la cele mai multe module de memorii sunt 2.5-3-3-6 sau 2.5-3-3-8 i command rate de 2. Cifrele sunt n ordinea aceasta: CAS, RAS-to-CAS, RAS precharge, Active-to-precharge. Ele nu reprezint uniti de timp (nanosecunde sau ceva de genul) ci cicluri de ceas. Memoriile cele mai de calitate de tip DDR pot funciona chiar i la 2-2-2-5 i command rate de 1. Memoriile DDR2 au latene mai mari de genul 5-5-5-12; 4-4-4-10 etc.
Setri uzuale ale latenelor memoriilor RAS Active-toNr. CAS RAS-to-CAS Tip memorie precharge precharge delay crt. (cL) (tRCD) (tRP) (tRAS) 1 DDR normale 2,5 3 3 6 2 DDR normale 2,5 3 3 8 3 DDR best 2 2 2 5 4 DDR2 5 5 5 12 5 DDR2 4 4 4 10

Command Rate 2 2 1

S vedem acuma ce legtur au latenele cu overclock-ul. n momentul n care ridicm frecvena memoriilor peste cea stock i ele devin instabile sunt 2 metode de a le mri stabilitatea. Una este prin supravoltare i este tratat pe larg mai jos, iar cealalt
128

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

este prin modificarea latenelor. Ele trebuiesc mrite pentru a stabiliza memoriile la frecvene mrite. Ideal este s avem frecvena ct de mare la memorii i latente ct de mici, aici intervin memoriile de calitate, fcute pentru overclock (ele de altfel "overclockeaz" i portofelul, deoarece i determin o vitez de golire mult peste cea stock laughing care suport frecvene mari cu latene mici. Voltajele n primul rnd, dac avei de gnd s supravoltai, nu lsai voltajele pe auto deoarece placa de baz crete prea mult voltajul la procesor n funcie de FSB-ul setat, i acest lucru va duce la o uzur prea mare a procesorului. Povestea cu voltajele este similar ca i la AMD. Singura diferen este c dac overclock-ai un Pentium Prescott, el se v nclzi foarte tare la ridicarea voltajelor i i va crete mult consumul de curent. Dac avei un Northwood atunci fii foarte atent la SNDS. SNDS nseamn de fapt "Sudden Northwood Death Sindrome" i apare atunci cnd voltajul este ridicat peste 1.75V. El const n moartea foarte prematur a procesorului spre deosebire de alte procesoare supravoltate. Practic procesorul va deveni din ce n ce mai instabil, pn cnd ntr-o zi brusc nu va mai funciona. Explicaia acestui "sindrom" este n fenomenul fizic de migraie a electronilor care degradeaz n timp traseele electronice din nucleul procesorului. Acest fenomen este amplificat i de temperaturi ridicate (De-aia nu-i bine s se ncing prea tare procesorul), i este prezent la toate procesoarele dar la Northwood se pare c este mai accentuat. n primul rnd cnd se supravolteaz o component, este recomandat s nu se depeasc cu 10% voltajul stock. S lum de ex procesorul Intel Pentium D805 care are frecvena stock de 2,66Ghz, FSB de 533Mhz (133 real) i multiplicator de 20x. Iniial vom urca n pai mici cu FSB-ul pn la 160Mhz (640 efectivi) obinnd o frecventa de 3200Mhz. Pn aici este stabil la voltaj stock (1.24V conform cpu-z). Dac i dm pana la 1.30V urc pn la 3800Mhz, iar dac suntem duri i i bgm n el 1.4V trece de 4Ghz dar cu un coolerul box nu prea st mult la frecvena asta i imediat intr n Throttling i pierde stabilitatea pentru c temperatura ajunge la 80 de grade n full load. Pentru cei care nu tiu Throttling-ul este tehnologia de protecie a procesoarelor Intel mpotriva supranclzirii. La nceput ea ncepe s introduc cicluri IDLE printre ciclurile de ceas ale procesorului, acest lucru urmrind s-i scad temperatura. Dac ciclurile idle nu scad temperatura suficient, throtlingul ia msuri mai drastice i i scade multiplicatorul scznd-ui astfel frecvena de lucru i astfel scznd i mai mult temperatura pn cnd aceasta coboar sub limit. Cred c este evident c odat intrat n Throttling procesorul va avea penalizri de performan. La procesorul dat ca exemplu, observam c ctigm destul de muli mhz, n plus prin supravoltare dar acesta este doar un procesor, altele se comporta diferit la supravoltare, unele s-ar putea s nu urce mai mult de vreo 200mhz orict voltaj i s-ar da, de fapt dou procesoare identice nu se overclockeaz la fel. Supravoltarea uzeaz mai puternic procesorul dect simpla supratactare astfel c trebuie folosit cu grij, i s urmrii tot timpul s folosii voltajul minim necesar pentru stabilitate. De ex dac i dai 1.4V, dar el este stabil i la 1.3V atunci lsai-l la 1.3V. Tot timpul cnd supravoltati FITI CU OCHII PE TEMPERATURI. La Pentium 4 i la Pentium D s nu depeasc 50 n idle i 60 n full, iar la core 2 duo s nu
129

5.4

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

treac de 55 cel mult n full i s stea n jur de 4042 n idle. Dac ele depesc aceste limite va trebui fie s v cumprai un cooler mai performant, fie s mbuntii ventilaia n carcasa dac aceasta las de dorit (ideal este un ventilator jos n fa care bag aer i unu sus n spate care scoate. Se mai pot pune ventilatoare i pe capacul lateral sau n partea de sus a carcasei-"blow-hole"). La memorii se aplic cam acelai principiu, dar i acolo unele s-ar putea s urce mult dac le mrim voltajul i altele s-ar putea s nu urce aproape de loc mai mult chiar dac le ndopm cu voltaj. Dac ai fcut overclock i sistemul nu este stabil, dar din anumite motive tii c memoriile i procesorul ar putea mai mult (de ex dac le testai cu o alt plac de baza i cu aia merg mai mult) limitarea vine din placa de baz, mai exact din cipset. Multe plci de baz ofer opiunea de a mari i voltajul pe cipset, i din nou se aplic cam acelai principiu ca i la procesor. Strap-ul la northbridge Asemenea unui procesor, northbridge-ul are frecvena intern proprie i latenele proprii care influeneaz performana sistemului (lucru valabil de la i865 ncoace). Ne vom referi la frecvena lui prin NBCC (North Bridge Core Clock). Acest NBCC afecteaz direct performana i stabilitatea memoriilor, deoarece cum am spus mai sus, la Intel frecvena memoriilor se obine din FSB i nu din frecvena procesorului. Acest NBCC variaz n funcie de FSB-ul sistemului i de multiplicator. Putei descoperi NBCC-ul mprind multiplicatorul curent al procesorului cu multiplicatorul lui stock, i ctul l nmulii cu valoarea FSB-ului (valoarea real, nu cea quadpumped). S luam un exemplu: luam un Conroe E6600 i i coboram multiplicatorul (nu toate plcile de baza permit acest lucru, iar nici un procesor Intel n afar de cele extreme edition nu permit urcarea multiplicatorului) de la 9 la 7 i i dm FSB de 500Mhz. Obinem urmtorul lucru aplicnd formula: (9/7) * 500=642Mhz sta-i NBCC-ul. 5.5

Observm un lucru interesant. Cobornd multiplicatorul sistemului, ar trebui s-i mrim stabilitatea, dar aici dac l coboram, NBCC-ul va crete i NorthBridge-ul se va overclocka i deci va deveni mai instabil. Am vorbit despre frecventa NB-ului. S vedem i ce-i cu latenele lui. Aceste latene cresc n momentul cnd NBCC-ul atinge valori specifice, mrind astfel stabilitatea dar scznd performana. Seria de latene care este setat la o valoare specific a NBCC-ului se numete strap. Este un strap la 1066Mhz, unul la 1333Mhz i aa mai departe. Productorii de placi de baz totui, schimb valorile la care anumite strap-uri se seteaz. NBCC-ul declanator pentru fiecare strap difer de la plac de baz la plac de baz. Putei testa diverse valori ale NBCC-ului folosind SuperPI sau orice alt program de msurat lime de band pentru a vedea cnd se schimba latenele. Revenim puin asupra msurilor de recptare a stabilitii. Acestea erau: supravoltarea procesorului, a memoriei i a NB-ului. Supravoltarea NB-ului se face cnd acesta provoac instabilitatea. Acest lucru se ntmpl pe capt de strap. De ex dac suntem n strap-ul de 800Mhz, avem latena mai mare specifica strap-ului i deci
130

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

stabilitate. Cnd urcm FSB-ul, va urca i NBCC-ul dar latena va rmne la fel, devenind la un moment dat prea mic, iar NBCC-ul fiind mare, va rezulta instabilitate. Sunt 2 moduri de a rezolva aceast problem. Fie mrim FSB-ul pn ajungem s declanm urmtorul strap (strap-ul de 1066) i astfel se va mri latena i NB-ul se va stabiliza, sau dac procesorul nu duce FSB-ul mrit atunci vom supravolta NB-ul pentru a-l stabiliza. Ziceam mai sus c mrind FSB-ul de la 800 n sus la un moment dat ieim din strap-ul de 800 i intram n strap-ul de 1066Mhz. Intrarea n strap-ul de 1066 nu nseamn c suntem cu FSB-ul la 1066Mhz, ci mai jos. De-aia ziceam mai sus ca difer NBCC-urile la care se schimb strap-ul n funcie de placa de baz. S luam un exemplu concret c e mai uor aa (valorile sunt luate la ntmplare, deci nu tiu la ce plac de baz sunt valabile(poate la nici una)). Pornim de la 800Mhz FSB deci ne aflam n strap-ul de 800Mhz. S zicem c n momentul cnd trecem de 950 de Mhz NB-ul trece n strap-ul de 1066 (cum ziceam mai sus, valoarea declanatoare este mai mic). Asta nseamn c valoarea de 949Mhz este nc n strap-ul de 800Mhz deci este mai instabil dect 950Mhz care este deja n strapul de 1066Mhz. Asta se ntmpl deoarece 949 este o valoare mare pentru latena strapului de 800Mhz, ns latena strap-ului de 1066 este bun pentru valoarea de 950 i deci NB-ul este mai stabil. Mai trebuie tiut c fiecare strap vine cu raporturile lui pentru frecvena memoriei. Adic: pentru strapul 800 avem urmtoarele frecvene pentru memorie cu raporturile corespondente fiecreia: 400=1:1, 533=3:4, 667=3:5, 800=1:2 pentru strapul de 1066 avem aceleai valori de 400, 533, 667 i 800 dar rapoartele sunt altele: 400=4:3, 533=1:1, 667=4:5, 800=4:6 strapul 1333 are aceleai frecvene la ram dar alte rapoarte: 400=5:3, 533=5:4, 667=1:1, 800=5:6 La unele plci putem gsi opiunea pentru de ex 889 la memorie. Acest lucru se face prin modificarea forat a strap-ului n care ne aflm.

131

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 6

6 Metodologia de realizare a overclocking-ului la procesoarele AMD


6.1 Introducere Pentru nceput, este nevoie de: un procesor overclockabil; o plac de baz bun, care s permit modificarea unui numr mare de setri n BIOS (FSB, HT multiplier, latene/frecvene RAM, voltaje pentru procesor, memorii i chipset, etc.); rcire bun pe procesor i preferabil un airflow decent n carcas; o surs bun, cu destui amperi i care s nu aib fluctuaii de curent; Soft-uri care ar trebui folosite pentru. monitorizare i testarea stabilitii: CPU-z1, pentru informaii despre procesor i memorie; Everest2 /Speedfan3 /SmartGuardian, pentru monitorizarea temperaturilor; Prim95 / Orthos SP 2004, pentru testarea stabilitii procesorului i memoriei; Memtest de Windows, pentru testarea memoriei; SuperPI, un test rapid de performan, dar rezultatele sunt puternic influenate de tweak-uri; 3D Mark 2001, un test care evalueaz cele mai importante componente ale calculatorului: procesorul, placa video i memoria; RivaTuner/ATi Tool, pentru monitorizarea temperaturii core-ului plcii video;

6.2

Procedura de realizare a overclocking-ului 1) n primul rnd din BIOS, se schimb setrile pentru RAM, de pe Auto/SPD pe Manual i se schimb frecvena, pentru a nu exista o limitare din partea memoriei. Cum se face asta depinde de BIOS: la unele arat frecvena, la altele divizorul (CPU/9, CPU/14, etc.). Ideea este c frecvena memoriei trebuie sczut de la 400 MHz la 333 MHz sau chiar 266 MHz (n cazul sk. 754/939) i de la 667 MHz la 533 sau chiar 400 MHz pt. platforma sk. AM2. 2) Tot n BIOS exist opiunea HT Multiplier. Trebuie modificat pe Manual i sczut valoarea multiplicatorului de la 5x la 4x sau chiar 3x. Din nmulirea HT Multiplier cu HTT se obine frecvena HT, care nu trebuie s depeasc 1000 MHz (pt. a fi sigur c stabilitatea nu este afectat de aici). 3) Urmeaz setrile pt. procesor, care, din nou, trebuie puse pe Manual pentru a permite modificarea voltajului i a HTT-ului. Pentru nceput este recomandat creterea HTT-ului n pai de 5 MHz pentru a putea testa ct mai corect i sigur dac este sau nu stabil.

1 2

http://www.roclockers.net/monitorizare/cpu-z-1.40.html http://www.roclockers.net/monitorizare/everest-ultimate-edition-4.00.html 3 http://www.roclockers.net/monitorizare/speedfan-4.32.html 132

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 6

4) Se salveaz setrile, se repornete sistemul i se ruleaz un test din cele de mai sus, de preferat 3D Mark 2001 i/sau un joc pretenios. Ce s-ar putea ntmpla dac ceva nu e bine sau cnd s-a ajuns prea departe: sistemul nu POSTeaz, adic nici nu booteaz. n cazul sta probabil a crescut prea mult frecvena. Soluia este resetarea BIOS-ulului cu jumper-ul de clear CMOS de pe placa de baz. Toate setrile din BIOS vor reveni la default. Sau se poate ine apsat tasta "1" n timp ce se apas butonul de reset al PCului. n acest caz BIOS-ul va reveni la setrile de fabric. Nu tiu dac la toate plcile de baz este valabil aceast procedur, cel puin pe o plac ABIT A8N32X, la fel i pe un DFI NF4 ; calculatorul pornete, dar nu intr n sistemul de operare. Aici iari nseamn c s-a mers prea departe, dar se poate intra n BIOS pentru a efectua modificri. dac pornete sistemul de operare, dar se reseteaz sau apare un BSOD (ecran albastru) iari nu e bine i trebuie modificate valorile prin BIOS. 5) Testele: Prime95: se las cel puin o or s ruleze testul "Blend". Recomandat: peste 4 ore. Memtest de Windows: cel puin 100% cu maximul de capacitate. Recomandat: peste 1000%. SuperPI: mcar 16M. Recomandat: dou rulri ale testului 32M. 3D Mark 2001: un singur loop e OK. Recomandat: cteva ore de loop-uri continue.

Pentru fiecare dintre teste se vor monitoriza temperaturile, inclusiv pe cele ale plcii video n caz c se ruleaz un test 3D. Temperatura memoriilor se msoar "degetometric". Dac sunt calde/cldue e OK. Dac ard/frig ncercai s le asigurai o rcire, eventual cu un ventilator de 8 cm poziionat deasupra. Cnd se ajunge la limite ar mai fi urmtoarele variante: creterea voltajului furnizat procesorului, tot din BIOS. Limitele pt. folosirea zilnic ar fi + 0,15V cu rcirea stock i poate ajunge pn la 0,3V n funcie de rcire. Asta pe aer, pentru c rcirea pe ap e mai versatil i prefer s nu m pronun. o alt limitare ar putea fi memoria. Pentru ca s fim siguri c limitarea nu apare de aici trebuie ca frecvena memoriei s fie la 400 MHz sau mai jos (sk. 754/939) sau n funcie de frecvena nominal a memoriei, 667 MHz, 533 MHz, etc. (sk. AM2). acelai lucru este valabil i pentru HT, care nu trebuie s depeasc 1000MHz. Nu afecteaz cu nimic performana dac frecvena HT este mai mic de 1000 MHz, aa c poate fi folosit direct multiplicatorul 3x. este recomandat i creterea voltajului de la chipset-ul plcii de baz.

133

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 6

FSB la Athlon64 Poate c muli dintre voi tii c un overclock se face ridicnd fsb-ul. La Athlon64 este puin diferit pentru c odat cu integrarea controlerului de memorie n procesor nu mai avem FSB ci avem 2 magistrale. Este un memory bus care conecteaz memoriile de procesor i un HyperTransport Bus care conecteaz procesorul de cipset prin intermediul creia se trimit comenzi la diverse componente ale sistemului. Pentru a putea face un overclock bun la Athlon64 trebuie s nelegem cum este generat frecvena la aceste procesoare. Ele folosesc o frecven de baz care este de multe ori greit numita ca FSB. Aceasta este de fapt frecvena HyperTransport sau i se mai spune HT sau HTT. Ea este ntotdeauna 200Mhz. nmulind aceast frecven cu multiplicatorul procesorului se obine frecvena de lucru. De exemplu un Athlon64 X2 5000+ merge la 2600Mhz. Ele are frecventa HT de 200Mhz i multiplicatorul de 13. Deci pentru a overclocka un Athlon64 trebuie ridicat frecventa HT (se poate face overclock i din multiplicator dar acesta este de cele mai multe ori blocat). Dar, i celelalte frecvene de pe placa de baz deriv tot din frecvena HTT. Frecvena efectiv a HyperTransport-ului este frecvena de baza multiplicat cu multiplicatorul HTT. Multiplicatorul HTT este de regula 5x adic 5*200=1000Mhz (sau 2000Mhz sau 4GB/s). Modelele mai vechi de Athlon64 au htt-ul la 800Mhz deci cu multiplicator de 4x. n momentul n care urcai frecventa de baz trebuie s avei grij c aceasta multiplicat cu multiplicatorul HTT s nu depeasc maximul permis. De ex dac urcai la 250mhz de la 200Mhz i multiplicatorul HTT rmne 5x va rezulta o frecven efectiv a HyperTransportului de 1250 deci peste maxim. Astfel c trebuie cobort multiplicatorul HTT-ului ca s coboare i frecvena sub limit. n cazul de fa setnd un multplicator de 4x va rezulta 1000Mhz deci perfect. Nu este nici o problema dac merge i sub 1000Mhz c nu are un impact vizibil asupra performanei. O alt frecven care deriv din HTT este i frecvena PCI-express sau AGP dup caz, i cea PCI. Frecvena PCI-express trebuie s fie 100Mhz cea AGP 66Mhz i cea PCI 33Mhz. De asemenea porturile SATA necesita frecvena tot de 100Mhz. De obicei plcile de baz pentru overclock folosesc un clock-generator separat pentru aceste frecvene i au opiunea de a le bloca la valoarea lor standard. Orice overclock depinde de placa de baz i de opiunile pe care aceasta le ofer. Vom ncerca s prezentm ct mai generalizat: blocai toate componentele la frecvena standard n afar de procesor bineneles dac v permite placa de baz punei frecvena de baza pe Manual de pe Auto dac este cazul incrementai frecvena de baz n pai mici (din 5 n 5 Mhz e ok) verificnd stabilitatea sistemului de fiecare dat (putei folosi programe specializate pentru acest lucru cum ar fi: Prime95, Orthos, Stress Prime2004, SuperPI, S&M) setai multiplicatorul HTT la 4x odat ce ai trecut de 220Mhz setai multiplicatorul HTT la 3x odat ce ai trecut de 250Mhz Frecvena efectiv HTT trebuie s stea sub 1000 sau sub 800, depinde de procesor i de placa de baz.

6.3

134

Bibliografie
1. http://www.memtest.org/ 2. http://www.mersenne.org/freesoft.htm 3. http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2322 4. http://www.xf.ro/content-62-page1.html 5. http://en.wikipedia.org/wiki/Wire_frame_model 6. http://www.realstorm.com/ 7. http://www.memtest.org/ 8. http://hcidesign.com/memtest/download.html 9. http://brain-power.net/menus.php?name=Company&c_lang=english 10. http://www.xf.ro/article135.html 11. http://www.guru3d.com/index.php?page=rivatuner 12. http://www.techpowerup.com/downloads/Tweaking/ATITool 13. http://www.techpowerup.com/atitool/ 14. http://downloads.guru3d.com/download.php?det=872 15. http://www.mvktech.net/component/option,com_remository/Itemid,26/func,sele ctfolder/cat,92/ 16. http://www.entechtaiwan.net/util/ps.shtm 17. http://www.roclockers.net/monitorizare/cpu-z-1.40.html 18. http://www.roclockers.net/monitorizare/everest-ultimate-edition-4.00.html 19. http://www.roclockers.net/monitorizare/speedfan-4.32.html

135

Cuprins
CUVNT NAINTE

Partea a I-a : Curs


1. NOIUNI DE BAZ PRIVIND EVALUAREA PERFORMANELOR.....................................5 1.1. BENCHMARK-UL ORGANIZAIILOR.............................................................................................5 1.1.1. Avantajele benchmarking-ului ..................................................................................................5 1.1.2. Procedura de realizare a benchmark-ului ................................................................................5 1.1.3. Costul benchmarking-ului.........................................................................................................6 1.2. BENCHMARKING-ULUI N COMPUTERE .......................................................................................6 1.2.1. Scopul benchmarking-ului ........................................................................................................7 1.2.2. Provocri ..................................................................................................................................7 1.2.3. Tipuri de benchmark .................................................................................................................8 1.3. ARHITECTURA CALCULATOARELOR ...........................................................................................9 1.3.1. Scopurile proiectrii ...............................................................................................................10 2. EVALUAREA PERFORMANELOR PLCILOR DE BAZ .................................................12 2.1. PLCILE DE BAZ: FUNCIONARE, ISTORIE...............................................................................12 2.1.1. Definiii de baz: chipset-ul....................................................................................................12 2.1.2. Memoria, tipuri de memorie ...................................................................................................15 2.1.3. Interfeele interne: ISA, VLB, PCI, AGP etc ...........................................................................18 2.1.4. Interfeele externe: serial, paralel, USB etc............................................................................20 2.1.5. Interfeele pentru dispozitive de stocare .................................................................................21 2.2. TESTAREA PLCILOR DE BAZ SOCKET 939.............................................................................23 2.2.1. Introducere..............................................................................................................................23 2.2.2. Modul de testare .....................................................................................................................24 2.2.3. Testarea efectiv .....................................................................................................................26 2.2.4. Abit AN8 Fatal1ty (nForce4 Ultra).........................................................................................26 2.2.5. Abit AN8 (nForce4).................................................................................................................29 2.2.6. DFI LANParty UT nF4 Ultra-D (nForce4 Ultra)...................................................................30 2.2.7. Gigabyte GA-K8NXP-SLI (nForce4 SLI)................................................................................33 2.2.8. Gigabyte GA-K8NF-9 (nForce4-4X) ......................................................................................35 2.2.9. Rezultate comparative.............................................................................................................36 2.2.10. Concluzii ...............................................................................................................................37 3. EVALUAREA PERFORMANELOR PROCESOARELOR ....................................................38 3.1. ARHITECTURA LUI PENTIUM 4 PRESCOTT ................................................................................38 3.1.1. Introducere..............................................................................................................................38 3.1.2. Gestionarea memoriei principale i secundare ......................................................................39 3.1.3. Latena ....................................................................................................................................41 3.1.4. Conductele ..............................................................................................................................42 3.1.5. Calculul matematic .................................................................................................................45 3.1.6. Tensiunile................................................................................................................................45 3.1.7. Ambalarea...............................................................................................................................45 3.1.8. Versiuni de Prescott-uri ..........................................................................................................46 3.1.9. Alte procesoare din familia P4 ...............................................................................................47 3.1.10. Concluzii ...............................................................................................................................48 3.1.11. Anex: Chipset-uri pentru Pentium 4 ...................................................................................49 3.2. ARHITECTURA PROCESOARELOR AMD64 ................................................................................49 3.3. TRECUT I PREZENT..................................................................................................................49 3.3.1. Cei 64 de biii..........................................................................................................................50 3.3.2. Memoria gestionat direct din procesor.................................................................................51 136

Cuprins 3.3.3. HyperTransport.......................................................................................................................52 3.3.4. Cache-ul..................................................................................................................................53 3.3.5. Conductele i predicia ...........................................................................................................54 3.3.6. Motentirea de la Intel ............................................................................................................54 3.3.7. Modele de K8, tehnologii de fabricaie i platforme...............................................................55 3.3.8. Concluzii .................................................................................................................................56 3.4. PROCESOARE DUAL-CORE .......................................................................................................58 3.4.1. Tehnologia Intel dual-core Intel .............................................................................................59 3.4.2. Tehnologia Dual-Core AMD ..................................................................................................60 3.5. TEST DE PROCESOARE ..............................................................................................................61 3.5.1. Testarea propriu-zis..............................................................................................................64 3.5.2. Procesoare testate: .................................................................................................................66 3.5.2.1. Socket 939.................................................................................................................66 3.5.2.2. Socket AM2 ..............................................................................................................66 3.5.2.3. Socket T (LGA775) ..................................................................................................67

4.

EVALUAREA MEMORIILOR .....................................................................................................70 4.1. INTRODUCERE ..........................................................................................................................70 4.2. STANDARDE, HTT, FRECVENE, LIMI DE BAND .................................................................71 4.2.1. Latene ....................................................................................................................................72 4.2.2. Concluzii .................................................................................................................................78 4.3. MODUL DE TESTARE .................................................................................................................78 4.4. CHIP-URI DE MEMORIE .............................................................................................................80 4.4.1. A-Data Vitesta DDR500..........................................................................................................81 4.4.2. Corsair TWINX1024-3200C2PT rev 4.2.................................................................................82 4.4.3. Corsair TWINX1024-3200C2PT rev 5.2.................................................................................83 4.4.4. Corsair TWINX1024-3200XLPT rev 1.2.................................................................................83 4.4.5. Corsair TWINX1024-3200C2PRO rev 4.1..............................................................................84 4.4.6. Corsair TWINX1024-4400C25PT rev 1.1...............................................................................84 4.5. CONCLUZII ...............................................................................................................................85

5.

EVALUAREA PLCILOR GRAFICE .........................................................................................86 5.1. INTRODUCERE ..........................................................................................................................86 5.2. FRECVENE I LATENE ...........................................................................................................87 5.2.1. Frecvene ................................................................................................................................87 5.2.2. Latene ....................................................................................................................................88

6.

EVALUAREA HARD DISCURILOR ...........................................................................................91 6.1. INTRODUCERE ..........................................................................................................................91 6.2. STRUCTUR I FUNCIONARE...................................................................................................91 6.2.1. Transferul datelor la memorie ................................................................................................92 6.2.2. Interfee i controlere..............................................................................................................92 6.3. CARACTERISTICI ......................................................................................................................93 6.3.1. Optimizarea timpilor de cutare.............................................................................................94 6.3.2. Optimizarea latenelor de rotaie............................................................................................94 6.3.3. Tehnologia NCQ .....................................................................................................................95 6.3.4. Hard discuri...puin mai silenioase........................................................................................96 6.3.5. Criptare nativ pentru hard discuri........................................................................................96 6.3.6. Hard discuri liliputane............................................................................................................97

137