Sunteți pe pagina 1din 140

UNIVERSITATEA DIN BACU

FACULTATEA DE INGINERIE

POPA SORIN EUGEN

EVALUAREA SISTEMELOR DE CALCUL


note de curs i seminar
pentru studenii Facultii de Inginerie

2007

Cuvnt nainte,

Volumul "Evaluarea performanelor sistemelor de calcul " se


adreseaz studenilor de la specializarea Tehnologia informaiei anul IV
i acoper materia cursului intitulat generic "Evaluarea performaelor"
Cursul este structurat pe dou pri, prima de teorie ce conine 6
capitole referitoare la noiunile teoretice privind aspectele generale a
evalurii, testrii i comparrii performanelor componentelor de baz ale
sistemelor de calcul, i a doua parte conine care conine 6 lucrri de
seminar cu scopul de completare a celor predate la curs.
Primul capitol, "Noiuni de baz privind evaluarea
performanelor" face o trecere n vedere a ntregului domeniu de evaluare
a performanelor, att al companiilor (firmelor) ct i a sistemelor de
calcul. Aa cum se va vedea i din prelegerea ce urmeaz, este aproape
imposibil evaluarea unui sistem de calcul ca ntreg, o evaluare obiectiv
putndu-se realiza doar pe componente. n consecin, urmtoarele
capitole vor trata problema evalurii computerelor pe baza evalurii
principalelor sale componente.
Capitolul doi trateaz evaluarea plcilor de baz ale unui
computer, i conine definiii i elementele componente ale plcii de baz
i o evaluare comparativ a plcilor soket 939.
Al treilea capitol trateaz problema evalurii procesoarelor, cu
descrierea arhitecturii celor dou mari clase de procesoare, Intel i AMD,
i dual-core. n ultima parte a capitolului, prezentndu-se procedura de
realizare practic a testelor comparative.
Capitolul patru trateaz procesul de evaluare i testare a
memoriilor iar capitolul cinci pe cel al plcilor grafice.
Ultimul capitol care ncheie acest volum se apleac asupra testrii
i evalurii hard discurilor.
A doua parte a volumului conine ase lucrri de seminare care
vin n completarea materialelor prezentate n capitolele anterioare cu
detalieri i exemple practice.
n primul seminar se prezint metodologia de evaluare general a
componentelor unui calculator, cu specificaii mai detaliate pentru
testarea plcilor de baz.
Al doilea seminar trateaz , drept exemplu, evaluarea plcilor de
baz dual core.

Al treilea seminar prezint procedura de realizare a overclockingului plclor video, adic procedura de mbuntire a performanelor
acestora.
Seminarul numrul patru prezint modul general de testare i
evaluare a ecranelor TFT-LDC, i criteriile de alegere a acestora
Ultimele dou lucrri prezint procedura de realizare a
overclocking-ului la procesoarele Intel i AMD64

Autorul

ii

Prelegere
La prima vedere, pare o problem absurd, o chestiune fr sens i prea vag
pentru a fi discutat. La urma urmei, cum se poate msura performana unui sistem fr
a aluneca n groapa discuiilor fr sfrit legate de platforme i setri diferite i
benchmark-uri inconsistente? Ei bine, aceasta e problema cea mai important...
Avem de-a face cu o gam aa de diversificat de produse nct ncercarea de a
da consisten rezultatelor ce msoar performana unui sistem informatic se transform
ntr-o lupt cu morile de vnt. Adevraii entuziati ai benchmark-urilor ignor n mod
voit problemele ivite, fiindc altfel ar rmne fr pasiunea care i motiveaz. n cele ce
urmeaz vom ncerca s explicm n ce fel un sistem de calcul se transform dintr-un
standard ntr-un unicat.
Un calculator poate fi definit n termeni vagi ca fiind alctuit dintr-o unitate
central i periferice. Bineneles c exist i excepii, dar haidei s ne concentrm
asupra sistemului care respect aceast regul. Unitatea central este alctuit, la rndul
ei, din componente de baz (fr de care sistemul nu poate funciona) i componente
opionale. Acestea din urm pot fi ndeprtate din demonstraie fr a avea un impact
asupra concluziei. Rmn, deci, componentele de baz.
1. Placa de baz - prezentat n forme i tipuri diverse (ATX, micro-ATX, BTX,
etc.), motorizat de chipset-uri la fel de diverse (Intel, NVIDIA, ATI, ULi, VIA etc), cu
suport divers pentru procesoare diverse (Socket 462, 478, 754, 775, 939, 940, AM2 etc),
cu suport video variat (grafic integrat, slot AGP, PCI Express, SLI etc), cu suport
felurit pentru memorii (de la btrnele SDRAM i RIMM la DDR, DDR2 etc).
Menionm pe scurt i alte caracteristici care pot lrgi i mai mult varietatea plcilor de
baz (IDE, S-ATA, S-ATA II, sunet integrat de diferite tipuri i performane, numrul
de porturi USB, tipul i numrul de conectori LAN etc).
2. Placa video - a crei alegere se poate dovedi dificil chiar i pentru un
specialist. Un cumprtor obinuit se uit n special la cantitatea de memorie video,
obicei prins repede de ctre productori i care este exploatat la maximum, rezultnd
hibrizi cum ar fi plci video cu performane slabe i cantitate de memorie prea mare fa
de capacitile motorului, sau faimoasele plci video cu memorie TurboCache. Pe
lng aceasta, numrul i varietatea de motoare grafice existente n prezent simultan pe
pia fac genomul uman s se nverzeasc de ciud. n afar de seriile ATI (numerotate
de la 9200 la 9800 i de la X300 la X850) i GeForce (de la 5100 la 7800) trebuie s
acordm atenie i sufixelor (SE, TD, VL, VE, TC, GT, GTO, GT2, GT3 etc) care
contribuie cu succes la ndesirea peretelui de fum ce acoper sub nume frumoase
performane uneori dezamgitoare.
3. Memoriile - cu denumiri create n mod special pentru a suna frumos i cu
caracteristici reale ascunse de ctre productor mai bine dect chipul femeilor din
Afghanistan. Cumprtorul este din nou orbit de frecvenele scrise cu litere uneori
uriae i ignor existena acelui termen esenial numit latene, permind
productorilor s vnd bine memorii cu latene uriae, preuri colosale i performane
nu cu mult mai mari dect cele ale memoriilor cu frecvene mai mici dar latene strnse.
4. Am ajuns i la componenta care prea s aib o descriere mai simpl ns este,
se pare, nc mai dificil de neles, i anume procesorul. Limitndu-ne doar la cei mai
mari juctori de pe piaa actual (AMD i Intel), enumerm doar cteva dintre
caracteristicile ce afecteaz performana: frecvena de funcionare, dimensiunea cacheiii

ului, dimensiunea tranzistorilor, tipul i numrul de instruciuni. Bineneles c goana


dup procente de vnzare i-a fcut pe ambii productori s creeze coduri i denumiri
care bag n cea un utilizator obinuit. Avem Athlon 64 X2 4000+ sau Pentium 4
640+, Sempron 2500+ Palermo sau Celeron D315, denumiri teribile i confuze.
La aceast sup primordial se adaug i alte componente (sursa de
alimentare, monitorul, o tastatur, un mouse, alte componente interne opionale) care
pot face diferena afectnd pozitiv sau negativ performana sistemului.
Cu attea posibiliti de a combina componente de baz, rezultatul testelor este
nicicum altfel dect neconcludent. nc mai mult, aceleai teste, efectuate succesiv pe
acelai sistem sau pe sisteme absolut identice, dau rezultate diferite (i ne referim aici la
diferene cuprinse ntre 1% i 3%). Cu alte cuvinte, se ridic nc o ntrebare: este un
benchmark o soluie sigur de msurare a performanei unui sistem de calcul, mai ales
lund n considerare existena altei variabile care poate afecta puternic modul n care se
comport un calculator: software-ul?
De ce software-ul? Fiindc un calculator fr un sistem de operare este inutil. Iar
un calculator cu un sistem de operare... este un sistem cu performan condiionat de o
mulime de factori suplimentari: versiunea i calitatea driverelor, modul n care sistemul
de operare tie s lucreze nativ cu anumite componente, cantitatea i tipul resurselor
consumate de ctre alte produse software instalate etc. Dar nainte de sistemul de
operare i lucrnd n strns relaie cu componentele hardware se afl BIOS-ul,
clciul lui Ahile, un conglomerat de linii de cod care, configurat incorect, poate
transforma un iepure n broasc estoas.
Ei bine, soluia a venit tot din partea entuziatilor: s msurm ntregul pe
buci! Au aprut testele axate pe msurarea performanelor procesorului, memoriei,
plcii video, hard disk-ului, unitilor optice, apoi au aprut testele care verific fiecare
component din punct de vedere al performanei i, folosind un algoritm uneori obscur
i complicat, genereaz un scor final. Ca urmare, au aprut i jocuri murdare (driver
care detecteaz prezena unui program de benchmark i l minte pentru a obine
scoruri mai mari), au aprut contestaii, a aprut o ntreag industrie bazat pe testarea
performanelor unui sistem fa de altul. Toat aceast goan dup aur continu s fie
alimentat de spiritul de competiie tipic uman, reprezentat n acest caz prin expresia
scorul meu e mai mare ca al tu!.
La final, ne lovim de o ntrebare de 100 de puncte: avnd n vedere toate aceste
diferene care fac ca dou sisteme s nu poat fi comparate obiectiv, care este cel mai
bun program de benchmarking? Rspunsul amar i evident este: nici unul. De fapt,
rspunsul corect este: cea mai bun msur a performanei unui sistem este utilizatorul
acestuia, fiindc este la fel de subiectiv ca i un soft de testare. n sensul c dac mie mi
este de ajuns sistemul X, degeaba rd alii de mine c nu scot nici 1000 de puncte n
3DMark 05, iar dac sunt un mega-super-hiper pretenios, pot s am 15.000 de puncte n
PCMark 05, tot nemulumit rmn. Ergo, satisfacia unui utilizator nu este egal cu cifra
afiat ca rezultat de respectivul program de testare. Dar cine se poate lupta cu spiritul
de competiie al omului?

iv

1. Noiuni de baz privind evaluarea performanelor


Benchmarking este un proces utilizat n management i n particular
management strategic, n care organizaia evalueaz mai multe aspecte ale propriilor
procese n relaie cu "best practice" (succesul), de obicei n interiorul sectorului propriu
de activitate. Acest proces permite organizaiilor s dezvolte planuri despre cum s
adopte aceste poveti de succes (best preactice), cu scopul de a obine creteri n
performanei. Benchmarking-ul poate fi un eveniment de singular, dardeseori este tratat
ca un proces continuu n care organizaia caut n mod permanent s-i mbunteasc
practicile.
Traducere:
Bench-mark = (inf) mulime bench-mark (mulime cu un numr minim de
lucrri, utilizat pentru evaluarea performanelor);

1.1. Benchmark-ul organizaiilor


1.1.1. Avantajele benchmarking-ului
Benchmarking-ul este o unealt de management puternic deoarece nvinge
"paradigmul orbului", paradigm care poate fi rezumat la modul de gndire, adic astfel:
"Calea pe care o urmm este cea mai bun, deoarece este calea pe care o urmm
ntotdeauna". Benchmarkingul deschide organizaiile ctre noi metode, idei i mijloace
pentru ai mbunti eficacitatea. El ajut la nvingerea rezistenei naturale mpotriva
schimbrilor prin demonstrarea altor metode utilizabile n rezolvarea problemelor i
demonstreaz c aceste metode funcioneaz fiind folosite i de alii.
Avantajele benchmarking-ului asupra companiilor:
O mai bun nelegere asupra ateptrilor clienilor deoarece benchmark-ul este
bazat pe realitatea pieei estimate ntr-un mod obiectiv;
O planificare economic mai bun a scopurilor i obiectivelor de atins n
companie deoarece ele sunt: centrate pe ce are loc n afara spaiului controlat i
stpnit;
O mai bun cretere a productivitii: rezoluia problemelor reale prin
nelegerea proceselor i a ceea ce produc ele;
O practic curent mai bun;
O mai competitivitate datorit: nelegerii solide a competiiei cu o puternic
implicare a noilor idei de vrf n practic i n testarea noilor tehnologii.
Benchmark-ul are consecine care sunt dincolo de procesul nsui: el reformeaz
toate nivelurile companiei, modific procesul de producie, reformeaz organizarea
ierarhic a companiei, producia nsi, i mentalitatea angajailor.
1.1.2. Procedura de realizare a benchmark-ului

Identificarea zonelor cu probleme - deoarece benchmakingul poate fi aplicat


oricrui proces sau funcii economice, pot fi necesare o serie de tehnici de
cercetare. Acestea includ: conversaii informaionale cu clienii, angajaii sau
5

Evaluarea performanelor sistemelor de calcul

furnizorii; tehnici de cercetarea exploratorii, cum ar fi: grupul int, cercetri de


marketing, cantitative, supraveghere, chestionare, analiz inginereasc, harta
procesului, controlul calitii, analiza indicatorilor financiari:
Identificarea organizaiilor care sunt lideri n aceste probleme
Examinarea, supravegherea companiilor pentru msurtori i practic
companiile ating anumite procese de afaceri folosind examinri detaliate ale
msurtorilor i practicilor utilizate pentru a identifica procese alternative i
companii de vrf. Supravegherea este realizat, de obicei, asociai i/sau
consultani neutri, pentru a proteja datele confideniale;
Vizitarea companiilor de succes pentru a identifica cele mai bune metode
(practici) companiile sunt de obicei de acord cu schimbul mutual de informaii
n interes comun pentru un grup de benchamark i a mpri rezultatele n
interiorul grupului,
Implementarea i mbuntirea noilor practici acumulate preluarea celor
mai bune practici (metode) i dezvoltarea planurilor de implementare care includ
identificarea oportunitilor specifice, finanarea proiectului i vnzarea ideilor
ctre organizaie n scopul obinerii valorilor demonstrative ale procesului.

1.1.3. Costul benchmarking-ului


Benchmarking-ul este un proces cu un cost moderat-scump. Principalele trei
tipuri de costuri sunt:
Costuri cu deplasri cheltuieli cu transportul, cazarea, diurna, cadouri
simbolice, i pierderea timpului cu munca;
Costuri cu timpul membrii echipei de benchmark vor investi timp n cercetarea
problemelor, gsirea celor mai bune companii pentru studiu, vizitare i
implementare. Acest timp este luat din timpul dedicat activitilor curente de
producie;
Costul bazei de date de benchmarking - organizaiile ca au instituionalizat
benchmarkingul n procedura zilnic creeaz i ntrein o baz de date cu best
practice i cu companiile asociate fiecrui succes.

1.2. Benchmarking-ului n computere


n domeniul computerelor, benchmarking-ul nseamn rularea unui program de
calculaor, sau a unui set de programe sau alte operaii, cu scopul de a stabili
performanele relative a unui obiect, normal prin rularea a unui numr de testa standard
sau de ncercare asupra lui. Termenlul benchmark mai este de asemenea folosit de
specialiti pentru a defini nsi programele de testare.
Benchmarking-ul este de obicei asociat cu evaluarea performanelor
componentelor hardware caracteristice ale calculatoarelor, de exemplu, testarea
performanelor procesoarelor la operarea n virgul mobil. Testarea poate fi aplicat,
de asemenea, i software-uli, n special n testarea compilatoarelor sau a bazelor de date
de management a sistemului.
Benchmark-urile ofer o metod de comparare a performanelor diferitor tipuri
de subsisteme n combinaie cu diferite sisteme. Benchmark-ul este util n nelegerea
modului n care managerul bazei de dare rspunde n diferite condiii. Pot fi create
scenarii care testeaz blocarea definitiv a manipulrii, utiliti de performan, diferite
6

Cap 1: Noiuni de baz privind evaluarea performanelor

metode de ncrcat date, caracteristica ratei de tranzacie cnd sunt conectai mai muli
utilizatori i chiar efectele utilizrii unei versiuni noi a produsului.
1.2.1. Scopul benchmarking-ului
Odat cu avansarea arhitecturii calculatoarelor, este din ce n ce mai dificil
compararea performanelor diferitelor sisteme de calcul doar prin analizarea
specificaiilor lor. Astfel, au fost dezvoltate teste care pot fi realizate pe diferite sisteme,
permind compararea rezultatelor obinute pe sisteme diferite. De exemplu, n tip ce
un procesor Intel Pentium 4 opereaz n general la frecvene mai mari dect AMD
Athlon XP, asta nu nseamn n mod automat mai mult putere de calcul,. Cu alte
cuvinte, un procesor AMD "mai lent" din punct de vedere al frecvenei de ceas, poate
realiza la fel de bine un test de benchmark ca un procesor Intel ce funcioneaz la o
frecven mai mare.
Benchmark-urile sunt destinate a imita un anumit tip de suprasarcin pe un
calculator sau sistem. Benchmarking-ul "sintetic" realizeaz testarea prin programe
special create care impun o suprasarcin componentei evaluate. Benchmark-ul
"aplicaie" ruleaz un program din lumea real pe sistem. n timp ce benchmark-ul
aplicaie ne d o msur mult mai bun a performanelor reale ale sistemelor,
benchmark-ul sintetic i are utilitatea n testarea individual a unor componente, cum
ar fi hard discuri sau dispozitive de reea.
Benchmark-urile sunt importante n special n proiectarea micorprocesoarelor,
oferind arhitecturii procesorului abilitatea de a msura i realiza optimizarea deciziilor
din proiectarea micro arhitectural. De exemplu, dac un benchmark ne ofer algoritmul
cheie pentru o aplicaie, el va conine aspecte ale performanelor sensibile ale acelei
aplicaii. Rulnd aceasta ntr-o bucl mult mai strmt pe un simulator ciclic precis,
putem obine indicii privind mbuntirea performanelor.
Productorii de calculatoare au o lung istorie n ncercarea de a-i seta
(proiecta) sistemele pentru a obine performane mai nalte, nerealiste, n testele de
benchmark care nu se regsesc i n utilizarea real. De exemplu, prin 1980 unele
compilatoare puteau detecta o operaie specific matematic folosit n cunoscutul
benchmark n virgul mobil i nlocuiau operaia cu o operaie matematic echivalent
care este mult mai rapid. Dar, o asemenea transformare era rareori utilizat n afara
benchmark-ului , pn la mijlocul anilor 1990, cnd arhitecturile RISC1 i VLIW2 au
evideniat importana tehnologiei compilrii n atingerea performanelor. Benchmarkurile sunt acum frecvent utilizate de dezvoltatorii de compilatoare pentru a mbunti
nu numai propriul scor, dar i performanele reale ale aplicaiilor.
Productorii raporteaz de obicei doar benchmark-urile (sau aspecte ale
acestora) care pun produsul lor ntr-o lumin bun. Este de asemenea cunioscut metoda
de a denatura semnificaia benchmark-urilor, doar pentru a pune ntr-o lumin mai
bun propriile produse. Luate mpreun, aceste practici sunt numite "benc-marketing".
1.2.2. Provocri
Benchmarking-ul nu este uor i deseori implic mai multe runde iterative
nainte de a obine concluzii predictibile i utile. Interpretarea datelor benchmark-ului

1
2

RISC = reduced instruction set computer


VLIW = Very Long Instruction Word
7

Evaluarea performanelor sistemelor de calcul

este, de asemenea, extraordinar de dificil. Iat cteva din provocrile normale ale
benchmarking-ului:
productorii au tendina de a potrivi specificaiile produselor dup standardele
industriale;
benchmark-urile n general nu dau nici o garanie pentru calitatea serviciilor.
Exemple de ne-msurare a calitii serviciilor includ: securitatea,
disponibilitatea, fiabilitatea, integritatea execuiei, durata de serviciu,
scalabilitatea (n special abilitatea de a aduga sau modifica capaciti n mod
nedistructiv);
n general, benchmark-urile nu msoar TCO3. Specificaiile TCP4 Benchmark
se adreseaz parial asupra costului de proprietate prin specificarea faptului c
trebuie utilizat o metric pre/performan.
Benchmarkul rareori msoar performanele din lumea real a sarcinilor mixate
rularea unor aplicaii multiple concureniale ntr-un context multidepartamental / multi-aplicaie. De exemplu, serverul mainframe IBM exceleaz
n sarcini mixate, dar standardele industriale de evaluare nu tind s msoare
puterea I/O i design-ul mare i rapid al memoriilor de care are nevoie serverul.
Multe alte arhitecturi de server dicteaz o funcie fix, un scop unic: server de
baze de date, server de aplicaii, server de fiiere, server web;
Productorii de benchmark-uri tind s ignore necesitile pentru capacitile de
dezvoltare, testare i recuperarea n caz de dezastru. Productorilor le place s se
raporteze doar la necesitile restrnse ale capacitilor de producie.
Benchmark-urile au probleme n adaptarea la lumea serverelor distribuite, n
special datorit sensibilitii topologiei reelelor;
Utilizatorii pot avea percepii foarte diferite a performaneei pe care benchmarkul o poate sugera. n particular, utilizatorii apreciaz predictabilitatea servere
care ntotdeauna ndeplinesc sau depesc SLA5. Bgenchmark-ul tinde s
accentueze un scor (din perspectiva IT).
Multe arhitecturi de servere se degradeaz dramatic la un nivel ridicat de
utilizare (apropiat de 100%) - ("fall off a cliff" = cdere n pant, brusc), dar
benchmark-ul nu ia ntotdeauna n calcul acest factor. Productorii au tendina s
publice rezultatele benchmark-ului pentru o utilizare constant de 80% a
serverelor, o situaie total nereal, i s nu ne informeze despre ce se ntmpl la
suprancrcarea sistemului, cnd vrful de sarcin trece epste acest prag.
1.2.3. Tipuri de benchmark
1. Real program
o Software de procesare text;
o Unelte software CDA
o Aplicaii utilizator (MIS)
2. Kernel
o Conine codul cheie;
o n mod normal abstract de la programul actual ;
o Kernel normal: bucle Livermore;
3

TCO = Total cost of ownership


TCP Benchmark = Transaction Processing Performance Council
5
SLA = Service Level Agreement
8
4

Cap 1: Noiuni de baz privind evaluarea performanelor

linpack benchmark (cnine subrutine algebrice lineare scrise n limbajul


FORTRAN);
6
o rezultatele sunt prezentate n MFLOPS
Toy Benchmark/ micro-benchmark
o Utilizatorii le pot programa i utiliza pentru a testa componentele de baz
ale calculatorului;
o Detecteaz
automat parametrii componentelor hardware ale
calculatoarelor, cum ar fi: numr de nregistrare, dimensiune cache,
ntrzierea memoriei;
Synthetic Benchmark
o Procedura pentru programarea unui synthetic Bench mark
Se culeg date statistice despre toate tipurile de operaii de la
programele de aplicaii;
Se obine proporia fiecrei operaii
Se scrie un program bazat pe proporiile obinute anterior.
o Tipuri de Synthetic Benchmark:
Whetstone
Dhrystone
o Rezultatele sunt reprezentate n KWIPS (kilo whetstone instructions per
second). Acest test nu este adecvat
pentru a msura pileline-ul (conductele)
computerelor.
I/O benchmarks
Benchmark-uri paralele: sunt utilizate pe
maini cu procesoare multiple sau sisteme ce
onstau din mai multe maini.
o

3.

4.

5.
6.

1.3. Arhitectura calculatoarelor


n viziune clasic, arhitectura calculatorului
este vzut c o serie de straturi abstracte:
Hardware este un termen utilizat n general Fig. 1.1: O viziune tipic asupra
pentru deschierea componentelor fizice ale
arhitecturii calculatorului ca o
sistemului,
serie de straturi.
Firmware este un software scris (ars) de
productori n componentele hardware (cipuri);
Assembler program utilitar folosit pentru traducerea limbajului de asamblare
(care este un limbaj low-level pentru programarea calculatoarelor);
Kernel reprezint componenta central a oricrui sistem de operare al
computerului, el administreaz resursele sistemului i comunicarea dintre
componentele hardware i software;
sistem de operare reprezint un set de programe care administreaz resursele
hardware i software ale unui computer;
aplicaii.

MFLOPS = FLoating point Operations Per Second, operaii n virgul mobil pe secund
9

Evaluarea performanelor sistemelor de calcul

n ingineria calculatoarelor, arhitectura calculatoarelor este un design conceptual


i structurarea funcionrii fundamentale a unui sistem de calcul. Ea reprezint copia
fidel i descrierea funcional a cerinelor (n special viteze i interconexiuni) i
designul implementrii pentru diferite pri ale calculatorului, concentrndu-se pe larg
asupra modului n care unitatea central de calcul (procesorul) realizeaz funciile sale
interne i acceseaz adresele din memorie.
Arhitectura calculatoarelor cuprinde cel puin trei ari categorii:
arhitectura setului de instruciuni, sau ISA, - este o imagine abstract a
sistemului de calcul care este vzut de limbajul main (limbajul de
asamblare), i include setul de instruciuni, modul de adresare al memoriei,
regitrii procesor i adresarea i formatul datelor;
micro-arhitectura, cunoscut ca i organizarea calculatorului, - este de nivel
sczut, mai concret, descrierea sistemului care implic cum prile
constituente ale sistemului sunt interconectate i cum inter-opereaz ele
pentru a implementa ISA. De exemplu, dimensiunea memoriei cache, este o
caracteristic organizaional care, n general, nu are nimic n comun cu ISA.
designul sistemului, care include toate celelalte componente hardware din
calculator, cum ar fi:
o sistemul de interconectare: magistrale i comutatoare;
o controllerul de memorie i ierarhie;
o mecanismul de acces direct la memorie al CPU;
o faciliti ca multiprocesarea.
Odat ce ISA i microarhitectura au fost specificate, dispozitivul trebuie s fie
proiectat n hardware. Acest proces de design, proiectare, este deseori denumit
implementare. Implementarea nu este considerat ca fcnd parte din arhitectura
calculatorului, ci, mai degrab, din ingineria proiectrii.
Implementarea poate fi mprit n trei pri, i anume:
implementarea logic n care blocurile definite n microarhitectur sunt
implementate ca ecuaii logice;
implementarea circuitului n care blocuri de vitez critic, sau ecuaii
logice sau pori logice sunt implementate la nivel de tranzistor;
implementarea fizic n care circuitele sunt desenate, componente de
circuit diferite sunt plasate n planul chipului sau pe plac i sunt trasate
conexiunile dintre piese.
Pentru procesoare, ntregul proces de implementare se numete CPU design.
1.3.1. Scopurile proiectrii
Cele mai comune ine n arhitectura calculatoarelor este realizarea echilibrului
dintre cost i performan (ex: vitez), alturi de alte consideraii, cum ar fi:
dimensiunea, greutatea, fiabilitatea, setul de faciliti, expandabilitatea i consumul de
energie.
Costul n general costul este meninut constant, determinat de cerineele de
sistem sau comerciale;
Performana
n general, performana calculatorului este descris n termeni de vitez de ceas
(MHz sau GHz). Aceasta se refer la cicluri pe secund ale ceasului procesorului. Dar,
10

Cap 1: Noiuni de baz privind evaluarea performanelor

de multe ori aceast msur este greit neleas, deoarece o main cu o frecven de
ceas mai mare nu este obligatoriu s ating performane mai nalte. Drept rezultat,
productorii sau ndeprtat de msurarea performanelor prin msurarea frecvenei
procesorului. Performanele calculatorului mai pot fi, de asemenea, msurate prin
dimensiunea memoriei cache. Drept analogie s luam traficul auto, dac viteza mainii
este dat n MHz sau n GHz, lipsa aglomeraiei de pe autostrad este dat de mrimea
cache. Nu conteaz ct de mare este viteza unei maini, dac autostrada este aglomerat
(cache mic) performanele vor fi reduse. Cu ct viteza este mai mare, cu att mai mare
este necesarul de cache.
Procesoarele moderne pot executa mai multe instruciuni pe un ciclu de ceas,
ceea ce crete dramatic viteza de execuie a unui program. Un alt factor care
influeneaz viteza este mixarea unor uniti funcionale, viteza magistralei,
disponibilitatea memoriei i tipul i ordinea instruciunilor din programul care ruleaz.
Sunt dou tipuri principale de vitez: latena i puterea de trecere (throughput).
Latena este timpul dintre nceputul procesului i terminarea lui. Puterea de trecere
reprezint cantitatea de munc realizat pe unitate de timp. Latena de ntrerupere7 este
garantarea timpului maxim de rspuns a sistemului la un eveniment electronic (ex: cnd
HDD termin de mutat datele dintr-un loc n altul). Performana este afectat de o foarte
mare plaj de alegeri fcute n proiectare de exemplu, adugarea de cache face latena
mai proast (lent) dar crete puterea de trecere. Calculatoarele care controleaz maini
(calculatoarele de proces) necesit, de obicei, o laten de ntrerupere sczut. Aceste
calculatoare opereaz n timp real i produc eec dac o operaie nu este terminat ntrun anumit interval de timp.
Performana unui calculator poate fi msurat folosind alte metrici, dependente
de domeniul de aplicaie. Consumul de energie a devenit important n sistemele server
i cele portabile.
Benchmarking-ul ncearc s ia n considerare toi aceti factori n procesul de
msurarea a timpului de execuie a unei serii de programe de test. Cu toate c
benchmark-ul ne d puterea, el nu ne poate ajuta n alegerea unui calculator. De cele
mai multe ori, msurarea unei maini nseamn mai multe msurtori. De exemplu, un
sistem poate realiza rapid aplicaii tiinifice, iar un altul poate rula jocuri video la mod
mult mai uor.
Schema general a optimizrii este de a cuta costurile diferitor pri
componente al calculatorului. ntr-un sistem de calcul echilibrat, rata de transfer a
datelor va fi constant pentru toate prile sistemului, i costul va fi alocat proporional
pentru a asigura acest lucru. Forma exact a unui sistem de calcul va depinde de
constrngerile i scopurile pentru care va fi optimizat.
Consumul de energie
Consumul de putere este un alt criteriu de design. Eficiena energetic poate fi
deseori tratat pentru performan sau eficien economic. Odat cu creterea densitii
de energie n circuitele numerice moderne datorat creterii numrului de tranzistori din
chip, eficiena energetic a crescu ca importan. Designul procesoarelor moderne, cum
este i IntelCore 2 pune un accent mai mare pe creterea eficienei energetice. Astfel, n
lumea calculatoarelor capsulate, eficiena energetic a fost i rmne principala int n
proiectare, alturi de performan.
7

latena de ntrerupere - timpul scrus de la generarea unei ntreruperi de ctre un dispozitiv i deservirea
acelui disozitiv.
11

2. Evaluarea performanelor plcilor de baz


2.1. Plcile de baz: funcionare, istorie
2.1.1. Definiii de baz: chipset-ul
Chip-ul reprezint denumirea pentru un circuit integrat, construit pe baz de
siliciu, care are un rol bine definit n funcionarea unui echipament electronic.
Procesorul, memoria, placa de baz, placa grafic, placa de sunet, toate nglobeaz unul
sau mai multe astfel de chip-uri, fiecare avnd rolul su, ce poate fi ori de execuie a
anumitor operaii, ori de memorare a unor date, de obicei temporar. Spre exemplu,
funcia procesorului este uor de neles: execuia propriu-zis a operaiilor necesare
desfurrii activitilor unui computer. Placa grafic deine un chip principal ce
efectueaz operaii similare dar optimizate pentru domeniul grafic, att 2D ct i 3D.
Memoria nu face altceva dect s stocheze temporar informaii necesare celorlalte
echipamente. Am ajuns la placa de baz, al crei rol este mai greu de neles. Muli vor
considera c singurul ei rol este acela de a lega componentele ntre ele, aadar ce nevoie
mai avem de chip-urile prezente pe ea? n primul rnd, placa de baz nu este pur i
simplu un element de legtur ci componenta principal a unui sistem, care coordoneaz
toate activitile. Ea joac rol de arbitru i direcioneaz fluxurile de date ntre procesor
i memorie, memorie i hard disk, procesor i tastatur i altele asemenea. Nimic nu
poate funciona pur i simplu, este nevoie de o component suprem care s tie s
foloseasc resursele celorlalte componente dintr-un PC. Un astfel de echipament poart
numele de controller. Putem spune c placa de baz este un controller general, diferitele
segmente ale ei oferind funcia de controller local. De exemplu, controller-ul de
memorie este circuitul care d via memoriei, fr el minunatele memorii DDR
PC3200 vor fi alimentate cu energie i nimic mai mult, neexistnd nimeni care s
exploateze posibilitile oferite de ele.

(plac de baz pentru procesoare 486)

(plac de baz modern: Epox 4PCA3+)

Controller-ul principal al plcii de baz este denumit chipset, fiind format de


obicei din dou chip-uri independente (de aici denumirea de chipset = set de chip-uri).
Ele poart numele de northbridge i southbridge (aceasta n ciuda ncercrii unor
companii de a le schimba aceste nume deja ncetenite). Sau altfel spus, puntea de nord
i cea de sud (evident c nu exist nici o legtur cu punctele cardinale, nordul i sudul
fiind alese pentru a sublinia poziiile opuse pe care le au aceste chip-uri, aproape
simetrice fa de centrul plcii). Fiecare dintre ele are un rol bine determinat, rol care
depinde de la chipset la chipset dar exist multe elemente comune ntre diferitele
modele. Numrul tipurilor de chipset-uri aprute de-a lungul istoriei este foarte mare,
ns numrul celor folosite ntr-o anumit perioad a evoluiei PC-urilor este relativ mic.
12

Cap 2: Evaluarea performanelor plcilor de baz

Voi folosi n continuare denumirile de chipset, northbridge i southbridge chiar dac ele
nu sunt 100% corecte, n primul caz pentru c unele chipset-uri sunt de fapt simple chipuri (nordul se contopete cu sudul), fiind prezent un singur integrat principal pe placa de
baz ce joac dublu rol, iar n ultimele cazuri pentru c schimbarea forat a denumirilor
de ctre productori (un exemplu fiind Intel) este ntemeiat i relevant.
Aceast prim parte a capitolului intenioneaz, pe de o parte, s fac lumin
printre utilizatorii de calculatoare care nu cunosc principiile funcionrii plcilor de baz
moderne i nici nu sunt la curent cu ultimele evoluii de chipset-uri i, pe de alt parte,
s ofere pasionailor o scurt istorie a acestui domeniu. Cum o istorie a modelelor de
plci de baz este inutil i practic imposibil de realizat, numrul lor fiind de ordinul
miilor, vom parcurge chipset-urile prezente n epoca modern a calculatoarelor,
insistnd pe perioada ultimilor 5-6 ani i exemplificnd acolo unde este cazul cu modele
de plci care au rmas cu adevrat n istorie.
Pentru nceput, vom vorbi despre modelul clasic de chipset, format din
northbridge i southbridge, componente ce ndeplinesc anumite sarcini standard:
northbridge-ul este rspunztor de comunicarea cu procesorul, cu memoria, cu portul
AGP i/sau PCI Express (dac cel puin unul dintre ele exist) iar southbridge-ul cu tot
ce nseamn periferic: uniti de stocare (porturile IDE i cel de floppy), slot-urile PCI i
ISA i interfeele externe, cum ar fi cea USB, FireWire, reeaua sau sunetul.
Comunicarea dintre cele dou componente principale este realizat la o vitez maxim
predefinit, care este de regul egal cu cea a bus-ului PCI (133 MB/s), eventual
multiplicat de un numr de ori. (Vom vedea mai trziu ce este un bus.) Spre exemplu,
comunicarea dintre nordul i sudul chipset-ului VIA KT133A este realizat la viteza
bus-ului PCI, la KT266A ea este (cu ajutorul tehnologiei V-Link) de 266 MB/s iar n
cazul lui KT400 la 533 MB/s (V-Link 8x). Aceasta nseamn c fluxul de date nu poate
depi aceast limit, deci degeaba avei un hard disk Serial ATA cu un transfer de 150
MB/s (iari, maxim) dac exist limitarea de 133 MB/s. n realitate, aceste limite nu
influeneaz aproape deloc performana unui sistem, necesarul fiind mai mare dect
limita ntr-un numr infim de situaii; dac hard disk-ul dorete s transfere 150 MB/s
ntr-o situaie dintr-o mie i nu-i pot fi satisfcui dect 133 MB/s, rezult faptul c
viteza sa a fost diminuat cu un procent total nesemnificativ. Productorii de chipset-uri
se lupt n aceast pseudo-competiie a bus-urilor, recent depindu-se 1 GB/s. ntradevr, arat bine pe hrtie.
Dup cum ai putut observa, fiecare component a
sistemului trebuie controlat de cineva. Plcile PCI sunt, la
rndul lor, un fel de controllere, ele fiind rspunztoare de
activiti conexe, cum ar fi emiterea de sunet n boxe (plcile de
sunet), preluarea semnalului din linia telefonic (modemul) sau
prelucrarea semnalului TV (TV tuner-ul). Mai mult, unele plci
chiar se numesc controllere i ndeplinesc funcia de suport
pentru unele componente externe pe care placa de baz nu le
cunoate. Spre exemplu, dac placa de baz nu deine integrat suportul pentru interfaa
FireWire, o simpl plac PCI poate ndeplini sarcina. Sau, mai exist situaia n care
controller-ul nu este nici integrat n chipset-ul plcii de baz, nici prezent sub forma
unei plci suplimentare; el este pur i simplu integrat pe plac, sub forma unui chip,
fiind considerat un dispozitiv obinuit, ataat adesea la bus-ul PCI.
Northbridge-ul este componenta principal a chipset-ului, de el depinznd
practic performana sa. Un controller de memorie bun poate oferi mai mult vitez, i
13

Evaluarea performanelor sistemelor de calcul

aceasta ne putem da seama parial doar privind specificaiile. S lum nite exemple:
VIA KT266A i KT333. Primul poate lucra cu memorie DDR la frecvena de 133 MHz,
al doilea poate crete viteza acesteia la 166 MHz, de unde rezult performane mai bune.
Exist i alt situaie, aceea n care specificaiile sunt aceleai dar performanele difer:
KT266A este mai rapid dect KT266, dei ambele suport acelai tip de memorie, din
cauza optimizrilor interne. Uneori, aceste optimizri
depesc n eficien fora brut a creterii frecvenei,
cum este i n cazul de fa: saltul de performan de la
KT266 la KT266A este mai mare dect n cazul
comparaiei KT266A - KT333.
Exist mai multe tipuri de controllere de
memorie, n funcie de tipul acesteia. Unele pot lucra i
cu memorie SDR i cu cea DDR, altele sunt dedicate
special celor de tip Rambus, altele ofer tehnici de
dublare a vitezei efective (nc o dat fa de DDR); este
vorba de tehnologia dual-channel. Iar alte chipset-uri nici nu conin acest controller, el
fiind integrat n procesor, precum este cazul procesoarelor din familia AMD64.
A doua sarcin principal a northbridge-ului este comunicarea cu procesorul.
Aici apar diferenele fundamentale dintre chipset-uri i de aceea exist incompatibiliti
ntre anumite chipset-uri i anumite procesoare. Limbajul folosit pentru comunicare
trebuie s fie comun i, din cauza faptului c exist mai multe generaii i mai multe
companii care produc procesoare, exist i mai multe standarde n ceea ce privete
chipset-urile. Astfel, gsim cteva platforme distincte: Athlon XP (Socket A), Pentium
4 (Socket 478, LGA 775), Athlon 64 (Socket 754 i 939) i exemplele pot continua.
Pentru fiecare din ele exist o serie de chipset-uri care cunosc limbajul procesoarelor
n cauz i astfel pot dota plci de baz corespunztoare acestora. Acest limbaj, care
permite comunicarea pe aceeai lungime de und ntre orice dou componente dintrun sistem, se numete bus.
Deja se nate o ntrebare fireasc: care este viteza de comunicare dintre
northbridge i procesor? Aceast vitez este dat de PSB (Processor Side Bus), variaz
n funcie de procesor dar i de setrile plcii de baz i se msoar n MHz.
Procesoarele pn la Pentium III aveau acest PSB setat la frecvene ntre 66 i 133 MHz
(nu vorbim aici de creterea artificial, adic overclocking). Pentru procesoarele din
familia AMD K7 (Athlon, Athlon XP, Duron), el variaz ntre 100 i 200 MHz, n
funcie de procesor, frecven care este multiplicat cu 2. n termeni electronici, spunem
c informaia este transmis att pe frontul cresctor ct i pe cel descresctor al
semnalului, de unde rezult o dublare a vitezei (i nu o dublare a frecvenei), tehnic
folosit i la memoria DDR. Departamentele de marketing au profitat imediat de situaie
i au afirmat c FSB-ul procesoarelor Athlon este de 200-400 MHz, afirmaie teoretic
greit, practic neafectnd cu nimic adevrul palpabil. Pentium 4 folosete un
mecanism asemntor prin care multiplic de patru ori PSB-ul, rezultnd 400, 533, 800
i 1066 MHz virtuali n loc de 100, 133, 200 i 266.
Bus-urile AGP i PCI Express reprezint a treia sarcin a northbridge-ului. Orice
sistem modern deine o plac grafic cu capabiliti 3D, component care comunic cu
northbridge-ul prin bus-ul AGP sau PCI Express X16. Frecvena celui AGP este de 66
MHz, egal cu dublul frecvenei PCI, ns ea este multiplicat opional de un numr de
ori, corespunztor x-ului indicator: AGP 2x, AGP 4x, AGP 8x, ultimul oferind valoarea
impresionant de 2.1 GB/s. Sunt valabile aceleai considerente de la comunicarea dintre
14

Cap 2: Evaluarea performanelor plcilor de baz

cele dou componente ale chipset-ului, aadar necesarul efectiv este n majoritatea
cazurilor mult mai mic dect cel oferit de AGP 8x. Drept dovad, micorarea forat a
transferului la nivelul lui AGP 2x nu scade performanele cu mai mult de 10-30%.
n cazul lui PCI Express, lucrurile stau altfel: att bus-ul X16, necesar plcii
grafice (eventual X8 n unele cazuri), ct i cele destinate plcilor obinuite (X1, X4)
sunt gestionate de northbridge. Frecvena sa este de 100 MHz,
iar rata de transfer n modul 1x este similar lui AGP 1x i dubl
fa de PCI.
2.1.2. Memoria, tipuri de memorie
Memoria RAM (Random Access Memory) este denumirea generic pentru orice
tip de memorie care deine urmtoarele caracteristici:
poate fi accesat aleator (nu secvenial, precum benzile magnetice),
este volatil (la ntreruperea alimentrii cu energie electric, datele stocate se
pierd) i ,
se prezint sub form de chip-uri (aadar excludem dispozitivele magnetice sau
optice, precum hard disk-urile sau CD-urile).
Utilitatea memoriei RAM este foarte mare, ea beneficiind n plus fa de alte
medii de stocare a informaiilor de o vitez extrem de mare, fiind de mii de ori mai
rapid dect un hard disk, de exemplu. Exist dou tipuri principale de RAM: memorie
static (SRAM = Static RAM) i dinamic (DRAM = Dynamic RAM), diferenele
constnd n stabilitatea informaiilor. Astfel, memoria static pstreaz datele pentru o
perioad de timp nelimitat, pn n momentul n care ea este rescris, asemntor unui
mediu magnetic. n schimb, memoria dinamic necesit rescrierea permanent, la cteva
fraciuni de secund, altfel informaiile fiind pierdute. Avantajele memoriei SRAM:
utilitatea crescut datorit modului de funcionare i viteza foarte mare; dezavantaj:
preul mult peste DRAM.
n realitate, memoria de tip SRAM este folosit cel mai adesea ca memorie
cache pe cnd DRAM-ul este uzual n PC-urile moderne, fiind prezent n primul rnd ca
memorie principal a oricrui sistem. De acest din urm tip ne vom ocupa n continuare,
enumernd tipurile uzuale de DRAM prezente de-a lungul istoriei, toate concepute n
scopul creterii performanelor DRAM-ului standard: FPM DRAM (Fast Page Mode
DRAM), EDO DRAM (Extended Data Out DRAM), BEDO RAM (Burst EDO DRAM),
RDRAM (Rambus DRAM), n prezent impunndu-se SDRAM (Synchronous DRAM),
cu variantele DDR SDRAM (Double Data Rate SDRAM) i DDR2 SDRAM.
De asemenea, pentru plcile grafice au fost concepute mai multe tipuri de
memorie, printre care VRAM (Video RAM), WRAM (Windows RAM), SGRAM
(Synchronous Graphics RAM) i GDDR3, ele fiind variante de DRAM (primele dou),
SDRAM i respectiv DDR2 SDRAM, optimizate pentru a fi folosite ca memorie video.
Ar mai fi de menionat alte dou elemente care influeneaz viteza, stabilitatea i
preul memoriilor: funciile ECC i Registered, integrate n unele module de memorie.
Cele ECC (Error Correction Code) dein o funcie special care permite corectarea
erorilor ce apar pe parcursul utilizrii iar cele Registered (numite i Buffered), dein un
buffer (zon de memorie suplimentar) care depoziteaz informaia nainte ca ea s fie
transmis controller-ului, permind verificarea riguroas a acesteia.
Memoriile Registered sunt mai lente dect cele normale sau ECC i extrem de
scumpe, folosirea lor fiind justificat doar n cazuri speciale, cnd corectitudinea
15

Evaluarea performanelor sistemelor de calcul

informaiilor prelucrate i stabilitatea sistemului este vital, de exemplu n cazul serverelor. n general, att timp ct memoria nu este supus unor situaii anormale de
funcionare (frecven, tensiune sau temperatur n afara specificaiilor) ea ofer o
stabilitate extrem de apropiat de perfeciune, arhisuficient pentru un calculator
obinuit.
Ne-am referit pn acum la chip-urile de memorie, cnd vine vorba de modulele
n sine (plcuele care se introduc n slot-urile plcii de baz), avem cteva modele
constructive. Dup perioada de nceput, cnd chip-urile de memorie se nfigeau pur i
simplu n placa de baz, primul model uzual a fost SIMM-ul pe 30 de pini, urmat de cel
pe 72 de pini. Denumirea de SIMM provine de la Single Inline
Memory Module, modulul prezentnd o lime de band de 8
bii pentru prima versiune i de 32 pentru cea de-a doua;
dimensiunea fizic a SIMM-ului pe 30 de pini este de dou ori
mai mic dect n cazul celeilalte variante. Diferenele de vitez
dintre ele corespund perfect perioadei de glorie: dac prima versiune era uzual pe
timpul sistemelor 286 i 386, SIMM-ul pe 72 de pini a stat la baza generaiei 486,
Pentium i Pentium Pro. Chip-urile folosite au fost de tip DRAM, FPM i, mai trziu,
EDO DRAM.
Urmaul lui SIMM s-a chemat DIMM, adic Dual Inline Memory Module. Dup
cum i spune i numele, el ofer o lime de band de 64 de bii, dubl fa de SIMMurile pe 72 de pini, avnd la baz un fel de dual-channel intern, dac ni se permite
comparaia. Numrul de pini a fost de 168 sau de 184 de pini, n funcie de tip: SDRAM
sau DDR SDRAM. A existat i un numr limitat de modele de DIMM bazate pe EDO
DRAM dar ele nu au avut succes pentru c trecerea de la SIMM la DIMM a coincis cu
cea de la EDO la SDRAM.
RIMM (Rambus Inline Memory Module) este modelul constructiv al memoriilor
RDRAM. Numrul de pini este de 184 (ca i la DDR SDRAM) dar asemnrile se
opresc aici, configuraia pinilor i modul de lucru fiind total diferit. Mai amintim de
modulele SO-DIMM, destinate calculatoarelor portabile, care dein un numr diferit de
pini: 184 pentru SDRAM i 200 pentru DDR SDRAM.
Practic vorbind, montarea modulelor SIMM era o operaie greoaie i necesita
experien i ndemnare. Odat cu modulele DIMM (i RIMM, care au acelai sistem
de prindere) chinul a fost dat uitrii, oricine putnd monta o memorie, fiind necesar
doar puin atenie. Montarea invers a unui DIMM (care necesit, totui, destul for)
duce ntotdeauna la arderea memoriei.
Diferenele de vitez dintre memorii se bazeaz n mare parte pe diferenele de
frecvene. S lum cazul memoriei principale, inclus n sisteme ca memorie de lucru.
n prim faz, pn la apariia procesoarelor 80486, frecvena sa era egal cu cea a
procesorului i a PSB-ului (de ordinul zecilor de MHz), ns n momentul n care
procesoarele au atins frecvene de peste 50 MHz, s-a pus problema faptului c nu exist
posibilitatea fabricrii (la preuri acceptabile) de memorii la astfel de frecvene. Aa c
s-a recurs la un truc: s-a hotrt ca memoria i PSB-ul s lucreze la o frecven mai
mic dect cea a procesorului, setndu-se astfel un raport fix ntre PSB i procesor.
Astfel, un 486 DX4 la 100 MHz avea un PSB de 33 MHz (memoria rulnd i ea la
aceast frecven) iar un Pentium MMX la 233 MHz avea un PSB de 66 MHz. Spunem
c procesorul ruleaz asincron fa de PSB, n primul caz cu un multiplicator de 3x iar
n al doilea de 3.5x. Nu numai imposibilitatea creterii frecvenei memoriei a dus la
16

Cap 2: Evaluarea performanelor plcilor de baz

aceast situaie ci i limitrile celorlalte bus-uri, la acea vreme ISA, VLB i PCI, care nu
suportau frecvene mult mai mari dect cele standard.
Observaie: Nu trebuie confundat frecvena PSB cu cea a memoriei, sunt
lucruri total diferite, PSB-ul fiind viteza de comunicare dintre procesor i northbridge.
ntmpltor, controller-ul de memorie se afla n northbridge i, tot ntmpltor, memoria
rula sincron cu FSB-ul. Vom vedea c mai trziu c situaia s-a schimbat.
66 MHz a fost un prag greu de trecut pentru memorie, poate i datorit faptului
c aceast frecven corespunde dublului frecvenei bus-ului PCI i egalului frecvenei
bus-ului AGP (care a aprut mai trziu), iar pentru a crete frecvena RAM independent
de aceste dou bus-uri era necesar implementarea acestei funcii n chipset. Dar poate
cel mai important factor a fost instabilitatea preului la memorie, care a oscilat
permanent foarte puternic, existnd cazuri n care el a crescut de cteva ori pe parcursul
unei singure luni; scderea a fost, desigur, mult mai lent. Trecerea la SDRAM i
creterea FSB-ului uzual de la 66 la 100 MHz (odat cu Pentium II Deschutes i K6-2) a
facilitat depirea acestei bariere, ajungndu-se rapid la 100 i apoi la 133 MHz (chiar i
cu pstrarea FSB-ului la 100 MHz). Urmtorul prag, de 166 MHz, nu a mai fost atins de
SDRAM dar nici exclus total, ci mai degrab neglijat datorit apariiei memoriei DDR
SDRAM, care dubla limea de band a unui SDRAM. Chiar dac frecvena real era de
100, 133 sau 166 MHz, memoria se comporta aproape identic cu una la frecven dubl
i de aceea au fost ncetenite frecvenele improprii de 200, 266 i 333 MHz
(memoriile fiind marcate ca DDR200, DDR266 i DDR333 sau PC1600, PC2100 i
PC2700, corespunztor limii de band: 1.6, 2.1 i respectiv 2.7 GB/s). Ulterior s-a
ajuns la 400 MHz (DDR400, PC3200) i chiar mai sus, amatorii de overclocking
dezlnuindu-i pasiunea odat cu module DDR533 (PC4200) sau chiar DDR625
(PC5000), care cost totui o avere.
Urmtorul pas a fost DDR2 SDRAM, un standard asemntor
cu DDR, dar care permite, la latene mai ridicate, frecvene mai mari.
S-a nceput cu DDR2-400 (PC2-3200), urmnd apoi DDR2-533
(PC2-4300), ultima realizare fiind DDR2-800 (PC2-6400). Dei
numele ar sugera dublarea vitezei, un modul DDR2 nu este mai rapid
dect unul DDR la aceeai frecven, ci dimpotriv: latenele mai
ridicate scad uor performana. Avantajul const n posibilitatea creterii frecvenei mult
dincolo de DDR400, standardul la care s-a poticnit DDR SDRAM (DDR533 i
urmtoarele sunt pseudo-standarde, nefiind ratificate).
Pentru plcile grafice, avem GDDR3 SDRAM, fiind anticipat o nou versiune,
numit (cum altfel?) GDDR4. Este vorba de o optimizare a standardului DDR2 pentru
plcile grafice, la fel cum era SGRAM pentru SDRAM.
Ca o mic parantez, am folosit termenul de PSB (Processor Side Bus) care s-a
metamorfozat n cazul lui Pentium II n FSB (Front Side Bus). Aceste denumiri au
generat i genereaz n continuare confuzii; termenul de FSB a fost introdus special
pentru procesoarele al cror cache level 2 era extern procesorului, FSB-ul fiind bus-ul
care lega chipset-ul plcii de baz de acest cache. Bus-ul BSB (Back Side Bus) era cel
care fcea legtura mai departe, ntre cache-ul L2 i nucleu.
Procesoarele cu cache-ul L2 inclus n pastila central au bus-urile FSB i BSB
unificate sub denumirea de PSB. Aadar, denumirea de FSB are sens doar cu privire la
procesoarele Pentium II, o parte din modelele Pentium III (doar cele cu nucleu Katmai)
i unele variante de Athlon, toate avnd la baz platforma Slot 1 (pentru Intel) i
17

Evaluarea performanelor sistemelor de calcul

respectiv Slot A (pentru AMD). Aadar, orice procesor inserabil ntr-un socket, nu are
FSB, ci PSB.
Dei nu intr n categoria de mai sus, trebuie s
menionm n final i un alt tip de memorie: ROM (Read
Only Memory). Dup cum i spune i numele, aceast
memorie nu poate fi dect citit, nu i scris prin metode
obinuite. Distingem i aici mai multe varieti, diferite de
ROM-ul standard: PROM (Programmable ROM) - care
poate fi scris o singur dat, similar unui CD-R, EPROM
(Erasable Programmable ROM) - care poate fi i rescris,
similar unui CD-RW i EEPROM (Electrically Erasable Programmable ROM) memorie care poate fi rescris inclusiv prin metode software. Acest din urm tip este
folosit ndeosebi n cazul BIOS-urilor diverselor componente (plci de baz, plci
grafice), BIOS care este rescris n caz de necesitate (se spune c i se face update).
BIOS-ul (Basic Input Output System) reprezint interfaa dintre hardware i
software, elementul care face posibil comunicarea dintre un program i o component
hard. l putem numi controller la nivel software, fiind n esen un program care traduce
comenzile software-ului ntr-un limbaj propriu al componentei respective i invers. Ar
putea fi asemnat i cu un driver, dar BIOS-ul lucreaz la un nivel mai low-level, mai
apropiat de hardware i deine doar cteva funcii elementare, pe care se va baza
driverul.
Legat de EPROM i EEPROM, este puin forat denumirea de ROM pentru c,
la prima vedere, funcionalitatea unei astfel de memorii este asemntoare memoriei
RAM: informaia poate fi alterat. ns modul de construcie i ofer o vitez redus i o
face utilizabil doar ocazional i n cantiti mici.
2.1.3. Interfeele interne: ISA, VLB, PCI, AGP etc
Revenind la nceputuri, voi detalia istoricul interfeelor destinate dispozitivelor
mai mult sau mai puin periferice, precum ISA, PCI, AGP, USB, IDE, Serial ATA i
altele.
Bus-ul ISA (Industry Standard Architecture) a fost inventat de IBM odat
primul IBM PC, aprut la nceputul anilor '80 , calculator ce folosea magistrala de 8 bii
specific procesorului 8088. ISA era destinat plcilor de extensie (plci grafice,
controllere de hard disk) ce se ataau PC-ului. Odat cu 80286 i cu nevoile tot mai mari
de vitez, s-a impus versiunea pe 16 bii a lui ISA, ce consta (fizic vorbind) ntr-o
extensie la vechiul ISA, cu care era compatibil, n sensul c o plac de baz compatibil
16-bit ISA suporta plci de extensie 8-bit. Standardul s-a pstrat pn aproape de zilele
noastre, chiar i azi mai putnd fi ntlnite plci ISA i plci de baz care s le suporte.
Odat cu procesorul 80386DX, s-a pus problema unui nou bus, care s
foloseasc din plin posibilitile acestuia, i anume adresarea pe 32 de bii. Astfel s-au
nscut o serie de standarde, incompatibile ntre ele, i anume MCA (Micro Channel
Architecture), EISA (Extended ISA) i VLB (VESA Local Bus, VESA = Video
Electronics Standards Association). MCA a euat din cauza politicii IBM foarte
restrictive, care s-a manifestat prin incompatibilitatea bus-ului cu vechiul ISA i prin
decizia de a face acest standard proprietar; cu alte cuvinte, IBM era singurul care putea
proiecta i fabrica plci de extensie destinate lui MCA. EISA a fost rspunsul lui
Compaq la MCA, care a evitat cele dou greeli ale lui IBM dar nu a reuit s se impun
18

Cap 2: Evaluarea performanelor plcilor de baz

datorit preului mare practicat i a performanelor nu tocmai strlucite. A urmat bus-ul


VLB ce a fost conceput pentru plcile grafice dar a fost folosit i pentru diverse
controllere, fiind mult mai rapid fa de predecesori i avnd compatibilitatea cu ISA
asigurat (fizic, plcile VLB aveau un conector suplimentar fa de ISA). Dei a devenit
popular n epoca lui 486, odat cu introducerea de ctre Intel a bus-ului PCI (Peripheral
Component Interconnect) VLB a deczut ca importan datorit problemelor de
compatibilitate cu nou-aprutul Pentium i a altor detalii minore care adunate au
determinat impunerea lui PCI pe pia. Acesta, ca i celelalte trei tentative de bus-uri pe
32 de bii (deloc sau doar parial reuite), oferea avantajul utilizrii ntregului potenial
al procesoarelor 386 i 486 dar nu i al lui Pentium, care deinea un bus extern de 64 de
bii. ns cum necesitile vremii nu au cerut altceva dect un simplu bus PCI pe 32 de
bii, acesta a devenit un standard utilizat i n prezent, nu nainte de a deschide calea lui
PCI-64, utilizat doar n servere. Pentru calculatoarele obinuite, urmaul lui PCI s-a
numit AGP i a fost (i este) destinat doar plcilor grafice.
AGP (Accelerated Graphics Port) a sosit mai trziu, n epoca
jocurilor 3D, impunerea sa datorndu-se exclusiv nevoii tot mai mari
de cretere a numrului de cadre pe secunde afiate n jocuri. n loc s
se creasc limea de band, ca n cazul lui PCI-64, a fost crescut
frecvena, de la 33 la 66 MHz, efectul fiind similar. Avantajele lui
AGP n faa lui PCI sunt numeroase i legate n special de plcile grafice. Spre exemplu,
a fost introdus posibilitatea ca chip-ul video s poat accesa memoria sistemului ca
memorie video, realizndu-se aa-zisa texturare AGP. Desigur, tehnica este inferioar
folosirii de ctre placa grafic a propriei memorii, dar aceasta poate fi ntr-o cantitate
mai mic dect este necesar. Extinderea bus-ului AGP a dus la crearea standardelor
AGP 2x, AGP 4x i AGP 8x, tehnici speciale permind atingerea unei frecvene
virtuale de opt ori mai mari dect AGP-ul standard (numit i AGP 1x), dar care nu au
adus mult-ateptatul spor de vitez din simplul motiv c ele nu erau necesare.
De remarcat faptul c, odat cu dublarea limii bus-ului la 2x i respectiv 4x, au
fost create noi standarde, numite AGP 2.0 i AGP 3.0. Ele modificau diverse aspecte
interne (i relativ puin importante) ale bus-ului i scdeau tensiunea de alimentare de la
3.3 la 1.5V i respectiv de la 1.5V la 0.8V - o surs de incompatibilitate ntre unele plci
grafice i de baz.
Ultima realizare n domeniu se numete PCI Express. Standardul este total
incompatibil cu oricare altul, att fizic ct i logic, fiind necesare controllere noi pentru
a-l gestiona - practic plci de baz noi, bazate pe alte chipset-uri dect cele cunoscute.
Dei n prezent utilitatea sa este legat exclusiv de plcile grafice, ce lucreaz n modul
PCI Express X16 (de 16 ori mai rapid dect AGP-ul standard), majoritatea plcilor de
baz compatibile PCI Express ofer cteva slot-uri X1 sau X4, n care pot fi introduse
unele plci de extensie practic absente de pe pia. Chipset-urile PCI Express nu sunt, n
general, compatibile cu AGP, motivul fiind ncercarea productorilor de a impune noul
standard n defavoarea celui vechi. ns cu plcile PCI simplu nu exist probleme, ele
putnd coexista cu PCI Express (de fapt, de ele este rspunztor southbridge-ul, care
este comun tuturor northbridge-urilor, att cu controller AGP ct i cu PCI Express).
Un alt avantaj al noului bus const n posibilitatea ca plcile grafice NVIDIA (i
n curnd i ATI) s lucreze n mod SLI (Scalable Link Interface), o facilitate multiGPU. Astfel, este posibil existena a dou plci grafice n sistem care s lucreze n mod
cooperativ, crescnd substanial performana n jocuri. Tehnologia se afl abia la
nceput i nu este foarte popular, nefiind altceva dect o opiune pentru entuziati.
19

Evaluarea performanelor sistemelor de calcul

2.1.4. Interfeele externe: serial, paralel, USB etc


Pe lng interfeele care permit conectarea componentelor interne, n spe
plcile de extensie, porturile externe permit ataarea de dispozitive exterioare PC-ului
care ndeplinesc diverse funcii, de la mouse pn la DVD writer.
Porturile serial i paralel sunt prezente n practic toate
sistemele, de la apariia PC-ului ncoace, fiind utilizate n principal
pentru cuplarea unor dispozitive periferice externe (mouse serial,
imprimant, modem, scanner etc). Diferenele dintre ele privesc
modul de funcionare: portul serial transmite date pe un singur fir (bit
cu bit), fa de cel paralel care transfer datele pe opt linii paralele
(byte cu byte).
Iniial, portul paralel era capabil de transmisie unidirecional
(ntr-un singur sens), aceasta datorit limitrii standardului SPP
(Standard Parallel Port); odat cu EPP (Enhanced Parallel Port),
problema a disprut iar viteza maxim atins a crescut de la 150 KB/s la 2 MB/s.
Nevoia tot mai mare de vitez a adus un nou impediment privind creterea ratei de
transfer: utilizarea prea mare a procesorului sistemului. Pentru a se evita inconvenientul
a fost introdus standardul ECP (Extended Capabilities Port) care lucra n aa-numitul
mod DMA (Direct Memory Access), utilizarea procesorului fiind minim. Pe lng
aceasta, EPP a oferit compresie/decompresie n timp real, ceea ce a constituit un ajutor
remarcabil pentru dispozitivele ce necesitau rate mari de transfer.
Perifericele conectate la portul paralel sunt diverse, cuprinznd n primul rnd
imprimantele, scanner-ele, unitile de band dar i altele mai exotice, precum webcamurile. ns odat cu necesitile tot mai mari de la sfritul anilor '90, portul paralel a
nceput ncet-ncet s fie dat uitrii, locul su fiind preluat de alte standarde
incompatibile cu acesta.
Portul serial, datorit vitezei sczute, nu poate fi utilizat dect
de componente care nu necesit viteze mari, precum mouse-ul sau
modem-ul. Un avantaj al su, de cele mai multe ori ignorat, este
posibilitatea de transmitere a datelor la distane mult mai mari dect
portul paralel. Putem aduga i numrul de fire de transmisie mai mic
(3 n cazul portului serial fa de 19 sau 25 pentru paralel), deci
costurile cablurilor sunt mai reduse.
Concluzionnd, nu putem pune o relaie comparativ ntre
portul serial i paralel pentru c ele au fost concepute pentru utilizri
diferite. Ambele se afl n declin, ns nici un alt standard nu a reuit
s se impun puternic din cauza costurilor ridicate, cu excepia celui
PS/2 - utilizat azi pentru tastatur i mouse. Acesta a fost introdus de
IBM n 1987, odat cu seria de PC-uri numit PS/2 (Personal
System/2), un eec total pentru Big Blue. ns Intel s-a folosit de standard, el devenind
uzual abia odat cu introducerea n 1997 a form factor-ului ATX, despre care vom vorbi
mai trziu. Reinem c att mouse-ul ct i tastatura (conectat pn atunci prin
standardul AT - compatibil pin la pin cu PS/2, dar de form mai mare) se leag n
prezent la computer prin acest port.
Un nou standard, pe numele su USB (Universal Serial Bus), a aprut din
dorina de a se oferi o interfa universal, capabil s conecteze la PC orice fel de
dispozitiv, de la mouse, imprimant, pn la interfa extern de sunet (similar unei
plci de sunet dar situat n exteriorul PC-ului), TV tuner, hard disk i unitate optic.
20

Cap 2: Evaluarea performanelor plcilor de baz

Interfaa este plug&play i hot-swappable, ceea ce nseamn c orice dispozitiv va fi


recunoscut automat de sistemul de operare i respectiv va putea fi conectat sau
deconectat din zbor, fr a fi necesar o repornire.
USB s-a impus foarte greu, pe parcursul ctorva ani el progresnd lent din cauza
performanelor reduse ale dispozitivelor conectate la acest port, fapt datorat limitrii
transferului la 12 Mbps. Spre exemplu, unui CD-ROM 40x i era imposibil s se
conecteze la portul USB pentru c ar fi avut nevoie de un transfer de 6 MB/s (48
megabii pe secund), de patru ori mai mult dect limitele bus-ului. De aceea, USB a
fost destinat doar dispozitivelor lente (totui mult mai rapide dect portul serial, care era
limitat la cteva sute de Kbps).
Soluia la problem a fost oferit de USB 2.0, a doua versiune a standardului, ce
prevedea viteze de pn la 480 Mbps (60 MB/s, deci i un ipotetic CD-ROM 400x ar
face fa). n prezent, majoritatea plcilor de baz suport interfaa USB 2.0 i
dispozitivele ce se conecteaz la aceasta sunt din ce n ce mai multe. Totui, cei mai
muli utilizatori prefer soluiile comune (dac ele exist), care cost mai puin i ofer
aproape aceleai faciliti.
Un port cu funcii mai avansate i cu o vechime mai mare este FireWire, numit
i IEEE 1394, standard introdus de ctre Apple la mijlocul anilor '80 i oferit apoi ctre
IEEE (Institute of Electrical and Electronics Engineers) pentru standardizare, de unde i
numele alternativ.
n 1995, acest institut lansa specificaiile sale oficiale, oferind trei rate de
transfer posibile: 100, 200 i 400 Mbps. Aceasta n perioada n care USB, n prima sa
versiune (12 Mbps) era doar n proiect... Totui, scopul lui FireWire este diferit: el
dorete s conecteze la computer dispozitive ce au nevoie (i aveau nevoie nc de la
acea dat) de viteze foarte mari, precum camerele video digitale, Sony adoptnd rapid
standardul. ncet-ncet, FireWire a ctigat popularitate, devenind astzi ceva doar cu
puin mai exotic dect USB (nefiind prezent pe orice plac de baz, dar cele high-end
sigur l dein). n prezent, utilizarea sa este destul de larg, fiind folosit de dispozitive
real-time de editare audio/video, dar i de produse destinate publicului larg, precum
scannere, webcam-uri, uniti optice de stocare sau hard disk-uri portabile.
Alt interfa ntlnit pe majoritatea plcilor de baz, dar mai rar folosit, este
IrDA (Infrared Data Association), care permite schimbul de date wireless (fr fir) cu
alte echipamente ce au incorporat o astfel de tehnologie (imprimante, laptop-uri, PDAuri, telefoane mobile, camere digitale etc) sau chiar cu un alt PC. Tot la capitolul
interfee wireless mai merit menionat standardul Bluetooth, relativ folosit, dar nc
exotic pentru utilizatorii obinuii. Prin intermediul acestuia, PC-urile, PDA-urile,
telefoanele mobile, imprimantele i alte dispozitive, pot fi conectate folosind undele
radio, pe distane scurte sau medii.
Cum subiectul este destul de complex pentru a fi detaliat aici, trecem la capitolul
urmtor.
2.1.5. Interfeele pentru dispozitive de stocare
Interfeele de conectare a unitilor de disc nu au fost ntotdeauna att de rapide
precum sunt astzi. Primul standard, introdus n IBM PC-ul original s-a numit ST-506,
fiind dezvoltat n anul 1980 de ctre Seagate. Mai multe sub-standarde au respectat
specificaiile ST-506, printre ele numrndu-se MFM (Modified Frequency Modulation,
versiunea original), RLL (Run Length Limited, ce cretea densitatea datelor cu 50% i
era compatibil cu MFM), ESDI (Enhanced Small Device Interface, ce oferea o rat de
21

Evaluarea performanelor sistemelor de calcul

transfer foarte ridicat pentru acea perioad) i, n final, IDE (Integrated Drive
Electronics), numit i ATA (Advanced Technology Attachment).
Spre deosebire de standardele iniiale, ESDI i mai ales IDE au integrat pe hard
disk o mare parte din funcionalitatea controller-ului acestuia (i e uor s ne dm seama
de acest lucru privind partea electronic a oricrui hard disk
modern); astfel, viteza de transfer a crescut substanial.
IDE aducea o serie de inovaii, fiind practic o versiune
foarte sofisticat a lui RLL, oferind, spre exemplu, posibilitatea
conectrii a dou hard disk-uri pe acelai cablu n combinaia
Master/Slave. Transferul era realizat prin intermediul modului PIO
(Programmable Input/Output) - n acest proces fiind angrenat i
procesorul - sau DMA (Direct Memory Access), prin care controllerul IDE comunica direct cu memoria, procesorul fiind degrevat de
aceast sarcin. Rata maxim de transfer era de 8.3 MB/s.
O extensie a lui IDE, EIDE (Enhanced IDE), numit i FastATA sau ATA-2, oferea la mijlocul anilor '90 rate de transfer de pn
la 16.6 MB/s, posibilitatea detectrii automate n BIOS a parametrilor
hard disk-ului, precum i capaciti mai mari dect limita impus
IDE-ul standard - 504 MB. De fapt, denumirile nu sunt perfect sinonime, EIDE i FastATA (numite astfel de Western Digital i respectiv Seagate) fiind versiuni ale
standardului ATA-2 ce cuprind i specificaiile ATAPI (Advanced Technology
Attachment Packet Interface). Este vorba de posibilitatea conectrii i a altor tipuri de
uniti de stocare dect hard disk-urile, precum unitile optice (doar de tip CD-ROM la
acea vreme), de band sau de dischete cu capaciti mari.
ATA-3, introdus n 1997, nu a adus mbuntiri legate de vitez, ci privind
securitatea, un Power Management extins (micorndu-se astfel consumul de putere) i,
nu n ultimul rnd, legat de tehnologia SMART (Self Monitoring Analysis and Report
Technology), ce permitea monitorizarea permanent a strii de sntate a hard disk-ului.
Mai departe, ATA-4 (1998) a introdus modul Ultra DMA/33 (Ultra ATA,
UDMA33 sau Ultra DMA 2), renunndu-se la mbuntirea modului PIO, UDMA33
oferind un maxim de 33 MB/s. ATA-5 (UDMA66 sau Ultra DMA 4), ATA-6
(UDMA100 sau Ultra DMA 5) i ATA-7 (UDMA133 sau Ultra DMA 6, srit de unii
productori) nu au fcut dect s creasc rata maxim de transfer la 66, 100 i respectiv
133 MB/s, de obicei mai mult dect puteau oferi hard disk-urile acelei perioade. Aadar,
marketing similar lui AGP 8x vs. 4x.
Totodat, ncepnd cu Ultra DMA/66, numrul de fire ale cablului de date a
crescut de la 40 la 80 pentru a se reduce interferenele electromagnetice ce ar putea
aprea la viteze att de mari (fiecare al doilea fir era unul de mas, pentru ecranare). n
plus, standardul Ultra DMA/100 a oferit i AAM (Automatic Acoustic Management), o
facilitate care permite reducerea zgomotului emis de hard disk prin reducerea
nesemnificativ a performanelor; totui, nu toate unitile suport AAM.
Serial ATA (sau S-ATA) a fost urmtorul pas. Schimbrile palpabile au fost
reprezentate de noile tipuri de cabluri, att pentru alimentare ct i pentru date (ultimul
mult mai comod de folosit, fiind mai subire, cu doar 7 fire), precum i de eliminarea
conceptelor de Master i Slave, fiecare hard disk avnd canalul su dedicat. Un alt
avantaj remarcabil este hot-swapping-ul, fiind posibil introducerea/eliminarea hard
22

Cap 2: Evaluarea performanelor plcilor de baz

disk-ului fr a opri PC-ul; practic, orice hard disk normal poate fi acum folosit precum
unul portabil.
Standardul ATA a fost redenumit retroactiv n Parallel ATA (sau P-ATA),
pentru a se putea diferenia uor de S-ATA. Denumirile provin chiar de la modul n care
sunt transmise datele: P-ATA folosete mai multe ci pentru transmiterea n paralel a
informaiilor (de aici i numrul mare de fire necesar), pe cnd S-ATA efectueaz o
transmisie serial.
Versiunile curente sunt Serial ATA original (150 MB/s) i Serial ATA II (300
MB/s), dar se ateapt adoptarea n viitor a lui Serial ATA III pentru 600 MB/s.
Separat de ATA/IDE i variantele sale, SCSI (Small Computer System Interface
- pronunat scazi, n dou silabe i cu accent pe a) a devenit, ncepnd cu mijlocul
anilor '80 , un standard foarte utilizat n workstation-uri, servere i, ocazional, n PCurile high-end.
Avantajele sunt numeroase (vitez mai mare, ocupare minim a procesorului n
timpul transferului, daisy-chaining etc) i nu afecteaz n mare msur utilizatorul
obinuit. SCSI este folosit i n alte scopuri, precum conectarea imprimantelor sau a
scanner-elor.
Orice controller P-ATA/S-ATA/SCSI poate fi integrat pe placa de baz (este
cazul P-ATA, cel puin pentru plcile fabricate n ultimii 10 ani, a celor S-ATA pentru
mai toate modelele de plci din ultimul an, precum i cazul SCSI pentru plcile de baz
de servere), dar se poate gsi i separat, sub forma unei plci de extensie ce se ataeaz
prin intermediul unui slot (PCI, eventual VLB sau ISA).
n finalul acestui capitol, trebuie s spunem cteva cuvinte i despre unitatea de
dischete, al crei controller a trecut prin multe faze, ncepnd cu MFM (controller care
putea gestiona att floppy-ul ct i hard disk-ul), el fiind azi integrat pe placa de baz.
Cablul de date este asemntor celui IDE, ns cu numai 34 de fire.
De notat c unitile floppy se mai pot conecta prin SCSI sau USB

2.2. Testarea plcilor de baz Socket 939


2.2.1. Introducere
Platforma Socket 939 nu poate fi dect atrgtoare,
performana actual dar mai ales cea viitoare, posibil printr-un
upgrade la un procesor mai rapid fiind imboldul care golete
magazinele de puinele plci cu 939 de pini. Platforma Socket
939 este una high-end, ce se adreseaz n primul rnd utilizatorilor cu pretenii mari i n
acelai timp cu buzunarele ceva mai pline dect ceilali.
AMD a lansat primele procesoare AMD64 odat cu platforma Socket 940,
nlocuit rapid de cea 754. Procesoarele sunt practic identice, dar cele cu 754 de pini
sunt limitate la un controller de memorie single-channel. Cu alte cuvinte, o platform
mainstream. Socket 939 este urmaul lui S940, AMD determinnd astfel utilizatorii de
Socket 940 s schimbe placa de baz pentru a obine un pin n minus dar compatibilitate
cu nou-aprutele modele de Athlon 64 i Athlon 64 FX. Totui, de ce aceast
schimbare? Socket 940 necesit memorii de tip registered din cauza motenirii
arhitecturii lui Opteron; modelele cu un pin mai puin au scpat de aceast limitare,
modulele non-registered (unbuffered) fiind mult mai ieftine. Dual-channel-ul oferit de
pinii suplimentari (n comparaie cu 754) readuce n prim-plan o tehnologie att de bine
23

Evaluarea performanelor sistemelor de calcul

gndit nct nu merita s moar: limea de band a memoriei este dublat folosind un
mic artificiu, destul de puin costisitor.
n continuare se vor prezenta o serie de teste realizate cu placi de baz Socket
939.
Produsele testate sunt nzestrate cu slot-uri PCI Express, plcile cu suport AGP
urmnd s fac subiectul unor teste viitoare, n caz c se vor gsi pe pia n cantiti
suficiente. Oricum, bus-ul AGP este nc suportat de o serie de plci, ns numrul lor
este n scdere, n cteva luni - maxim un an - urmnd s aib loc impunerea plcilor
grafice PCI Express. Astfel este lsat n urm un bus ce a dominat ultimii 78 ani i care
a fost izgonit oarecum pe nedrept, complotul marilor productori neavnd, aparent,
o justificare clar. E adevrat, acum putem avea din nou dou plci grafice n sistem,
unite prin SLI, performanele obinute fiind foarte mari (la un pre foarte mare), plus alte
mici detalii care fac diferena dar nu justific renunarea la un bus ce nu constituia
limitarea n calea obinerii de performane maxime.
Chipset-ul nForce4 de la NVIDIA se pare c domin plcile PCI Express, cele
mai multe produse de pe pia i toate cele testate dotate cu acesta. nForce3 este deja
depit datorit suportului pentru AGP i a lipsei unor faciliti incluse n urmaul su.
La fel i K8T880 (Pro), doar K8T890 fiind comparabil cu nForce4, dar el nu a fost
adoptat la scar larg. n toate variantele sale (simplu, Ultra, SLI i eventual
neoficialul 4X) nForce4 ofer o serie de faciliti deosebite, NVIDIA fiind o companie
care n ultima vreme a nceput s dea tonul pe piaa plcilor de baz pentru procesoare
AMD. Amintim de Serial ATA II (numai n versiunile Ultra i SLI), ce dubleaz
limea maxim de band fa de prima versiune de Serial ATA (avantaj total
neobservabil n practic) i suport pentru modul SLI (doar n versiunea nForce4 SLI) cu alte cuvinte e posibil conectarea a dou plci
grafice PCI Express pentru performane nu chiar duble
dar foarte mari. nForce3 deine i el o serie de funcii
inovatoare, cum ar fi un Firewall integrat, ns ncepe
ncet-ncet s-i resimt btrneea.
2.2.2. Modul de testare
nainte de orice, trebuie s stabilim cine sunt
utilizatorii n pielea crora am ncercat s intrm,
evalund la snge produsele. n primul rnd, este
vorba de entuziati, cei ncntai mai degrab de o
dotare n plus sau, n egal msur, de opiune ascuns
n BIOS care le permite un overclocking superior,
dect de un pre mai mic.
Calificative precum excelent sau extrem cost i vor costa ntotdeauna
foarte mult, aadar dac cititorul este interesat mai degrab de un ECS ieftin, dotat
numai cu cteva elemente eseniale i al crui pre nu trece de 50-60 de dolari, ar trebui
s parcurg testul nostru cel mult din curiozitate. n lucrare, au fost punctate cu o
pondere mai mare caracteristicile pe care un pasionat i le-ar dori la placa sa de baz,
precum un port FireWire sau o frecven mare atins prin overclocking.
Testul a fost mprit n patru categorii, i anume:
performan,
24

Cap 2: Evaluarea performanelor plcilor de baz

faciliti,
construcie & ergonomie;
documentaie & service.
Ponderea performanei a fost relativ mic, de 40%, diferit fa de cele mai
multe review-uri ntlnite n diverse reviste sau pe web. Aceasta deoarece am considerat
c performana unei plci de baz este extrem de puin important n luarea unei decizii
privind achiziionarea uneia pentru c diferenele sunt de ordinul a 1-2%, maxim 3%.
De aceea, alii sunt factorii care ar trebui s influeneze un potenial cumprtor.
Performana a fost evaluat prin rularea mai multor programe speciale de
benchmark, a unora ce au alt scop dar care dein i un modul de testare a vitezei sau pur
i simplu prin cronometrarea timpului scurs ntre dou momente ntre care a fost
efectuat o anumit operaie.
Testele analitice au avut o pondere mic. Astfel, testul de lime de band a
memoriei din SiSoft Sandra i cel de laten a memoriei din ScienceMark au contat cu
cte 5%. SPECviewperf i 3DMark 2001, dei sintetice, reflect destul de bine
activitatea profesionitilor n grafic i a gamerilor, de aceea au contat cu 8 i respectiv
12.5%. Restul testelor au fost practice:
arhivarea unor fiiere cu WinRAR (8%),
comprimarea unui film cu codec-ul XviD (8%),
randarea unei imagini cu PovRay (8%),
copierea unor fiiere de pe o partiie pe alta a unui hard disk Serial ATA (8%),
testele implicite din 3DMark 2001, FarCry i Unreal Tournament 2004 (12.5%
fiecare) i un test special creat n Quake3 care folosete procesorul mult mai
mult dect testul implicit (12.5%).
De remarcat faptul c testele 3D au contat n total cu 50% din punctaj (excludem
de aici SPECviewperf care, dei ruleaz n mod 3D, se adreseaz altei categorii de
utilizatori).
Facilitile au contat tot cu 40 de procente. Am inclus aici numrul de slot-uri i
porturi, complexitatea interfeei de sunet, facilitile din BIOS (n special cele legate de
overclocking), precum i software-ul livrat. Menionm pentru cei (ne)interesai de
overclocking c opiunile destinate acestei practici, precum i rezultatele testelor
realizate n condiii extreme au contat cu 35% din cele 40 de procente ale facilitilor,
deci cu 14% la nota final. Mult, puin, rmne s judecai dumneavoastr.
Ergonomia i construcia, reunite ntr-o singur rubric, au contribuit cu 15%
la rezultatul final. Au fost acordate note att comoditii operrii pe placa de baz, n
interiorul carcasei (de exemplu poziia jumper-ilor i a conectorilor), precum i
diverselor indicii privind fiabilitatea produsului, lund n seam temperaturile atinse de
diversele componente de pe plac i alte aspecte subiective. Este imposibil de evaluat
fiabilitatea oricrui produs hardware, fiind necesare luni sau chiar ani pentru ca primul
defect s-i fac apariia, precum i un numr mare de produse care s fie supuse
testelor. De aceea, punctajul oferit aici a fost destul de mic i n totalitate subiectiv, un
rol important jucnd experiena n acest domeniu.
n fine, documentaia i service-ul au completat ultimele 5 procente, fiind
punctat manualul, garania, precum i posibilitatea de contact online cu productorul.

25

Evaluarea performanelor sistemelor de calcul

2.2.3. Testarea efectiv


Sistemul de test a constat ntr-un procesor Athlon 64 3200+ (nume de cod
Winchester - 0.09 microni, 2000 MHz, 512 KB L2 cache, 1.4V, frecvena maxim la
care rula stabil: 2550 - 2600 MHz la 1.6 1.65V), un kit de memorii Corsair
TwinX1024-3200XLPT ce totalizau 1 GB, o plac grafic Gigabyte GV-NX66T128D
cu chip GeForce 6600 GT (128 MB, 500 MHz core, 1000 MHz memoria), un hard disk
Western Digital Caviar SE (WD800JB) de 80 GB cu 8 MB cache pe Parallel ATA, iar
pentru evaluarea performanei controller-ului Serial ATA am montat un Seagate
Barracuda 7200.7 SATA cu aceleai specificaii. Driverele au fost cele mai noi oficiale
la data nceperii testrii, i anume nForce4 Standalone Kit 6.39 i ForceWare 66.93.
Sistemul de operare, desigur, Windows XP SP2.
Fiecare plac a fost setat, dup un update al BIOS-ului (dac exista unul mai
nou dect cel cu care placa venea), la maximul de performan pe care l puteam obine
n condiii de stabilitate perfect. Stabilitatea a fost msurat cu al cincilea test din
Memtest86+1, urmat de cteva procente din testul 7. Nu am rulat Prime952 pentru c
procesorul nu avea prea mult motive s manifeste instabilitate, iar testele rulate pentru a
evalua performana sunt suficient de stresante pentru acesta pentru a se bloca sau a da
erori n caz de probleme. Setrile principale de memorie, i anume CAS Latency, tRCD,
tRP, tRAS i Command per Clock au fost setate la minimul posibil, de obicei CL2 2-2-5
1T, ns au fost i cazuri n care am rulat n CL1.5 2-2-0 1T. tRC, tRFC, tRRD, tWR,
tWTR, tRTW, tREF sunt alte cteva setri, primele dou ieind n eviden prin faptul
c au valori mari, de minim 7 i respectiv 9. Rareori am rulat stabil n aceste condiii,
valorile normale fiind 9 i respectiv 12. De asemenea, Bank Interleave a fost i el
activat.
Overclocking-ul a fost testat n dou moduri, n ambele situaii scopul fiind
obinerea unui bus HTT maxim (n pai de 5 MHz). Am setat multiplicatorul (dac
placa a permis acest lucru) n aa fel nct frecvena final a procesorului s fie cel puin
egal cu cea implicit, de 2 GHz, iar celelalte setri au fost puse la minim sau aproape
de minim, n aa fel nct ele s nu afecteze stabilitatea (LDT 2x sau 3x, CL3 4-4-8 2T
etc). Apoi am setat memoria att sincron cu HTT-ul ct i la un raport de 1:2 fa de
acesta. Tensiunea procesorului a fost ajustat la 1.65V (sau cea mai apropiat valoare
mai mic de 1.65V pe care o permitea BIOS-ul) - maximul la care putem sta linitii c
nu urmeaz o mic explozie n interiorul acestuia. De asemenea, tensiunea memoriei a
fost urcat pn la maxim 2.9V iar dac placa permitea setarea voltajului chipset-ului,
am realizat i aceast modificare, crescnd valoarea la maxim. Nu am folosit programe
de tip A64 Tweaker sau ClockGen pentru a efectua alte setri dect cele ale BIOS-ului
sau a ncerca creterea HTT-ului direct din Windows.
2.2.4. Abit AN8 Fatal1ty (nForce4 Ultra)
AN8 Fatal1ty poart numele lui Johnathan Wendel, alias Fatal1ty, un gamer
care la doar 23 de ani a ctigat numeroase turnee de 3D Shootere (Quake3, Unreal
Tournament, Doom3). Placa are ca scop declarat obinerea celor mai mari performane,
ns tim cu toii c diferenele dintre plci dotate cu acelai chipset, sau chiar cu
chipset-uri diferite, sunt minime (desigur, dac neglijm factorul overclocking).
Productorul susine c seria Fatal1ty (deschis cu modelul AA8XE pentru Pentium 4)
1
2

http://www.memtest.org/
http://www.mersenne.org/freesoft.htm
26

Cap 2: Evaluarea performanelor plcilor de baz

este creat special pentru jocuri, att datorit performanelor extreme ce pot fi obinute
ct i faptului c placa a fost lipsit de anumite componente pe care gamerii nu le
folosesc - fcnd referire, probabil, la absena porturilor serial i paralel. Aadar, avem
de-a face cu o campanie de marketing aparent reuit, mai ales dac inem seama de
aspectul exterior al produsului, extrem de atrgtor. S vedem ce surprize ne mai
rezerv. Cele dou cutii incluse n pachet, cu care Abit ne-a obinuit de ceva vreme,
conin diverse accesorii utile plcii. Nu s-a pus att de mult accent pe cantitate, precum
vedem la plcile Gigabyte high-end. Astfel, nu avem dect un bracket USB
2.0/FireWire, totaliznd (mpreun cu porturile din back-panel) ase i respectiv trei
porturi. ns pe plac avem un singur conector extern de FireWire, ceea ce nu justific
cele dou porturi prezente pe bracket.

Cablurile Serial ATA sunt n numr de patru, iar pentru alimentarea hard diskurilor este disponibil un convertor molex SATA, ce conine doi conectori. Cablurile
Parallel ATA sunt n numr de unu, ns el iese n eviden prin faptul c este de tip
rounded, acoperit cu un plastic transparent, astfel nct cele 80 de fire se afl la vedere.
i cablul floppy este rounded, ns de culoare neagr. Un efect deosebit s-ar fi obinut
dac i aceste din urm cabluri erau de culoare rou-viiniu, precum cele SATA, PCB-ul
plcii, slot-urile PCI i DIMM i cele cteva LED-uri. Dac pn aici nu am gsit nimic
ieit din comun, situaia se schimb dramatic odat ce punem ochii pe OTES RAMFlow,
un set de dou ventilatoare de 40 mm nglobate ntr-o carcas de plastic i destinate
rcirii memoriilor. Ele se aeaz deasupra slot-urilor DIMM, prinzndu-se cu ajutorul a
dou cleme, meninnd astfel memoriile la o temperatur la care s suporte un
overclocking superior condiiilor normale. Iat c ncet-ncet acele performane extreme
promise ncep s-i arate colii...

Rcirea extrem este lucrul de care Abit s-a ngrijit cel mai mult. Tranzistorii de
tip MOSFET sunt acoperii de radiatoare, iar dac temperatura acestora depete o
anumit limit, spre ele ncep s bat dou ventilatoare Dual OTES tot de 40 mm dar
mai adnci dect cele normale, poziionate n locul porturilor PS/2, serial i paralel pe
plcile obinuite. De asemenea, rcirea chip-ului principal (nu a chipset-ului, pentru c
nForce4 este construit dintr-un singur chip) este, dup spusele lui Abit, eficient,
radiatorul fiind realizat din cupru. Practic, este vorba de cooler-ul clasic Abit, ntlnit de
exemplu la modelul NF7, doar culoarea roie trdeaz materialul din care a fost
confecionat. Nu putem trece mai departe fr a enumera succint celelalte elemente de
27

Evaluarea performanelor sistemelor de calcul

pe plac: un slot PCI Express X16, dou X1, trei PCI, dou porturi IDE aezate culcat
(un bravo! la ergonomie), patru Serial ATA 300 coordonate de southbridge-ul
integrat n chip-ul central, iar de reeaua Gigabit se ocup un integrat Vitesse. n caz c
neglijm alimentrile de ventilatoare deja ocupate (dou cu rcirea surselor de putere,
una cu chip-ul nForce4, una opional pentru rcirea memoriilor), gsim doar dou fan
headere libere, ceea ce nu prea st bine unui produs Abit, care ne-a obinuit cu patru sau
chiar cu cinci astfel de conectori. Dac mufa de floppy nu s-ar fi aflat ntr-o poziie
extrem de proast, i anume n spatele ultimului slot PCI, nota la ergonomie ar fi fost
mare. Oricum, la acest capitol AN8 st bine, peste medie.
Performanele nu au dezamgit, fiind normale pentru o plac bazat pe acelai
chipset (sper c mi este permis folosirea n continuare a acestui termen, el specific
foarte clar la ce se face referirea dei este impropriu numit astfel).
Trecnd la analiza BIOS-ului, primul lucru care iese n eviden este
imposibilitatea setrii multiplicatorului. Imposibil i inadmisibil pentru o plac Abit, cu
att mai mult cu ct e vorba de una de vrf. n testul de overclocking, placa se oprea fr
drept de apel la un HTT de 255 MHz din cauza procesorului care nu reuea s ruleze
stabil la frecvene mai mari (reamintesc c este vorba de un Athlon 64 3200+ ce ruleaz
stabil la puin sub 2600 MHz, frecvena standard fiind de 2 GHz). Problema poate fi
rezolvat cu versiunea beta de BIOS (12 beta 1, varianta iniial fiind 11), ce rezolv
problema multiplicatorului. Frecvenele maxime atinse prin overclocking au fost de 310
MHz sincron i 375 MHz cu raport de 2:1 ntre HTT i memorie, valori foarte bune. n
acordarea notei sa inut seama doar de funcionarea cu acest BIOS beta deoarece
lansarea variantei finale de ctre Abit este iminent.
BIOS-ul este foarte bun, dei nu de excepie. Setrile uzuale sunt la locul lor, n
meniul SoftMenu, devenit acum Guru. Tensiunea procesorului poate fi ajustat pn la
1.75V, cea a memoriei pn la 2.8V, valori aproape deranjant de comune. Nu aveam
pretenia la 4V la memorie, rulm cu Abit, nu cu DFI, dar un 3.2V pentru a hrni
memorii precum Winbond BH5 nu ar fi stricat deloc. Voltajul chipset-ului poate urca
pn la 1.8V, valoarea cea mai mare ntlnit (pe majoritatea plcilor el se limiteaz la
1.65V). Temperatura cooler-ului de pe chipset nu a fost deloc mic, semn c radiatorul
de cupru lucreaz la maximul de care este capabil. Setarea greit a parametrilor
sensibili poate duce, desigur, la imposibilitatea pornirii. Placa detecteaz automat aceste
situaii, nefiind necesar nici mcar apsarea clasicei taste Insert pentru ca sistemul s
POST-eze. n cel mai ru caz, avem la dispoziie LED-urile binecunoscute, ce indic
printr-un cod de eroare starea n care sistemul s-a agat.
Turaiile celor maxim ase ventilatoare pot fi reglate n fel i chip, existnd
posibilitatea setrii unei valori minime de temperatur la care s intre n funciune
ventilatorul la o turaie mic (reglabil n voli), ct i o valoare destinat turaiei
maxime. Monitorizarea este bun, att pentru temperatur ct mai ales pentru voltaje,
fiind prezente i cmpuri rar ntlnite, precum voltajul de standby al chipset-ului. O
problem destul de grav am ntlnit-o chiar de la pornirea plcii: dup cteva secunde,
ea s-a nchis irevocabil din cauza ventilatorului pentru procesor alimentat din alt
conector. Pe lng faptul c suntem obligai s folosim, la prima montare a plcii (sau
dup reset-area BIOS-ului) un anume conector, sunt ventilatoare care se alimenteaz din
mufa molex i care practic nu pot fi folosite pe aceast plac pn nu i este setat n
BIOS opiunea de a nu stinge sistemul dac observ c CPU Fan raporteaz zero turaii.
Soft-ul livrat include, pe lng un program de scriere a BIOS-ului din Windows,
Abit EQ i OC Guru, utilitare capabile cam de aceleai lucruri ca i meniurile de
28

Cap 2: Evaluarea performanelor plcilor de baz

monitorizare i respectiv overclocking din BIOS. n plus, n cazul lui Abit EQ exist trei
preset-uri: Quiet, Normal i Turbo, ce corespund valorilor de 204, 210 i 216 MHz
pentru HTT, ajustndu-se n acelai timp i voltajul memoriei i procesorului. ntlnim
acelai 204, valoare considerat implicit de anumite plci Abit, precum AV8. De
aceea, putem face presupunerea c viitoarele BIOS-urile de AN8 ar putea recurge la
aceeai metod, nu foarte ortodox, de a crete performana plcii.
Ce lipsete? Dispozitivul extern 3rd Eye, prezent pe multe plci mai slab cotate.
Dar dac spm puin, descoperim c exist i modelul cu al treilea ochi, puin mai
scump.
Concluzie
Nu este foarte plcut s afli c placa de baz pe care tocmai ai cheltuit o sum
impresionant are un BIOS n stadiu beta, dei marcat ca oficial. Acesta este unul dintre
puinele impedimente care pot hotr un entuziast s nu cumpere Abit AN8 Fatal1ty.
+ potenial mare de overclocking
+ rcire excelent
+ LED-uri de diagnosticare
+ prezentare atrgtoare
- BIOS beta
- doar 2.8V pentru memorie
- pre mare
2.2.5. Abit AN8 (nForce4)
Probabil ai remarcat pe parcursul acestei prezentri c uneori m-am referit la
plac numind-o AN8 pur i simplu, fr sufixul Fatal1ty. De ce? Pentru c exist i
versiunea AN8 simplu, ce nu difer de sora mai mare dect prin culoarea PCB-ului i
a slot-urilor, prin inscripionarea diferit a sistemului de rcire a surselor de putere, prin
absena modulului de rcire a memoriilor i prin dotarea puin mai obinuit la capitolul
cabluri (de exemplu, nu avem cabluri IDE rounded ci normale). i nu n ultimul rnd,
prin dotarea cu chipset-ul nForce4 simplu, ce nu dispune de Serial ATA 300, ci de
versiunea ce permite un transfer de doar 150 MB/s. Diferena este absolut insesizabil,
testele nu au scos-o n eviden. Teste care au demonstrat performane identice i
frecvene de overclocking atinse la fel de identice. Preul ei este cu circa 25% mai
mic, aadar este foarte discutabil dac achiziionarea versiunii Fatal1ty reprezint o
opiune bun.

Concluzie
+ potenial mare de overclocking
+ rcire bun
29

Evaluarea performanelor sistemelor de calcul

+ LED-uri de diagnosticare
+ prezentare atrgtoare
- BIOS beta
- doar 2.8V pentru memorie
2.2.6. DFI LANParty UT nF4 Ultra-D (nForce4 Ultra)
BE6-II, KX7-333, IT7, NF7 - toate sunt modele de plci de baz de la Abit ce
ntr-un moment sau altul au fcut istorie, fiind considerate adevrate campioane ale
overclocking-ului. Probabil v vei ntreba ce au ele n comun cu DFI-ul despre care
vrem sa discutm aici?; ei bine, ele, ca i ultimele modele produse de DFI, poart
semntura aceluiai inginer, pe nume Oscar Wu. Aceasta, mpreun cu lista de
specificaii tehnice i mai ales cu opiunile foarte ndrznee disponibile n meniul
BIOS-ului (pe care le vom detalia mai trziu), ar trebui s spun multe despre cui se
adreseaz placa de fa.

La o prim vedere aruncat asupra ambalajului, singura opinie este legat de


culorile folosite i de imaginea stilizat ce las impresia unui ambalaj de jucrii.
Deschiznd cutia, observm un coninut nu foarte bogat, nsa interesant dac lum n
calcul c modelul prezentat aici este cea mai srac variant din oferta DFI a acestei
game. Cablurile (dou ATA-133 rounded, dou S-ATA, unul FDD rounded) sunt toate
de culoare galben i sensibile la ultraviolete i, mpreun cu combinaia de culori (PCB
cafeniu i slot-uri galbene la fel de UV-sensitive) folosit de placa de baz, pot avea un
aspect destul de plcut ntr-o carcas cu fereastr. Alturi de aceste cabluri, sunt
furnizate un adaptor pentru alimentarea a dou hard disk-uri S-ATA, un cletior pentru
manevrarea mai uoar a jumper-ilor, cinci jumperi suplimentari cu mo, trei seturi de
jumperi SLI de rezerv i un back-panel ce asigur compatibilitatea configuraiei
mufelor la orice carcas. De asemenea, n cutie se mai gsesc un manual nu foarte
bogat, ns cu informaii suficiente pentru ca instalarea s decurg fr probleme, CD-ul
cu drivere i utilitare, un pliant ce prezint tehnologia CMOS Reloaded, o dischet cu
driverele de RAID Silicon Image (inutil, deoarece controller-ul Sil3114 se afl numai
pe modelele high-end), precum si exoticul modul audio Karajan, care dei nu e dect un
simplu codec ALC850 pe opt canale ce se monteaz pe un PCB separat, se presupune c
ofer o mbuntire calitativ a semnalului fa de implementarea obinuit onboard.

30

Cap 2: Evaluarea performanelor plcilor de baz

Trecnd la analizarea aspectului plcii, observm poziionarea mai deosebit a


slot-urilor de memorie i a procesorului, probabil n efortul de a reduce lungimea
traseelor bus-ului HyperTransport; un vot n plus pentru inginerii DFI, pentru c au
depus efortul de a modifica att de radical PCB-ul de referin NVIDIA. Analiznd
sistemele de rcire, observam c att tranzistorii ce deservesc sursa de alimentare a
procesorului, ct i cei pentru RAM i chipset, sunt dotai cu radiatoare de dimensiuni
impresionante, din aluminiu, ce promit o funcionare stabil a respectivelor module n
condiii extreme. Punnd i cooler-ul de pe chipset sub lup, cooler ce are dimensiuni
peste medie i beneficiaz de un ventilator Mag-Lev (teoretic de cteva ori mai fiabil
dect cele ball bearing si n acelai timp mai silenios), i adugnd la aceasta faptul c
sunt prezente nu mai puin de 4 (patru!) mufe de alimentare pentru placa de baz (ATX
2.0, +12V, molex HDD + mufa FDD), nu putem trage dect o concluzie: placa e
proiectat s gzduiasc componente ce consum foarte multa putere. Overclocking
anybody?
Majoritatea conectorilor au o amplasare bun, singurul care aduce o penalizare
mai serioas este unul din cei de alimentare, i anume cel cu mufa de FDD, plasat foarte
aproape de centru; existena lui acolo este justificata dac ne gndim la eficien
maxim, pentru c livreaz curentul foarte aproape de consumator, eliminnd astfel
pierderile suplimentare prin traseele de pe PCB-ul plcii de baza. Un alt lucru care
merit cu siguran atenia e prezena a dou slot-uri PCI Express X16, iar alturi de ele
existena unor seturi de jumperi ce se pot seta pe Normal sau SLI, ntocmai ca la
modelele ce suport modul SLI. Mai mult, AnandTech3 a sesizat acum ceva timp c
chipset-urile nForce4 Ultra i nForce SLI sunt unul i acelai, diferena constnd doar n
prezenta unei puni conectate pe chipset (similare celei ntlnite la procesoarele Athlon),
ce permite identificarea chipset-ului ca avnd sau nu posibiliti de SLI. DFI-ul a
suportat cu succes modificarea (ce poate fi realizat cu un creion, cu substan
electroconductoare sau chiar cu pistolul de lipit - nerecomandat celor care nu au
priceperea necesar), funcionnd perfect cu dou plci grafice Leadtek 6800 n mod
SLI, sistemul overclock-at depind bariera celor 19.000 de puncte in 3DMark03.
Back-panel-ul e special, gzduind nu mai puin de ase mufe USB, dou RJ-45
(LAN Gigabit), una FireWire, ase jack-uri audio, dou conectoare de tip RCA
(intrarea, respectiv ieirea SP/DIF), precum i obinuiii conectori PS/2 pentru tastatur
i mouse. Se observ eliminarea conectorului pentru portul paralel, n timp ce cel serial
precum i unul suplimentar FireWire i patru USB pot fi conectate intern pe placa de
baz, dei conectorii de extensie lipsesc. Ultimul lucru legat de layout ce merit
menionat este prezena switch-urilor de Power i Reset precum i a unui speaker direct
3

http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2322
31

Evaluarea performanelor sistemelor de calcul

pe placa de baza, pe care am avut ocazia s le apreciem n timpul testelor, placa avnd
funcionalitate deplin fr a necesita folosirea unei carcase.
Mai departe, descoperim un BIOS extrem de bogat care, pe lng numrul foarte
mare de setri legate de memorie, permite reglarea tensiunii Vcore (pentru procesor)
pn la 2.1V, VDD (chipset) pn la 1.8V, LDT (HyperTransport) pn la 1.5V i, cel
mai impresionant, Vdimm (cea a memoriei) pn la 4V. Dei aceast din urm setare e
util doar n cazul n care sunt folosite memorii cu anumite chip-uri Winbond ce
rspund dar mai ales rezist la asemenea valori, notm nc un punct n plus pentru DFI
din partea entuziatilor. Toate setrile legate de overclocking sunt strnse ntr-o singur
categorie a BIOS-ului, numit Genie BIOS - i cnd zic toate nu m refer doar la
memorie i voltaje, ci i la posibilitatea de a dezactiva anumite device-uri on-board ce ar
putea limita overclocking-ul extrem (porturi S-ATA, on-board LAN etc) - de unde
putem afla tensiunile critice i, foarte interesant, avem posibilitatea de a rula
Memtest86+ imediat dup POST (test ce este integrat n chip-ul de BIOS). Ambalajul
de jucrii conine, se pare, i ceva jucrii de oameni mari.
Un lucru de asemenea special este CMOS Reloaded, ce const n posibilitatea de
a stoca patru configuraii ale BIOS-ului, ce se pot ncrca mai trziu prin simpla apsare
a unei taste; alturi de modul Safe Boot selectabil printr-un jumper (pentru a nu fi
necesar s resetm BIOS-ul), este o unealt foarte util n cazul overclocking-ului sau al
testrii componentelor.
Trecnd mai departe la msurarea performanelor, am observat un comportament
excelent, placa stabilind referina pentru celelalte incluse n test, mai ales datorit
faptului c a suportat setri ale memoriei mai agresive dect n cazul celorlalte modele.
Astfel, setrile CAS i TRAS au mers coborte pn la unele valori mai neobinuite, i
anume 1.5 i respectiv 0, n timp ce la celelalte modele testate nu am reuit sa le
coborm n condiii de stabilitate mai jos de 2, respectiv 5. De asemenea, tRC, tRFC si
tRRD au cobort pn la 7-9-0, comparativ cu 9-12-2 la celelalte. Cea mai mare
diferen de performan a avut loc n compresia WinRAR, unde placa a punctat cu
1.5% mai bine dect urmtoarea clasat. Overclocking-ul este ns capitolul unde DFI
arat cu adevrat tot ce poate. Fornd memoriile Corsair la latene crescute, am reuit
s le mpingem pn la o frecven stabil de 315 MHz, destul de impresionant avnd n
vedere c ele sunt certificate la o frecven de lucru de 200 MHz (cu latene mult mai
strnse ns). Cel mai impresionant lucru a fost HTT-ul atins, i anume 445 MHz,
folosind un divizor 2:1 pentru memorie; astfel, placa a dovedit c poate rula stabil la o
frecven aproape de dou ori i jumtate mai mare fa de specificaii.
Software-ul inclus pe CD-ul cu drivere const ntr-un program de monitorizare
(ITE SmartGuardian) ce permite i controlul turaiei ventilatoarelor n funcie de
temperaturi, soft-ul NVIDIA nTune precum i un alt utilitar numit ITE SmartSpeed.
Acesta conine, pe lng funcionalitatea lui ITE SmartGuardian, i posibilitatea setrii
tensiunilor Vcore, Vdimm si VDD, precum i un overclocking limitat. Aceast din urm
funcie este total nereuit, posibilitile de supratactare fiind practic nefuncionale,
aceasta pe lng greelile evidente de limb englez din program.
Per total, micul productor DFI reuete s se prezinte cu o ofert excepional,
singurele categorii care ar putea fi mbuntite fiind legate de documentaie i de
funcionalitatea software-ului; avnd ns n vedere c target-ul produsului se afl mai
degrab n zona power-user, aceste lipsuri sunt ca i inexistente.

32

Cap 2: Evaluarea performanelor plcilor de baz

Concluzie
Performana i posibilitile deosebite de overclocking fac din DFI LANParty
UT nF4 Ultra-D ctigtorul testului nostru, chiar i n competiie cu modelele high-end
de la productori consacrai. Titlul de XF Award l-a primit cu greu din cauza absenei
de pe piaa romneasc la data efecturii testelor.
+ overclocking extrem atins n practic
+ BIOS special conceput pentru overclocking
+ numeroase setri de memorie
+ poate fi transformat uor pentru lucrul n mod SLI
- documentaia i software-ul las de dorit
2.2.7. Gigabyte GA-K8NXP-SLI (nForce4 SLI)
Plac creat special pentru a oferi maximul de performan dintr-un sistem de
gaming, este dotat cu dou slot-uri PCI Express X16, GA-K8NXP-SLI impresioneaz
n primul rnd prin dotare i, de ce nu, prin aspectul estetic de excepie. Mai nti sare n
ochi cutia dubl fa de cea a unei plci normale, n interiorul pachetului aflndu-se
dou cutii mai mici, pline cu jucrii. n prima gsim (enumerate ntr-o ordine
aleatoare) o foaie ce face reclam la cooler-ul 3D Rocket, creat tot de Gigabyte (un
model foarte reuit), un manual bine scris, unul destinat chip-ului Sil3114 (hint: Serial
ATA, RAID 5), un ghid de instalare rapid sub form de pliant, scris n cteva limbi, un
abibild Gigabyte... i cam att cu maculatura. Lucrurile mai serioase se concretizeaz
prin nu mai puin de opt cabluri Serial ATA i patru cabluri convertoare molex
alimentare SATA (cu cte doi conectori pe fiecare cablu) i numai un cablu Parallel
ATA. Cu alte cuvinte, fiecare hard disk Serial ATA ce poate fi utilizat mpreun cu
aceast plac de baz nu va avea nevoie de nici un cablu suplimentar fa de cele livrate.

n cealalt cutie avem deja obinuitul DPS (Dual Power System) cu care ne
rsfa Gigabyte de circa doi ani ncoace, precum i o plac al crui nume spune totul:
802.11 Wireless LAN Card. S nu uitm nici de cele trei bracket-uri USB (ase porturi
n total, fr a le meniona pe cele patru de pe plac), unul servind i conectrii a dou
dispozitive FireWire. Analiznd acum placa, observm cele dou slot-uri PCI Express,
fiecare putnd suporta o plac grafic performant. Modul SLI este reflectat de un mic
card, asemntor modulelor SO-DIMM, ce permite selectarea modului de operare: SLI
sau Normal. Cu alte cuvinte, 1x PCI Express 16x sau 2x PCI Express 8x - evident c
dac cea de-a doua plac lipsete, vom alege prima variant.
DPS este, dup cum spuneam anterior, o plac suplimentar (dotat i cu sistem
de rcire separat) ce se aeaz ntr-un slot special (asemntor ca i construcie cu
vechiul ISA, dar mult mai mic dect acesta), ce conine o surs de putere suplimentar,
33

Evaluarea performanelor sistemelor de calcul

util n caz de stres maxim (overclocking, temperaturi mari, consum foarte mare din
partea procesorului). Practic, am observat c aceasta preia cea mai mare parte din
sarcina surselor de putere deoarece tranzistorii de tip MOSFET prezeni pe placa de
baz au rmas reci, cei de pe DPS fiind fierbini.

Analiznd mai departe, mai reperm dou slot-uri PCI Express X1, aezate
alternativ cu cele X16, precum i dou PCI normal. Interfeele de uniti de stocare
sunt n numr de zece, dou Parallel i opt Serial-ATA, de patru din acestea din urm
ocupndu-se chipset-ul (pardon, chip-ul), restul cznd n sarcina unui controller
separat, de la Silicon Image. Fiecare controller este capabil de funcia RAID, ultimul
permind i RAID 5. Back-panel-ul este asemntor cu cel clasic, conectorul serial
fiind nlocuit de o intrare i o ieire SPDIF, iar conectarea la reea este servit de dou
interfee capabile de 1 Gbps, chip-urile rspunztoare fiind produse de Marvell i
Vitesse. Este ciudat alegerea a dou chip-uri diferite destinate acestui scop, ns
opiunea productorului nu poate fi privit dect ca un plus, utilizatorul avnd acum de
unde alege.
Ergonomia. Aproape nimic de reproat, minusurile fiind de neles avnd n
vedere numrul de componente care au ncput pe plac. Spaiu n jurul procesorului?
Este. Spaiu ntre placa grafic i DIMM-uri? Este. Plasare potrivit a conectorului de
alimentare? Este. Ce nu prea este e spaiul dintre slot-urile PCI Express, slot-ul X1
dintre cele dou plci grafice fiind practic inutilizabil pentru c plasarea unei plci n
acesta ar crea probleme grave rcirii plcii grafice din vecintate.
BIOS-ul plcii este excelent, cel puin dup apsarea tastelor Ctrl+F1, operaie
necesar pentru a putea accesa opiunile ascunse i destinat utilizatorilor experimentai.
Gsim astfel posibiliti de overclocking practic nelimitate, de la banala setare a busului HTT (era s spun FSB) pn la reglaje fine ale memoriei. Numrul de setri legate
direct sau indirect de memorie este de 12, putnd fi ntlnite o serie de timing-uri care
lipsesc cu desvrire n BIOS-urile plcilor ieftine. Tensiunile, att pentru memorie ct
i pentru procesor, pot fi ajustate pn la maxim 2.8V i respectiv 1.75V, ceea ce nu mai
reprezint nimic deosebit. Deosebit este posibilitatea de overclocking a plcii grafice.
Da, ai citit bine, placa poate seta din BIOS frecvenele VPU-ului i a memoriei plcii
(plcilor) video n procente, plaja de valori fiind ntre 100% i 255%. Performanele
atinse au fost foarte bune, dei nu cele mai bune. Prin setarea unor latene foarte
agresive pentru memorie, am obinut o instabilitate exemplar. Schimbnd valorile la
unele mai de bun sim dar n continuare foarte agresive, am sczut performana
extrem de puin, dar sistemul a rulat stabil. (Reamintesc faptul c testul de performan
a fost rulat cu o singur plac grafic. Prezena celui de-al doilea slot PCI Express X16
a contat doar la capitolul dotare.)
Overclocking-ul a produs mari dureri de cap. Dei frecvenele atinse au fost de
315 MHz asincron i 265 MHz sincron (destul de modeste, sub preteniile pe care le
34

Cap 2: Evaluarea performanelor plcilor de baz

aveam de la o astfel de plac), am fost lovit de diverse probleme de stabilitate n condiii


uneori hilare. De exemplu, am reuit s aduc placa n situaia de a nu trece de POST la
un HTT mai mare de 213 MHz i aceasta n condiiile n care, peste cteva ore, la exact
aceleai setri, am obinut 315 MHz. Altfel spus, placa a funcionat haotic n condiii de
stres, la un moment dat la circa dou din cinci porniri intrnd n funciune Dual BIOSul, fiind detectat coruperea BIOS-ului. Alarmele erau n mod clar false, astfel c am
dezactivat opiunea Auto Recovery (practic, am dezactivat funcionalitatea Dual BIOSului) i am putut realiza testele. Nu se poate pune problema calitii slabe a
componentelor de pe plac, temperaturile atinse nefiind foarte mari (mai puin
temperatura DPS-ului care a ajuns la valori deranjante odat cu setarea unei tensiuni
mari pentru procesor), iar condensatorii Nichicon ce nvluie socket-ul procesorului
sunt considerai ca avnd o fiabilitate peste medie, putnd rezista vreme ndelungat la
temperaturi mari. De asemenea, nsi prezena unei surse de putere suplimentare prin
prezena DPS-ului crete n mod teoretic fiabilitatea produsului, precum i ansele de
reuit ale unui overclocking extrem. Aadar, vina nu se poate spune a cui e. Cert este
c alte exemplare ale acestui model au rulat fr probleme la un HTT mai mare i este
posibil ca acest exemplar s fi avut unele probleme, eventual versiunea BIOS-ului (F6,
ultimul disponibil la data testrii) s creeze probleme. Oricum, aceasta este fraza clasic
pe care orice tester o afirm n situaii de acest gen, drept urmare impresia subiectiv
asupra posibilitilor de overclocking ale plcii de fa - i lund n calcul experienele
similare pe plci mai vechi ale aceluiai productor - nu este pozitiv.
n rest, productorul taiwanez a fost la nlime. Dotrile extravagante, chiar
dac au anse mici s fie folosite n practic, ofer o aur de supremaie, placa fiind
printre cele mai bine dotate plci pe care am avut ocazia s le testez.
Concluzie
Cu puin atenie suplimentar la detalii, Gigabyte ar putea accede la fotoliul de
lider al plcilor de baz destinate entuziatilor, deinut n prezent de alte nume sonore pe
care v lsm plcerea s le descoperii mai departe n acest capitol. Pn atunci, nota
10 la dotare i doar not de trecere la overclocking.
+ dotare excelent
+ accept dou plci grafice n mod SLI
+ setri bune de overclocking n BIOS
+ Dual BIOS
- lips aproape total a monitorizrilor n BIOS
- overclocking-ul efectiv a creat mari probleme
2.2.8. Gigabyte GA-K8NF-9 (nForce4-4X)
O variant pentru buget redus a plcii descrise anterior este GA-K8NF-9. Bazat
pe un PCB foarte asemntor, deosebirile privesc n primul rnd absena celui de-al
doilea slot SLI (ce este nlocuit de unul PCI normal), iar chipset-ul din dotare este
nForce4-4X. Chipset ce nu exist n documentele NVIDIA (Gigabyte este singurul
productor care l utilizeaz) i care nu reprezint dect o revizie mai veche a lui
nForce4 (A2 fa de A3) care suport un bus HyperTransport de maxim 800 MHz (fa
de 1000 MHz pentru variantele clasice). Diferenele de performan sunt absolut
neglijabile n sistemele obinuite, drept dovad placa a fost la fel de rapid ca i
35

Evaluarea performanelor sistemelor de calcul

K8NXP-SLI. n plus, a rulat aparent stabil la un LDT de 5x (deci 1000 MHz), e drept,
fr s fie conectate la plac prea multe dispozitive i fr a se efectua teste riguroase.

De asemenea, dotarea plcii nu este nici pe departe att de extravagant ca cea a


suratei mai mari. Lipsesc patru din cele opt porturi Serial ATA, placa DPS, unul din
cele dou BIOS-uri, iar conectorii de ventilatoare sunt n numr de doi (nelund n
seam cel destinat chipset-ului rcit acum pasiv, n format cu dou fire). BIOS-ul este
identic cu excepia opiunii de overclocking a plcii grafice, frecvenele acesteia
nemaiputnd fi ajustate n procente, ci doar pe baza a dou preset-uri: Fast i Turbo.
Frecvenele maxime ale bus-ului HTT au fost urcate ceva mai sus dect n cazul plcii
anterioare, problemele ntlnite la K8NXP-SLI neaprnd. Totui, 320 MHz asincron i
280 sincron nu impresioneaz pe nimeni care a pus mna pe plci mai bune, dar sunt
nite valori excelente pentru un produs value.
Concluzie
Una peste alta, GA-K8NF-9 i merit banii, fiind un model destul de ieftin i
care dispune de faciliti remarcabile. Chiar dac nu avem dou interfee LAN sau opt
conectori SATA, nici nu avem nevoie de aa ceva. Cine? Noi, cei care nu suntem
dispui s pltim dublu pentru astfel de faciliti.
+ setri bune de overclocking n BIOS
+ overclocking bun atins n practic
+ pre foarte atractiv
- lips aproape total a monitorizrilor n BIOS
2.2.9. Rezultate comparative
n continuare se prezint, comparativ, rezultatele obinute cu diferite progrme de
testare, a plcilor de baz.
Placa de baz Activitate /program testare - punctaj
testat
SiSoft
Science
Copiere
Sandra
Mark
fiiere
DFI
5647
42,8
355
Abit AN8
5632
42,8
358
Gigabyte
5636
43,3
356

Arhivare
WinRAR
255
261
259

PovRay
842
837
841

Codare
XviD
478
480
481

SiSoftSandra (Unitatea de msur: puncte; mai mare = mai bine)


Testul sintetic de lime de band a memoriei din SiSoft Sandra a confirmat ceea
ce bnuiam, avnd n vedere setrile efectuate n BIOS i rezultatele obinute n celelalte
teste: placa de la DFI ofer un plus de performan datorit latenelor mai mici ale
memoriei.
Science Mark (Unitatea de msur: nanosecunde; mai mic = mai bine)
36

Cap 2: Evaluarea performanelor plcilor de baz

Testul de laten a memorie din ScienceMark nu ne-a oferit nici un rezultat


relevant; ne ateptam la altceva.
Copiere fiiere (Unitatea de msur: secunde; mai mic = mai bine)
La copierea fiierelor, un test al controller-ului Serial ATA, diferenele au fost
mici, innd cont c el este acelai la toate cele trei plci.
Arhivare WinRAR (Unitatea de msur: secunde; mai mic = mai bine)
Comprimarea cu WinRAR a scos la iveal cele mai mari diferene: Abit AN8 a
fost cea mai lent plac din test, DFI-ul lund un avans de peste dou procente fa de
aceasta.
PovRay (Unitatea de msur: secunde; mai mic = mai bine)
Randarea unei imagini n PovRay depinde aproape n totalitate de procesor,
drept pentru care placa DFI a stors doar un 0.6% n faa lui Abit.
Codare XviD (Unitatea de msur: secunde; mai mic = mai bine)
Scoruri foarte apropiate la codarea unui film folosind XviD, placa DFI fiind n
continuare n frunte.
2.2.10. Concluzii
Este greu de tras linia i fcut totalul dup doar cinci plci testate, mai ales cnd
dou dintre ele sunt variante mai srace ale modelelor de vrf. Practic, am avut n test
trei plci de baz.
DFI LanParty UT nF4 Ultra-D este fr discuie ctigtorul testului. Ea s-a
comportat excelent, o dovad n plus c DFI este un productor care poate accede uor
la trofeele cele mai mari din domeniul overclocking-ului, orientarea firmei schimbnduse total n ultima perioad. i, s nu uitm, versiunea testat nu este cea mai dotat plac
a productorului taiwanez, iar preul este foarte tentant.
Abit s-a prezentat exemplar prin AN8, att cu, ct i fr sufixul Fatal1ty.
Acesta din urm ncarc substanial preul, oferind un plus de faciliti pe care, cel mai
probabil, nu le vei folosi, sau care nu v vor ajuta prea mult. Dotarea i overclocking-ul
sunt foarte bune, ns la aceiai bani se pot gsi produse care nu poart tampila Abit
i care pot oferi satisfacii similare.
Gigabyte a ocupat ultimele dou locuri. Dac la dotare este de neegalat (SLI, opt
porturi Serial ATA i alte minunii), restul facilitilor nu au excelat, modelul GAK8NXP-SLI fiind un produs mediu pentru categoria sa. Ct despre codaa
clasamentului, GA-K8NF-9, ea reprezint fr discuie best buy-ul acestui test,
dovedind c nu avem nevoie de o gaur n buget de 200$ pentru a obine o plac bun.

37

3. Evaluarea performanelor procesoarelor


3.1. Arhitectura lui Pentium 4 Prescott
3.1.1. Introducere
Ultima realizare de la Intel, ce poart aceeai
denumire comercial ca i predecesorii si, Pentium 4,
este cunoscut sub numele de cod Prescott. Dac AMD
prefer denumiri legate de cai pentru a-i promova
CPU-urile (Morgan, Palomino, Thoroughbred sunt
rase de cai) iar VIA folosete termeni cu rezonan
religioas (Nehemiah, Joshua, Ezra), Intel prefer
nume de localiti sau regiuni geografice din America
(Willamette i Coppermine sunt ruri, Northwood este denumirea atribuit mai multor
localiti), Prescott fiind att o pdure, un orel n Arizona cu o populaie de cteva
zeci de mii de locuitori, ct i un nume, marele fizician englez Joule avnd numele
complet de James Prescott Joule. Cam att cu povetile, s trecem la lucruri serioase.
Modificrile aduse de Intel arhitecturii vechiului Pentium 4 (cod Willamette sau
Northwood) nu sunt att de marcante ca n cazul trecerii de la Pentium III la Pentium 4
ns putem spune c, din anumite puncte de vedere, ele se aseamn cu precedentul salt
de tehnologie. Arhitectura NetBurst a fost pstrat, deci vom avea n continuare un
procesor ce ruleaz cu un PSB efectiv ncepnd cu de patru ori mai mare dect frecvena
de baz, i anume 4x200=800 MHz, frecven cunoscut de la ultimele modele de
Northwood, ajungndu-se la modelele ulterioare la 4x266=1066 MHz. Simplificnd,
schimbrile aduse de ctre Prescott se bazeaz pe ncercarea productorului de a crete
performana n primul rnd prin creterea frecvenei; pentru aceasta, au fost necesare
unele schimbri interne care au dus inevitabil la scderea vitezei comparativ cu alte
procesoare la aceeai frecven. Cu alte cuvinte, Northwood este mai rapid dect
Prescott la aceeai frecven n anumite aplicaii, la fel cum Pentium III Coppermine era
mai rapid dect Pentium 4 Willamette dac se comparau dou CPU-uri rulnd la tacturi
similare.
Nu trebuie s v ngrijorai: Intel a fcut tot posibilul pentru a minimaliza
efectele ncercrii oarecum forate de cretere a frecvenei. Astfel, dimensiunea cacheului L2 a fost dublat, o serie de uniti ale procesorului, precum cache-ul i unitatea
pentru numere ntregi au fost optimizate, iar cteva instruciuni suplimentare au extins
setul SSE2, el devenind acum SSE3. n acelai timp, numrul de stagii ale conductelor
de prelucrare (aa numitele pipeline-uri) a fost crescut n continuare, el ajungnd la
peste 30 (10 la Pentium III, 20 la Pentium 4 Willamette i Northwood). Aceast
modificare, mpreun cu creterea latenei cache-ului, ofer noi orizonturi privind
potenialul de a atinge frecvene uriae, de ordinul a 5 GHz. Nu este nevoie de prea
mult imaginaie pentru a afla motivul acestor schimbri, el fiind unul comercial: mai
muli megahertzi nseamn pentru cei mai muli mai mult performan, fapt ce se
dovedete a fi din ce n ce mai fals. Vom explica n continuare majoritatea schimbrilor
aduse de Prescott lui Pentium 4 Northwood, explicnd (cel puin sumar) toate noiunile
care ar putea produce dificulti n urmrirea textului pentru un cititor nceptor.
38

Cap 3: Evaluarea performanelor procesoarelor

Cteva cuvinte despre tehnologia de fabricaie. Numrul de microni ntlnit n


specificaiile oricrui procesor se refer la distanele dintre tranzistorii procesorului. Cu
ct acestea sunt mai mici, cu att se mrete potenialul creterii frecvenei de tact.
Aceasta este teoria clasic, ce tinde s nu mai fie valabil din cauza atingerii unor
distane critice: 0.13 microni pentru Pentium 4 Northwood i 0.09 microni (90
nanometri) pentru Prescott. Pe de o parte, tranzistorii pot lucra mai rapid, pe de alt
parte apar fenomene nedorite, n special datorit dimensiunii foarte mici a pastilei,
devenind necesare unele schimbri de ordin intern. Astfel, tehnologia Strained Silicon
rezolv parial neajunsurile datorate arhitecturii pe 0.09 microni a lui Prescott.
3.1.2. Gestionarea memoriei principale i secundare
S comentm puin
memoria cu care lucreaz
ultimele procesoare Intel.
Dup
cum
se
tie,
northbridge-ul,
pentru
majoritatea
chipset-urilor
destinate lui Pentium 4,
deine integrate n primul
rnd controller-ul de memorie
i cel pentru bus-ul AGP sau
PCI Express X16. Controllerul de memorie influeneaz
puternic performana, el
avnd posibiliti de a lucra
cu memoria SDRAM, DDR
SDRAM, DDR2 SDRAM sau RDRAM (Rambus). Toate chipset-urile uzuale folosesc
memoria n mod dual-channel (care n principiu dubleaz performana acesteia dac
sunt folosite dou sau mai mult module de memorie ntr-o anumit combinaie), o
valoare normal ca lime de band fiind cea de 6.4 GB/s (DDR400 n mod dualchannel). Pentru ca aceast vitez teoretic s afecteze puternic performana este nevoie
ca datele furnizate de procesor s ajung n memorie la timp, ceea ce nseamn c, prin
intermediul PSB-ului (care este n esen viteza de comunicare dintre CPU i
northbridge), s fie furnizai memoriei cte 6.4 GB ntr-o secund. Exact aceasta este
limea de band a PSB-ului de 800 MHz. i nu este vorba de 800 MHz reali, ci de 200
MHz multiplicai de un numr de patru ori, folosindu-se o tehnic asemntoare cu
dublarea ratei de transfer la PSB-urile procesoarelor Athlon i la memoriile DDR.
Astfel, circulaia fluxului de date procesor-northbridge-memorie se desfoar cu viteza
de 6.4 GB/s, de dou ori mai mult dect pentru un Athlon XP cu PSB de 400 MHz
(2x200). n varianta de PSB 533, acest flux circul cu doar 4.3 GB/s, o frecven a
memoriei mai mare de cea corespunztoare lui PC2100 (DDR266) dual-channel
neaducnd creteri majore de performan, motivul fiind explicat mai sus. Prescott
ruleaz la un PSB de 533, 800 i 1066 MHz; n schimb, Northwood beneficiaz doar de
400, 533 i 800 MHz. Totui, majoritatea modelelor de Prescott nu depesc dect prin
overclocking cei 800 MHz, ele fiind similare din acest punct de vedere celor mai
recente procesoare Northwood.
Cache-ul este o zon de memorie intermediar care stocheaz informaiile mai
des folosite, crescnd foarte mult (de mii de ori) performana unui procesor, aceasta
39

Evaluarea performanelor sistemelor de calcul

datorit faptului c, n cele mai multe cazuri, datele i instruciunile nu sunt folosite o
singur dat ci de un numr foarte mare de ori ntr-un interval scurt. Exist cel puin
dou nivele de cache: level 1 (L1) i level 2 (L2), primul nivel fiind mai aproape de
nucleul procesorului i avnd astfel o eficien mai mare. La majoritatea procesoarelor
de azi, el este mprit ntr-o seciune pentru date i una pentru instruciuni.
Pentru procesoarele AMD, cele dou zone sunt de capacitate identic i
totalizeaz 128 KB, ns Pentium 4 a adus o nou organizare a cache-ului, existnd o
seciune de date de doar 8 KB i una de instruciuni, numit Execution Trace Cache,
care stocheaz aceste instruciuni ntr-o form deja decodat, capacitatea fiind de 12.000
de micro-operaii (micro-ops); acest tip de cache depete ca eficien unul obinuit de
8 KB. n cazul lui Prescott, cache-ul pentru instruciuni a rmas acelai iar cel de date a
fost crescut la 16 KB, acest lucru avnd un impact direct asupra performanei; el este
nc extrem de mic comparat cu procesoarele AMD, care dein un cache total (date +
instruciuni) de 128 KB. Totui, acest trace cache este vital pentru un procesor cu un
pipeline lung, cum este Pentium 4, un cache convenional chiar i mult mai mare ar fi
putut dezavantaja procesoarele Intel. n plus, L1 cache-ul lui Prescott a fost puternic
optimizat, avnd un hit rate (probabilitatea ca informaiile cerute s se afle n cache)
mai mare dect la predecesori.
Cache-ul L2 este de asemenea o zon de memorie care stocheaz date
temporare, ns rolul su este diferit, n funcie de relaia sa cu L1. n momentul
umplerii cache-ului L1 este solicitat nivelul al doilea, n care sunt depuse informaiile
mai rar folosite, s le numim reziduale (desemnate conform unui algoritm numit LRU Least Recently Used), urmnd ca datele considerate mai importante s fie aduse n
spaiul liber creat n L1. Dac informaia copiat anterior din L1 n L2 redevine util, ea
este readus n L1, consumndu-se din nou timp preios (se creeaz alt informaie
rezidual ce este copiat n L2, crendu-se loc n L1 pentru noua informaie preioas,
fost rezidual). De ce nu este prelucrat direct n L2? Pentru c sunt anse foarte mari
ca informaia s fie necesar de un numr mare de ori, fiind mai eficient copierea ei
ntr-o zon de memorie mai rapid dect meninerea sa ntr-una lent. Aceast relaie
dintre cele dou nivele de cache o numim exclusiv.
O alt metod elimin necesitatea transferului ntre L1 i L2 datorat celei dinti
situaii expuse mai sus. Aceasta datorit faptului c L2 conine, pe lng informaiile
reziduale, i imaginea complet a nivelului 1 de cache, nemaifiind necesar copierea
informaiei din L1 a datelor considerate inutile pentru moment. n acest caz, avem de-a
face cu o relaie inclusiv ntre cele dou nivele. O consecin direct este faptul c o
relaie inclusiv implic o dimensiune a L2 cache-ului mai mare dect cea a nivelului 1.
n plus, dimensiunea total a cache-ului este mai mic dect suma celor dou
componente ale sale. Mai exact, cache-ul total este egal cu L1 + (L2 L1) = L2.
Avantajul vitezei a decis compania Intel s implementeze acest tip de cache n toate
procesoarele sale ncepnd cu Pentium Pro i terminnd (deocamdat) cu Prescott.
Dimensiunea cache-ului L2 este de 256 KB la primul Pentium 4 (Willamette), 512 KB
la Northwood i 1 MB la Prescott. Dup cum v-ai dat seama, n privina lui L1 se
merge pe ideea de vitez mare i dimensiune mic, el fiind folosit mult mai intens dect
L2. Pentru acesta din urm se prefer o vitez mai redus dar o dimensiune mai mare,
L2 fiind de zeci de ori mai ncptor dect L1.
Relaia exclusiv este caracteristic procesoarelor din familia K7 (Athlon) pe
Socket A i AMD64, care au o dimensiune a cache-ului L1 comparabil cu cea a lui L2
dar eficiena acestuia din urm este destul de redus. Chiar dac avem de-a face cu o
40

Cap 3: Evaluarea performanelor procesoarelor

dimensiune dubl fa de predecesor, att (parial) pentru L1 ct i pentru L2, noul


model de Pentium 4 are o laten mai mare a cache-ului. Motivul este faptul c ambele
nivele de cache ruleaz la frecvena intern a procesorului. Cu alte cuvinte, frecvenele
uriae pentru care este proiectat Prescott trebuie s fie suportate i de cache, iar pentru
aceasta sunt necesari timpi mori suplimentari sau costuri de fabricaie mai mari. Intel
a preferat prima variant.
Tehnologie
Cache L1
Cache L2
Laten
cache L1
Laten
cache L2
Tip cache

Willamette
Northwood
Prescott
AMD K7
0,18
0,13
0,09
0,250,13
8KB+12Kops 8KB+12Kops 16KB+12Kops
128 KB
256 KB
512 KB
1 MB
256 KB
2
2
4
3

AMD64
0,130,09
128 KB
512KB1MB
3

19

19

28

20

13

inclusiv

inclusiv

inclusiv

exclusiv

exclusiv

3.1.3. Latena
Latena reprezint timpul
(msurabil n cicluri de tact) scurs
de la solicitarea unei operaii pn
la executarea efectiv a acesteia. Pentru cache-ul L1, acest numr este de dou cicluri la
Pentium 4 Northwood i de patru cicluri la Prescott. Nivelul doi de cache deine o
laten de 19 cicluri pentru Northwood i 28 pentru Prescott. Cu toate acestea, avantajul
(parial pentru L1, total pentru L2) dublrii cache-ului este probabil superior
dezavantajului scderii eficienei sale. Aceasta se datoreaz frecvenei mari a
procesorului, deoarece importana unui cache mare crete odat cu creterea diferenei
dintre viteza CPU-ului i cea a memoriei. S vedem i de ce.
Dac un procesor poate face multe, un singur lucru nu poate: s stocheze date
(excluznd cache-ul). Pentru aceasta, este nevoie de memoria sistemului. Spre exemplu,
dac procesorul are de adunat 1000 de numere, el le va solicita pe rnd, primind
informaiile i oferind imediat rezultatul cerut. Dar ce se ntmpl cnd n algoritm
apare, dup terminarea adunrii, solicitarea de a refolosi cel de-al 537-lea numr din
irul de 1000? Procesorul ar trebui s cear memoriei elementul cu numrul de ordine
537. ns cte cicluri de tact trec de la efectuarea cererii pn la obinerea informaiei?
Dac procesorul ruleaz la peste 3 GHz iar memoria la cteva sute de MHz, este uor de
neles c soluia aceasta pune procesorul n situaia de a atepta rezultatul n loc s
execute alte operaii, ceea ce duce, evident, la scderea performanelor. Situaia real
este alta: al 537-lea numr se afl n cache, alturi de celelalte elemente ale irului i de
multe alte informaii recent utilizate, durata obinerii valorii acelui element fiind astfel
mult mai mic. Probabilitatea ca o instruciune sau o variabil recent folosit s fie din
nou necesar ntr-un interval scurt este foarte mare.
Cu ct frecvena procesorului este mai mare, cu att diferena dintre viteza
acestuia i cea a memoriei crete i, pe de alt parte, cu att procesorul va solicita mai
rapid informaii. Dac cache-ul nu este suficient de mare, acesta se va umple rapid i
procesorul va trebui s cear memoriei ceea ce i dorete. Pentru a se evita aceast
situaie, a crei frecven de apariie crete odat cu creterea frecvenei procesorului,
41

Evaluarea performanelor sistemelor de calcul

trebuie crescut dimensiunea cache-ului. Din pcate, aplicaiile de azi sunt mai sensibile
la creterea latenei cache-ului dect la creterea dimensiunii sale, astfel c, cel puin din
punct de vedere al cache-ului level 2, Northwood este mai rapid dect Prescott.
Ce limbi vorbete?
O alt caracteristic a lui Prescott (dar i a altor procesoare din familia P4) este
HyperThreading-ul. Acesta reprezint, n esen, un set de instruciuni capabil s
simuleze funcionarea procesorului n mod dual, software-ul comportndu-se ca i cum
n sistem ar fi prezent, fizic, un al doilea CPU. S-a dovedit faptul c dou sarcini
diferite, cum ar fi dou aplicaii sau dou thread-uri (ramuri) ale aceleiai aplicaii
lucreaz mai rapid n acest mod, cu un minim de suport att hardware ct i software,
motivul fiind faptul c multe zone ale procesorului nu sunt folosite la adevratul
potenial cnd execut o singur sarcin. De aceea, Intel a implementat tehnologia
HyperThreading n ultimele procesoare Northwood, precum i n majoritatea modelelor
de Prescott. ns sporul maxim de vitez se obine doar atunci cnd aplicaiile sunt
optimizate pentru acest mod de lucru, n caz contrar putnd fi sesizate chiar i scderi de
performan. Dei aceast tehnologie nu este specific doar lui Prescott, am descris-o
pentru a putea fi neles paragraful urmtor. De remarcat ns c exist versiuni de
Prescott fr aceste instruciuni.
n 1997, Intel a introdus instruciunile MMX (MultiMedia eXtensions), cu
scopul de a accelera aplicaiile multimedia optimizate pentru acestea. MMX a fost
extins cu SSE (Streaming SIMD Extensions), apoi cu SSE2 odat cu Pentium 4 iar
Prescott a introdus SSE3, ce cuprinde un numr mic de instruciuni n comparaie cu
precedentele versiuni, nefiind dect o completare a acestora. Nu este deloc o exagerare
s afirmm c SSE3 conine ceea ce Intel a uitat s implementeze n SSE i SSE2. SSE3
ofer avantaje minore diverselor sarcini ale aplicaiilor multimedia, cum ar fi compresia
video. Pe lng cele 11 instruciuni diverse, destinate operaiilor cu numere complexe,
conversiei integer-FPU i altele, ultimele dou optimizeaz modul de operare
HyperThreading dar necesit suport din partea sistemului de operare. Ateptm cu
interes dezvoltarea software-ului care s profite de SSE3, Intel punnd la dispoziie
versiunea a opta a compilatorului propriu de C++, care tie de SSE3. Sporul de
performan adus ar putea atinge 10 procente, SSE3 nefiind altceva dect unul din
numeroasele avantaje minore ale lui Prescott, ns sub care dac tragem linie obinem
ceva remarcabil. Asta dac ar fi vorba doar de avantaje...
3.1.4. Conductele
Poate cel mai important aspect legat de noul
Prescott este dat de pipeline (n traducere - conduct).
Acesta reprezint suma unor etape pe care instruciunile
trebuie sa le parcurg pn la obinerea rezultatului final.
Pipeline-ul este mprit n stagii, fiecare avnd o sarcin
bine definit. Iat un exemplu de pipeline simplu, fiecare
stagiu ocupnd exact timpul unui ciclu de tact.
stagiul 1: fetcher pregtete urmtoarea instruciune
stagiul 2: decoder decodific urmtoarea instruciune
stagiul 3: ALU execut instruciunea
stagiul 4: retire unit aduce rezultatul napoi n memorie
42

Cap 3: Evaluarea performanelor procesoarelor

Desigur, toate aceste operaii puteau fi executate neorganizat, ns pentru un


pipeline cu patru stagii avem patru operaii care sunt realizate simultan n locul uneia
singure. i nu trebuie neles faptul c fiecare pipeline este legat de aceeai instruciune,
ci dimpotriv. Spre exemplu, fetcher-ul pregtete instruciunea de desenare a unei
ferestre, decoder-ul este ocupat cu decodificarea unei instruciuni de desenare a unui
caracter n acea fereastr, ALU-ul calculeaz poziia icon-ului n interiorul ferestrei iar
retire unit-ul returneaz memoriei rezultatul copierii unor fiiere n background.
Desigur, fiecare instruciune trebuie s treac prin toate etapele pipeline-ului dar nu e
necesar ca la un moment dat pipeline-ul s fie plin cu aceeai instruciune. n caz c nu
exist simultan mai multe instruciuni de prelucrat (situaie practic imposibil pentru c
procesorul are permanent ceva de lucru), doar un singur stagiu al pipeline-ul va fi
ocupat, ceea ce ne ofer o vitez identic cu cea observat n execuia secvenial.
Pipeline-ul a fost gndit tocmai pentru a oferi posibilitatea execuiei simultane a
mai multor instruciuni i, n cazul ideal, performana este multiplicat de un numr de
ori dat de lungimea pipeline-ului. Astfel, dac procesorul are de executat 100 de
operaii, fiecare necesitnd cte patru stagii, vor fi necesare doar 100 de cicluri de tact n
locul a 400, pe fiecare ciclu fiind executate cte patru operaii. Din pcate, situaia
ideal nu este ntlnit niciodat pentru c instruciunile depind unele de altele mai mult
dect pare la prima vedere. S presupunem c plecai de acas cu maina personal i la
jumtatea drumului v dai seama c nu mai avei benzin. Cum nu este nici o
benzinrie prin zon i cum nimeni nu se ofer s v tracteze, trebuie s ateptai pe
cineva s v aduc benzina. Drept urmare, vei atepta cteva ore n trafic,
incomodndu-i pe ceilali oferi, eventual v vei retrage la marginea drumului pentru a
evita neplcerile pricinuite. i cu ct drumul pe care l avei de parcurs este mai lung, cu
att cresc ansele s rmnei fr combustibil. Acelai lucru se ntmpl i cu o
instruciune dac ea nu poate fi executat dect dup ce primete de la alta un rezultat:
ea va rmne blocat n pipeline pn cnd primete unda verde sau va fi eliminat din
pipeline, execuia ei fiind amnat i lsnd loc altor instruciuni care pot fi executate la
acel moment. Este evident c ansele ca acest eveniment s aib loc cresc odat cu
creterea numrului de stagii, tot mai multe instruciuni fiind blocate n trafic. Situaia
descris duce la apariia timpilor mori, n care procesorul nu se nclzete i de care se
poate profita, crescndu-i-se frecvena.
Un procesor care i propune s ating performana maxim la o frecven dat
va realiza un compromis ntre avantaje i dezavantaje, fiind dotat cu un numr relativ
redus de stagii. Dac scopul este atingerea de frecvene mari, neinndu-se seama de
performan, atunci se va realiza un procesor cu un numr imens de stagii al pipelineului, procesor care s zac nefolosit o bun parte din timp, ceea ce va duce la scderea
drastic a vitezei raportat la frecven. Exact acest lucru a realizat Intel, care a crescut
numrul de stagii odat cu apariia primului Pentium 4 (Willamette): 20 fa de 10 la
Pentium III. Rezultatul a fost evident: cu toate mbuntirile aduse de noua arhitectur
(PSB 400 fa de 133, SSE2 i altele), un Pentium 4 la 1.5 GHz era depit deseori de
un Pentium III la 1 GHz, semn c dezavantajul datorat pipeline-ului lung nu este
compensat de frecvena ridicat. O situaie similar o ntlnim i la Prescott, al crui
numr de pipeline-uri a ajuns la 31 de stagii. Totodat, avem i avantaje: un cache
dublu, instruciuni SSE3, etc, elemente concepute s afecteze pozitiv viteza, dar pe alte
ci. Totul pentru a se putea atinge frecvene mari, de ordinul a 4-5 GHz, frecvene
irezistibile pentru orice cumprtor neavizat.
43

Evaluarea performanelor sistemelor de calcul

Un procesor clasic execut fiecare instruciune n ordinea fireasc, ateptnd


terminarea fiecreia pn s treac la execuia celei urmtoare. Un procesor inteligent
se bazeaz pe faptul c timpii mori pot fi folosii pentru execuia urmtoarei
instruciuni. Ce se ntmpl atunci cnd instruciunea curent depinde de cea
precedent, fiind necesar obinerea rezultatului de pe urma execuiei acesteia? Un caz
clasic este acela al unui bloc if-then-else din cadrul oricrui limbaj de programare.
Pentru execuia unei anumite ramuri trebuie executat instruciunea if, dup care se ia o
decizie: se merge pe ramura A sau B. Exemplu:
if x=y then { ramura A }
else { ramura B }

Cu ajutorul unitii de predicie (branch predictor), procesorul va executa,


bazndu-se pe experienele precedente, ramura care are ansele cele mai mari s fie
adevrat, fr a evalua condiia x=y. Cu ct algoritmul prediciei este mai bun, cu att
acurateea ei este mai mare iar cazurile n care este aleas ramura greit sunt mai rare.
(Nu trebuie neles faptul c, la alegerea ramurii greite, rezultatul furnizat va fi
incorect; situaia doar va genera timpi suplimentari.) Pentru Prescott, Intel a mbuntit
predicia, motivul fiind faptul c un pipeline mai lung avea nevoie stringent de acest
lucru. Modificrile sunt minore dar importante i de natur calitativ, nu cantitativ. i
anume, nu a fost mrit Branch Target Buffer-ul (spaiul de memorie din procesor
destinat depozitrii aciunilor precedente, pe baza crora algoritmul s prevad aciunile
viitoare) ci algoritmul a fost optimizat.
O alt unitate a procesorului este scheduler-ul. Acesta, ca i branch predictor-ul,
este conceput pentru a crete eficiena CPU-ului, pentru a-l determina s lucreze la
potenialul maxim de care dispune. De data aceasta nu este vorba de ramuri cu
instruciuni ce vor fi probabil executate ci de unele care vor intra sigur n execuie.
Procesoarele moderne dein mai multe uniti independente care ndeplinesc aceeai
sarcin (spre exemplu, toate modelele de Pentium 4 dein trei uniti de calcul cu
numere ntregi ALU), ns fr acest scheduler (to schedule = a programa, cu sensul
de a stabili ceva la un anumit moment), nu ar fi activ dect o singur unitate la un
moment dat. S presupunem c avem de efectuat trei adunri, toate urmnd a fi
executate de cte o unitate ALU. Dar ce ne facem cnd instruciunile depind una de alta,
precum se poate vedea n exemplul urmtor:
1. a = 1 + 2
2. b = a + 4
3. c = b a
Este clar c numai dup execuia primei instruciuni va putea fi executat cea dea doua i numai dup execuia primelor dou va putea fi executat cea de-a treia. Ceea
ce nseamn c o singur unitate ALU din cele trei va fi folosit, procesorul rulnd la o
treime din potenial. Aici intervine scheduler-ul, care programeaz execuia altor
instruciuni, nelegate de cele de mai sus, dnd astfel cte o sarcin fiecrei uniti ALU.
Prescott a necesitat modificri i n aceast privin, pentru a compensa creterea
numrului de stagii al pipeline-ului. Cum arhitectura curent nu permite o modificare
puternic a acestei uniti, schimbrile au fost minore.

44

Cap 3: Evaluarea performanelor procesoarelor

3.1.5. Calculul matematic


Numrul de uniti a rmas acelai ca la precedentele modele de P4. Segmentul
ALU (Arithmetic and Logic Unit), cel care se ocup cu calcule legate de numere ntregi,
a rmas divizat n trei segmente care pot prelucra datele i instruciunile independent,
conform celor descrise n paragraful anterior. Dou dintre ele lucreaz la o vitez dubl
fa de restul unitilor (sunt double pumped), de aceea operaiile se execut foarte
rapid. Odat cu Prescott, Intel a ncercat s elibereze al treilea ALU (cel lent) de
sarcinile pe care oricum le ndeplinea cu greutate, oferind unitilor ALU double
pumped mai multe sarcini. Astfel, operaiile de tip shift i rotate erau executate de
ALU-ul lent, acum ele au fost preluate de celelalte dou mai rapide.
Un exemplu practic de mbuntire este acela n care sunt aplicate unui
numr binar operaii de multiplicare cu 2 (10 binar), caz tipic de shift n care este
suficient deplasarea cu cte un pas a fiecrui bit. De asemenea, nmulirile sunt acum
realizate de unitatea FPU (Floating Point Unit), care chiar dac teoretic este mai lent
dect ALU-ul, este specializat n astfel de operaii i poate furniza rezultatele mai
rapid.
3.1.6. Tensiunile
Se tie c prin creterea fineii tehnologiei se pot obine, pe de o parte
temperaturi de rulare mai sczute i, pe de alt parte, frecvene mai mari de funcionare.
S ne amintim de P4 Willamette (0.18 microni) care se oprea fr drept de apel la 2
GHz pe cnd Northwood (0.13 microni) a atins 3.4 GHz. Mai mult, necesarul de
tensiune de funcionare scade, de la 1.75V pentru Willamette s-a ajuns la 1.5V pentru
Northwood, iar Prescott coboar pn la 1.287V. Pe de alt parte, arhitectura intern
influeneaz puternic factorii putere disipat i temperatur de funcionare, deci ar fi
greit s afirmm c, indiferent de alte considerente, un CPU construit pe baza unei
tehnologii mai fine i rulnd la un voltaj mai mic va fi mai rece. Ca s nu o mai
lungim, Prescott este un procesor mai fierbinte dect se dorea a fi, care consum mult.
La 3.4 GHz, un Northwood disip 89W fa de 103W n cazul lui Prescott. Chiar dac
acesta din urm este special conceput pentru frecvene mari, este nevoie de msuri
speciale de precauie: n primul rnd, datorit consumului excesiv, plcile de baz
trebuie s suporte acest consum, n al doilea rnd sistemul de rcire trebuie s fie foarte
bine pus la punct.
n fine, Prescott este compatibil cu standardul VRM 10.0 (VRM = Voltage
Regulator Module), ceea ce i confer cteva avantaje,
printre care posibilitatea selectrii tensiunii n pai mai
mici (0.0125V fa de 0.025V la predecesori) i Dynamic
VID, adic posibilitatea ca procesorul s-i schimbe
tensiunea on the fly, nu doar din BIOS, cu utilitate
evident n cazul sistemelor mobile. Dezavantajul: toate
plcile de baz trebuie s suporte acest standard, deci
plcile vechi nu au nici o ans s lucreze cu Prescott.
3.1.7. Ambalarea
Dei nu are legtur cu arhitectura lui Prescott, menionm c Intel a introdus un
nou mod de a mpacheta procesorul, denumit LGA775, socket-ul purtnd denumirea
de Socket T. n trecut, modul PGA a dominat modelele acestei companii, reprezentat
45

Evaluarea performanelor sistemelor de calcul

de Socket 478. Principiul, folosit la toate procesoarele de la 80386 pn n prezent, era


clar: spatele chip-ului cuprindea un numr mare de pini care erau inserai ntr-un socket,
realizndu-se astfel contactul. Noul mod de mpachetare LGA (Land Grid Array)
elimin aceti pini (cel puin partea vizibil a acestora), contactul realizndu-se prin
alturarea direct a procesorului de socket. Astfel, ndoirea sau ruperea pinilor nu mai
poate avea loc, n schimb socket-ul poate fi deteriorat destul de uor prin montarea
repetat a procesoarelor. Odat cu apariia acestui mod de
mpachetare, Intel a schimbat i modul de a marca produsele
sale. Dac concurentul su, AMD, folosete de mult vreme
alt unitate de msur (rating-ul) pentru a caracteriza
procesoarele, Intel a utilizat pn acum modul consacrat, i
anume specificarea frecvenei de funcionare.
Recent, aceast politic a fost schimbat, locul
frecvenei fiind luat de un numr; de exemplu, Pentium 4 550
desemneaz un P4 ce ruleaz la 3.40 GHz. Modelele cu sufixul
J (de exemplu 550J) beneficiaz de tehnologia antivirus XD
(eXecute Disable), cunoscut i ca EDB (Execute Disable Bit) sau NX (No eXecute),
care asigur o minim protecie mpotriva celor mai uzuali virui. Practic, sistemul de
operare (Windows XP SP2, de exemplu) se folosete de aceast funcie a procesorului
pentru a marca diferite segmente de memorie ca fiind neexecutabile. Astfel, doar
codurile marcate n mod explicit ca executabile pot fi rulate, viruii bazndu-se, n
general, tocmai pe aceast slbiciune a sistemului, de a putea rula orice cod din orice
zon de memorie. Tehnologia a fost pn acum implementat de Intel doar n modelele
pe 64 de bii (Itanium), iar AMD a fost mai sprinten, fiind prima companie care a
introdus ntr-un procesor de larg consum aceast tehnic.
3.1.8. Versiuni de Prescott-uri
Exist pn n prezent cteva revizii ale lui Prescott, denumite stepping-uri,
diferenele dintre acestea fiind minore sub aspectul funcionalitii i inexistente cnd
vine vorba de performane. Prima revizie (uzual - deoarece au existat i reviziile A0 i
B0 dar informaiile despre acestea sunt practic inexistente), C0, suferea de boli ale
copilriei, procesoarele ce purtau acest nsemn fiind extrem de fierbini i producnd
diverse neplceri. Astfel, cei care doreau s ating maximul de performan prin
overclocking erau dezamgii, noul P4 neputnd face fa temperaturilor mari. Mai
mult, plcile de baz cu regulatoare de tensiune mai slabe nu fceau fa curenilor mari,
consumul de putere putnd depi 100W, stresnd n acelai timp i sursa sistemului. De
asemenea, o mai mare atenie trebuia acordat fluxului de aer din carcas, procesorul
fiind acum o surs enorm de cldur, putnd afecta buna funcionare a sa i a
componentelor din jurul su dac nu erau luate msuri de precauie. Tocmai de aceea,
Intel a specificat n mod expres temperatura maxim ambiant la care procesoarele sale
pot lucra: 38 de grade. Intel a remediat problema i a introdus a doua revizie, denumit
D0, mbuntind eficiena funcionrii tranzistorilor care, odat cu trecerea la o
tehnologie de fabricaie tot mai mic, generau pierderi de putere (power leakage).
Cea mai nou revizie, numit (cum altfel?) E0, mbuntete i mai mult
caracteristicile termice ale procesoarelor ns de data aceasta sporul este minor.
Aspectele mai importante ale lui E0 constau n primul rnd n adugarea de faciliti
suplimentare, cum ar fi Execute disable sau XD - tehnologia antivirus de care vorbeam
mai devreme, Enhanced Halt State - facilitate care permite ajustarea tensiunii de
46

Cap 3: Evaluarea performanelor procesoarelor

alimentare a procesorului n mod dinamic, scznd-o n momentul n care nu este nevoie


de putere de procesare, fapt ce conduce la un consum de putere i cldur degajat mai
sczute i Thermal Monitor 2 - funcie prin care se poate ajusta frecvena procesorului
n cazul n care temperatura sa depete pragul maxim admis aceasta spre deosebire
de senzorul termic iniial, care punea procesorul pe tu n totalitate ori de cte ori
temperatura depea limita.
Pe lng toate acestea, n aceeai perioad cu introducerea noii revizii, Intel a
adugat n procesoarele sale suport pentru EM64T (Extended Memory 64-bit
Technology), motiv pentru care majoritatea chip-urilor E0 dein EM64T. Aceasta din
urm reprezint rspunsul lui Intel la tehnologia AMD64 care deja ncepuse s prind
pe pia server-elor, ce oferea n plus regitri i mod de adresare pe 64 de bii. Aceast
arhitectur este compatibil cu cea AMD64 i incompatibil cu cea pe care Intel a
promovat-o mult timp prin seria de procesoare Itanium, IA64. Practic, EM64T este o
extensie a setului IA32, toate procesoarele compatibile EM64T putnd rula fr
probleme aplicaii IA32, pe cnd procesoarele Itanium ruleaz extrem de lent codul pe
32 de bii deoarece IA64 reprezint o arhitectur complet nou. Intel a inut mult timp
secret acest supliment, aproape sigur prezent dar dezactivat nc de la prima revizie a
lui Prescott, motivul principal fiind promovarea de ctre al su concurent a aceleiai
tehnologii, iar setul de instruciuni made in Santa Clara se numea, de civa ani,
IA64. Pe cnd EM64T nu este dect o copie a instruciunilor dezvoltate de texani, fiind
pentru prima dat cnd gigantul californian a realizat o clon a unei tehnologii AMD.
Ne putem pune ntrebarea de ce Intel a implementat n procesoarele sale aceast
tehnologie care nu-i aparine, istoria spunnd c tendina este invers, AMD copiind sau
urmnd s copieze fiecare set de instruciuni Intel, ncepnd cu MMX i terminnd cu
SSE3. Rspunsul este legat de software-ul conceput pentru AMD64, ce a devenit din ce
n ce mai rspndit, existnd versiuni ale sistemelor de operare destinate acestei
arhitecturi att de Windows XP i 2003 Server ct i de Linux (n diverse distribuii,
precum Red Hat, SuSE, Fedora Core, Gentoo, Mandrake etc).
3.1.9. Alte procesoare din familia P4
Celeron este numele comercial al unui procesor n
mare parte identic cu versiunea de prim rang dar care sufer
de anumite limitri. Scopul este evident: costuri mai sczute,
deci acoperirea unei categorii din pia dornic de un pre
foarte mic, pentru care performanele conteaz mai puin.
Primul Celeron a aprut la nceputul anului 1998, fiind
o variant de Pentium II cu performane ceva mai mici. Nu vom insista asupra acestei
perioade ci vom meniona c Celeron a fost omniprezent pe pia de atunci i pn n
prezent. Dei arhitectura sa a suferit schimbri majore, fiecare model de Celeron a avut
la baz nucleul fratelui mai mare. n privina versiunii care se trage din Pentium 4,
limitarea a fost legat de trei aspecte: n primul rnd, cache-ul L2 a fost redus la 128 KB
(fa de 256 KB pentru P4 Willamette i 512 KB pentru P4 Northwood), acest lucru
afectnd puternic performanele. Chiar dac diferena nu pare colosal, trebuie inut
cont c prima parte a acestui cache afecteaz cel mai mult viteza de lucru; astfel,
creterea de la 256 la 512 KB conteaz mult mai puin dect creterea de la 128 la 256
KB. Al doilea factor este frecvena PSB. Primele versiuni de P4 (Willamette) rulau cu
acest bus la 400 MHz iar a doua versiune, P4 Northwood, l-a crescut la 533 i apoi la
800 MHz. ns Celeron a rmas la 400 MHz, ceea ce reprezint a doua limitare, totui
47

Evaluarea performanelor sistemelor de calcul

nu att de drastic n comparaie cu cea descris anterior. Al treilea factor, i puin


important, este absena funciei HyperThreading.
Celeron a existat att n versiune cu nucleu Willamette ct i Northwood.
Specificaiile sale fiind similare (afar de tehnologia folosit 0.18 i respectiv 0.13
microni), performanele au fost identice la frecven identic, adic relativ slabe n
comparaie cu Pentium 4 sau chiar cu versiunea low-end de la AMD, i anume Duron.
Astfel, Celeron a cptat o reputaie negativ, fiind recomandat doar utilizatorilor care
doresc neaprat un procesor Intel dar dispun de fonduri limitate.
Celeron D este numele noului Celeron, avnd la baz nucleul Prescott. Aceasta
nseamn c toate aspectele enunate mai devreme care privesc Pentium 4 Prescott, l
privesc i pe Celeron D. Diferenele fa de acesta constau, n principal, n absena a trei
sferturi din cache-ul L2, dimensiunea sa fiind de 256 KB, dublu fa de Celeron-ul
vechi. n plus, PSB-ul a fost limitat la 533 MHz (fa de majoritatea P4 Prescott-urilor
care lucreaz la 800 MHz), dar cu 33% mai mult dect la Celeron. Drept urmare,
performanele sporite fa de varianta veche transform acest Celeron D ntr-un
procesor ct se poate de decent pentru orice aplicaie.
Pentium 4 Extreme Edition i-a fcut apariia datorit nevoii lui Intel de a
concura (a se nelege cel puin a egala, de preferin a depi) cel mai rapid procesor de
la AMD, i anume Athlon 64 FX-51. Acesta dispunea de avantaje minore dar
observabile n cifre n cadrul diverselor teste realizate de reviste i site-uri. i aici un
avantaj de 2-3%, dei nesemnificativ n realitate, poate decide succesul sau insuccesul
unui produs. Aadar, Intel a introdus un model de Pentium 4 cu un al treilea nivel de
cache, acesta avnd o dimensiune de 2 MB. Desigur, acest L3 a contat extrem de puin
n materie de performan dar a fcut diferena; preul, n schimb, a fost stabilit la nite
valori exorbitante, de unde i succesul foarte redus al acestui model. Arhitectura lui P4EE a fost preluat de la Gallatin, un Northwood uor modificat. n plus,
a fost introdus i o versiune cu un PSB de 1066 MHz, ea reprezentnd
la data lansrii singurul model de Pentium 4 care rula la aceast
frecven de bus.
3.1.10. Concluzii
Pentru cei care nu au avut rbdare s ne urmreasc pn aici,
vom recapitula noutile aduse de Prescott:
tehnologie de 0.09 microni (90 nm) Strained Silicon;
pipeline crescut cu circa 50%, ceea ce determin o scdere masiv de
performane dar i un potenial crescut privind frecvena de funcionare;
cache pe de o parte mbuntit, prin dublarea seciunii de date a nivelului 1 i n
totalitate a nivelului 2 i prin creterea eficienei sale, pe de alt parte suferind de
handicapul creterii latenei;
branch predictor-ul i scheduler-ul mbuntite, rezultnd o predicie i o
execuie a instruciunilor mai eficient; totui este vorba de optimizri strict
necesare unui pipeline att de lung;
optimizarea execuiei anumitor operaii, precum nmulirile;
13 instruciuni noi, cuprinse n setul SSE3, care pot aduce avantaje minore n
anumite aplicaii, cu sprijinul acestora;
tehnologiile antivirus XD i EM64T, implementate doar n ultimele modele.

48

Cap 3: Evaluarea performanelor procesoarelor

3.1.11. Anex: Chipset-uri pentru Pentium 4


Nu putem spune c exist anumite chipset-uri specifice lui Prescott pentru c
orice chipset uzual lucreaz fr probleme cu noul P4 i totodat toate chipset-urile nouaprute, lansate n preajma apariiei lui Prescott lucreaz fr probleme cu procesoarele
mai vechi. Singura condiie este ca chipset-ul s dein suport pentru un PSB cel puin
egal cu cel al procesorului. Astfel, un P4 la 2.4 GHz cu FSB 800 nu poate fi montat pe o
plac de baz cu chipset Intel 845PE, care nu suport (cel puin oficial) aceast
frecven de bus. Anumii productori au depit specificaiile chipset-ului, garantnd
funcionarea plcilor lor la un PSB superior celui suportat de chipset. ns, vorbind din
punctul de vedere al chipset-ului, doar Intel 848P, 865 (n versiunile PE, G i GV),
875P, 910GL, 915 (P, G, GV) i 925 (X i XE) suport acest PSB (s ne reamintim
faptul c majoritatea modelelor de Prescott ruleaz la un PSB de 800). n plus, Intel
925XE suport suplimentar i PSB-ul de 1066 MHz de care dispune modelul de
Pentium 4 Extreme Edition la 3.46 GHz.
Putem observa mai sus dou generaii de chipset-uri: 8xx i 9xx. Primele,
aprute n prima parte a anului 2003, erau adaptate la procesoarele acelei perioade,
oferind dotri precum AGP 8x i USB 2.0, dual-channel DDR, uneori RAID i Serial
ATA, dotri demne de a fi menionate, la acea vreme, pe ambalajul oricrui produs.
Urmtoarea generaie, n special familiile 915 i 925 au oferit faciliti noi, precum PCI
Express, DDR2, faciliti utile anilor 2004 i mai ales 2005.

3.2. Arhitectura procesoarelor AMD64


3.3. Trecut i prezent
Competiia procesoarelor din urm cu civa ani era mult diferit fa de cea
actual. Revistele de specialitate abundau de materiale care prezentau pe cteva pagini
cum noile (pe vremea aceea) AMD K6 i Cyrix 6x86 zdrobeau (pe ici pe colo doar n
punctele eseniale) performana Pentium-urilor, criteriul de stabilire al performanei
fiind doar frecvena acestuia.
Situaia s-a schimbat n timp, viteza brut a procesorului
pierznd mult din importan. Dac acum cinci ani vedeam ncrcarea
Windows-ului de dou ori mai rapid pe un procesor la 500 MHz dect
pe unul la 200MHz, odat cu atingerea barierei de 1GHz, procesorul a
ncetat s mai reprezinte punctul de atracie. Aceasta pentru limitarea n
privina jocurilor, cele mai avide de performan, a nceput s fie dat
de placa grafic. Astzi degeaba ne scldam cu 3.8 GHz dac rulm Half Life 2 pe un
Radeon 9200 pe 64 de bii.
Procesorul a rmas important doar pentru crcotai, fani Intel sau AMD, care
susin cu trie ori c produsele de la Intel sunt mult superioare celor AMD (i acest
"mult" este nelipsit), ori invers. Tocmai pentru aceast categorie se duce btlia ntre
cele dou companii, cel puin cea vizibil prin marketing, ele fcnd tot posibilul pentru
a-i satisface fanii. Fiecare schimbare de arhitectur, micorare de proces de fabricaie,
adugare de cache, noi nume de ci, cretere n frecven, trebuie anunat cu surle i
trmbie de-o parte i de alta. Dar din ce n ce mai puini cumpr procesoare de dragul
tehnologiilor, nimic nu mai este ca nainte. Trebuia s se ntmple ceva...

49

Evaluarea performanelor sistemelor de calcul

i s-a ntmplat! AMD a amanetat herghelia1 pe o tehnologie nou, pe 64 de bii.


Iniial, dei departamentul de marketing a lucrat serios la imaginea noii progenituri,
nimeni nu a zis nimic. Revistele i site-urile de profil au publicat tirile corespunztoare
i... att. Aceasta pentru c Opteron, cci acesta este numele su, era creat pentru un
domeniu destul de ciudat al computerelor: server-ele de mare performan. Abia la
aproape un an distan au ieit la lumin nite procesoare utilizabile de ctre oamenii
obinuii: Athlon 64, Athlon 64 FX i, mai trziu, Sempron.
Nucleul s-a numit K8 (n contrast evident cu precedentele K6 i K7 - Athlon).
Numele de cod au purtat denumirea general Hammer, versiunile iniiale fiind
Sledgehammer (Opteron) i Clawhammer (Athlon 64). Dup nume (K8), ne putem da
seama c AMD a ntors foaia i vrea s ne rsfee cu ceva complet nou. S vedem prin
ce se difereniaz de arhitectura K7.
Este discutabil care dintre instruciunile pe 64 de bii i integrarea controllerului de memorie este mai important. Dac primul aspect este legat n viitor, extinderea
setului IA32 la cel denumit acum AMD64 ducnd la crearea unui potenial suplimentar
de performan i nimic mai mult, controller-ul de memorie (pn acum prezent n
northbridge-ul plcii de baz) scap sistemul de o gtuire extrem de deranjant. n rest,
modificrile sunt minore, implementarea instruciunilor SSE2 sau creterea uoar a
numrului de stagii ale pipeline-ului sunt schimbri fireti pentru care nu s-a fcut prea
mare tam-tam.
3.3.1. Cei 64 de biii
S ncepem cu nceputul. Am spus
mai devreme c cei 64 de bii nu
afecteaz n mod esenial performana.
Cel puin nu n acest moment. Pentru a
justifica afirmaia, vom face o cltorie n
istorie, mai exact n 1985, cnd Intel lansa
primul procesor pe 32 de bii, 80386. El
era dotat cu un set nou de instruciuni,
capabil s acceseze pn la 4 GB de memorie (fa de cei 16 MB ai celor pe 16 bii) i
s ofere performane de invidiat dac era folosit la potenialul su maxim. Soft-urile
uzuale pe 32 de bii au nceput s rsar abia la nceputul anilor 90, iar prima tentativ
de sistem de operare pe 32 de bii a fost Windows 95, un adevrat talme-balme de cod
pe 16- i 32-bit. Windows NT exista de ceva vreme pe pia dar el era adresat celor care
azi folosesc procesoare Opteron, aa c nu poate intra n discuie. Abia Windows 2000
i mai ales Windows XP, ce sunt programate complet pe 32 de bii, au devenit sisteme
de operare uzuale, la nu mai puin de 15 ani de la lansarea primului procesor capabil
(teoretic, nu i din punct de vedere al vitezei) s le utilizeze.
Nu este deplasat s anticipm un fenomen asemntor cu privire la instruciunile
pe 64 de bii. Ele sunt prezente de ceva timp - dar sub o cu totul alt form - n
procesoarele Intel Itanium, destinate server-elor; ele, spre deosebire de cele AMD64, nu
lucreaz nativ cu cod IA32.
Exist totui o veste bun: deja o serie de sisteme de operare utilizeaz la maxim
noile procesoare AMD, precum Windows XP x64 Edition sau o serie de distribuii de
Linux. Mai mult, i Intel a adoptat recent aceste instruciuni, denumind setul EM64T.
1

http://www.xf.ro/content-62-page1.html
50

Cap 3: Evaluarea performanelor procesoarelor

Nu trebuie ns s ne bucurm prea mult pentru c schimbarea nu poate avea loc de la o


zi la alta i va trece mult timp pn ce vom vorbi de aceste sisteme de operare la fel cum
vorbim azi de cele pe 32 de bii care sunt prezente n marea majoritatea sistemelor de
calcul moderne. Cei 64 de bii au reprezentat n primul rnd un instrument de marketing
pentru AMD, nicidecum o necesitate a momentului.
Trebuie s privim instruciunile AMD64 ca pe o extensie la setul IA32, nu ca pe
un nlocuitor. Procesorul este capabil s comute ntre legacy mode i long mode n
funcie de necesiti, la fel cum 80386 putea comuta ntre modul real i cel protejat.
Practic, este vorba de nite regitri suplimentari inclui n nucleul procesorului,
care pot efectua operaii cu numere pe 64 de bii (pn la 2 la puterea 64). Astfel,
pot fi prelucrate simultan de dou ori mai multe date, traficul dintre procesor i celelalte
componente desfurndu-se mult mai fluent. (Observaie: tehnic vorbind,
programatorul are la dispoziie 5 moduri: legacy 16-bit mode, legacy 32-bit mode,
compatibility 16-bit mode, compatibility 32-bit mode i 64-bit long mode, ns
descrierea lor n detaliu nu face subiectul cursului de fa.).
De asemenea, dublarea numrului de regitri i practic triplarea spaiului de
memorare a acestora (msurabil n bii 3072 fa de 1280) conduce la posibilitatea
meninerii de date n procesor pentru mai mult timp, fiind mai rar necesar schimbul cu
memoria principal.
De remarcat urmtorul fapt: K8 nu va rula mai rapid (dar nici mai lent) dect K7
codul pe 32 de bii sau, dac performanele vor diferi, ele se vor datora altor motive
dect prezena noului set de instruciuni. n legacy mode, K8 este transformat ntr-un
procesor normal, capabil s execute instruciunile precum orice procesor pe 32 de bii.
S lum un exemplu: algoritmii de criptare. Unii necesit operaii cu numere pe
64 de bii. Folosind o main 32-bit, este imposibil obinerea direct a unui rezultat,
singura metod de calcul fiind crearea unui algoritm care s realizeze acest lucru,
similar celui aplicat de om pentru orice adunare sau nmulire. (v mai aducei aminte de
75-18; le punem unul sub altul; 5-8 nu se poate, mprumutm o zece; 15-8=7; la cifra
zecilor ne mai rmne 6; 6-1=5, deci rezultatul e 57 ?). Orice procesor pe 64 de bii
poate realiza dintr-un foc operaia, economisindu-se mult timp.
Memoria maxim adresabil a crescut i ea de la 64 GB la procesoarele IA32 cu
PAE (Physical Addressing Extensions) activat la 1 TB. E drept, e puin probabil ca
acum un server s necesite att de mult memorie, dar cei 64 GB precedeni se aflau n
mod sigur la limit.
3.3.2. Memoria gestionat direct din procesor
O alt noutate adus de generaia K8 este faptul c de
acum nu chipset-ul va mai fi rspunztor de memorie ci nsui
procesorul. Memoria, ca orice entitate din interiorul sistemului
de calcul, trebuie s fie gestionat de un controller care s realizeze comunicarea dintre
aceasta i elementul central, procesorul. Pn acum, northbridge-ul integra acest
controller ns, din raiuni de vitez, procesorul a preluat sarcina.
Comunicarea dintre memorie i procesor se realiza prin bus-ul denumit pn
acum PSB sau (incorect dar ncetenit) FSB, ce reprezenta una dintre gtuirile
principale de care sufereau procesoarele rapide. Totui, s nu ne bucurm prea mult de
noua reuit a celor AMD i s prezentm i dezavantajele. De fapt dezavantajul: cel
care decide ce tip de memorie poate fi folosit n sistem este procesorul. Dac el deine
un controller DDR SDRAM, atunci va fi imposibil asortarea lui cu una de tip DDR2
51

Evaluarea performanelor sistemelor de calcul

sau RDRAM, de exemplu. Astfel, upgrade-ul este mai problematic, de schimbarea


procesorului depinznd schimbarea memoriei i invers.
Limea bus-ului dintre procesor i controller-ul de memorie a rmas aceeai ca
la vechile sisteme: 64 sau 128 de bii, n funcie de tipul controller-ului integrat: singlesau dual-channel. Frecvena ns a crescut la valori impresionante, ea fiind acum egal
cu frecvena procesorului. S lum ca exemplu trei procesoare: unul K8, unul K7 i altul
Pentium 4 ce ruleaz la 2.4 GHz, ultimele dou avnd un PSB de 200 MHz reali.
Arhitectura K7 beneficiaz de bus-ul EV6, ce dubleaz frecvena, PSB-ul efectiv fiind
de 400 MHz. n cazul lui P4, situaia este mai fericit, bus-ul Quad Pumped ridicnd
aceast frecven la 800 MHz efectivi. K8 se va situa mult deasupra ambilor concureni,
bus-ul dintre procesor i controller-ul de memorie rulnd la 2400 MHz, depind de 6 i
respectiv 3 ori arhitecturile celorlalte dou CPU-uri.
Comunicarea dintre controller i memorie se desfoar la aceeai vitez, i
anume la frecvena memoriei, i pe 64 sau 128 de bii, n funcie de numrul de canale.
Exist un aspect ciudat dar foarte important pentru cei interesai de overclocking
(dar nu numai) care trebuie explicat n acest context. n sistemele obinuite, memoria
ruleaz la o frecven egal cu frecvena PSB nmulit cu un raport fix de numere mici.
De exemplu, pe o platform K7 cu un chipset nForce2, dac avem un PSB de 400 MHz,
memoria va rula, spre exemplu, la 1:2, 5:12 sau 2:6 din aceast frecven, adic 200,
166 i respectiv 133 MHz teoretici (sau 1:1, 5:6 sau 2:3 n cazul n care considerm
frecvenele efective, de 400, 333 i 266 MHz). Motiv: controller-ul de memorie trebuie
s lucreze n strns legtur cu PSB-ul, la fiecare n bii primii de la memorie trebuind
s transmit m bii ctre procesor, i invers unde n i m sunt direct proporionali cu
frecvena memoriei, respectiv a bus-ului PSB.
Ce ne facem cnd controller-ul este integrat n procesor? El va primi de la acesta
n bii i va transmite mai departe m, ns raportul trebuie s fie unul de numere mici.
Raiuni tehnice mpiedic rapoarte gen 2:29, cum ar fi necesar dac procesorul ar rula la
2900 MHz iar memoria n DDR400. Astfel, s-au ales nite divizori ntregi, frecvena
memoriei fiind 1:15, cea mai apropiat valoare de 2:29 (adic 1:14.5) inferioar
acesteia. De ce inferioar? Pentru c nu se poate permite memoriei s ruleze la o
frecven superioar celei dorite, din motive evidente. Astfel, n exemplul nostru,
memoria va rula la doar 193.33 MHz n loc de cei 200 solicitai.
3.3.3. HyperTransport
Comunicarea dintre procesor i chipset se realizeaz prin bus-ul HyperTransport
(pe care l vom numi n continuare HT), numit iniial LDT (Lightning Data Transport).
Bus-ul nu este conceput special pentru aceast platform, el fiind unul universal, ce
servete, de exemplu, i la comunicarea dintre southbridge-ul i northbridge-ul chipsetului nForce2 (deci n cadrul platformei K7!). n cazul nostru, bus-ul este o component
a PSB-ului, dar cea care afecteaz cel mai puin performana i care depinde exclusiv de
chipset. De aceea, dei exist o btlie pe via i pe moarte privind cine scoate cel
mai rapid HyperTransport, trebuie tiut c acest lucru nu afecteaz aproape deloc
viteza de lucru. Dei el este conceput pe doar 32 de bii (16 bii pentru transmisie, 16
pentru recepie cazul cel mai frecvent) la o frecven de tipul 800 sau 1000 MHz, e
suficient s ne gndim c limea de band obinut este de 800 MHz x (32/8) bytes =
3.2 GB/s, adic puin peste valoarea lui AGP 8x dar sub cea oferit de PCI Express
X16. Un HT de 1 GHz (prin cei 4 GB/s) se apropie de cei 4.3 GB/s ai lui PEG x16.
Ceea ce nseamn c nu vom putea folosi la ntreaga capacitate o plac grafic PCI
52

Cap 3: Evaluarea performanelor procesoarelor

Express. Reprezint acest lucru un dezavantaj? Cu siguran nu, jocurile de azi nefiind
limitate aproape deloc de o lime de band echivalent cu AGP 4x (circa 1 GB/s).
Bus-ul HT realizeaz legtura i cu celelalte componente, de exemplu controllerul IDE, cel USB 2.0 sau chiar cel SCSI. Nu putem nega dezavantajul ce rezult de pe
urma folosirii acestui bus, dar el este extrem de mic, lucru reflectat de un test ce poate fi
realizat de ctre oricine: cele mai multe plci de baz permit ajustarea frecvenei HT i
un scurt 3DMark rulat la mai multe frecvene ne poate lmuri c diferenele sunt infime.
Revenind la controller-ul de memorie, trebuie spus c sistemele obinuite nu
sunt afectate foarte mult de prezena acestuia n procesor: latenele reduse nu au crescut
niciodat la valori impresionante performanele. Sporul adevrat apare n sistemele
multiprocesor unde, spre deosebire de alte platforme, limea de band dintre procesor
i controller-ul de memorie nu este mprit n mod egal ntre procesoare. Fiecare
procesor are acum maxim trei legturi (Hyper Transport Links): una prin care este legat
de chipset (prezent i la sistemele cu un singur procesor) i altele dou prin care putea
lua legtura cu alte dou procesoare. Iat, de exemplu, schema de interconectare ntre
8 procesoare, figura 3.1:
n plus, interconectarea dintre
procesoare este supus specificaiilor
NUMA (Non-Uniform Memory Access)
prin care se asigur posibilitatea oricrui
procesor de a accesa orice zon de
memorie, spre deosebire de tehnica shared,
unde fiecare procesor avea alocat o zon
specific de memorie, neputnd adresa una
ce aparinea altui CPU.
3.3.4. Cache-ul
La AMD64, aceast memorie
intermediar este stratificat pe dou nivele
integrate n CPU, ca la orice procesor
modern. Relaia dintre ele este exclusiv,
ca i la generaia anterioar, ceea ce Fig. 3.1: Schema de interconectare ntre 8
procesoare.
nseamn c nivelul al doilea de cache nu
include i o imagine a celui dinti (n contrast cu relaia inclusiv ntlnit la Pentium
4). Astfel, eficiena nivelului doi este mai redus datorit unui transfer mai frecvent
dintre L1 i L2.
Viteza comunicrii dintre cele dou nivele a fost dublat, de aici rezultnd nc
un plus de performan fa de arhitectura K7. Tot legat de cache, notm o cretere a
numrului de intrri n TLB (Translation Lookaside Buffer) pentru ambele nivele de
cache. Desigur, trebuie s explicm ce este acest TLB.
Gestionarea memoriei de ctre procesor este realizat n dou moduri: adresare
real i adresare virtual. Uneori este mai util ca adresarea s se fac relativ la alt
locaie dect la mod absolut, adic preciznd distana de la alt adres i nu pe cea de la
punctul zero. TLB este o mic zon de memorie integrat n nucleul procesorului care
53

Evaluarea performanelor sistemelor de calcul

face legtura dintre cele dou tipuri de adresare (cu ajutorul ei se poate transforma o
adres virtual ntr-una real i invers).
Dimensiunea cache-ului a suferit i ea modificri. Dac primul nivel a rmas la
128 KB, nivelul al doilea a fost crescut la 512 KB sau 1 MB, n funcie de modelul
procesorului. Se spune c creterea de la 256 KB la 1 MB afecteaz cu 15%
performana, dei aceast cifr poate prea unora destul de optimist, aceasta datorit
eficienei mai sczute a nivelului doi comparativ cu Pentium 4.
Ct despre latena cache-ului, pentru nivelul unu ea a rmas aceeai, dar pentru
cel de-al doilea a fost micorat. Situaia e foarte interesant, Prescott are pipeline i
latene crescute fa de predecesor pentru a-i putea crete frecvena, pe cnd K8 are
aproape acelai pipeline iar latena a sczut, ceea ce poate constitui o barier n goana
dup gigahertzi. Desigur, AMD tie mai bine ce face...
3.3.5. Conductele i predicia
La procesoarele AMD, pipeline-ul este mprit n dou segmente: unul pentru
ALU i unul destinat FPU-ului. Exist un segment comun, de 6 stagii, care nu a fost
afectat de nici o schimbare n cazul lui K8, el cuprinznd fetch (preluarea instruciunii)
i decode (decodificarea acesteia). Prelucrarea efectiv este realizat n alte stagii, la K7
n numr de 4 (pentru ALU) i respectiv 9 (pentru FPU). La K8, aceste ultime stagii au
fost crescute cu cte 2, numrul total devenind 12 fa de 10 (pentru ALU) i 17 fa de
15 (pentru FPU).
Dup cum spuneam i n subcapitolul anterior, dedicat lui Prescott, un pipeline
prea lung afecteaz negativ performana dar crete posibilitatea atingerii de frecvene
mari. De asemenea, nu este de dorit nici un pipeline foarte scurt pentru c astfel nu mai
poate fi executat n paralel un numr prea mare de instruciuni. AMD a crescut cu 2
numrul de stagii din cauza reproiectrii blocului de predicie (branch predictor),
anticiparea instruciunilor devenind acum cu 510% mai precis, precum i datorit
mbuntirii spaiului din scheduler destinat unitii ALU. De ce creterea pipeline-ului
a fost datorat mbuntirii celor dou uniti? Cu ct prezictorul este mai eficient,
cu att exist anse mai mici ca ramura curent de execuie s fie incorect, urmnd
golirea pipeline-ului. De aceea, AMD a considerat c pipeline-ul poate fi crescut,
ansele de alegere greit a ramurii fiind suficient de reduse astfel nct creterea
lungimii sale s fie considerat un avantaj.
Acelai lucru se poate spune i despre scheduler, care trimite ctre fiecare
unitate de prelucrare instruciunile cuvenite. Cu ct acesta poate reine mai multe
instruciuni, cu att ele vor fi executate mai eficient. La K8, spaiul acestuia a crescut
substanial, de trei ori.
Observaie. Un pipeline foarte lung, avnd un branch prediction cu un hit-rate
de 100% precum i un scheduler foarte ncptor va oferi numai avantaje n termeni de
performan. Lungimea mare a pipeline-ului nu trebuie privit ca o sperietoare. Numai
ca pentru un pipeline lung s nu afecteze negativ viteza sunt necesare un branch
prediction i un scheduler pe msur, iar acestea nu pot fi mbuntite la infinit.
3.3.6. Motentirea de la Intel
n primul rnd, SSE2. Setul de instruciuni introdus odat cu primul Pentium 4
este, n sfrit prezent i n CPU-urile AMD. Situaia este oarecum amuzant, ambii
productori schimbnd ntre ei tehnologii (Intel a preluat de la texani setul AMD64).
Dei instruciunile de acest tip nu sunt liceniate n nici un fel, o regul dedus
54

Cap 3: Evaluarea performanelor procesoarelor

experimental spune c niciodat cel care copiaz nu va obine, legat de acele


instruciuni, performanele concurentului su. Aa se face c noua generaie de
procesoare de la AMD obine performane teribil de mici prin SSE2. ntr-o situaie
asemntoare s-a aflat i Intel la lansarea lui P4 (Willamette, primul model), unitatea
FPU fiind mai lent dect cea din Pentium III, programele inteligente care foloseau
instruciuni SSE n locul celor FPU obinnd performane mult crescute. Sau, dac ne
adncim i mai mult n istorie, gsim un K6-2 cu al su FPU de 2-3 ori mai lent dect
cel din procesoarele Intel similare. ns setul 3DNow!, folosit cu totul i cu totul
ocazional n programele acelor vremuri, salva onoarea firmei AMD, dei utilizatorii nu
prea beneficiau de acesta.
Revenind n prezent, avnd n vedere c procesoarele K8 au ntrziat nepermis
de mult, unii au presupus c AMD pur i simplu nu a mai avut timp s optimizeze
SSE2-ul, aplicaiile ce se folosesc de el fiind deseori mai lente dect cele ce se bazeaz
pe clasicul FPU.
Ce am mai vzut la Intel i ateptm implementat i n procesoarele concurenei?
Thermal throttling, SSE2 optimizat, SSE3 (inclus deja n ultimele stepping-uri de K8)
i, de ce nu, HyperThreading. Legat de ultimul aspect, AMD a achiziionat licenele
necesare pentru aceast tehnic, dar nu se ntrevede nici un model care s beneficieze de
ea. AMD este o companie mic (n comparaie cu ali gigani din lumea IT, printre care
se afl i Intel), deci orice implementare care cost mult e calculat la snge. AMD nui poate permite prea multe eecuri, nainte de fiecare lansare a unei noi generaii ea
avnd dificulti mari financiare: nainte de lansarea lui K6 era n pragul falimentului,
nainte de lansarea lui K7 avea serioase probleme financiare (ultimele modele de K6
nefiind prea reuite) iar nainte de K8 mergea n pierdere.
Un ultim lucru care merit menionat este protecia antivirus NX (No Execute)
despre care am discutat la capitolul destinat lui Prescott i care de altfel este prezent n
ultimele versiuni ale acestuia. AMD s-a aflat n faa lui Intel de aceast dat, oferind
nc de la primul procesor K8 aprut (Opteron) aceast protecie.
3.3.7. Modele de K8, tehnologii de fabricaie i platforme
Primele variante de K8 au fost destinate server-elor i au
purtat numele de Opteron. Controller-ul de memorie integrat era
de tip dual-channel iar memoriile necesare erau de tip registered.
Cele patru versiuni disponibile, dei aparent identice, erau
capabile s ruleze n sisteme de un singur, dou, patru i respectiv
opt procesoare, ele identificndu-se printr-un numr de tip 1xx,
2xx, 4xx i 8xx. Spre exemplu, Opteron 246 rula la 2 GHz i putea
funciona n sisteme dual-procesor.
Numele de cod a fost Sledgehammer iar platforma utilizat
Socket 940. Odat cu apariia modelelor desktop, destinate tuturor utilizatorilor, AMD a
portat o versiune a lui Opteron n sisteme mai cumini dar destinate entuziatilor.
Astfel s-a nscut Athlon 64 FX, un procesor extrem de scump pentru aproape oricine
(costa peste 1000$ la lansare). n plus, fiind practic un Opteron din seria 1xx redenumit,
necesita i memorii registered, extrem de scumpe i cu puin mai lente dect cele
normale (unbuffered). Notarea lui Athlon 64 FX a fost destul de ciudat, modelele
purtnd numele FX-51, FX-53, FX-55 etc.
55

Evaluarea performanelor sistemelor de calcul

Pentru utilizatorii care ineau seama i de bugetul alocat, Athlon 64 simplu a


oferit satisfacii similare, diferena de performan fa de FX fiind minim. Athlon 64 a
fost vduvit de o parte din pini, numrul lor fiind redus la 754, iar controller-ul de
memorie integrat rula pe un singur canal, memoria L2 cache rmnnd la 1 MB.
Pentru denumirea modelelor, AMD s-a folosit de rating-ul cunoscut de la Athlon
XP, referina fiind procesoarele Intel Pentium 4. Astfel, un Athlon 64 3200+ este
(teoretic) la fel de rapid ca un Pentium 4 la 3.2 GHz. Northwood sau Prescott? Nu
rspundem la ntrebri filozofice...
Noul core, NewCastle, exista att n versiuni single- ct i dual-channel,
diferena fa de Clawhammer privind dimensiunea cache-ului: doar 512 KB. Acest
lucru nu a constituit un dezavantaj, frecvena superioar compensnd minusul cu
pricina. De exemplu, Athlon 64 3200+ n versiunea Clawhammer (1 MB cache) avea o
frecven de 2 GHz, pe cnd cea NewCastle (512 KB) de 2.2 GHz.
Platforma Socket 754 a fost pstrat, fiind ns considerat din ce n ce mai
low-end. Socket 940 a fost nlocuit cu Socket 939, modelele ce se inserau n acest
socket beneficiind de un controller de memorie ce lucra cu memorii unbuffered n dualchannel.
Toate nucleele amintite erau create n tehnologia de 0.13 microni (130 nm).
Trecerea la 0.09 microni (90 nm) a fost iminent, fiind necesar pentru atingerea de
frecvene superioare. Aa s-a nscut nucleul Winchester, aproape identic ca
funcionalitate cu NewCastle, dar mai rece, creat numai pentru platforma 939 (care de
altfel are i un viitor asigurat). Totui, el s-a dovedit a fi un semi-eec din punct de
vedere al overclocking-ului, procesul de fabricaie nematurizat punndu-i amprenta
asupra frecvenelor atinse. De remarcat i controller-ul de memorie uor mbuntit al
noului core.
Recent, AMD a introdus nou noi nuclee pe 0.09 microni: Venice i San Diego,
cu 512 i respectiv 1 MB de cache, implementnd instruciunile SSE3, un controller de
memorie optimizat i un potenial crescut de atingere a frecvenelor mari.
Pentru Socket 754, AMD a introdus cteva versiuni de Sempron, diferenele fa
de Athlon 64 privind cache-ul: 128 sau 256 fa de 512 KB sau 1 MB (controller-ul de
memorie fiind, evident, single-channel), precum i setul de instruciuni pe 64 de bii
absent. Mai exact dezactivat i imposibil de activat. Rating-ul su a fost stabilit n
funcie de Celeron D, modelul 3100+ rulnd la 1.8 GHz, ca i Athlon 64 2800+, dar
acesta din urm avea un cache level 2 dublu.
De reinut faptul c modelele inferioare lui Sempron 3100+ sunt concepute
pentru platforma Socket A, ele neavnd nimic n comun (afar de nume) cu cele S754.
n fine, menionm c tehnologia de fabricaie a lui K8 a unor modele a suferit o
modificare important: introducerea SOI (Silicon-On-Insulator) care, pe scurt, ofer
anse suplimentare creterii frecvenei procesorului, dar despre care nu vom vorbi n
detaliu aici.
3.3.8. Concluzii
AMD a schimbat multe odat cu K8. Puine dac ne referim strict la arhitectura
intern dar multe dac lum n calcul adaosurile: controller-ul de memorie integrat i
instruciunile pe 64 de bii. Dac al doilea aspect nu aduce beneficii prea mari, primul
ajut substanial la creterea performanei, excluznd astfel din ecuaie o puternic
limitare de care sufereau vechile K7, limitare care uneori nu putea fi suprimat nici
mcar odat cu creterea foarte mare a frecvenei de tact. Limitare care nu era prezent
56

Cap 3: Evaluarea performanelor procesoarelor

la procesoarele Pentium 4, probabil din cauza PSB-ului foarte mare (de ordinul a 800
MHz fa de maxim 400 la K7) care compensa latenele suplimentare datorate prezenei
externe a controller-ului n cauz. Cu alte cuvinte, puteam crete orict frecvena unui
Athlon XP, efortul necesar atingerii vitezei unui Pentium 4 sau Athlon 64, n unele - i
destul de puine - aplicaii urmnd o curb exponenial ascendent. n testele n cauz,
un Athlon XP supus unui overclocking puternic i rulnd la 2.6 GHz era cu doar puin
mai rapid dect unul la 2 GHz; n schimb, un Athlon 64 la 2.6 GHz nu are probleme n a
afia rezultate oarecum proporionale cu cel la 2 GHz, nefiind att de limitat de factori
externi precum un controller de memorie.
Acestea fiind zise, s facem un rezumat al facilitilor oferite de noile procesoare
AMD:
tehnologie de 0.13 (130 nm) i apoi de 0.09 microni (90 nm) SOI;
controller de memorie integrat, ce deine principalul merit al creterii
performanelor;
instruciuni AMD64, slab folosite pentru moment;
instruciuni SSE2 (introduse pentru prima dat n Pentium 4), implementarea
lsnd de dorit la capitolul vitez;
pipeline uor crescut odat cu un branch prediction i o unitate scheduler
mbuntite;
cache crescut iniial la 1 MB, revenindu-se ulterior la 512 KB, cel de 1 MB fiind
destinat modelelor high-end;
protecie antivirus NX, similar celei XD de la Intel.
Anex: Chipset-urile destinate procesoarelor din familia AMD64
Dac la Prescott lucrurile erau mai simple, piaa fiind mprit n Intel i alii,
n cazul lui AMD exist doi mari juctori: NVIDIA i VIA. Pentru prima dat, NVIDIA
folosete un singur chip, unind northbridge-ul (vduvit de controller-ul de memorie) cu
southbridge-ul, denumirea de chipset devenind astfel improprie (ntlnim expresia
single-chip core-logic). Exist dou familii de nForce pentru procesoarele AMD K8, i
anume nForce3 - cu suport AGP 8x, i nForce4 - cu suport PCI Express. Dac seria
nForce3 150 nu are n dotare dect simpla interfa ATA 133, nForce3 250 ofer att
porturi Parallel ATA ct i Serial ATA. Mai mult, nForce4 Ultra introduce Serial ATA
II, dublnd limea de band disponibil pentru unitile de stocare (nForce4 simplu
se limiteaz la un Serial ATA I), ns impactul asupra performanelor este cvasi-zero.
n fine, nForce4 SLI ofer posibilitatea conectrii n acest mod a dou plci grafice PEG
X16 pentru maximizarea performanei 3D.
De partea cealalt, VIA ne ofer pentru platforma AGP un K8T800 simplu i
unul Pro, diferenele dintre ele constnd n viteza HyperTransport, precum i n viteza
de comunicare dintre northbridge i southbridge, precum i K8T890 pentru PCI
Express, a crui rspndire nu este mare.
Menionm c ntre chipset-uri mai exist diverse diferene la nivelul
HyperTransport, att ca lime a bus-ului (8 bii sau 16 bii) ct i ca lime de band
(ntre 600 i 1000 MHz). n sistemele obinuite aceste elemente influeneaz att de
puin performana nct competiia este doar una de marketing (similar celei dintre
AGP 4x i 8x, de exemplu).
Viitorul ne va oferi multe surprize, cea mai ateptat fiind legat de DDR-2 i de
modelele cu dou nuclee. Legat de primul aspect, acest lucru depinde de procesor i
57

Evaluarea performanelor sistemelor de calcul

doar AMD este cel care poate decide; cu siguran, atunci cnd se va simi nevoia, vom
avea parte i de noul standard implementat n viitoarele Athlon 64.
Ct despre dual-core, ele au frecvene mai sczute dect modelele cu un singur
nucleu, performanele urmnd s fie, ns, superioare.

3.4. Procesoare Dual-Core


Cipurile dual-core, proiectate pentru a sustine dou nuclee distincte, ofer
practic dou uniti centrale de procesare integrate ntr-o singur bucat de silicon. Pe
scurt, n baza testelor PC World dintre Intel Pentium 840 Extreme Edition i AMD
Athlon64 X2, ctigtor este procesorul celor de la Advanced MicroDevices, care
surclaseaz toate procesoarele Intel existente. Interesant de aflat este: pentru cat timp?
Procesorul AMD Athlon 64 X2 4800+, ce lucreaz la o frecven de tact de 2,4
GHz pe o arhitectur de 90 nm, are 1 MB de memorie cache L2 pe fiecare nucleu.
Magistrala sistemului funcioneaz la 2.000 MHz datorit tehnologiei HyperTransport.
Conectarea la sistem se face prin intermediul unui Socket 939. Procesorul consum
maximum 110 W, beneficiind i de tehnologia Coolnquiet, care ajusteaz puterea
consumat n funcie de activitatea desfurata de procesor. Lansate n iunie anul curent,
procesoarele Athlon 64 X2 pe 64 bii propulseaz deja serverele dual-core Opteron i
staiile de lucru.
Intel nu s-a lsat mai prejos i a lansat procesorul Intel Pentium 840 Extreme
Edition. Este implementat pe o arhitectura de 90 nm, funcionnd la o frecven de tact
de 3,2 GHz. Ca i competitorul direct, are cte 1 MB de memorie cache L2 pe fiecare
nucleu. Front Side Bus-ul acestui procesor atinge 800 MHz, conectndu-se pe socket
LGA 775.
Interesant este ca pe lng tehnologia Dual-Core, acest model este dotat i cu
funcia Hyper Threading. Astfel, avnd n vedere c fiecrui procesor fizic dintre cele
dou de pe capsula i sunt alocate dou procesoare logice prin HT, rezult ca noul model
de la Intel poate executa nu mai puin de patru procese n paralel.
Computerele cu procesoare dual-core au nceput s apar deja pe pia n diferite
variante. Pentru o mai uoar trecere ntre generaiile de procesoare, la platformele
AMD exist posibilitatea de upgrade a existentului Athlon 64 din PC doar printr-un
simplu upgrade de BIOS. Pe de alta parte, Intel nu ofer aceeai flexibilitate, pentru
trecerea la tehnologia Intel Dual-Core fiind necesar achiziia unei noi placi de baz.
Testele indic faptul c indiferent de constructorul ales, Intel sau AMD, cipurile
Dual Core beneficiaz de performane ridicate atunci cnd ruleaz mai multe aplicaii
simultan. Vom analiza n continuare tehnologiile i proprietile specifice fiecrui
productor pentru a ne face o idee de ansamblu asupra modurilor de implementare a
procesoarelor dual-core.

58

Cap 3: Evaluarea performanelor procesoarelor

3.4.1. Tehnologia Intel dual-core Intel


Un procesor dual-core Intel are dou nuclee de execuie separate pe acelai cip
care ruleaz la aceeai frecven. Ambele nuclee mpart acelai package fizic i aceleai
interfee cu chipset-ul i memoria. Totui, ele pot opera ca nuclee distincte de execuie.
Procesarea dual-core este una dintre metodele de a furniza performana n timp ce se
balanseaz cerinele de putere i const n adugarea mai multor resurse procesorului i
nu n creterea frecvenei acestuia (fig. 3.2).

Fig.3.2: Procesor dual-core: se observ paralelismul n execuia proceselor.

Fig.3.3: Procesor dual-core cu tehnologie Hyper Threading 4 procese pot rula


simultan.

Fig.3.4: Procesor cu tehnologie Hyper Threading execuie simultan a dou procese.


O staie de lucru bazat pe un procesor dual-core Intel extinde capabilitile PCului i asigur un mai mare grad de procesare simultan, un utilizator putnd, de
exemplu, s randeze i s editeze o secven video n acelai timp. Ca o analogie,
imaginai-v o autostrad cu patru benzi: pe ea trec pn la de doua ori mai multe
maini fr a obliga fiecare main s mearg de doua ori mai repede.
Procesorul Intel dual-core este o evoluie a tehnologiei Hyper Threading. Att
tehnologia HT, ct i un procesor dual-core permit rularea mai multor aplicaii
concepute pentru a exploata procesele multiple, dar dual-core aduce mai multe resurse
i putere de procesare n cadrul PC-ului. n alte cuvinte, procesarea dual-core face
acelasi lucru ca i Hyper Threading, doar c mai repede, avnd o putere de calcul mai
mare.

Fig.3.4: Procesor cu un singur nucleu procesele sunt rulate secvenial.

59

Evaluarea performanelor sistemelor de calcul

n viitor, Intel va lansa procesoare ce vor mbina cele dou tehnologii, HyperThreading i Dual-Core, pentru a asigura rularea n paralel a unui numr maxim de
patru procese diferite. Acest lucru va duce, pe lng dublarea teoretic a vitezei, la o
explozie a numrului aplicaiilor concepute s ruleze pe sistemele multi-core.
3.4.2. Tehnologia Dual-Core AMD
AMD continu drumul inovaiilor introducnd tehnologia dual-core (dual
socket) pentru piaa PC. Procesoarele dual-core Opteron pentru staii de lucru extind
arhitectura Direct Connect a AMD, conectnd dou uniti centrale de procesare (CPU)
ntr-un singur circuit integrat, mbuntind per total performantele sistemului i
eficiena acestuia. Procesoarele AMD Operton single-core i dual-core cu arhitectura
Direct Connect i HyperTransport Technology permit tranziia uoar la tehnologia pe
64 bii fr a sacrifica performanta pe 32 bii.
Un lucru mbucurtor pentru fanii AMD este c tehnologia dual-core este extrem
de uor de implementat prin urmtoarele considerente principale:
procesorul dual-core conine dou uniti centrale de procesare ntr-un singur
circuit integrat, fiecare nucleu avnd propria memorie cache L2 de 1 MB;
se conecteaz pe socket-urile existente cu 940 de pini pentru procesoarele AMD
Opteron;
un update de BIOS este tot ceea ce este necesar pentru a obine un sistem
compatibil de a rula cu procesoare dual-core;
cele dou nuclee CPU se descurc cu aceeai memorie i cu tehnologia
HyperTransport disponibile pentru procesoarele single-core.
Procesoarele AMD Opteron dual-core prezint, de asemenea, avantajele
arhitecturii unui procesor cu un singur nucleu. Aceste avantaje cuprind urmtoarele
tehnologii:
Direct Connect Arhitecture - ajut la mbuntirea performanei sistemului i a
eficienei prin conectarea direct a procesoarelor, controllerului de memorie i a
dispozitivelor de intrare-ieire ale procesorului.
HyperTransport Technology - asigur interconectare cu lime de band
scalabil ntre procesoare, subsitemele periferice i alt chipset.
AMD PowerNow! Technology cu Optimized Power Management (OPM) asigur necesarul de putere de calcul n funcie de cerine, rezultnd un raport
performan-putere optimal.
S analizm, ns, cum se vor comporta noile cipuri n PC-urile noastre:
Cretere de viteza
Sistemul de referina pe care s-au efectuat testele a rulat Windows XP Pro.
Acesta a venit configurat cu 1 GB de memorie DDR 400, un hard disc de 10.000 rpm i
o placa video nvidia GeForce 6800 Ultra cu 256 MB de memorie DDR3. Mainria
AMD Athlon64 X2 a reuit un scor de 116 puncte n WorldBench 5, cu mult mai bun
dect cele 95 de puncte obinute de procesorul dual-core Pentium 840 Extreme Edition.
Unitatea AMD a artat un real plus de putere n poriunea de multitasking a lui
PC WorldBench 5. Timpul de doar 6 minute i 44 de secunde a fost cu 3 minute i 42 de
secunde mai bun dect media dintre dou sisteme Athlon 64 FX 55 i cu aproape 3
minute mai bun dect Pentium 840 EE dual-core. n WorldBench 5, unitatea dual-core
60

Cap 3: Evaluarea performanelor procesoarelor

produs de Intel, a artat mbuntiri comparativ cu acelai sistem, dar echipat cu un


procesor Pentium 4 seria D la 3,2 GHz (ambele cu Hyper-Threading activat).
Despicnd firul n patru, mai aflam un lucru interesant: n testele de anduran i
de stabilitate, procesorul 840 al lui Intel rmne ferm pe poziie, chiar i dup multe zile
de lucru intens, n timp ce Athlon-ul 4800+ ncepe s aib probleme. La acest capitol
putem acorda o bil alb lui Pentium 840 EE, care se potrivete ca o mnu serverelor
i staiilor de lucru folosite cu aplicaii puternice. Este adevrat c procesorul produs de
Intel consum mai mult curent electric, dar de aici provine i plusul de stabilitate att de
necesar multor utilizatori.
Ce se poate face concret cu procesoarele dual-core?
Pentru a plasa procesoarele dual-core ntr-un context potrivit, trebuie s
reconsiderm modul de lucru cu computerul. Sistemele cu dou procesoare logice sunt
perfect potrivite pentru a face operaiuni multiple, simultan, fr ca utilizatorul s
observe scderi de performan. Imaginai-v cum ar fi s jucai un joc 3D sofisticat n
timp ce arhivezi fiiere audio.
Chiar dac decizi s mai introduci o operaiune dificil, cum ar fi compresia de
volume mari de fiiere, abilitatea de a juca shooter-ul 3D nu va fi redus. Dac se
introduce a patra comand consumatoare de resurse de ctre sistem, atunci se va reduce
n mic msur timpul total de execuie a proceselor, dar nu se va observa un impact
major asupra rspunsurilor directe date de sistem.
Intel deja introduce procesoarele dual-core bazate pe sistemul Pentium D, iar
PC-urile propulsate de acestea vor fi considerabil mai ieftine dect cele cu Pentium 840
EE.
Dei scumpe, procesoarele dual-core dovedesc performane simitor
mbuntite. AMD i continu n salturi drumul ctre inimile gamer-ilor nnebunii de
gigaherti, n timp ce Intel prefer sa urce cu pai mruni, siguri i stabili.

3.5. Test de procesoare


Importana unui procesor (CPU) ntr-un sistem de calcul este printre cele mai
mari. Teoretic, vorbim despre componenta central a PC-ului, creierul su, unitatea
care coordoneaz toate activitile i fr de care nimic din ceea ce vedem pe monitor
nu s-ar putea realiza. Aadar, o modificare a nivelului su de performan va conduce la
schimbarea dramatic a vitezei de lucru, productivitii i satisfaciei.
Nu trebuie neglijat, ns, importana memoriei (mai ales din punct de vedere
cantitativ), a plcii grafice i a altor componente de baz. De fapt, n primul rnd
conteaz sarcinile pe care le dm PC-ului, n funcie de ele putndu-se deduce nivelul de
performan necesar din partea fiecrei componente. De exemplu, un mptimit al
jocurilor va avea nevoie n primul rnd de o plac grafic performant (cu un GeForce
6200, de exemplu, nu se va putea atinge un framerate minim decent n ultimele apariii),
apoi de un procesor performant; abia n ultimul rnd conteaz ali factori, precum o
cantitate de memorie mai mare de 1 GB sau un hard disk rapid. n schimb, un
profesionist al graficii (2D) nu se va folosi de puterea 3D a plcii grafice, n schimb va
avea nevoie de un procesor ct mai rapid i de o cantitate de memorie de minim 2 GB
pentru a-i face treaba n condiii bune.

61

Evaluarea performanelor sistemelor de calcul

n continuare se prezint rezultatele unor teste care se doresc a fi un ghid al


momentului cu privire la achiziionarea unui procesor, fie pentru un sistem nou, fie n
cazul unui upgrade. Se urmrete s se acopere toate domeniile de utilizare a PC-ului,
prin prezentarea unui numr mare de teste, cuprinznd att jocurile i partea de
multimedia/entertainment ct i aplicaiile profesionale. Au fost introduse att teste
analitice (jocuri reale, codare audio/video, arhivare), ct i sintetice (3DMark, SuperPI),
pentru o evaluare din dou perspective: cea real - perceptibil n practic, i cea
teoretic - att de popular printre entuziati i cei care doresc s doboare recorduri. i,
de ce s nu recunoatem, testele sintetice reflect n mare msur comportamentul n
utilizarea real.
Platformele alese au fost n numr de trei: LGA775, Socket AM2 i Socket 939,
toate prezente pe pia n acest moment, dei Socket 939 se pare c n curnd va iei din
scen.
LGA775, numit i Socket T, a aprut n urm cu peste doi ani, fiind dedicat
exclusiv procesoarelor Intel. Aceasta a nlocuit vechiul Socket 478 i a introdus pentru
prima dat acest Land Grid Array (LGA) - un tip de mpachetare diferit de cel clasic:
pinii nu se afl pe procesor, ci pe placa de baz, CPU-ul coninnd doar contactele
necesare pentru a se face legtura cu pinii. Criticat n primul rnd pentru faptul c pinii
situai n socket pot fi ndoii sau chiar distrui relativ uor, LGA775 a cptat - vrndnevrnd - o popularitate mare printre utilizatori, devenind singura soluie pentru
platforma Intel.
Socket AM2 desemneaz penultimul socket introdus de AMD, El se deosebete
de cel anterior, Socket 939, printr-un pin suplimentar, precum i prin dispunerea diferit
a celorlali. Este evident faptul c AMD a decis acest lucru pentru a crea o
incompatibilitate forat, dar necesar pentru introducerea noilor sale procesoare cu
suport DDR2: controller-ul de memorie fiind situat n procesor, un CPU Socket AM2
introdus ntr-o plac de baz cu suport DDR nu ar fi funcionat, i nici reciproc.
Socket 939 a fost, timp de doi ani, referina pentru platforma AMD64. Dei
mbuntirile aduse de Socket AM2 sunt minore, procesoarele S939 sunt pe cale de
dispariie din magazine, dar n acelai timp foarte populare printre utilizatori.
Arhitecturile testate sunt n numr de trei: Intel NetBurst, Intel Core i AMD64.
Intel NetBurst reprezint o arhitectur aspru criticat, dar care a dominat lumea
procesoarelor Intel n ultimii ase ani. Ea a fost introdus odat cu Pentium 4 i a
succedat-o pe cea P6 (Pentium II/III), avnd ca principale caracteristici creterea de
patru ori a limii de band a bus-ului PSB (el fiind numit acum Quad Pumped) i
restructurarea cache-ului level 1. Mai trziu i fr legtur direct cu arhitectura, Intel a
introdus o serie de inovaii n procesoarele acestei serii, precum tehnologiile
HyperThreading i EM64T (aceasta din urm fiind mprumutat de la AMD64),
precum i includerea a dou nuclee ntr-un singur CPU. Critica principal adus a fost
62

Cap 3: Evaluarea performanelor procesoarelor

datorat consumului extrem de ridicat i a performanei mici per clock (performana la o


frecven dat), fapt datorat pipeline-ului2 extrem de lung; spre exemplu, un Athlon 64
la 2 GHz depea cu mult un Pentium 4 la aceeai frecven; interesant este faptul c i
vechea arhitectur de la Intel, P6, ntrecea unele modele de Pentium 4 chiar i la o
frecven mai ridicat (de exemplu, Pentium III la 1 GHz vs. Pentium 4 la 1.3 GHz).
Succesul lui NetBurst a fost datorat numelui Intel, marketing-ului agresiv, dar i
faptului c procesoarele din aceast serie puteau, ntr-adevr, s ating frecvene
deosebit de ridicate - apropiindu-se de 4 GHz i depind chiar cu mult aceast valoare
prin overclocking-ul extrem.
Platforma Intel Core a fost introdus n acest an de ctre Intel, ea reprezentnd
o revenire n prim-plan a arhitecturii P6, aflat la baza procesorului Pentium III.
Arhitectura a fost folosit chiar i n vremurile de apogeu ale lui Pentium 4 n
persoana lui Pentium M (nume de cod Dothan), un procesor foarte popular pentru
platformele mobile. Ca fapt divers, Pentium M a ptruns i n domeniul desktop datorit
adaptorului Socket 479-478, care a dat natere celei mai performante i mai reci
combinaii posibile pentru un PC, el oferind o performan per clock superioar chiar i
unui Athlon 64 FX.
n ceea ce privete arhitectura Core, practic Intel a preluat scheletul lui Dothan i
i-a adus numeroase mbuntiri pentru a o face competitiv acestei perioade.
Instruciunile SSE3, EMT64 i VT sunt considerate de muli bling-bling-uri accesorii inutile, ns nu se tie niciodat cnd este nevoie de ele. Au mai fost motenite
unele inovaii aduse de NetBurst (dar fr legtur cu arhitectura n sine), precum bus-ul
Quad Pumped. Performana per clock a devenit foarte ridicat, depind-o pe cea a
concurenilor de la AMD, iar procesoarele rezultate au, spre deosebire de cele AMD64,
rezerve foarte mari de atingere a frecvenelor ridicate. S-ar prea c diferena de
performan se datoreaz n mare parte i cache-ului de 4 MB de tip inclusiv, mprit
ntre cele dou nuclee. Pe baza acestei arhitecturi a ieit la lumin, de curnd, i primul
CPU cu patru nuclee: Core 2 Extreme QX6700 (nume de cod Kentsfield).
AMD64, dei un simplu update al vechiului AMD K7 (Athlon, Athlon XP), a
introdus cteva mbuntiri cheie, cea mai important fiind includerea controller-ului
de memorie n procesor. Dei s-a insistat mult pe instruciunile, regitrii i ntreaga
arhitectur pe 64 de bii, utilitatea acestui add-on este momentan extrem de redus,
dat fiind lipsa de popularitate a sistemelor de operare i a aplicaiilor care s utilizeze
cod 64-bit. Oricum, cine i cumpr procesoare AMD64, nu o face din cauza celor 64
de bii, ci datorit performanei sporite de mutarea controller-ului de memorie din placa
de baz n procesor, ceea ce reprezint, n continuare, principalul avantaj al
procesoarelor AMD, fr de care ele nu ar fi fcut fa concurenei. Acest lucru a adus i
cteva dezavantaje, unul dintre ele fiind resimit chiar acum, la apariia lui Socket AM2:
odat cu schimbarea tipului de memorie, trebuie nlocuit i procesorul, i placa de baz.
Descrierea configuraiilor care au stat la baza testului
Placa grafic folosit a fost un NVIDIA GeForce 7900 GTX produs de EVGA,
tactat la 710/1800 MHz, frecvene ridicate fa de cele standard (650/1600 MHz) n
ideea de a nu avea plafon n performan grafic - lucru practic imposibil pentru
anumite procesoare, care ar fi fost satisfcute doar de o configuraie SLI. (Desigur,
2

Pipeline - reprezint suma unor etape pe care instruciunile trebuie s le parcurg pn la obinerea
rezultatului final
63

Evaluarea performanelor sistemelor de calcul

frecvenele au fost testate minuios, astfel nct placa a rulat perfect stabil i fr
artefacte n aceste condiii.)
S-a renunat la mperecherea a dou plci grafice pentru acest test deoarece ar fi
putut aprea probleme serioase cu driverele n anumite cazuri, cel puin pe platforma
Intel. Ca pas firesc de urmat, am sczut detaliile i rezoluiile pn am ajuns la un punct
unde coborrea sub o anumit limit deja ar fi fost irelevant (nimeni nu mai folosete
rezoluii precum 800 x 600 sau 640 x 480 cu un Core 2 Duo, spre exemplu). Sistemul de
operare a fost Windows XP Professional SP2, iar setrile plcii grafice din drivere au
fost cele implicite, pentru o evaluare ct mai apropiat de condiiile utilizrii de zi cu zi.

Ca plci de baz, pentru platforma Intel sa ales un DFI Infinity 975X/G (chipset
Intel 975X) deoarece, n momentul n care s-au rulat testele, era practic cea mai
performant plac disponibil. Layout-ul este unul simplu, ce nu exceleaz prin nimic,
dar ca performan surclaseaz alternativele de la Asus i Gigabyte. Voltajele
generoase, att pentru procesor ct i pentru memorii, au nlturat ndoielile pe care leam avut n legtur cu ea.
Pentru procesoarele AM2 sa folosit o plac Abit AN9 32X (chipset nForce 590
SLI), ce ofer premisele unui overclocking ridicat. n fine, pentru Socket 939, sa dispus
de un btrn Abit AN8 (chipset nForce 4), cu setri moderate de overclocking, dar cu
performane de top.
Memoriile folosite au fcut parte dintr-un kit Corsair CM2X512-8000UL,
module echipate cu chip-urile Micron D9 fatbodies; ele au rulat la frecvene
impresionante, cu latene extrem de mici: pn la 800 MHz am rulat cu CL3 2-2-7, n
cazul platformei Intel. Pentru platforma Socket 939 (DDR) am dispus de un kit OCZ
PC4400 Gold Limited Edition (chip-uri TCCD), fr performane deosebite, dar
arhisuficiente pentru nevoile noastre.
Sursa a purtat numele Antec Phantom 500W, ea fiind dotat cu dou rail-uri
independente de 12V de 16A i respectiv 17A i dovedind voltaje stabile, cu variaii
minime, chiar i la stresul enorm exercitat de o platform de ultim generaie overclockat aproape de limit.
Rcirea a fost asigurat de un cooler Scythe Ninja Plus, un monstru care ar
nspimnta utilizatorul obinuit. El a reuit s rceasc pasiv toate procesoarele pe care
le-am avut n teste. Evident, la frecvene implicite.
3.5.1. Testarea propriu-zis
n general, performana unui procesor este evaluat utiliznd diverse aplicaii
care calculeaz ori timpul necesar efecturii unei operaii, ori cte operaii sunt efectuate
ntr-un interval de timp prestabilit. Operaiile (benchmark-urile) n cauz ncearc s
reflecte, pe ct posibil, comportamentul practic al procesorului, simulnd activitatea
64

Cap 3: Evaluarea performanelor procesoarelor

utilizatorului. Aadar, nici un benchmark nu este perfect, ci depinde att de aplicaia


folosit de ctre utilizator, ct i de operaiile realizate n cadrul acelei aplicaii.
Testele care folosesc aplicaii reale se numesc teste analitice, iar cele care
raporteaz rezultatele unor programe create special pentru a evalua performana sunt
testele sintetice. Clasificarea este oarecum convenional, ntruct numeroase teste
sintetice folosesc aplicaii ce au la baz motorul unor software-uri clasice; de exemplu,
3DMark se bazeaz pe engine-uri reale de jocuri, diferenele de comportament dintre
benchmark i jocurile propriu-zise fiind nesemnificative.
Benchmark-ul sintetic 3DMark 2001 a fost folosit deoarece este pn acum
singurul test care solicit semnificativ toate componentele vitale ale unui sistem (CPU,
memorie RAM, plac grafic, surs). Grosso-modo, putem spune c testul Car Chase
depinde de procesor, Dragothic de procesor i placa video, Lobby de memorie (latene
i lime de band), iar Nature este intens grafic. Tocmai de aceea sa preferat
compararea framerate-ului n toate testele, n defavoarea scorului final.
Din 3DMark03 sa selectat pentru testarea procesorului numai GT1 (Wings of
Fury), testul fiind comparabil ca pondere a procesorului cu primele trei teste din
3DMark2001.
Din 3DMark05 s-au selectat testele de baz, care ofer un scor final, dar s-au
reinut, de asemenea, rezultatele din fiecare test. n cazul lui 3DMark06, s-au utilizat
numai testele pentru CPU deoarece celelalte sunt foarte intens solicitante pentru placa
grafic, iar aceasta plafoneaz performana ntr-un mod ce face imposibil deducerea
influenei procesorului asupra rezultatului final, deci, practic, diferenierea
procesoarelor.
Tot la capitolul performan 3D, s-au introdus o serie de jocuri reale, fie
complete sau demo-uri ale acestora create special pentru testare: F.E.A.R., Quake 4,
FarCry, GunMetal i X3.
Pentru evaluarea vitezei de randare n aplicaii de grafic profesional, sa avut la
dispoziie SPECviewperf, alturi de CineBench, PovRay i Photoshop CS2 (aplicarea
filtrului Radial Blur asupra unei imagini).
Pentru testarea n aplicaii multimedia, sa codat un scurt film n format original
DVD (MPEG-2 la 720 x 480) folosind codec-ul DivX 6.3, precum i un fiier audio
(Dream Theater - Octavarium, de pe albumul cu acelai nume) cu mai multe encodere
lossy i lossless, rezultnd fiiere n formatele MP3, MPC, Vorbis, AAC, FLAC i
APE.
n fine, ultimele trei teste au constat n folosirea benchmark-ului din WinRAR,
a aplicaiei ScienceMark (pentru diverse simulri tiinifice), precum i clasicul
SuperPI, care efectueaz att de inutilul calcul cu milioane de zecimale al numrului pi.
Explicaii
n cazul jocurilor 3D, creterea rezoluiei (sau creterea nivelului de anti-aliasing
- are un efect similar) conduce la un stres suplimentar din partea plcii grafice i,
eventual, a memoriei sistemului. n alctuirea scenelor, procesorul calculeaz n
principal wireframe-ul3 obiectelor, altfel spus coordonatele punctelor ce le definesc,
urmnd ca mai apoi placa grafic s le umple cu culoare i s le aplice diverse efecte.
Este evident faptul c un obiect va fi calculat ntr-un mod similar, indiferent dac
rezoluia este 640 x 480 sau 1600 x 1200, fiind aplicate aceleai formule de calcul
pentru definirea poligoanelor i funciilor matematice care le creeaz. Aadar, pentru
3

http://en.wikipedia.org/wiki/Wire_frame_model
65

Evaluarea performanelor sistemelor de calcul

evaluarea performanei pure a unui procesor, este de dorit folosirea unei rezoluii ct
mai mici, pentru ca placa grafic s termine ntotdeauna calculele naintea procesorului,
ea neconstituind astfel un factor limitativ.
Altfel st treaba cnd vine vorba de nivelul de detalii ale unei scene, scderea
sau creterea lui reflectndu-se ntr-o solicitare mai intens a procesorului i/sau plcii
grafice, de la caz la caz, n funcie de ce reprezint pentru fiecare aplicaie/joc
schimbarea acestui nivel. De exemplu, nivelul maxim poate nsemna folosirea un
poligon regulat cu 100 de laturi pentru nfiarea unui cerc, pe cnd un nivel mai sczut
poate reduce acest numr la 50, realismul scenei devenind altul - caz n care procesorul
are mai puin de lucru. Dar, la fel de bine, reducerea nivelului de detalii poate desemna
o filtrare mai sumar a texturilor, ele devenind mai puin clare - caz n care placa grafic
este degrevat de o parte dintre sarcini.
n aceste condiii, de ce nu sa folosit rezoluia minim permis (uneori chiar 320
x 240), mpreun cu nivelul minim de detalii, pentru a fi siguri c placa grafic nu
limiteaz n nici un fel performana? Pentru c orice test trebuie s aib o aplicabilitate
practic, s reflecte comportamentul real al unui utilizator; or, nimeni nu i chinuiete
ochii ntr-o rezoluie mai sczut de 1024 x 768 dac i cumpr o plac grafic de
ultim generaie - cum este cea folosit n testul nostru.
3.5.2. Procesoare testate:

3.5.2.1. Socket 939


Athlon 64 3500+ Venice (2.2 GHz, 11 x 200, 512 KB cache L2);
A treia variant de Athlon 64 pentru Socket 939, dup ClawHammer i
Winchester, Venice aduce n prim plan un controller de memorie mbuntit (puin mai
lent dect cel inclus n Winchester, dar mai compatibil), temperaturi mai joase ca
predecesorii si i potenial de overclocking mai ridicat.
Revizia E3, prezent n testul nostru, a oferit, teoretic, un potenial de
overclocking mai ridicat dect cea ulterioar, E6. Aceasta din urm a dezamgit
entuziatii, necesitnd voltaje mari pentru a atinge frecvene ct de ct ridicate.
Testarea a avut loc la setrile:
2200 MHz, PSB 200 MHz, DDR400, CL2 2-2-5 1T (Athlon 64 3500+)
2500 MHz, PSB 250 MHz, DDR500, CL2.5 3-3-7 1T
2000 MHz, PSB 200 MHz, DDR400, CL2 2-2-5 1T (Athlon 64 3200+)
Athlon 64 X2 4600+ Manchester (2.4GHz, 12 x 200, 2 x 512 KB cache L2);
Dual-core de la AMD, nucleul Manchester este de fapt rezultatul alipirii a dou
nuclee de tip Venice. Performanele sunt specifice unui CPU dual-core, mai ales n
aplicaiile optimizate pentru multiprocesor.
Testarea a avut loc la setrile:
2400 MHz, PSB 200 MHz, DDR400, CL2 2-2-5 1T (Athlon 64 X2 4600+)
2750 MHz, PSB 250 MHz, DDR500, CL2.5 3-3-7 1T

3.5.2.2. Socket AM2


Sempron 2800+ Manila (1.6 GHz, 8 x 200, 256 KB cache L2);
Mezinul familiei AM2 urc generos n frecven mulumit cache-ului minuscul
(dar suficient pentru aplicaiile nepretenioase), memoriilor excelente i plcii de baz
66

Cap 3: Evaluarea performanelor procesoarelor

excepionale. Nucleul Manila este un nucleu Orleans (A64 AM2) cu cache-ul redus la
256 KB.
Testarea a avut loc la setrile:
1600 MHz, PSB 200 MHz, DDR2-667, CL3 3-3-7 1T (Sempron 2800+)
2880 MHz, PSB 360 MHz, DDR2-960, CL4 3-3-8 2T
Athlon 64 X2 4200+ Windsor (2.2 GHz, 11 x 200, 2 x 512 KB cache L2);
Dual-core-ul pentru platforma AM2, nucleul Windsor nu reprezint o inovaie,
ci doar o cuplare a dou nuclee Orleans. Comportamentul n teste este decent, dei am fi
preferat ca urcarea n frecven s se fac cu o cretere mai mic a tensiunii.
Testarea a avut loc la setrile:
2200 MHz, PSB 200 MHz, DDR2-800, CL4 3-3-8 1T (Athlon 64 X2 4200+)
2750 MHz, PSB 250 MHz, DDR2-834, CL4 3-3-8 1T
2000 MHz, PSB 200 MHz, DDR2-800, CL4 3-3-8 1T (Athlon 64 X2 3800+)

3.5.2.3. Socket T (LGA775)


Intel Celeron D 336 Prescott (2.8 GHz, 21 x 133, 256 KB cache L2);
Ruca cea urt a lui Intel, Celeron, nu a dezamgit, dovedind prin
overclocking performane decente pentru zona n care se afl i pentru preul pe care l
are.
Testarea a avut loc la setrile:
2800 MHz, PSB 133 MHz, DDR2-533, CL3 2-2-7 (Celeron D 336)
4305 MHz, PSB 205 MHz, DDR2-617, CL3 2-2-7
Intel Pentium 4 531 Prescott (3 GHz, 15 x 200, 1 MB cache L2);
Considerat de muli o relicv vie a arhitecturii NetBurst, procesorul de fa este
unul decent, dei temperaturile atinse i-ar face pe muli s nnebuneasc, mai ales dac
i doresc sisteme silenioase. Performana sa este una bun, ns fr a excela.
3000 MHz, PSB 200 MHz, DDR2-667, CL3 2-2-7 (Pentium 4 531)
3825 MHz, PSB 255 MHz, DDR2-680, CL3 2-2-7
Intel Pentium D 945 Presler (3.4 GHz, 17 x 200, 2 x 2 MB cache L2);
Performanele foarte bune caracterizeaz acest procesor, datorit cache-ului
mricel i mai ales a faptului c avem de-a face cu un procesor cu dou nuclee.
3400 MHz, PSB 200 MHz, DDR2-667, CL3 2-2-7 (Pentium D 945)
4250 MHz, PSB 250 MHz, DDR2-667, CL3 2-2-7
Intel Core 2 Duo E6300 Allendale (1.86 GHz, 7 x 266, 2 x 1 MB cache L2);
Mezinul familiei Core 2 Duo, 6300 dovedete o putere de calcul ieit din
comun i se ia la trnt voinicete cu Pentium D 945. i are numai 2 MB de cache
level 2 i frecven net inferioar acestuia.
1866 MHz, PSB 266 MHz, DDR2-667, CL3 2-2-7 (Core 2 Duo E6300)
3010 MHz, PSB 430 MHz, DDR2-646, CL3 2-2-7
Intel Core 2 Duo E6700 Conroe (2.66 GHz, 10 x 266, 2 x 2 MB cache L2);
Englezul spune save the best for last. Noi nu spunem nimic, ci v invitm doar
s studiai graficele testelor, deoarece ele vorbesc de la sine.
67

Evaluarea performanelor sistemelor de calcul

2666 MHz, PSB 266 MHz, DDR2-667, CL3 2-2-7 (Core 2 Duo E6700)
3450 MHz, PSB 345 MHz, DDR2-690, CL3 2-2-7

Observaii:
sa folosit frecvena de 2 GHz pentru Venice cu scopul de a simula
comportamentul lui Athlon 64 3200+, un procesor de referin pentru platforma
Socket 939;
sa folosit frecvena de 2 GHz pentru Windsor pentru a simula comportamentul
lui Athlon 64 X2 3800+, cel mai lent CPU dual-core de la AMD;
n cazul lui Sempron AM2, setarea memoriei a fost DDR2-667 datorit
compatibilitii oficiale restricionate la aceast frecven, dei nu au fost
probleme n rularea la DDR2-800;
aparent, limitarea overclocking-ului la Sempron 2800+ (la 80%!) a fost datorat
plcii de baz, procesorul putnd urca la o frecven i mai mare;
pentru platforma Intel, nu (mai) exist setarea Command Per Clock (1T/2T),
rulndu-se implicit cu valoarea 2T, ns procesoarele Intel se pare c nu depind
n mod vital de latena 1T; n cazul lui AMD, creterea la 2T determin o
scdere masiv de performan;

Diferenele dintre procesoare au fost marcante n toate testele, cu excepia lui


Nature - primul test popular ce a folosit funcia Pixel Shader introdus odat cu
generaia GeForce 3 i n cazul cruia, la cinci ani de la apariie, plcile grafice moderne
determin n continuare o limitare a framerate-ului. Altfel ar fi stat situaia ntr-o
configuraie multi-GPU.
Rezultatele sunt exprimate n numr de fps.

68

Cap 3: Evaluarea performanelor procesoarelor

Alegerea unui procesor a fost ntotdeauna o decizie grea. Aici nu exist cel mai
rapid, ci cel mai potrivit, n cele din urm fiind o decizie subiectiv.

69

4. Evaluarea memoriilor
4.1. Introducere
Un test de memorie nu este simplu de realizat. Puini se ncumet, puini reuesc.
Spre deosebire de alte teste, acesta nu este unul care s reflecte cu acuratee
comportamentul produselor, precum st treaba la plci de baz sau plci grafice. De ce?
Pentru c numrul parametrilor care trebuie luai n calcul este cu cel puin un ordin de
mrime mai mare. Unii ar spune c e simplu: setezi frecvena, micorezi latenele,
eventual creti tensiunea la maxim i vezi la ct ruleaz stabil. Fals. Un test riguros ia n
calcul i parametrii cei mai puini uzitai. Drive Strength, tRFC, tRWT, tREF... i lista
lor ar putea umple o pagin.
Testarea i metoda prezentate n curs reprezint un compromis, testarea nu este
att de riguroas pe ct s-ar fi putut realiza, din cauza timpului enorm care ar fi fost
necesar acestui demers. Fr a exagera ctui de puin, un test de memorii perfect
riguros ar trebui s dureze circa trei luni de munc intensiv. Nu s-au efectuat testele
dect sumar pe o a doua plac de baz, nu s-au luat n considerare dect parial latenele
secundare, s-au testat doar 30 de produse (cu toate c s-ar fi putut procura mai multe) i
nu s-au introdus n concurs dect kit-uri de 1 GB (cte dou module de 512 MB).
Tocmai de aceea testul nu trebuie considerat ceva exhaustiv, ci n primul rnd un ghid
care s deschid gusturile celor pasionai, s lmureasc unele aspecte delicate legate de
memorii i abia apoi s ofere un ghid de cumprare celor interesai.
Momentan, ne aflm ntr-o perioad de trecere de la standardul DDR la cel
DDR2. Totui, platforma AMD se folosete intensiv memorii DDR, iar sistemele bazate
pe procesoarele companiei texane sunt preferate de foarte muli, dac nu de cei mai
muli entuziati de la noi, cu att mai mult cu ct chipset-urile au cptat o anumit
maturitate, iar multe plci de baz ofer o configurabilitate foarte bun. E suficient s
comparm BIOS-ul unei plci high-end cu chipset Intel cu cel al unei plci nForce4 (n
ediia pentru AMD): trei sau patru setri de memorie versus minim 10, uneori 20 sau 30.
De asemenea, mentalitatea cumprtorului a suferit schimbri semnificative n
ultima perioad. Acum, el nu mai pune problema la modul vreau s-mi iau o memorie
de 512 MB, ci vreau s-mi aleg o memorie care merge n latene strnse i n
frecven mare. Chiar dac sporul de performan nu este senzaional, latenele pot face
diferena dintre un sistem rapid i unul care sufer de pe urma unei limitri ce putea fi
evitat. Mai problematic este aspectul frecvenelor; de exemplu, cine posed un Athlon
64 3200+ care, supus overclocking-ului, ruleaz n 2700 MHz, va avea nevoie de o
memorie pe msur, care s satisfac foamea de lime de band a procesorului, i
anume una care s reziste cu succes la 270 MHz. Dac nu, frecvena ei va trebui sczut
iar penalizarea de performan va fi destul de mare.
Aadar, nu exist memorie ideal. Fiecare utilizator i va stabili propriile
standarde n funcie de diveri factori, dintre care amintim:
frecven,
latene,
performan brut,
rspuns la tensiune i, de ce nu, aspect.
70

Cap 4: Evaluarea memoriilor

Mai mult, ar putea conta i aplicaiile rulate: ce este mai convenabil, un Athlon
64 chinuit la 2600 MHz cu memoria rulnd sincron (260 MHz) sau unul la 2750 MHz
chinuit i mai mult, cu memoria asincron (230 MHz)? Cine se joac va prefera prima
opiune, cine codeaz filme va merge pe a doua.
Aspectele abordate n acest material sunt diverse. Vei afla care sunt, ce
nseamn i cum trebuie setate latenele memoriei, precum i modul de comportare al
celor mai importante module de pe pia, alturi de modul lor de procurare.

4.2. Standarde, HTT, frecvene, limi de band


Standardul DDR SDRAM a adus mbuntiri minore de ordin tehnologic fa de
vechiul SDRAM, ns a dublat performana. Datele sunt transmise att pe frontul
cresctor, ct i pe cel descresctor al semnalului, rezultnd o lime de band de dou
ori mai mare, i asta la aceeai frecven. n rest, avem principii similare standardului
SDRAM, i care se regsesc i la recentul DDR2. Nu vom intra prea mult n detalii,
ntruct am mai scris despre memorii n capitolul 2.1.2, ci ne vom limita la descrierea
funcionrii memoriei DDR SDRAM - pe scurt, DDR.
Fizic vorbind, modulele DDR prezint 184 de pini (fa de 168 pentru SDRAMul clasic i de 240 pentru DDR2). Aspectul lor este asemntor, cele SDRAM
prezentnd dou crestturi, fa de celelalte dou tipuri care dispun de una singur.
Desigur, plcile de baz dispun de slot-uri specifice n care modulele vor fi inserate, n
funcie de tipul acestora; aadar, nu vom putea introduce o memorie DDR2 ntr-un slot
DDR, orict de asemntoare ar fi ele.
Limea de band oferit de DDR este egal cu frecvena sa nmulit cu 2, i
apoi cu 8, unitatea de msur fiind GB/s (gigabyte pe secund). Astfel, o memorie
DDR400 va transmite (aproximativ) 3,2 GB/s ctre controller-ul de memorie, elementul
central de gestiune a acesteia. De ce cifrele 2 i 8? Pentru c avem de-a face cu memorii
DDR, ce dubleaz limea de band, iar la fiecare ciclu de tact sunt transmii cte 8
bytes (64 de bii), aceasta fiind limea consacrat a bus-ului. n cazul controller-elor de
memorie dual-channel, numrul lor crete la 16 bytes (128 de bii) per ciclu, ns sunt
necesare (cel puin) dou module de memorie, de preferin identice.
Standardele DDR aprobate de JEDEC - autoritatea n domeniu care ratific
diversele standarde de memorie, sunt PC1600, PC2100, PC2700 i PC3200, frecvenele
corespunztoare fiind de 100, 133, 166 i respectiv 200 MHz, deseori fiind referite ca
DDR200, DDR266, DDR333 i DDR400 din cauza raportrii la SDRAM: o memorie
DDR266 (PC2100) este de dou ori mai rapid dect una SDRAM PC133, chiar dac
ambele ruleaz la 133 MHz.
Cu toate acestea, diveri productori au impus anumite pseudo-standarde, care s
satisfac nevoile n cretere ale utilizatorilor. Dac platformele Intel au trecut la DDR2,
cele AMD sunt n continuare fidele standardului DDR i solicit o lime de band tot
mai mare. Marketing-ul joac un rol esenial aici, diferenele palpabile dintre o
memorie la 600 MHz i una la 400 MHz fiind minime datorit latenelor mai crescute la
frecvene mari.
n mod uzual, frecvena memoriei nu poate depi frecvena bus-ului
procesorului (HTT, ex-FSB = viteza de comunicare dintre procesor i chipset-ul plcii
de baz), care n mod implicit este de 200 MHz. Modelele recente de procesoare Athlon
64 (precum cele cu nucleu Venice sau San Diego) pot folosi un divizor maxim de
250:200, adic 5:4, ntre memorie i HTT. Atunci ce sens are s depim limea de
band oferit de memoriile ce ruleaz la 250 MHz (DDR500)?
71

Evaluarea performanelor sistemelor de calcul

Soluie se gsete ntotdeauna. Aici ea poart numele de overclocking: bus-ul


HTT poate fi crescut cu oarecare riscuri la 300 MHz sau chiar mai sus (micornd n
acelai timp multiplicatorul acestuia, astfel nct produsul final s nu depeasc 5 x
200), limitarea constituind-o acum placa de baz, eventual controller-ul de memorie al
procesorului. De exemplu, un bus HTT de 300 MHz va putea profita de o frecven a
memoriei de pn la 375 MHz (DDR750), o valoare practic imposibil de atins. Dar nu
ne oprete nimeni s setm divizorul la 1:1, rezultnd un frumos DDR600. Ca s fie mai
clar, un HTT crescut nu afecteaz cu nimic performana (din moment ce frecvena final
a acestuia nu poate depi 1000 MHz - e totuna dac avem 5 x 200 sau 4 x 250),
dar arhitectura procesoarelor AMD64 nu permite o frecven a memoriei mai ridicat
dect produsul dintre HTT i 5:4 (1,25).
Totui, dac cretem HTT-ul la 300
MHz nu se mrete i frecvena final a
procesorului? Cum va rezista un Athlon 64 de la
2 la 3 GHz? Simplu: prin scderea
multiplicatorului (operaie posibil la toate
procesoarele AMD, cu un suport minim din
partea plcii de baz); n cazul de mai sus l vom
reduce de la 10x la 7x, rezultnd o frecven
final de 2100 MHz, uor de suportat de ctre
orice procesor.
Plcile de baz nu accept uor frecvene mari ale HTT-ului: unele se plafoneaz
la 220 MHz, altele suport i peste 300 MHz cu anumite setri. Mai mult, dac rulm
asincron (nerecomandat dar posibil) - deci frecvena memoriei va fi egal cu HTT-ul
nmulit cu un numr fracionar (de exemplu 1:2), putem atinge HTT-uri de peste 400
MHz!
Putem jongla cu divizorul dintre HTT i memorie astfel nct s obinem
performanele optime. Uneori, datorit latenelor mai sczute, o frecven mai mic a
memorie ar putea completa perfect nevoile de calcul, astfel nct rularea asincron la un
raport 333:400, adic 5:6, ar putea fi avantajoas.
4.2.1. Latene
Numite i timing-uri, acestea reflect ndeaproape performana memoriei.
Practic, latenele sunt nite numere ce reprezint cicluri de tact dintre diferite stadii de
prelucrare a informaiilor de ctre memorie. Cu ct acestea sunt mai mici, cu att
performanele vor fi mai mari, dar cu att cresc i ansele ca memoria s nu le suporte.
Latenele se pot regla din BIOS-ul plcii de baz (dac acesta dispune de o astfel
de facilitate) sau prin intermediul diverselor utilitare, precum SysTool sau A64Tweaker.
Logica de baz a latenelor va fi explicat n capitolul urmtor (test plci grafice) i v
invitm s o (re)citii; n continuare, vom completa acele explicaii i ne vom referi la
latenele ce pot fi setate de ctre utilizator, detaliind semnificaia acestora.
Fiecare bank al memoriei (un bank fiind o grupare de mai multe chip-uri - de
multe ori logic) const, n realitate, ntr-o matrice uria, pentru accesarea unei
informaii fiind necesar localizarea unei celule. n acest scop, au loc cteva procese
fundamentale: CAS (Column Address Strobe) i RAS (Row Address Strobe), fiecare
fiind dedicat selectrii coloanei, respectiv liniei din matrice. RAS-ul const n cteva
etape, prin care informaia este citit sau scris: Active (activeaz rndul), Read (citete
informaia), Write (scrie informaia); Precharge (terge informaiile i face pregtirile
72

Cap 4: Evaluarea memoriilor

pentru reluarea ciclului), dei nu face parte din ciclul RAS, este strns legat de acesta
din motive evidente. ntre Active i Read/Write are loc i selectarea coloanei prin
intermediul lui CAS, astfel nct la nceputul demarrii citirii sau scrierii s existe
informaia legat de coordonatele celulei accesate.
Limitarea timpilor necesari desfurrii acestor operaii este efectuat prin setarea
latenelor. Dac acestea sunt prea mici, memoria va pierde informaii i vor aprea erori
(de la blocaje, erori de program i ecrane albastre n Windows pn la imposibilitatea de
a intra n POST).
tCL (CAS Latency), dei era latena de baz n cazul memoriilor SDRAM,
importana acesteia a sczut mult la DDR SDRAM. Ea reprezint timpul minim n care
se desfoar selectarea coloanei prin intermediul procesului CAS.
Valorile uzuale sunt de 2, 2.5 i 3, cele mai rapide memorii suportnd valoarea 2
la 200 MHz, 2.5 la 250 sau chiar 300 MHz. Valoarea 3 nu este acceptat de unele
module, indiferent de frecven, ns la altele ea este strict necesar pentru atingerea de
frecvene mari. De asemenea, valoarea de 1.5, suportat de unele plci de baz, nu
creeaz probleme de stabilitate dar nici nu ofer vreun avantaj; n schimb, cele de 1, 3.5,
4 i 4.5 sunt practic inutile i, de cele mai multe ori imposibil de setat.
tRCD (RAS to CAS Delay) limiteaz timpul dintre RAS i CAS sau, altfel spus,
timpul dintre comenzile Active i Read/Write. Ea este cea mai important laten pentru
memoriile DDR deoarece afecteaz cel mai mult performana.
Memoriile ieftine lucreaz cu valori de 3 sau chiar 4, pe cnd cele mai rapide
ofer un tRCD de 2 la 200 MHz, 3 la 250 MHz i 4 la 300 MHz.
tRP (RAS to Precharge Delay) se refer la timpul de desfurare al comenzii
Precharge, adic refacerea celulelor pentru reluarea ciclului. Importana ei este mai
redus dect cea a lui tRCD i comparabil cu tCL.
Valorile uzuale sunt de 2, 3 i 4; memoriile performante accept tRP = 2 la 230 250 MHz, apoi 3 la 300 MHz, pe cnd cele lente lucreaz cu 3 i 4 la 200 MHz.
tRAS (RAS Active Time sau Active to Precharge Delay) este o laten foarte
interesant, care iese din tiparele obinuite. Ea oglindete timpul dintre comanda Active
i cea Precharge, limitnd practic ntregul proces RAS. Deoarece ea include att tRCDul ct i tCL-ul, o valoare mai mic dect suma acestora dou nu va avea nici un efect.
Pentru performane optime se recomand o valoare cu 1 sau 2 mai mare dect suma
celor dou - aceasta deoarece, n mod paradoxal, o valoare prea mic poate chiar reduce
(nesemnificativ) performana.
Valorile uzuale sunt cuprinse ntre 5 i 11, fiecare productor prefernd o
anumit combinaie pe care o consider ideal. Numere mai mici de 5 nu sunt suportate
oficial (tRCD + tCL + 1 nu poate fi mai mic de 5), dar unele plci permit setarea
acestora pe riscul utilizatorului (risc de performane sczute, rareori de instabilitate). Per
total, impactul asupra performanei i stabilitii este neglijabil.
Trgnd linie, observm c memoria lucreaz ntr-un mod relativ simplu: se
selecteaz un bank, apoi un rnd i o coloan, se citete sau scrie informaia i se fac
pregtirile pentru reluarea ciclului. Selectarea unui rnd nu trebuie s dureze mai puin
dect specific valoarea tRCD, selectarea unei coloane se supune indicaiilor lui tCL,
timpul de accesare + citire/scriere + pregtire pentru pregtire nu trebuie s fie mai
redus dect indic tRAS-ul, iar pregtirile pentru ciclul urmtor nu trebuie s fie mai
scurte dect ne spune tRP-ul.
Dei nu este legat strict de memorie, ci de controller, setarea Command Rate
(CMD) este, de departe, cea mai important. Numit n diverse moduri (CPC, 2T
73

Evaluarea performanelor sistemelor de calcul

Timing, Command per Clock), ea semnific timpul scurs de la selectarea bank-ului


memoriei pn la nceperea trimiterii comenzilor ctre acesta.
Valorile posibile sunt 1T i 2T (notate exact astfel). Orice platform ar trebui s
suporte 1T pentru un maxim de dou module de 1 GB.
Pentru a nota timing-urile principale ale unei memorii, vom folosi notaia CL
tRCD-tRP-tRAS CMD, de exemplu CL2 2-2-5 1T sau CL2.5 3-3-7 2T. Dac setarea
CMD este omis, se va presupune implicit c ea este 1T.
Pe lng aceste latene principale, exist cteva ce au o importan mai redus i
pe care le-am descris n continuare, pe scurt. Menionm c ele sunt valabile n primul
rnd pe platforma nForce4, dei cele multe dintre ele pot fi aplicate i altor chipset-uri
sau chiar altor tipuri de memorii (SDRAM sau DDR2 SDRAM).
tRC (Row Cycle Time) are o importan semnificativ i reflect ntregul ciclu
de parcurgere al unui rnd, aadar RAS (reflectat de tRAS) + Precharge
(reflectat de tRP). n mod evident, valoarea minim este egal cu suma dintre
tRAS i tRP (de obicei nici nu pot fi setate valori mai mici de 5 + 2), ns unele
memorii au nevoie de mai mult.
tRFC (Row Refresh Cycle Time) este timpul minim dintre dou operaii de
Refresh aplicate aceluiai bank, adic de remprosptare a informaiilor, element
vital n cazul oricrei memorii DRAM. Valoarea minim este n general de 9,
ns unele memorii au nevoie de mai mult, mai ales la frecvene mari. Impactul
asupra performanei este neglijabil.
tRRD (Row to Row Delay) limiteaz timpul dintre RAS i RAS pentru acelai
bank. Opiunea rareori are un rol de luat n seam, valoarea clasic fiind 2. La
nevoie, ea poate fi crescut la 4 dar uneori poate fi sczut chiar la 0; impactul
asupra performanei se las ns ateptat.
tWR (Write Recovery Time) reflect timpul dintre finalizarea unei operaii de
scriere i operaia de Precharge. Importana setrii este redus, valorile posibile
fiind de 2 sau 3.
tWTR (Write to Read Delay) se refer la timpul dintre o operaie de scriere i
una de citire n cadrul aceluiai bank. Valoarea de 1 ofer cea mai bun
performan la citire, ns cea de 2 este uneori util pentru creterea stabilitii la
frecvene mari.
tRTW (Read to Write Delay) este similar lui tWTR, dar limiteaz timpul scurs
dintre o operaie de citire i una de scriere. Valoarea optim este 1, ns cea de 4
este indicat pentru anse mai mari de stabilitate. Dac tCL este setat altfel dect
2, s-ar putea s fie necesar i un tRTW de minim 2.
tREF (Refresh Period) conine o setare uor de neles dar dificil de setat optim.
Este vorba de timpul la care memoria este remprosptat; valorile mari ofer o
mai bun performan n detrimentul stabilitii, iar valorile foarte mici (sub
2000) o reduc n mod exponenial. 3120 pare a fi valoarea optim, ce ofer un
compromis bun ntre performan i stabilitate.
tWCL (Write CAS Latency) indic o setare de CAS specific operaiei de
scriere. Cum singura setare posibil pare a fi cea de 1, nu este cunoscut impactul
su asupra performanei.
Dei nu este o laten, setarea DRAM Bank Interleave are un impact
semnificativ asupra performanei. Dac o dezactivm, diferite bank-uri ale memoriei nu
vor putea fi accesate sau remprosptate alternativ, ci doar simultan, ceea ce nseamn
74

Cap 4: Evaluarea memoriilor

c nu vom putea folosi mai multe bank-uri n paralel, performana scznd


corespunztor.
Majoritatea acestor latene sunt obinute de ctre placa de baz pe baza citirii
SPD-ului (Serial Presence Detect), o tabel nglobat n fiecare modul de memorie, ce
cuprinde diverse alte informaii pe lng aceste timing-uri, cum ar fi productorul
memoriei. n momentul pornirii sistemului pentru prima dat, placa de baz citete
aceste valori i le seteaz, cel puin pn la intervenia utilizatorului care le poate ajusta
dup cum dorete. Teoretic, e vorba de latenele la care productorul garanteaz
funcionarea memoriilor, ns practic muli dintre acetia seteaz valori mai relaxate,
pentru mai mult siguran.
Acestea fiind zise, putem enuna o regul foarte important n cazul memoriilor:
toate memoriile de aceeai capacitate, ce ruleaz la aceleai latene i dein acelai
numr de bank-uri (sunt ori single-sided, ori double-sided), vor obine
performane identice n toate testele.
Testele realizate au vizat comportamentul diferitelor setri, instrumentele de
lucru fiind o plac de baz DFI UT LanParty Ultra-D, un procesor Opteron 146 (2 GHz,
frecven real setat: 200.9 MHz), o plac grafic Gigabyte GV-RX85X256V-B
(Radeon X850 XT PE) cu Catalyst 5.11 instalat. Memoriile au format un kit dualchannel de 1 GB i au rulat n DDR400, modulele fiind double-sided.
Setarea de baz a fost CL2 2-2-5 1T, iar celelalte latene au fost reduse la minim,
cu excepia celor suportate neoficiale i considerate neuzuale. Astfel, tRC a luat
valoarea 7, tRFC 9, tRRD 2, tWR 2, tWTR i tRWT 1. Ultimele trei teste au constat n
reducerea multiplicatorului procesorului la 9, rezultnd o frecven de aproximativ 1800
MHz (n timp ce memoria a rmas constant), precum i n scderea frecvenei
memoriei la 166 i respectiv 133 MHz (procesorul a rmas constant). n final, am ales
cteva combinaii uzuale ale latenelor, pentru a releva impactul asupra performanei
generat de creterea simultan a acestora.
S-a folosit att un demo personalizat pentru Quake 3, care a stresat puternic
procesorul i memoria, precum i mai puin cunoscutul program de benchmark
RealStorm Bench 20041, ce randeaz scene 3D folosindu-se exclusiv de puterea
procesorului.

http://www.realstorm.com/
75

Evaluarea performanelor sistemelor de calcul

76

Cap 4: Evaluarea memoriilor

77

Evaluarea performanelor sistemelor de calcul

4.2.2. Concluzii
Din rezultatele obinute mai sus putem trage cteva concluzii, cu meniunea c
acestea ar putea diferi n cazul folosirii altei platforme (alt plac de baz, eventual
chipset diferit).
tCL = 2.5 afecteaz relativ puin performana; n schimb, setarea la 3 o reduce
simitor.
tRCD = 3 este cauza unei scderi semnificative de vitez, iar tRCD = 4
depete cu puin ca importan tCL = 3.
tRP = 3 sau 4 este o setare ce are un impact minor, dar neneglijabil.
Command Rate = 2T omoar dintr-un foc viteza, aducnd-o la nivelul lui
tRCD = 4.
tRAS are o importan total nesemnificativ; totui, este recomandat o valoare
egal cu suma dintre tCL, tRCD i 1.
Creterea lui tRC genereaz o scdere minor de performan, dar care nu merit
neglijat. Cele mai multe memorii suport valori mici, drept urmare ncercarea
merit fcut.
Importana lui tRFC este complet nesemnificativ, similar lui tRAS.
Doar setarea lui tRRD la 4 a limitat viteza, cu toate c extrem de puin.
tWR, tWTR i tRWT au avut o importan neglijabil, dar pot face diferena
ntr-un test de performan.
Micorarea cu 200 MHz a frecvenei procesorului a avut un impact mai
pronunat dect orice nsumare a setrilor.
Scderea frecvenei memoriei la 166 MHz a depit ca importan setarea
Command Rate = 1T, tRCD = 4 sau tCL = 3 ns, cu siguran, nu i suma
acestora.

4.3. Modul de testare


Memoriile DDR testate au venit ori n kit-uri de 1 GB, ori separat, n module de
cte 512 MB. Diferene practic nu exist (dect, cel mult, legate de pre), orice modul
modern este capabil s ruleze n mod dual-channel fr probleme.
Ca platform de testare, sa folosit un procesor Opteron 146 (nume de cod
Venus sau San Diego - discutabil, 2 GHz, 0.09 microni) n format Socket 939. Chiar
dac numele de Opteron este asociat mai degrab serverelor, trebuie tiut c versiunile
pe Socket 939 au preuri foarte convenabile i sunt compatibile cu practic toate plcile
de baz recente. Performanele unui astfel de procesor sunt comparabile cu cele ale unui
Athlon 64 3500+, el dispunnd de frecvena lui 3200+ dar i de o cantitate dubl de
cache L2. Sa fcut aceast alegere ntruct sa dorit s fim limitai ct mai puin de
controller-ul de memorie, care la revizia Winchester era undeva n vecintatea stadiului
de catastrofal.
Placa de baz utilizat n primul rnd a fost un DFI UT LanParty Ultra-D cu
chipset nForce4 Ultra. Deasupra memoriilor am aezat un ventilator AeroCool X-Flow,
n general la turaie minim (2200 rpm), doar pentru determinarea frecvenei maxime
fiind folosit la maxim (3800 rpm, zgomot de Airbus).
Alternativ, sa folosit i o plac Abit AN8 SLi Fatal1ty, ce a edificat unele
probleme ntlnite pe DFI (i care s-au dovedit a fi legate de compatibilitate). BIOSurile au fost ultimele oficiale: N4D623-3 (23-06-2005), respectiv 18 (18-10-2005).
78

Cap 4: Evaluarea memoriilor

Avantajul plcii DFI const n stabilitatea mare la frecvene ridicate, exemplarul


testat urcnd pn la 320 MHz folosind BIOS-ul standard; probabil c, dac am fi recurs
la BIOS-uri speciale, am fi atins valori mai mari pentru anumite tipuri de memorii.
Setrile efectuate n BIOS au fost alese astfel nct frecvena procesorului s nu
fie mai mic dect cea implicit. La ce folos s folosim memoria la 320 MHz cnd
procesorul ruleaz la numai 1600 MHz? De asemenea, multiplicatorul HTT a fost astfel
ales nct produsul s nu fie mai mare dect valoarea implicit, de 1000 MHz.
S-au selectat patru praguri: 200, 250, 275 i 300 MHz, la care sa msurat
latenele minime principale: tCL, tRCD, tRP, asociate unor latene secundare alese
astfel nct ele s nu afecteze stabilitatea i folosind, de preferin, Command Rate 1T.
Timing-ul tRAS a fost ales n funcie de tRCD (nu i de tCL, pentru simplificare): 5
pentru tRCD = 2, 7 pentru tRCD = 3 i 8 pentru tRCD = 4.
n final, s-au urcat latenele la CL2.5/3 4-4-10 1T, precum i alte cteva timinguri secundare, obinnd astfel frecvena maxim la care memoriile ruleaz cu o
performan decent. Desigur, cu 7-7-15 2T am fi obinut frecvene mai mari, dar la o
lime de band prea mic.
Frecvene de peste 300 MHz au fost obinute aproape exclusiv pe platforma DFI.
Abit-ul a refuzat categoric orice frecven de peste 296 MHz la o pereche de module
normale (double-sided).
Revenind n detaliu la latene, pentru DDR400 am ales la tRC valoarea de 10,
pentru DDR500 11, pentru DDR550 i DDR600 12, iar pentru frecvena maxim, 14.
Chiar dac practic toate memoriile suport valoarea 7, am ales una standard i uzual.
tRFC a parcurs drumul 12-14-15-15-17, tRRD 2-2-2-2-4, tWR 2-2-2-2-3, tWTR
1-1-1-1-2, tRWT 3-3-3-4-4, iar tREF 3120-3120-3120-3120-2064. Placa Abit a avut
probleme cu tRWT, pe care l-a setat la 4 indiferent de dorina noastr.
Modelul de la DFI conine i alte cteva setri interesante, ele fiind reglate, pe
ct posibil, pe valoarea Auto. Nu le vom detalia aici, cu excepia celor legate de Drive
Strength, o opiune extrem de util dac dorim atingerea frecvenelor maxime. Practic,
este vorba de ajustarea amplitudinii semnalului dintre memorie i controller,
influenarea acesteia avnd consecine directe asupra stabilitii. Diferene aparent
minore, precum revizii diferite ale plcilor de baz, au o influen direct asupra
valorilor optime. De asemenea, tipul chip-urilor ce doteaz memoriile conteaz enorm;
aici cea mai bun soluie nu st n recomandri, ci n invitaia de a ncerca. Dureaz
cteva ore pentru a gsi optimul, iar satisfacia este garantat pentru pasionai.
Pentru a evalua stabilitatea am folosit versiunea 1.65 a popularului
Memtest86+2, cu care am rulat de trei ori testul #5, o dat #8 i cteva procente din #7
(din motive de timp) apoi o versiune pentru Windows3, unde ne-am limitat la 40%, cu
excepia frecvenei maxime, unde am parcurs ntreg testul. Nu afirmm c o asemenea
testare este suficient pentru a declara o memorie perfect stabil, dar a fost cel mai
bun compromis pe care l-am putut realiza.
Ultimul aspect discutat este tensiunea memoriei. Un voltaj crescut poate aduce
stabilitate sporit n overclocking, dar crete n acelai timp cldura degajat. Uneori,
dup o jumtate de or este necesar scderea lui pentru a atinge rezultatele optime,
chiar dac n primele minute o tensiune crescut pare a oferi mai mult stabilitate. i
aceasta indiferent ct de bun este rcirea.
2
3

http://www.memtest.org/
http://hcidesign.com/memtest/download.html
79

Evaluarea performanelor sistemelor de calcul

O regul empiric spune c dac memoria rspunde la voltaj (adic se


comport mai bine la o tensiune mrit) atunci l putem crete n continuare; condiia
este s avem o rcire bun. Totui, nu recomandm valori mai mari
de 3V dect n cazul celor care tiu cu adevrat ce fac.

4.4. Chip-uri de memorie


Pentru muli, o memorie se evideniaz (pe lng frecvene i
latene) prin productor. n general, afirmaia este fals, singurii
factori care conteaz cu adevrat sunt chip-urile (peste 90% din
importan) i PCB-ul. Acesta din urm a purtat, de obicei,
semntura cunoscutei companii BrainPower4, renumit pentru produsele sale de calitate.
n imaginea alturat avem cteva exemple de inscripionri, prin care un PCB poate fi
identificat ca BrainPower.
Dup cum spuneam, tipul chip-urilor din dotare determin ntreg
comportamentul unei memorii, abia diferena dintre produsele cu aceleai chip-uri fiind
fcut de elemente auxiliare, precum PCB-ul i eventual radiatoarele ce acoper
memoria.
Exist puine modele populare de chip-uri, ele fiind descrise n continuare. Ne
vom referi doar la situaia n care folosim dou module de 512 MB, situaia fiind
diferit pentru 256 MB sau 1 GB deoarece o cantitate mai mare de memorie streseaz
mai mult controller-ul, rezultnd frecvene maxime mai reduse; desigur, i reciproca
este adevrat, recordurile fiind obinute ntotdeauna cu 2 x 256 MB.
Foarte frecvent este procesul de remarcare a chip-urilor, acestea avnd
inscripionat productorul modulului, i nu fabricantul real al integratelor. Cumprtorul
este astfel derutat, chiar dac memoriile nu sunt acoperite cu radiatoare.
Samsung TCCD reprezint, probabil, cele mai bune
chip-uri DDR. Ele sunt depite pe alocuri n materie de latene,
dar sunt singurele care depesc considerabil frecvena de 300
MHz (DDR600). Timing-urile la care lucreaz stabil sunt CL2
2-2-x sau 2-3-x pentru DDR400, CL2 sau CL2.5 3-3-7 pentru
DDR500, CL2.5 3-3-x, pn la CL2.5 4-4-x pentru DDR550 i
CL2.5 4-3-x sau 4-4-x pentru DDR600. Ele rspund la un voltaj
de pn la 2.8V, ns uneori pot urca pn la 3V (rareori mai
mult) cu un impact mic asupra frecvenelor maxime. Cele mai multe rezist la cel puin
310 MHz i se pare c nu agreeaz setarea CL3, cu care pot genera erori la frecvene
mari.
Dezavantaj: pre ridicat.
Winbond UTT au fost memorii excepionale n trecut, mai ales n
versiunea BH5; cu timpul, popularitatea lor a sczut. Avantajul lor st n faptul c nu
sunt afectate aproape deloc de latene, majoritatea oferind cel puin 240 MHz cu CL2 22-x (spre deosebire de TCCD-uri, care se opresc la 215 - 225 MHz). Alt caracteristic
a Winbond-urilor, n general, este tensiunea mare la care rspund, ce poate urca pn la
4V! Puine plci de baz permit aa ceva, mai ales c un TCCD la 4V s-ar evapora
instantaneu.
Totui, unele UTT-uri creeaz probleme i la 3.2V. Pentru DDR400 CL2 2-2-x
sunt suficieni i 2.7V, situaie n care nu avem nevoie de rcire suplimentar.
4

http://brain-power.net/menus.php?name=Company&c_lang=english
80

Cap 4: Evaluarea memoriilor

Preul relativ redus este nc un atu al acestor chip-uri.


Micron 5B G ofer performane de invidiat, rulnd fr probleme la CL2 2-2-x
n DDR400, ntre CL2.5 2-2-x i CL3 3-2-x n DDR500 i n CL3 3-3-x mai sus, pn
n zona lui DDR600. Pe lng frecvenele ridicate atinse (totui, ceva mai reduse dect
la TCCD), avem i avantajul unor latene decente; practic, ele nu au nevoie de setarea 4
pentru tRCD i tRP, ns se simte afinitatea lor pentru CL3.
Ele rspund la tensiuni de circa 3V, dar au nevoie de rcire activ chiar i la
2.85V, n caz contrar riscnd supranclzirea, urmat de apariia erorilor.
Aceste chip-uri sunt ntlnite, n general, pe modulele provenite de la Crucial, o
divizie a companiei Micron Technology. Preul nu este tocmai redus, dar nici exagerat.
Micron 5B C nu se bucur de aceleai avantaje: ating n jur de 240 - 250 MHz
cu CL3 3-3-x, dar n DDR400 au un comportament bun: CL2.5 2-2-x. De asemenea, ele
rspund la voltaj, chiar i puin peste 3V.
Aceste chip-uri se gsesc pe memorii ieftine, la preuri convenabile.
ProMos 5B se comport foarte bine, atingnd frecvene apropiate de Micron 5B
G: 270 - 290 MHz cu CL3 4-3-x i CL2.5 3-3-x pentru frecvene
de 200 - 250 MHz.
Diverse tipuri de chip-uri Infineon pot fi ntlnite
ndeosebi pe memoriile DDR400 ieftine, ce suport de obicei
CL2 3-3-x sau 3-2-x, dar rareori ating 250 MHz. Nu obinuiesc
s rspund la un voltaj de peste 2.8V dect ocazional.
Numeroase memorii testate au manifestat un
comportament similar, rulnd cu CL2 3-3-x n DDR400, atingnd aproximativ 240 245 MHz i refuznd categoric CL3. Ele au avut chip-urile marcate n diverse moduri:
G.Skill, Kingmax, PQI, Princeton, Sycron etc. Bnuiala noastr se ndreapt ctre
Infineon B5. De asemenea, dou alte module au avut un comportament similar, dar au
avut o afinitate special pentru CL3, iar n DDR400 au rulat la CL2 3-2-x; de asemenea,
ele au avut probleme de compatibilitate cu placa de baz de la DFI, pe Abit simindu-se
n largul lor. Pe acestea le-am identificat ca Infineon CE-5.
Dei nu suntem siguri c Samsung TCC4 au stat la baza unui kit din test,
comportamentul este asemntor cu informaiile gsite pe Internet. Ele se pot luda cu
un comportament foarte slab, atingnd 210 - 225 MHz la latene CL3 3-3-x, iar n
DDR400 nu depesc CL2.5 3-3-x.
Afar de acestea, exist diverse chip-uri ale cror comportament nu l-am putut
testa. Printre ele se numr Hynix D43 i D5, ambele cu un comportament satisfctor:
260 - 290 MHz cu timing-uri CL3 4-4-x, respectiv CL2.5 4-4-x.
Samsung TCC5 i TCCC ofer performane total diferite; dac TCC5 sunt
versiuni puin slabe de TCCD, TCCC-urile ating 250 - 260 MHz cu CL3 4-4-x, iar la
200 MHz nu suport dect CL2.5 3-3-x.
Samsung UCCC pot fi ntlnite doar pe
module de 1 GB i ruleaz la 260 - 280 MHz cu
latene destul de relaxate.
4.4.1. A-Data Vitesta DDR500
Dei majoritatea modulelor ce poart
acest nume dein chip-uri Hynix, cele testate (ce
nu fac parte din vreun kit, fiind vndute separat)
sunt dotate cu Samsung TCCD. Surprinztor
81

Evaluarea performanelor sistemelor de calcul

este preul foarte redus pentru performanele oferite, performane similare celorlalte
memorii ce au n dotare aceleai chip-uri.
Modulele sunt acoperite cu radiatoare roii de aluminiu, iar PCB-ul este de
asemenea rou, fiind produs de BrainPower. Ele sunt certificate CL3 4-4-8 la 250 MHz
i CL2.5 4-4-7 la 200 MHz, cel puin dac privim SPD-ul. Se pare c latena CL3 este o
reminiscen de la implementrile cu Hynix, din moment ce chip-urile TCCD nu numai
c rareori sunt avantajate de aceasta, dar de obicei obin i performane mai slabe n
compania ei. Ce-i drept, nu la 250 MHz, unde nu exist probleme.
Testele au artat un comportament meritoriu. Am remarcat CL2 2-2-5 n
DDR400 (peste jumtate dintre TCCD-uri reuesc aceast setare), CL2 3-3-7 n
DDR500 (CL2 este chiar dificil de obinut), iar n frecven au urcat pn la 312 MHz, o
valoare mai degrab mediocr printre memoriile TCCD.
Concluzie
Performanele foarte bune, n prima jumtate a modulelor dotate cu chip-uri
TCCD, alturi de preul extraordinar de mic constituie avantaje indiscutabile ale acestui
produs. Totui, dac nu avei posibilitatea s verificai chip-urile din dotare (lucru
posibil doar prin testarea efectiv), s-ar putea ca memoriile de fa s nu v
mulumeasc dect parial.
+ performane excelente
+ pre foarte convenabil
+ radiatoare din aluminiu
- nu toate exemplarele se vor comporta la fel de bine
- latene prea relaxate nscrise n SPD
4.4.2. Corsair TWINX1024-3200C2PT rev 4.2
Revizia 4.2 a modelului 3200C2PT de la Corsair vine cu chip-uri TCCD, aezate
pe un PCB BrainPower. Iari avem de-a face
cu o memorie foarte ieftin, care i face toi
banii, cu toate c este certificat doar DDR400
CL2 (SPD-ul indic doar CL3 3-3-8).
Comportamentul
nu
a
fost
impresionant pentru un kit cu TCCD-uri, ci
impresionant n sine, dac ne raportm la pre.
Nu au fost probleme n DDR400 pentru CL2
2-2-5, dar DDR550 i DDR600 au fost obinute cu ceva efort, i doar la latene CL2.5 44-8 i respectiv CL3 4-4-8 din cauza tensiunii de alimentare mici pe care memoriile au
suportat-o. Practic, pentru CL2.5 n DDR600 avem nevoie de un minim de voltaj
crescut, ns C2PT-urile s-au plafonat la 2.7V, orice ncercare de a crete tensiunea
peste aceast valoare soldndu-se cu numeroase erori. Setarea CL3, chiar dac nu este
pe placul chip-urilor din dotare, dac totui poate fi prins, se mulumete cu o
tensiune mai mic. Dei nu putem garanta acest lucru, problema ar putea fi datorat
plcii de baz, care face mofturi cu anumite memorii la voltaje mari.
Frecvena maxim a fost de 314 MHz - nici bun, nici rea, dar foarte ridicat
dac ne uitm la zona de pre din care face parte kit-ul.
Concluzie
Per total, un produs foarte bun i ieftin, cu mici probleme pentru un entuziast
extrem, dar suficient de bun pentru a fi luat n calcul de ctre toate celelalte categorii
82

Cap 4: Evaluarea memoriilor

de utilizatori. Din pcate, aceast versiune se afl spre sfritul vieii, reviziile 5.x, ce
sunt mai uor de gsit, fiind considerabil mai slabe.
+ performane foarte bune
+ pre redus
+ radiatoare din aluminiu
- probleme la tensiune peste 2.7V
- nu ruleaz cu latene strnse la frecvene mari
- latene prea relaxate nscrise n SPD
4.4.3. Corsair TWINX1024-3200C2PT rev 5.2
Noua revizie de 3200C2PT se poate luda cu un comportament total diferit fa
de cea anterioar. Chip-urile din dotare sunt ProMos, probabil din seria 5B. Din pcate,
DFI LanParty a ntmpinat dificulti n combinaie cu acestea, maximul atins fiind de
doar 238 MHz, departe de potenialul kit-ului. Cu Abit AN8 nu au fost probleme - 286
MHz cu CL3 4-3-8, adic mai mult dect satisfctor. n schimb, setarea CL2 nu a fost
acceptat de Abit n DDR400, cu toate c pe DFI am atins CL2 3-3-7.
Latenele la 250 MHz au fost CL2.5 3-3-7, iar la 275 MHz CL3 4-3-8, adic la
mic distan de comportamentul TCCD-urilor; totui, nici nu s-a pus problema de
DDR600.
SPD-ul este... amuzant pentru o memorie al crei nume indic foarte clar CL2:
CL3 3-3-8 pentru DDR400, CL2.5 3-3-7 pentru DDR333 i CL2 2-2-6 pentru DDR266.
O particularitate a chip-urilor ProMos este legat de setarea tWTR (Write to
Read Delay), care nu este acceptat la valoarea 1 dect la frecvene reduse (n jur de 200
MHz), dei toate celelalte memorii nu au avut probleme de acest gen. Setarea afecteaz
foarte puin performana, deci nu este cazul s ne ngrijorm.
Ct despre tensiune, nu am obinut nimic n plus la peste 2.75V. La 2.8V au
aprut erori, semn c chip-urile ProMos nu sunt tocmai indicate supravoltrii.
Concluzie
Preul este corect, iar frecvenele atinse potrivite pentru o memorie de mijloc.
Sperm din partea productorilor de plci de baz - i n special din partea lui DFI - o
rezolvare ct mai rapid a problemelor de compatibilitate, ce pot ifona n mod incorect
imaginea acestui produs.
+ frecven maxim ridicat
+ radiatoare din aluminiu
- probleme serioase de compatibilitate cu DFI LanParty
- probleme minore de compatibilitate cu Abit AN8
4.4.4. Corsair TWINX1024-3200XLPT rev 1.2
Vrful de gam al celor de la Corsair, seria 3200XLPT, a strlucit din toate
punctele de vedere. Bazat pe clasicele chip-uri TCCD, modulele i-au ntrecut
concurenii n majoritatea testelor, atingnd CL2 3-3-7 n DDR500, CL2.5 3-3-7 n
DDR550 i CL2.5 4-3-7 n DDR600. Acest comportament flawless a fost completat
de frecvena maxim de 320 MHz (posibil mai mare, dac placa de baz ar fi permis,
am fi aflat), alturi de un rspuns la voltaj de pn la 3V!
De asemenea, frecvena de 226 MHz atins cu timing-urile CL2 2-2-5 a fost mai
ridicat dect concurentul direct, G.Skill Extreme Performance FF, motiv pentru care
putem declara acest kit ca fiind cel mai bun produs bazat pe chip-uri TCCD. E drept,
83

Evaluarea performanelor sistemelor de calcul

orice memorie cu Winbond UTT va rula n CL2 2-2-5 la frecvene mai mari, dar de la
nite TCCD-uri nu se poate cere mai mult dect ofer 3200XLPT.
SPD-ul este nscris corect, iar preul mare, dar corespunztor calitii produsului.
Concluzii
Cine este n cutarea celor mai bune memorii cu chip-uri TCCD (practic, a celor
mai potente memorii n materie de frecven), s-ar putea s fi gsit alegerea ideal.
+ performane maxime pentru TCCD
+ rspuns n voltaj pn la 3V
+ radiatoare din aluminiu
- pre ridicat, dei perfect justificat
4.4.5. Corsair TWINX1024-3200C2PRO rev 4.1
Interesante ca aspect, excelente din punct de vedere al performanei, kit-ul
3200C2PRO se deosebete de celelalte prin prezena LED-urilor ce indic activitatea.
Practic, atunci cnd memoriile sunt folosite intens, aceste lumini umplu memoria,
crend un efect vizual deosebit.
De asemenea, design-ul modulelor este
ieit din comun, ele fiind ceva mai nalte dect
memoriile obinuite, i aici ar putea mici
probleme la montarea pe anumite plci de
baz, n cazul n care cooler-ele se bazeaz pe
o nlime standard a modulelor de memorie.
Pe
lng
aceste
considerente,
performanele au fost foarte bune, kit-ul avnd
la baz aceleai chip-uri TCCD. SPD-ul indic
un obositor CL3 3-3-8, ns nu au fost probleme pentru rularea cu CL2 2-2-5 n
DDR400. n rest, nu au am observat diferene fa de alte memorii de acelai tip, poate
cu excepia frecvenei de 318 MHz, foarte apropiat de maximul posibil.
Mici probleme de sensibilitate la tensiune au aprut, dar ele nu au fost nici pe
departe att de grave ca n alte cazuri.
Concluzie
Kit-ul 3200C2PRO primete nota 10 la capitolul design, n rest rezultatele fiind
excelente pentru orice utilizator. Dac studiem i preul, observm c el nu este foarte
ridicat.
+ performane foarte ridicate
+ LED-uri de activitate, design atrgtor
+ radiatoare din aluminiu
- latene prea relaxate nscrise n SPD
4.4.6. Corsair TWINX1024-4400C25PT rev 1.1
nc un Corsair cu TCCD, nimic spectaculos - s-ar zice. Dei aa este, n mare
parte, observm faptul c aceste module sunt certificate pentru a rula n DDR550 CL2.5
4-4-8. Aadar, cei neinteresai de aspecte precum chip-uri din dotare sau revizii, vor
putea achiziiona fr grij 4400C25PT pentru a le tacta garantat la 275 MHz. Latenele
specificate sunt mai relaxate dect cele atinse de noi, la frecvena nominal obinnd
CL2.5 3-3-7.
Probleme cu voltajul mare au existat, dar ele s-au manifestat doar la frecvene
ridicate. Maximul atins a fost de 316 MHz, o valoare bun.
84

Cap 4: Evaluarea memoriilor

SPD-ul nu a concordat cu rezultatele obinute, fiind indicat doar frecvena de


200 MHz pentru latenele CL2.5 4-4-8. n schimb, noi am atins CL2 2-2-5.
Ce putem reproa acestui kit este preul, puin mai ridicat dect cel al kit-ului
3200XLPT, ceea ce ni s-a prut nejustificat. XLPT-urile ofer alte cteva avantaje
(minore, ce-i drept, i care ar putea depinde de la exemplar la exemplar), dar e puin
probabil s existe cndva module XLPT care s nu suporte 250 MHz cu CL2.5 4-4-8,
motiv pentru care dintre cele dou produse recomandm categoric kit-ul 3200XLPT.
Concluzie
Dei sunt module de mare performan, apropiindu-se de maximul pe care l-am
putut obine n materie de frecven, preul - dei nu exagerat - este mai ridicat dect cel
al altor produse similare, posibil mai bune.
+ performane foarte ridicate
+ radiatoare din aluminiu
- mici probleme la creterea tensiunii
- valori relaxate nscrise n SPD

4.5. Concluzii
Am parcurs mpreun treizeci de perechi de memorii ce poart marca unora
dintre cele mai cunoscute companii ale domeniului. Dintre toate, s-au remarcat
modulele cu chip-uri Samsung TCCD i ndeosebi Corsair TWINX1024-3200XLPT
rev 1.2 i G.Skill Extreme Performance F1-4800DSU2-1GBFF, care au obinut
performane maxime. Remarcabil a fost i prestaia modulelor A-Data Vitesta
DDR500, ce ofer performane apropiate la un pre extrem de mic, ns nu putem ti ce
se ascunde n spatele radiatoarelor: Samsung TCCD sau Hynix.
Trei produse au oferit funcii suplimentare de afiare. Dou dintre ele - Corsair
TWINX1024-3200C2PRO rev 4.1 i Crucial Ballistix Tracer PC4000 posed LEDuri pentru indicarea activitii, iar Corsair Xpert TWINXP1024-3200XL rev 1.2
deine suplimentar un senzor pentru monitorizarea temperaturii i alte cteva funcii
interesante. n plus, toate trei s-au comportat bine, ceea ce este normal - funciile
suplimentare nu sunt implementate dect pe modelele high-end.
n gama ieftin am avut numeroase produse ce purtau diverse brand-uri. Dintre
ele s-au remarcat Corsair VS1GBKIT400 cu chip-uri ProMos, precum i G.Skill
Normal Series F1-3200PHU2-1GBNT cu Infineon. Din pcate, compatibilitatea chipurilor ProMos cu platforma DFI a lsat de dorit, motiv pentru care am premiat modelul
de la G.Skill, mai slab dar mai compatibil.
Odat cu apariia Socket AM2, memoriile DDR vor fi date uitrii, locul lor
urmnd s fie luat de DDR2 - standardul care domin n prezent piaa Intel. Totui, pn
atunci mai e vreme lung, impunerea total a lui DDR2 urmnd s survin dup mai
muli ani. Aadar, nu ncercai s realizai un upgrade forat doar de dragul de a folosi o
tehnologie de viitor! V asigurm c platforma DDR merit nc toat atenia.

85

5. Evaluarea plcilor grafice


5.1. Introducere
Se spune c pentru a juca ultimele apariii n domeniu e nevoie de o plac grafic
de ultim or. n general, afirmaia este fals: preul pltit pe aceast component nu
trebuie s fie ct cel al unui ntreg sistem pentru a se obine performana dorit. Dac
banii nu reprezint deloc o problem, se gsesc plci cu rcire cu ap la preuri de
ordinul a 1000 de euro, cu potenial mare de overclocking i, n jocurile obinuite, cu
circa 50% mai rapide dect o plac ce cost de cinci ori mai puin. Iar acei 50% se
traduc prin posibilitatea de a (nu) juca n rezoluii mai mari i/sau cu nivelul de detalii
foarte ridicate. Nimic mai mult. n plus, trecerea este, de obicei, insesizabil, ochiul
uman se poate adapta foarte uor la o calitate cu puin mai sczut, iar adevraii gameri
nu se uit la detaliile graficii. Ei pur i simplu joac. Campionii shooter-elor se folosesc
de rezoluii mici (uneori 640x480) i de un nivel minim de detalii, motivul fiind
obinerea numrului maxim de fps.
Desigur, majoritatea utilizatorilor au jocurile ca pasiune, fie ea mai mare sau mai
mic i, n consecin, vor opta pentru rezoluii ntre 1024x768 i 1280x1024, cu
detaliile la (sau spre) maxim, dar fr nivele exagerate de anizotropie1 i anti-aliasing.
Cum plcile de baz cu suport pentru bus-ul PCI Express sunt din ce n ce mai populare,
achiziionarea unei plci grafice pe AGP nu este recomandat dect celor care tiu c
vor rmne la actuala platform cel puin un an de acum nainte. Astfel, am studiat piaa
romneasc i am ajuns la concluzia c plcile grafice care satisfac cel mai mult nevoile
unui juctor normal (nu ocazional sau profesionist, dar nici maniac al imaginilor de
cristal) sunt cele bazate pe chip-ul GeForce 6600 GT.
S vedem ce nseamn GeForce 6600 GT. Seria GeForce 6 de la NVIDIA se
compune din trei familii: GeForce 6800, 6600 i 6200. Din punct de vedere al
performanei, diferenele depind, n principal, de trei factori: frecvenele (dou - una
pentru chip i una pentru memorie), numrul de pipeline-uri (tot dou - unul de pixel,
cellalt de vertex) i lrgimea bus-ului memoriei. GeForce 6600 GT deine opt pipelineuri de pixel (fa de 8, 12 sau 16 la seria 6800, dar 4 la 6200) i trei de vertex (4, 5 sau 6
la 6800 i tot attea ct are 6200). Bus-ul memoriei este de 128 de bii, la jumtate fa
de 6800, n timp ce, la unele modele de GeForce 6200, el este de 64 sau chiar 32 de bii
(dar, pe de alt parte, 6200 nzestrat cu tehnologia TurboCache care poate folosi
memoria sistemului ca memorie video).
Cel mai interesant aspect este legat de frecvene. Versiunea GeForce 6600
simplu nu ofer dect 300 MHz pentru core, valoarea fiind apropiat de cea a
suratelor pe 256 de bii (GeForce 6800), ns 6600 GT deine 500 MHz, mai mult dect
orice model de 6800. Cauza st n procesul de fabricaie: 0.11 fa de 0.13 microni,
existnd astfel posibilitatea atingerii de frecvene mai mari. Tactul memoriei este de 550
MHz la 6600 i de 1000 MHz (sau 900 la versiunea pe AGP) n cazul lui 6600 GT. i
tipul ei difer: GDDR n prima situaie, GDDR3 n cea de-a doua (practic, GDDR3 este
un DDR2 optimizat pentru operaii grafice, performana sa fiind similar cu cea a unui
1

Proprietate a unei substane de a prezenta caracteristici fizice variate n funcie de direcia de msurare i
de observare (definiie DEX).
86

Cap 5: Evaluarea plcilor grafice

GDDR tactat la aceeai frecven - ns GDDR-ul nu are nici o ans de a atinge 1


GHz).
Trgnd linie, observm cteva avantaje de partea lui 6600 GT n comparaie cu
seria 6800. S lum ca exemplu GeForce 6800 simplu, cel mai lent din serie
(excluznd neserioasa variant LE). Plcile ce l ncorporeaz beneficiaz de memorie
tactat la 700 MHz, n timp ce chip-ul ruleaz la 325 MHz. Aadar, cu 175 MHz mai
puin la core i cu 300 MHz mai puin la memorie. Dac inem cont de faptul c
lrgimea bus-ului memoriei este dubl la 6800, obinem o lime de band echivalent
cu cea a unei frecvene de 1400 MHz pe 128 de bii
(256-bit @ 700 MHz <=> 128-bit @ 1400 MHz).
Aadar, avem i un avantaj, i un dezavantaj. Dar dac
adugm nc patru pipeline-uri de pixel, obinem
justificarea pentru care GeForce 6800 cost cu circa 50% mai mult dect un 6600 GT:
performane cu 2050% mai mari, n funcie de rezoluie i setri, dintre care un procent
de 2025% este datorat exclusiv pipeline-urilor suplimentare.
Privind facilitile, familia GeForce 6 ofer aceleai funcii de baz, printre care
se numr ceea ce NVIDIA numete CineFX 3.0 (Pixel i Vertex Shader 3.0, fa de 2.0
la generaia a cincea a lui GeForce) i IntelliSample 3.0 (Full-Scene Anti-Aliasing i
Anisotropic Filtering cu performane superioare celor ntlnite la IntelliSample 2.0, ce
nzestra seria GeForce FX). Dei relativ neinteresante, enumerm i alte funcii
prezente: accelerare hardware MPEG-2 (DVD, HDTV) i Windows Media 9, i dou
RAMDAC-uri integrate - ce ruleaz la 400 MHz i ofer posibilitatea prezenei a dou
ieiri video, dintre care una de tip digital (DVI); rezoluia maxim este de 2048x1536 la
85 Hz.
Toate plcile din test au dispus de dou ieiri, dintre care cel puin una de tip
DVI (destinat anumitor modele de monitoare LCD). Unele plci au oferit, prin
intermediul unui chip extern (produs de Philips), dou ieiri digitale. Desigur, n
cazurile n care ieirea normal (D-Sub) era absent, era livrat i un adaptor pentru ca
placa s poat fi folosit n combinaie cu monitoarele clasice. De asemenea, intrrile
Video-In i Composite-In au fost prezente la anumite produse, ele fiind declarate VIVO,
dar i preul a crescut n consecin.
Un ultim aspect discutat aici este legat de dimensiunea memoriei. Unii
productori nu realizeaz sau nu vor s realizeze faptul c 256 MB de memorie la un
6600 GT este frecie la picior de lemn. Sporul de vitez este foarte redus, rare fiind
cazurile n care performana crete cu mai mult de 5% i foarte multe cele n care ea nu
crete deloc. Cei 128 MB suplimentari nu ar fi o problem dac preul nu ar fi urcat de
acest aspect; cu alte cuvinte, pentru 5% de performan n 1% din cazuri se pot plti n
plus cteva zeci de dolari.

5.2. Frecvene i latene


5.2.1. Frecvene
NVIDIA specific pentru chip-ul GeForce 6600 GT frecvene de 500 MHz
pentru nucleu i de 1 GHz pentru memorie. Aceasta nu nseamn c ele sunt btute n
cuie, diveri productori vnznd plci cu frecvenele mrite. Se cheam overclocking
din punct de vedere al chip-ului, nu i din punct de vedere al plcii. Altfel spus,
NVIDIA nu garanteaz funcionarea n acei parametri, fabricantul ns da. i acesta din
urm este cel care acord garania.
87

Evaluarea performanelor sistemelor de calcul

Deseori, creterea frecvenelor este nsoit de creterea preului i de ataarea


unui sufix denumirii produsului. Astfel, Gainward i-a denumit versiunea overclock-at
GLH (Goes Like Hell), iar Leadtek Extreme Edition. Uneori, ele reprezint modele
selecionate, alteori doar plci comune cu tactul crescut.
Frecvenele pot fi ajustate n continuare de ctre utilizator prin intermediul
aplicaiilor specializate sau chiar din drivere, operaiune descris n seminar. Sa preferat
utilitarul RivaTuner2 i am considerat ca frecvene maxime valorile la care nici
ATITool3 (pe durata unui minut i jumtate, dup ce placa a fost nclzit n prealabil) i
nici jocurile/benchmark-urile rulate nu au generat artefacte4 vizibile. Prin aceasta
nelegem artefacte care pot fi detectate de o persoan experimentat, ce are privirea
aintit asupra monitorului pe toat durata testului.
Pentru nceput, s-a efectuat o filtrare preliminar cu ajutorul lui ATITool. Dup
experimente repetate sa ajuns la concluzia c testul din jocul FarCry este extrem de
solicitant pentru GPU, fiind prima aplicaie care genereaz anomalii vizuale, chiar i
atunci cnd toate celelalte teste ruleaz fr probleme. Mai exact, apa din deprtare
(unde Pixel Shader-ul lucreaz din plin) prezint unele dreptunghiuri n plus.
Frecvena maxim a memoriei video obinut cu ATITool a fost ntotdeauna cea
corect. Dac ATITool nu genereaz artefacte, nici celelalte teste nu o vor face, sau sunt
anse foarte mici s o fac. V putem asigura c testele de overclocking au fost realizate
n condiiile precizate mai sus, testarea nefiind exhaustiv dar nici superficial.
Temperatura ambiant din timpul testelor a fost de aproximativ 25-28 de grade Celsius.
Pe lng frecvene, un factor care influeneaz n mai mic msur viteza este
reprezentat de latene. S vedem ce nseamn acestea.
5.2.2. Latene
Memoria DRAM are nite principii de funcionare bine definite. Informaia nu
este citit/scris pur i simplu, ca i cum un om ar citi o carte sau ar scrie un text pe o
foaie de hrtie. Exist anumii timpi de ateptare ntre diversele operaii pe care
memoria va trebui s-i respecte, indiferent dac etapa anterioar a fost sau nu
completat. S presupunem c pe tot traseul Bucureti - Ploieti - Braov - Cluj-Napoca
- Oradea se afl cte o persoan care va porni ctre oraul urmtor la ore prestabilite
pentru a-i nmna celeilalte o scrisoare, ntocmai ca o tafet. Exist, ns, o diferen
important fa de tafeta clasic: indiferent cnd sosete omul cu scrisoarea, cel care
preia tafeta va trebui s plece la ora indicat. Dac omul din Ploieti ajunge n Braov
la ora 8:01, iar indicaiile spun c omul din Braov trebuie s plece mai departe la 8 fix,
atunci scrisoarea va fi pierdut i ntreg lanul se va distruge. Invers, dac omul din
Ploieti ajunge la Braov la ora 7:59, minutul diferen este un timp mort, dar tafeta
este predat.
La fel funcioneaz i memoria. Dac etapa X nu este ndeplinit n timpul
predefinit (msurabil n cicluri de tact), informaia pe care etapa Y trebuie s o preia va
fi distrus. n cazul memoriei sistemului, un singur bit omis va compromite, cel mai
probabil, stabilitatea sistemului, aprnd ecrane albastre sau resetri. n cazul memoriei
plcii grafice, problema se va manifesta prin apariia artefactelor. Cum ciclurile de tact
2

http://www.guru3d.com/index.php?page=rivatuner
http://www.techpowerup.com/downloads/Tweaking/ATITool
4
artefacte = Imagine fals aprut n preparatele histologice produs artificial sau datorit unor defecte de
fixare ori de colorare. 2. (Cib.) Semnal parazit supus unei informaii, n semnificaia creia joac un rol
nul sau negativ.
88
3

Cap 5: Evaluarea plcilor grafice

sunt mai lungi la frecvene mai mici (frecvena nsi reprezint numrul de cicluri de
tact ce au loc ntr-o secund, deci 1 GHz nseamn un miliard de cicluri pe secund),
este evident faptul c latene mai mari nseamn anse mai mari de preluare corect a
tafetei, i deci de o imagine clar, fr probleme.
Optimizarea latenelor memoriei nseamn reducerea la minim a acelor timpi
mori. n cazul ideal, exact n momentul n care operaia X este completat, operaia Y
i ncepe activitatea. Practic, productorii las o marj de eroare, introducnd aceti
timpi suplimentari tocmai pentru c plcile difer de la exemplar la exemplar i este
posibil ca o memorie s fie mai sprinten dect alta din cauze de natur electric; prin
setarea acelorai latene, toate memoriile vor avea aceeai performan, indiferent de
viteza lor intern. ns prin intervenia utilizatorului, latenele pot fi reduse la minimul
acceptabil, la fel cum frecvenele pot fi crescute (prin overclocking) la maximul posibil.
Reglarea latenelor unei plci grafice nu este o operaie
att de facil ca n cazul setrii memoriei sistemului. Aici nu
exist un BIOS Setup, n care se intr cu tasta Del i se seteaz
tot ce se poate seta. Aici avem doar mijloace rudimentare,
precum editorul de BIOS NiBiTor i utilitarul de setare a
latenelor nTimings. n lipsa unei documentaii oficiale n acest
sens, programele de acest tip sunt realizate empiric de ctre amatori, avnd numeroase
necunoscute. Totui, este foarte probabil s ne putem face treaba cu ele. Astfel,
nTimings poate seta latenele n timp real i astfel putem evalua stabilitatea imediat,
folosind funcia de detecie a artefactelor din ATITool. Dup ce am stabilit aceste
latene, este bine s rulm cteva jocuri sau teste 3D (precum 3DMark), pentru a
verifica suplimentar stabilitatea memoriei, mai exact lipsa artefactelor. Rezultatul final?
Performana va crete cu cteva procente preioase.
Dac utilitarul RivaTuner este instalat n directorul C:Program
Files&$92;RivaTuner (i nu altundeva!), prin acionarea butonului Show GPU registers
vom vizualiza latenele curente. Avem trei rubrici, fiecare coninnd opt numere. Pentru
toate plcile testate (i dotate cu memorii GDDR Samsung de 1.6 sau 2 ns), latenele
implicite au fost 060F1B15 - 09010509 - 20250407. Pentru a nu intra n detalii,
ncercai mai nti s reducei latena 6 din primul grup la 5 sau chiar 4 (conteaz mult la
performan); 0F poate fi adus fr probleme la 00, iar ultimele dou, 1B i 15, ar putea
fi reduse la 13 cu 10, eventual chiar mai puin (toate cele trei setri afecteaz extrem de
puin performana). Din grupul al doilea, numrul 1 poate fi redus la 0, iar prima apariie
a lui 9 poate fi sczut (cu mari riscuri de artefacte) la 8. Din ultima categorie, 202
poate fi transformat sigur n 000 (dei latenele sunt complet nedocumentate i nu par s
afecteze viteza n vreun fel), iar 5, 4 i 7 ar putea fi aduse la 4, 3 i respectiv 6 (cu
meniunea c acel 7 transformat n 6 afecteaz mult performana, dar setarea sa este
dificil). ncercai s editai cifrele direct pentru c programul este foarte primitiv i
deine un bug la acionarea butoanelor.
Latenele ideale le putei descoperi singuri. Pentru alte plci dect cele cu
memorii de acest tip, este foarte probabil ca latenele s fie altele i placa s se comporte
diferit la scderea lor.
Dac ai obinut o configuraie a latenelor, este necesar rescrierea BIOS-ului
plcii grafice pentru ca setrile s devin permanente. Operaia este lipsit de riscuri
(dureaz 10-15 secunde i, afar de cazul n care curentul se ntrerupe n acel moment,
nu avei de ce s v temei). Va trebui s creai o dischet de boot, mpreun cu utilitarul
89

Evaluarea performanelor sistemelor de calcul

nvflash5 (NVIDIA Firmware Update Utility), urmnd a executa de pe dischet comanda


nvflash --save bios.rom, crendu-se astfel un fiier care va conine BIOS-ul original al
plcii. Copiai fiierul pe hard disk sau chiar pe un CD (o dischet se poate defecta
foarte uor) - el este vital pentru revenirea la situaia iniial n caz de nevoie. Boot-ai
apoi n Windows i deschidei fiierul cu NiBiTor. n tab-ul Timings, vei cuta latenele
originale (060F...), n cazul nostru fiind gsite la categoria Timingset 7. Reglai-le dup
cum dorii, salvai fiierul (s zicem bios_nou.rom) napoi pe dischet i boot-ai de pe
ea, urmnd s rescriei BIOS-ul dnd comanda nvflash bios_nou.rom. Dac programul
refuz scrierea, ncercai comanda nvflash -4 -5 -6 bios_nou.rom.
Tot cu NiBiTor se poate regla frecvenele de funcionare. Ele pot fi setate i din
drivere sau din RivaTuner (cu aplicare direct la pornirea sistemului de operare), ns
dac le scriei n BIOS, ele devin permanente i independente de software. Cum orice
plac din generaia GeForce FX sau GeForce 6 deine dou frecvene de funcionare,
una pentru modul 2D i alta pentru cel 3D, valorile care intereseaz sunt ultimele, deci
alegei opiunea corect.
Nu uitai, la frecvene mai mari se pot seta latene mai puin mici, aadar mai
nti stabilii frecvena maxim de overclocking i abia apoi trecei la capitolul latene.
Dac vei considera c dup overclocking placa este prea fierbinte, umblai doar la
frecvene, pentru c reducerea latenelor nu afecteaz n nici un fel temperatura plcii.
Observaie: anumite plci dein BIOS-uri incompatibile cu NiBiTor - cel puin
cu versiunea 2.1. Cauza este aceeai lips de documentaie, utilitarul fiind creat prin
metode empirice. Astfel, una dintre plcile testate a avut nscrise frecvenele de 65536 i
255 MHz. Nu ncercai s modificai aceste valori pentru c
riscai s defectai BIOS-ul.
Rescrierea unui BIOS scris greit se face simplu dac
avei o plac grafic PCI la ndemn: setai n BIOS-ul plcii
de baz ca pornirea s se fac utiliznd placa PCI (opiunea va
fi Init Display First sau ceva asemntor). Apoi inserai n
sistem ambele plci (cea PCI Express i cea PCI) i boot-ai de
pe discheta cu utilitarul de scriere a BIOS-ului. Acum putei
urma metoda clasic; programul nvflash va detecta faptul c n
sistem se afl i o plac PCI Express (cu BIOS defect) i i va
rescrie corect BIOS-ul.
Dac ai lucrat corect i curat, nu vei avea probleme.
nainte de a vinde sau a returna placa la magazin (n cazul defectrii), este bine s-i
rescriei BIOS-ul cu cel original. Cu toate acestea, XF nu poate fi fcut rspunztor
pentru defectarea sau pierderea garaniei unei componentei hardware cauzat de
urmarea sfaturilor incluse n acest curs. Dac nu avei cunotinele necesare efecturii
acestor modificri sensibile, considerai aceast seciune a cursului pur informativ.
Toate plcile au fost testate att n condiii normale (frecvene i latene
implicite), ct i dup ce s-a crescut frecvenele la maxim i respectiv s-a sczut
latenele la minim.
Sistemul de test a fost constituit dintr-un procesor Athlon 64 3200+ Winchester,
o plac de baz Abit AN8 (nForce4), memoriile Corsair TwinX1024-4400C25PT fiind
setate n CL2 2-2-5 1T; software folosit: Windows XP SP2, ForceWare 71.84.

http://www.xf.ro/downloads/nvflas.rar
90

6. Evaluarea hard discurilor


6.1. Introducere
Hard discul sau discul dur este un dispozitiv non-volatil pentru stocarea
datelor. Stocarea se face pe o suprafa magnetic dispus sub forma unor platane. n
general sunt utilizate ca suport de stocare extern principal pentru calculatoare personale,
dar i pentru anumite aparate electronice (DVD Playere, MP3 playere). Dac la
nceputuri capacitatea unui hard disc nu depea 20 MO, astzi, un hard disc obinuit
poate depi 500 GO.

Fig. 5.1: Hard Disc Seagate Barracuda ATA

Fig. 5.2: Seciune transversal prin suprafaa magnetic n lucru. n acest caz datele binare sunt
codate folosind modulaia n frecven.

6.2. Structur i funcionare


Un hard disc este format din:
o plac de control logic;
un numr de platane (de obicei 2 sau 3), mprite n piste, cilindrii i sectoare;
capete magnetice de o parte i de alta a platanelor legate printr-un bra metalic;
un sistem electro-mecanic de blocare a capetelor pe pista de stop (landing-zone);
un motor electric pas-cu-pas.
Fiecare platan (disc) are doua fee i este divizat ntr-un numr de piste, fiecare
pist fiind divizat n sectoare. Platanele sunt astfel aranjate nct pista 0 de la platanul 1
91

Evaluarea performanelor sistemelor de calcul

s fie exact deasupra pistei 0 de la platanul 2. Pentru a accesa o pist oarecare pe unul
din platane, braul care susine capetele va muta capetele spre acea pist. Deoarece
aceast metod necesit doar un singur mecanism de poziionare, simplific design-ul i
coboar preul. Totui, pentru aceasta trebuiesc mutate toate capetele pentru a accesa o
singur pist. Deci, pentru a citi date de pe pista 1 de pe platanul 1, apoi pista 50 pe
platanul 3 si apoi iar pe pista 1 de pe primul platan, ntregul bra cu capete trebuie mutat
de doua ori. Pentru a muta un bra ca acesta trebuie un timp semnificativ comparativ cu
timpul de transfer. Pentru a minimiza acest lucru, trebuie prevenit ca datele sa fie
mprtiate pe mai multe piste. O metod de a optimiza timpul de acces este ca un grup
de date care sunt accesate secvenial s fie scrise pe o singur pist. Dac datele nu
ncap pe aceeasi pist, atunci este optim s fie scrise pe aceeai pist, dar pe un platan
diferit. Prin aceast metod, braul nu mai trebuie s execute micri. Doar capul de
citire i scriere cel mai apropiat trebuie s fie selectat pentru a efectua operaia de citire.
Selectarea capetelor este mult mai rapid dect micarea fizic a braului care susine
capetele pentru a schimba pistele. Se mai folosete termenul de cilindru pentru a descrie
multiplele platane suprapuse. Un cilindru se refer la toate pistele care au acelai numr
de pist, dar care sunt localizate pe diferite platane.
6.2.1. Transferul datelor la memorie
Modalitatea n care datele sunt transferate n memorie determin viteza efectiv
a combinaiei controler - hard disc. Sunt folosite patru metode:
Programmed I/O - Cu aceasta metod, porturile controlerului au grij att de
comenzile drive-ului ct i de transferul de date ntre controler i memorie. Se
folosesc comenzile IN i OUT ale limbajului de asamblare. Aceasta nseamn c
fiecare octet este transferat prin intermediul procesorului. Aici, viteza datelor va
fi limitat la cea a bus-ului PC i la performana procesorului.
Memory Mapped I/O - Procesorul poate procesa datele provenite dintr-un
controler de disc mult mai repede dac sunt stocate ntr-o regiune fix de
memorie. Segmentul localizat deasupra memoriei video RAM este folosit n
general cu acest scop. Datele sunt transferate cu ajutorul instruciunii de transfer
(mov n cazul arhitecturii x86). Este mai rapid dect metoda precedent.
DMA - Folosind DMA (Direct Memeory Access), un dispozitiv poate transfera
datele direct n memorie. Procesorul nu particip la acest transfer. Pentru a folosi
DMA, un program trebuie s i precizeze controlerului DMA mrimea n bytes a
pachetului de date ce urmeaz a fi transferat dintr-o locaie ntr-alta. Totui,
controlerul DMA ntr-un PC este inflexibil i lent. Controlerele DMA opereaz
la 4 MHz, n concluzie sunt extrem de lente.
Busmaster DMA - Folosind aceast metod, controlerul hard-discului
deconecteaz procesorul de la bus i transfer datele n memorie singur.
6.2.2. Interfee i controlere
ESDI
Controlerul ESDI a fost dezvoltat dup controlerul ST506, i a fost unul din
primele controlere de hard discuri pe calculatoare x86. Acest tip de controler a fost
folosit n modelele IBM PS/2. Pentru c separatorul de date i controlerul lucreaz n
paralel, rata de transfer este aproximativ 10 megabii/secund la modelele iniiale,
respectiv 15, 20 megabii la cele recente. Hard discurile ESDI stocheaz informaii
despre formatul fizic i adresele sectoarelor defecte i poate transmite aceste informaii
92

Cap 6: Evaluarea hard discurilor

controlerului, pentru identificare i corectare de erori. Nu mai este utilizat dect pe scar
redus.
SCSI
Controlerele SCSI (Small Computer System Interface) sunt folosite n special n
sistemele care au nevoie de performan i stabilitate ridicat (servere, staii de lucru
performante).
ATA/PATA (IDE/EIDE)
Controlerul IDE (Integrated Drive Electronics), cel mai folosit n calculatoarele
personale de astzi folosete un singur cablu de 40 pini care combin funciile unui
cablu de date i al unuia de control care conecteaz discul IDE direct la magistrala (busul) de sistem. Controlerele IDE au abilitatea de a emula orice format de disc. Din cauza
consumului redus de energie, este una din soluiile folosite pentru calculatoarele
portabile. Controlerul IDE permite legarea pe acelai cablu a dou hard discuri sau a
unui hard disc i al unei uniti optice n sistem master/slave. Aceast arhitectur a dus
la incompatibiliti ntre uniti n anii '90, care ns au fost rezolvate.
SATA
Controlerele SATA plaseaza fiecare disc pe propriul canal (cu un set propriu de
porturi intrare/ieire). Astfel se elimin problemele cauzate de arhitectura PATA.
USB/Firewire(IEEE 1394)
Exist i discuri portabile care folosesc interfaa USB sau Firewire pentru a
transmite datele. De obicei discurile acestea sunt ansambluri formate dintr-un disc IDE
sau SCSI, un controler pentru acestea i un controler USB/Firewire.

6.3. Caracteristici

Capacitatea (msurat n gigaoctei) - n general fabricanii folosesc ca unitate de


msur multiplii din SI ai octetului (putere de 10), pe cnd multe sisteme de
operare (Windows, unele distribuii de Linux, MacOS folosesc msurtoarea n
multiplii binari). Dac primul hard disc avea 5 MO, astzi capacitile hard
discurilor pot depi 500 GO.
Dimensiunea fizic, msurat n oli (inch). Astzi hard discurile au fie 3.5"
(pentru PC-uri), fie 2.5" (pentru laptopuri - mai mici, utiliznd mai puin curent
electric dar mai scumpe i mai ncete). Exist i discuri de 1.8", pentru playere
MP3 (precum Apple iPod), care pe lng mrimea redus, sunt mai rezistente la
ocuri.
Durabilitate (exprimat n timp mediu ntre erori - MTBF). Discurile SATA 1.0
au viteze de 10.000 rpm i un MTBF de 1 milion de ore sub un ciclu de utilizare
de opt ore. Alte discuri permit pn la 1.4 milioane de ore sub un ciclu de 24 de
ore.
Numr de operaii de intrare ieire permise
Consum de curent
Nivel de zgomot
Timpi de transfer i timpi de acces.

93

Evaluarea performanelor sistemelor de calcul

6.3.1. Optimizarea timpilor de cutare


Ordinea optim de executare a comenzilor primite de hard disc pentru a reduce
latenele de cutare este ordinea care minimizeaz micarea mecanic.
O analogie destul de sugestiv ar fi un ascensor. Dac toate opririle ar fi
executate n ordinea n care s-au apsat butoanele, liftul ar funciona ntr-o manier
foarte ineficient i ar pierde foarte mult timp pentru a circula ntre diferitele locaii.
Orict pare de incredibil, majoritatea hard discurilor existente pe piaa de
desktop-uri n ziua de astzi funcioneaz n acest mod ineficient. Ascensoarele au
evoluat pn la stadiul de a "nelege" c reordonarea locaiilor va avea ca efect un mod
de funcionare mai economic i mai rapid.
Odat cu apariia modului de transfer Serial ATA, nu numai c este posibil
reordonarea comenzilor dintr-un anumit punct de start, dar schema este dinamic.
Acest lucru se traduce prin faptul c la orice moment de timp pot fi adugate la
coada de ateptare a comenzilor (queue) cerine de execuie adiionale. Acestea pot fi
ncorporate ntr-un thread n desfurare sau pot fi amnate pentru urmtoarea serie de
execuie a comenzilor.
Traducnd aceste lucruri n tehnologie HDD, reducerea micrii mecanice ntrun drive poate fi realizat prin existena unei cozi de comenzi i prin reordonarea
acestora pentru a oferi datele cerute ntr-o manier eficient.
Ct timp drive-ul execut o comand, o nou comand poate intra n aceast
coad de ateptare, iar dac ea va putea fi procesat cel mai eficient din punct de vedere
mecanic, atunci va fi urmtoarea comand care va fi executat.
Totui, simpla reordonare a comenzilor bazat pe locaia de destinaie a capului
de citire/scriere deasupra platanului nu este cea mai eficient soluie. La fel ca n cazul
liftului, care nu se va opri brusc atunci cnd o persoan apas butonul unui etaj pe lng
care tocmai a trecut, HDD-urile vor folosi algoritmi compleci pentru a determina cea
mai bun comand pe care s o execute n continuare.
6.3.2. Optimizarea latenelor de rotaie
Timpul de rotaie reprezint durata necesar pentru ca blocul logic de nceput al
datelor cerute s se roteasc pn cnd ajunge sub capul de citire scriere, dup ce, n
prealabil, acesta s-a poziionat pe pista corespunztoare.
n cel mai ru caz posibil, platanul ar trebui s parcurg o rotaie complet pn
cnd aplicaia ar putea accesa datele cerute. Acest timp depinde, bineneles, de viteza
de rotaie a hard discului.
O viteza de rotaie a platanelor mai mare este o modalitate n care se pot reduce
latenele de rotaie. Totui, creterea acestei viteze implic un cost adiional substanial.
Timpii de rotaie pot fi minimizai, de asemenea, prin alte dou moduri de abordare.
Primul este reordonarea comenzilor ntr-un mod astfel nct latena de rotaie s fie
minimizat. Aceast optimizare este similar cu cea din cazul timpilor de cutare.
Al doilea mod de optimizare implic folosirea unei funcii denumite "out-oforder data delivery". Aceasta presupune ca braul s nu acceseze neaprat blocul logic
de nceput al datelor cerute, ci s citeasc din orice poziie aflat n interiorul zonei de
date corespunztoare.
Astfel, drive-ul ncepe s citeasc datele cerute imediat cum s-a poziionat pe
pista corespunztoare i adaug datele lips (cele aflate ntre blocul logic de nceput i
cel de la care s-a nceput efectiv citirea) la sfritul aceleiai rotaii.
94

Cap 6: Evaluarea hard discurilor

Folosind tehnologia "out-of-order data delivery", n cel mai ru caz, transferul


va fi complet n maxim o rotaie a platanului. Fr implementarea acestei funcii, cel
mai ru "scenariu" implic un timp de o rotaie, la care se adaug durat de timp
necesar pentru a citi blocurile logice de date cerute.
6.3.3. Tehnologia NCQ
Native Command Queuing (NCQ) este o tehnologie realizat pentru a crete
performanele hard discurilor SATA. Ea a fost dezvoltat de Intel i Seagate odat cu
apariia modului de transfer SATA pentru dispozitivele de stocare.
Bineneles, NCQ asigur performane mai bune i eficien prin intermediul
unei reordonri eficiente a comenzilor. n plus, exist trei noi capabiliti care sunt
ncorporate protocolului Serial ATA pentru a mbunti performanta NCQ:
Race-Free Status Return Mechanism,
Interrupt Aggregation i
First Party DMA.
Nu vom intra n detalii despre modul n care hard discurile "echipate" cu
tehnologia NCQ realizeaz aceast mult dorit reordonare a comenzilor pentru a mari
performanele. Ideea de baz este c Native Command Queuing "se simte" atunci cnd
mai multe comenzi sunt lansate ctre drive, acesta reordonndu-le pentru a reduce att
timpul de cutare, ct i pe cel de rotaie.
Pentru ca NCQ s fie activat, trebuie s fie suportat i activat de controllerul
SATA i de hard disc, bineneles. Metoda de activare variaz n funcie de controller.
Pe unele plci de baz cu chipset Intel, spre exemplu, aceast tehnologie necesit
activarea opiunii Advanced Host Controller Interface (AHCI) din BIOS i instalarea
aplicaiei Intel Application Accelerator.
Pe piaa hard discurilor ne putem atepta n viitorul apropiat la o "afluen" a
dispozitivelor nzestrate cu aceasta tehnologie. Acest lucru este subliniat i de recentul
anun de achiziie a companiei Maxtor, unul dintre productorii importani din domeniu,
de ctre Seagate. ns, Seagate nu este singurul care a nceput implementarea acestei
tehnologii, ceilali productori nefiind mai prejos.
Beneficiile principale ale NCQ:
Race-Free Status Return Mechanism - aceast
funcie permite ca starea oricrei comenzi s fie
comunicat sistemului. Nu este nevoie de o
compatibilitate special cu sistemul gazd pentru
ca aceast comunicare s aib loc.
Interrupt Aggregation - n general, drive-ul lanseaz cereri de ntrerupere
(interrupt requests) de fiecare data cnd termin de efectuat o comand. Cu ct
sunt mai multe astfel de cereri de ntrerupere, cu att mai mare este sarcina de
procesare a sistemului gazda. Tehnologia NCQ permite ca numrul mediu de
cereri de ntrerupere per comand s fie mai mic dect 1. Dac hard discul
efectueaz mai multe comenzi ntr-un interval scurt de timp (lucru des ntlnit n
majoritatea computerelor), cererile de ntrerupere individuale pot fi "combinate".
n acest caz, controllerul sistemului gazd proceseaz doar o cerere de
ntrerupere pentru mai multe comenzi.

95

Evaluarea performanelor sistemelor de calcul

First Party DMA - Native Command Queuing are un mecanism care i permite
drive-ului s i configureze modul de operare DMA (Direct Memory Access)
pentru a transfera datele fr o intervenie software din partea sistemului gazd.
Acesta este mijlocul prin care drive-ul poate n mod efectiv s reordoneze
comenzile, din moment ce poate selecta buffer-ul de transmisie la propria
iniiativ.

6.3.4. Hard discuri...puin mai silenioase


Noile hard discuri Samsung SpinPoint
S166 7200 rpm sunt ultra silenioase i de mare
viteza, pretinde compania, emind 24 dB in
stare idle i 27.5 dB atunci cnd citesc/scriu date.
Aceste coordonate le fac ideale pentru a
fi ncorporate n calculatoarele office, precum i
n electronicele destinate consumatorilor, precum
DVR sau orice alt echipament ce are nevoie de
stocare i va fi utilizat ntr-un mediu silenios.
Primele dou modele prezint capacitate de 60 Gb i 160 Gb, beneficiind att de
interfaa 3.0 Gbps Sata ct i PATA.
Alte specificaii: include 8 Mb memorie cache, mbuntirea capului de citire a
datelor, o mai bun rezisten la ocuri i un nou controller ce ofer viteze mai bune de
transfer i un consum redus de curent electric.
Ultima tehnologie dezvoltat de Samsung n cadrul SpinPoint S166 Series
adaug un surplus de atractivitate unei audiene mai largi, reducnd i mai mult nivelul
acustic i mbuntind vitezele de transfer ale datelor, a declarat TJ Lee, vice
preedinte n cadrul diviziei Samsung Electronics.
6.3.5. Criptare nativ pentru hard discuri
Seagate Technologies a anunat disponibilitatea primului hard disc destinat
laptop-urilor ce beneficiaz de capabiliti de criptare native, destinate protejrii datelor
n cazul n care dispozitivele sunt furate sau pierdute.
Seagate Momentus 5400 FDE.2, cu algoritmi de criptare AES pe 128 de bii,
poate fi totodat achiziionat cu software-ul de management Wave Systems Embassy
Trust Suite de la Wave Systems, ce permite administratorilor IT s controleze criptarea
datelor i parolele la nivel enterprise.
Acesta este un drive standard ATA ce este criptat n permanen. Se comport
ca un hard disc obinuit, nu i-ai da seama de vreo diferen, a declarat Lark Allen, vice
preedinte executive n cadrul companiei Wave Systems.
Dei exist o mulime de tehnologii de criptare bazate pe software, drive-ul
Seagate Momentus este primul care include o soluie de criptare firmware, mult mai
ieftin dect software-ul de criptare i fr s consume din ciclurile procesorului, a
declarat Melissa Johnson, seful departamentului de marketing n cadrul Seagate.
Hard discul are 5400 RPM i poate fi achiziionat n 3 versiuni diferite, n
funcie de capacitate: 80 GB, 120 GB i 160 GB. Facilitatea de criptare va spori preul
acestui cu aproximativ 25% fa de costul unui hard disc standard.
ASI Computer Technologies a anunat ca va distribui primul laptop care va
conine noul hard disc Seagate. Compania a declarat ca a ales propriul notebook
96

Cap 6: Evaluarea hard discurilor

Centrino de 15 inci pentru a gzdui hard discul, deoarece acesta este livrat deja cu
opiuni speciale de securitate precum un cititor de amprente.
6.3.6. Hard discuri liliputane
Toshiba a anunat c a fabricat un hard disc
de 1,8 inci cu o capacitate de stocare de 100 de GB,
cea mai mare din aceasta clas de hard discuri.
Noul dispozitiv, MK1011GAH utilizeaz
tehnologie
PMR
(perpendicular
magnetic
recording) i un cod de erori mbuntit pentru a
asigura cea mai mare densitate virtual dintre toate
hard discurile de pe pia: 240,8 MB pe milimetru
ptrat. Toshiba va ncepe producia de mas pentru
acest hard disc din ianuarie 2007.
mpachetarea capacitilor uriae n hard discuri din ce n ce mai mici este o
cerin obligatorie pentru a ine pasul cu tehnologiile avansate din piaa PC-urilor i
pentru a ntmpina cu succes cererile pentru medii digitale ce suport capaciti de
stocare din ce n ce mai mari.
Lansarea acestei bijuterii vine s suporte dezvoltarea viitoarelor generaii de
calculatoare mobile, oferindu-le utilizatorilor funcionaliti mbuntite. Totodat,
Toshiba a mbuntit consumul de curent la 0.003W/GB, asigurnd astfel un mediu de
lucru mult mai prietenos. De asemenea, noul dispozitiv respect directiva european
RoHS din iulie 2006.

97

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 1

1 Metodologia de evaluare pentru plci de baz


1.1

Obiective:
Cunoaterea metodologiei pentru testarea i evaluarea plcilor de baz ale
computerelor.
1.2

Introducere
Metodologia de testare este destul de complicat, astfel nct se va ncerca
descrierea pe scurt a procesului de evaluare.
Dup cum probabil tii exist cteva segmente de pia, un anumit produs
adresndu-se numai unuia dintre aceste segmente. S-a mprit piaa n patru categorii.
De obicei majoritatea companiilor media i de cercetare mpart piaa n doar trei
segmente, dar noi am ales un model pe patru nivele (ca cel TCP/IP) deoarece este mai
uor de testat n aceste condiii.
Cele patru segmente sunt:
segmentul inferior de pia. Perifericele i componentele hardware pentru
computere care costa mai puin de 600$. De obicei cel mai important aspect pe
aceast pia este preul, dar trebuie luai n considerare toi ceilali factori.
segmentul de pia mediu. Perifericele i componentele hardware pentru
computere care cost ntre 600$ i 1500$. Majoritatea utilizatorilor cumpr
computere n acest segment de pia.
segmentul superior de pia. Hardware i periferice pentru computere care
costa mai mult de 1500$. Majoritatea firmelor mici utilizeaz servere i
echipament de reea din acest segment de pia. Cel mai bun exemplu: plcile de
baza dual procesor care au preul destul de ridicat i ofer o performan la fel;
Professional computer hardware - preul nu conteaz, ci numai performana.
Din cadrul acestei categorii fac parte un numr limitat de produse, standarde de
firm, servere pentru reele de mare performan, etc. Acest segment de pia nu
va fi descris n acest seminar. Cel mai bun exemplu: Majoritatea serverelor rack
mountable. Chiar dac acestea nu sunt foarte scumpe se adreseaz utilizatorilor
profesioniti.
Am hotrt s utilizam sisteme de testare diferite pentru fiecare segment de
pia. Vom discuta despre specificaii mai trziu, acestea nu sunt foarte importante,
amintii-v doar c ceea ce este astzi nou s-ar putea ca luna viitoare s fie depit. Mult
mai important este metodologia, aa c acesta este subiectul principal al acestui
seminar. Sistemele de testare vor fi depite n cteva luni, dar acest lucru nu conteaz
atta timp ct pstrm metodologia de testare.
Am reuit s definim 5 pai n cadrul metodologiei de testare. Exist i un al
aselea pas, dar acesta reprezint prerea echipei de testare.
Procesul de testare al unei plci de baz este cel mai complex i exist produse
care pot sri peste anumite seciuni din metodologie. Paii care fac parte din
metodologia de testare se aplic n cazul fiecrui segment de pia fr diferen. Exist
produse la care se aplic numai anumii pai datorit unor motive logice, dar exist i
anumii pai obligatorii ntr-o sesiune de testare obiectiv.
98

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 1

1.3

Cei cinci pai n evaluarea obiectiv


n cele ce urmeaz va vom prezenta cei cinci pali din metodologia de evaluare.
Fiecare pas este alctuit din mai multe pri i majoritatea acestor pai se aplica tuturor
produselor (marcat cu obligatoriu).
1. Identificarea produsului.
Identificarea produsului - Productorul, modelul, versiunea, firmware, data
lansrii pe pia, lotul. Este posibil s nu fie toate disponibile pentru toate
produsele. Obligatoriu
Situaia pe pia, identificarea pieei. - segmentul int, momentul n care
produsul a fost / va fi prezentat pe pia, oferta concurenilor. Obligatoriu
Prezentarea produsului. - Acest pas include verificarea ambalajului i comentarii
despre campania de publicitate realizat de ctre compania productoare.
Documentaia. - Unul din paii principali. Vom analiza documentaia din punctul
de vedere al unui amator i din perspectiva unui inginer. De exemplu manualele
multor plci de baz descriu instalarea n detaliu, dar nu descriu bine setrile din
BIOS. Obligatoriu
Layout-ul produsului. - Privim produsul cu atenie i descriem design-ul /
layout-ul. Acest pas este foarte important deoarece n majoritatea cazurilor
layout-ul influeneaz paii urmtori. Obligatoriu
Calitatea componentelor. - Multe produse hardware sunt bine prezentate, dar
calitatea componentelor este mediocr. O atenie deosebit trebuie acordat
prii electronice / mecanice.
2. Instalarea produsului / compatibilitatea
Instalarea normal a unui produs. - Instalam produsul n aceleai condiii ca un
utilizator final. Cercetm problemele care ar putea aprea n timpul instalrii.
Orice aciune atipic la instalarea produsului va fi raportat. De asemenea n
aceast seciune vom discuta despre drivere. Obligatoiru
Compatibilitatea produsului cu platformele software. Unele produse nu sunt
compatibile cu anumite platforme. De exemplu un Winmodem nu ar trebui s
mearg sub Linux cu toate c pe net exist drivere scrise de teri care asigur
funcionarea. Noi testm produsul numai cu sistemele de operare (de exemplu)
suportate de produs. Dac exist produse similare pe pia care suport o gam
mai larg de platforme atunci vom nota acest lucru. Obligatoriu
Compatibilitatea produsului cu alte dispozitive hardware. Este imposibil s
testezi compatibilitatea cu toate dispozitivele hardware din lume. Majoritatea
laboratoarelor care testeaz i aprob hardware utilizeaz numai "cele mai
populare dispozitive". Din punctul nostru de vedere aceasta va fi seciunea cea
mai dificil i care va lua cel mai mult timp. De exemplu vom testa o plac de
baz cu cteva dispozitive USB, module de memorie, procesoare, placi video, de
sunet, SCSI i plci de reea. Obligatoriu
3. Caracteristicile produsului
Caracteristicile promovate de marketing / Caracteristicile reale. Verificm
caracteristicile promise ale produsului. Bineneles c majoritatea
99

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 1

caracteristicilor sunt deja cunoscute utilizatorilor. Verificam funcionalitatea


caracteristicilor promise i a celor reale. Obligatoriu
Caracteristicile unice ale produsului. Exist productori care ofer clienilor
caracteristici unice pe pia. De exemplu Abit SoftMenu nu mai este o
caracteristica unic, ci o caracteristic promovat de departamentul de
marketing, din momentul ce exist i ali productori care ofer caracteristici
comparabile. Obligatoriu
Utilitatea caracteristicilor oferite. n decursul timpului am vzut o mulime de
funcii inutile la unele produse hardware ale unor productori cunoscui. De
exemplu funcia numita "Voice Diagnostic" care este disponibil la multe plci
de baz i care n acest moment este o funcie absolut stupid. Testnd o
mulime de plci de baz cu aceast funcie vei constat c nu vei nelege nici
mcar un singur cuvnt din ce spunea vocea suava care anun o problema.
Discutam despre mbuntiri. Comparam cu caracteristicile oferite de ctre
concuren, poate exist caracteristici a cror prezen ar fi de dorit, dar care nu
exist la versiunea testat. Discutam despre ce ne-ar place s vedem la versiunile
viitoare ale produsului. Obligatoriu
Capacitatea produsului de a se adapta la schimbri / Durata de via. n general
MTBF-ul majoritii produselor este mai mult dect suficient. Determinm
intervalul de timp n care poi utiliza produsul fr s apar schimbri
arhitecturale. Amintii-v numai c plcile de baz Slot nu mai pot fi utilizate n
acest moment. Este greu s prezici aceste schimbri, dar putem afla care sunt
planurile productorilor. Obligatoriu

4. ncrederea ntr-un produs


Ct de demn de ncredere este un produs n condiii normale de exploatare. n
cazul unei plci de baz aceasta poart numele de stabilitate. Obligatoriu
Ct de demn de ncredere este un produs n condiii extreme (teste care depesc
specificaiile). Majoritatea plcilor de baz ofer funcii de overclock-are, dar
acestea nu sunt nici recomandate, nici suportate de ctre productori. Plcile de
baz care i dovedesc stabilitatea n condiii de overclock-are sunt i mai stabile
n condiii normale.
100 ore de teste burn-in. Orice produs sau orice component electronic se poate
strica n primele ore de funcionare. Cazurile n care produsele nu mai
funcioneaz dup cteva sptmni nu sunt foarte frecvente.
Suportul oferit de compania productoare: drivere, update-uri, website i
suportul online, garania. Este foarte important ct de rapid poate o companie s
ofere suport pentru clienii si. Garania este de asemenea important deoarece
exist produse la care o perioad de garanie mai ndelungat este bine-venit.
Suportul nu este totul, update-uri la software sunt vitale n meninerea sistemului
la zi i fara bug-uri. Obligatoriu
5. Performana
Performana testat cu benchmark-urile care folosesc aplicaii. Testele cu
benchmark-uri ca Ziff Davis Content Creation Winstone 2001, Bapco SysMark
2001. Obligatoriu
Performana testat cu ajutorul benchmark-urilor sintetice. Unul dintre cele mai
respectate teste din aceasta categorie este SiSoft Sandra.
100

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 1

Performana n aplicaii. Aceste teste se bazeaz pe aplicaii des folosite. De


obicei se msoar timpul de care are nevoie un produs pentru a finaliza o serie
de comenzi.
Comparaia cu alte produse. Se compar produsul cu alte produse de pe pia i
se determin poziia acestuia pe pia. Obligatoriu

6. Prerea evaluatorului
Opiunile existente pe pia. Discutam i comparm respectiva plac de baz cu
alte plci de baz de pe pia.
Sfaturi care privesc achiziionarea. Ce prere au specialitii de IT despre
achiziionarea unei astfel de plci.
Nota final. Nota final se bazeaz pe paii anteriori. Este extrem de important
i trebuie s discutam despre acest subiect n detaliu.
1.4

Consideraii finale / Nota final


Trebuie s ne reamintim mereu ca nu suntem n cutarea produsului perfect.
Produsul perfect nu exist, dar exist produse aproape perfecte, iar noi verificm ct de
aproape de perfeciune este un produs. Punctm comportamentul produsului n fiecare
seciune cu unul pn la cinci puncte. Un produs poate "pica" n cadrul unei seciuni
(ex: ncrederea n produs); aceasta nseamn c produsul are probleme serioase. Cnd
un anumit produs a trecut de o seciune primete un punctaj. S vedem care sunt aceste
punctaje:
mai puin de dou puncte - Are probleme serioase n aceast seciune. Acest
produs este jalnic i nu este recomandat.
ntre dou i trei puncte - Am avut cteva probleme cu acest produs. Dac are
punctaje bune n celelalte seciuni, poate fi o soluie.
ntre trei i patru puncte - Un produs mediu care s-a comportat dup cum era de
ateptat.
Peste patru puncte - Calitate deosebit, una dintre cele mai bune alegeri de pe
pia

Exist de asemenea o not final care, n principiu, este suma punctajelor


obinute n cadrul fiecrei seciuni, cu cteva excepii:
1. Dac un produs obine mai puin de trei puncte ntr-o seciune nu va obine
sub nici o forma mai mult de 18 puncte, chiar dac obine 5 n toate celelalte seciuni!
Puin posibil.
2. Putem aduna/scdea dou puncte din suma total n funcie de impresia
noastr general.

Interpretarea notei finale:


mai puin de 15 puncte - un produs mizerabil. Nici s nu v treac prin cap s-l
cumprai!
ntre 15 - 18 puncte - Un produs mediu, l putei cumpra, dar exist soluii mai
bune pe pia. Trebuie luat n considerare i preul.
ntre 18 - 22 puncte - O alegere bun, merit investiia
mai mult de 22 puncte - unul dintre cele mai bune de pe pia, cumprai-l i nu
vei regreta.
101

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

2 Evaluarea plcilor de baz dual core


2.1

Obiective:
Seminarul i propune evaluarea i compararea mai multor plci de baz ce
suport procesoare Intel Pentium din familia D.

Suntem deja mai mult dect familiarizai cu procesoarele dual core pe care marii
productori de astfel de componente le-au lansat i pe piaa autohtona. Performana de
care aceste procesoare dau dovad este de necontestat, mai mult dect att, posibilitatea
de a avea multi procesor pe acelai cip integrat este o soluie la care muli dintre noi se
gndeau s apeleze. Marele avantaj al acestei tehnologii este acela c n situaiile n care
sunt rulate pe sistemul de operare mai multe aplicaii odat, sarcinile sunt mprite ntre
cele dou nuclee ale procesorului.
2.2

Consideraii tehnice
Realizarea unui upgrate care s presupun ca platform noile procesoare dual
core de la Intel presupune cunoaterea ctorva detalii, care vor fi prezentate n
continuare.
Odat cu lansarea seriei Pentium D au fost necesare i cteva modificri n ceea
ce privete chipset-ul care are n grija procesorul dual core. La momentul actual sunt
doar trei chipset-uri la care se poate opta n cazul platformelor cu CPU Intel Pentium D:
945P, 945G i mai noul 955X. Facilitile pe care acestea le ofer se extind pn la
interfee S-ATA mai performante, plci audio cu opt canale sau dual LAN pe band
Gigabit i interfaa PCI Express.
Unul dintre dezavantajele acestor platforme, n privina gamerilor, este faptul c
acestea nu suport conectarea n mod SLI a dou plci nVIDIA (cazul chipset-urilor
Intel). ns, dac lum n calcul faptul c procesoarele dual core sunt destinate rulrii
mai multor aplicaii n acelai timp, n privina jocurilor nu avei nevoie de o astfel de
platform.
Cu toate acestea, apariia noilor chipset-uri de la nVIDIA - 7800GTX, respectiv
ATI - 1800, credem c opiunea multi GPU rmne o alternativa foarte scump. n

102

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

privina memoriilor compatibile, acestea pot fi doar DDR II la frecvene de pn la 800


MHz (valabil pentru chipset-urile 955X).
Pe lng acestea, posibilitatea de a alege noile suporturi Serial ATA II reprezint
un avantaj fantastic att pentru soluiile server, ct i pentru aa- numiii power users,
cei n cutare de un computer foarte performant. La acestea se adaug suportul RAID de
la matrice n configuraie 0 pn la 5 cu un transfer mediu de aproximativ 3 Gb/s.
Apropierea de conceptul digital home este realizat de integrarea unor plci de sunet cu
opt canale, alternativ ce va permite s conectai un sistem de boxe 7,1 sau 5,1.
2.3

Procedura de testare
S-a plecat de la ideea c dincolo de jocuri,
aceste platforme sunt destinate, n primul rnd,
aplicaiilor office, grafic workstation sau server. De
aceea, s-a ales n testele efectuate mai mult
programe care reflect performanele computerului
n aplicaii cum ar fi: arhivare de fiiere, codare
video sau interoperabilitate placa de baza - procesor.
Platforma de test:
CPU: Intel Pentium 4 D 3 GHz
Memorie: 2x1024MB DDR II SDRAM Kingmax 533 MHz
Placa Video: Gigabyte Radeon X800 XL PCIe 256MB GDDR3
Hard disc: Western Digital JB 200 GB, 8 MB cache ATA100
Sursa de putere: Zalman 400 W
PC Mark 2005:
Noul software dezvoltat de cei de la Futuremark destinat evalurii ntregului
sistem a ajutat foarte mult n aprecierea performantelor per ansamblu a platformei de
test. Setrile cu care am pornit benchmark-ul au fost cele default, numrul de subteste
fiind maxim.

WinRAR 3.50:
S-a considerat c arhivarea de fiiere reprezint un lucru destul de important la
ora actual, lund n considerare faptul c noi toi suntem n cutare de un transfer ct
mai rapid al fiierelor: fie pe mail, fie pe reea sau inscripionare pe CD/DVD. Arhiva sa constituit dintr-un folder iniial cu dimensiunea de 100 MB i un numr de 3.600 de
fiiere.
Lame mp3 Encoder:
Nu foarte popular n ceea ce privete codarea n format mp3, din cauza n primul
rnd absenei unei interfee prietenoase, Lame mp3 encoder a fost utilizat n mod default
pentru un fiier de test cu o dimensiune de 100 MB.
3D Mark 2005:
Performanele video ale platformei au fost testat cu popularul 3D Mark 2005,
test ce a rulat pentru setrile default: rezoluie 1024x768@ 32bit, 4x Anisotropic filter i
fr Full Scene Anti-Alasing.
103

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

SISoft Sandra 2005:


Test de referin n materie de performan a componentelor, SiSoft Sandra a
rulat doar pentru testul CPU Multimedia Benchmark. Programul ne ofer scoruri pentru
Testul de numere Integer (ntregi) i Floating point (calcule n virgul mobil).
Auto Gordian Knot (Xvid 1.0.3 encoder):
Testul de codare video a fost fcut cu Auto Gordian Knot pentru codec video
Xvid 1.0.3, Audio AC3. Fiierul de test a fost un fragment de DVD (.vob) cu
dimensiunea iniial de 200 MB. Fiierul de ieire a fost setat la dimensiunea de
100MB.
2.4

Plci de baz testate


ABIT AW8-MAX
Echipat cu ultimul chipset destinat procesoarelor dual core, AW8-MAX este o
plac ce se claseaz ca performane peste linia median a topului realizat. Scorurile mari
nregistrate n teste au convins att n privina performanei per ansamblu - i cnd ne
referim la asta ne referim n primul rnd la PC Mark 05, ct i la capitolul manipulare a
fiierelor. La fel ca i celelalte concurente, FSB-ul de care beneficiaz acest produs
atinge limita de 1066 MHz, frecvena maxim pentru memoriile compatibile pe aceast
platform fiind de 800 MHz. Caracteristic chipset-ului 955X de la Intel, facilitile
adiionale cum ar fi a doua plac de reea sau controlerul audio cu opt canale sunt
lucruri cu care ne-am obinuit deja.
ASUS P5WD2 Premium
Ctigtorul testului din cadrul seminarului nostru, P5WD2 Premium, s-a
dovedit a fi o platform complet - att din punct de vedere al performanei, ct i n
privina dotrilor sale. Scorul cel mai ridicat n testul 3D Mark05 duce imediat cu
gndul la faptul c placa de baz se adreseaz n primul rnd mptimiilor jocurilor i
apoi celorlalte categorii de cumprtori. Sub capota aceluiai chipset 955X de la Intel,
care d dovad de o fiabilitate bun i, n acelai timp, i de inovaii n direcii precum
storage (SATA II) sau audio (compatibilitate cu sisteme audio 7,1).
Gigabyte GA-9I955X Royal
Principalul rival al ctigtorului, GA-8I955X Royal este o platform care se
dorete a fi un suport pentru performane extreme. Bus-ul memoriei de 888 MHz, ajutat
de suportul DDR II i FSB-ul la 1066 MHz, au reuit s ofere rezultate mai mult dect
satisfctoare n testele rulate. n privina dotrilor suplimentare lucrurile stau la fel ca
la celelalte plci de baz cu chipset-uri 955X: suport RAID 0,1,5, plac audio cu opt
canale i Gigabit LAN.
MSI Neo 945P i Platinum 954P
Gemenele MSI din acest test s-au comportat exemplar n aplicaiile rulate, mai
ales dac lum n calcul c sunt cu un pas n urma plcilor care beneficiaz de mai noile
chipset-uri 955X. Cu toate acestea, specificaiile tehnice nu sunt cu mult inferioare:
acelai FSB 1066 MHz ca la concurente, suport pentru memorii DDR II i
compatibilitate S-ATA II. Absena conectorilor FireWire nu reprezint un dezavantaj
major dac lum n calcul performanele actuale ale porturilor USB ver2.0.
104

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

MSI 955X Platinum


Candidatul MSI la categoria chipset 955X versiunea Platinum beneficiaz de
caracteristici ntlnite la aproximativ toate celelalte concurente, ns scorurile pe care
aceasta le-a nregistrat pe parcursul testrii au demonstrat c produsul se vrea a fi n
primul rnd unul care s impresioneze prin performan.
Timpul destul de scurt nregistrat pentru codarea unui fiier video la standard
Xvid/AC3 arat faptul c interconectarea ntre componentele de baz este foarte bine
coordonat, testul implicnd att procesorul, ct i memoria, placa audio i placa video.
Foxconn 955X7AA
Dac punctarea la acest test ar fi fost dat doar de rezultatele n benchmark-uri,
cu siguran modelul 955X7AA de la Foxconn ar fi urcat vertiginos pe prima poziie.
Cu toate c bus-ul maxim pentru plac este de doar 667 MHz, performanele de care a
dat dovad platforma ne fac s credem c la urm materia prim - n spe chipset-ul nu reprezint totul. Cel mai mare scor n PC Mark 2005 i, de asemenea, cel mai sczut
timp la arhivarea datelor v pot face s v orientai pentru o astfel de plac de baz dac
suntei o persoan care nu se gndete n primul rnd la jocuri.
ASUS P5LD2 Deluxe
Echipat cu un chipset 945P, P5LD2 Deluxe se vrea a fi (probabil) o plac
middle-range, dar putem spune c dup rezultatele pe care aceasta le-a nregistrat n
teste, categoria n care se integreaz ine s se apropie de cea de vrf. Opional, la acest
produs putei achiziiona n interiorul pachetului i o plac WiFi-TV, soluie aleas de
productor pentru a atrage i o parte dintre clienii n cutare de sisteme digital home.
Platforma nu beneficiaz dect de o singur plac de reea gigabit i doar un slot
adiional PCX.
ASUS P5ND2 Sli
Destinat n primul rnd mptimiilor jocurilor, P5ND2 Sli este o plac de baz
ce se axeaz pe performana sistemului n aplicaii multimedia. Chipset-ul care
echipeaz platforma este unul nForce 4 Sli, capabil s ofere un FSB de 1066 MHz,
suport DDR II 667, RAID 0,1,5 sau ieire audio pe opt canale. Rezultatele n
benchmark-urile sintetice categorisesc n mod clar segmentul n care acest produs se
integreaz, i anume n cel al gamerilor.
Gigabyte GA-8N-Sli
Cea de-a doua plac ce suport modul Scalable Link Interface (SLI) s-a
comportat ceva mai bine la capitolul benchmark-uri sintetice, scorurile obinute fiind
ceva mai ridicate dect la modelul SLI venit de la ASUS. Chiar dac posibilitatea de
extindere la cea de-a doua plac grafic pe care aceste platforme o ofer este una
profitabil din punct de vedere al performanei, credem totui c sunt puini cumprtori
de pe piaa noastr care ar opta pentru o astfel de soluie. Remarcabile rmn
performanele plcii de baz n ciuda suprasolicitrii sale cu mai mult de o placa video.
ABIT AL8
Cunoscui mai ales datorit capacitilor fantastice de overclocking, cei de la
ABIT nu au reuit s impresioneze cu modelul AL8, acesta nregistrnd scoruri
105

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 2

ngrijortor de sczute la mai toate testele pe care le-a rulat. Dotat cu un chipset 945P,
potenialii cumprtori se pot bucura de suportul DDR II, FSB 1066 MHz, plac audio
cu opt canale i interfee S-ATA.
ASRock 775Dual-880Pro
Nu tiu ci dintre voi cunoatei att de bine brand-ul ASRock, ns dincolo de
performanele precare pe care aceast plac a reuit s le ofere, posibilitatea de a monta
la alegere un procesor AMD sau unul Intel pe aceast platform, este de admirat.
(Procesorul AMD se moteaz cu ajutorul unei placi special concepute ce se conecteaz
lng slotul PCIe x16.) Am rmas plcut impresionat s observ c n anumite teste
775Dual-880Pro a reuit s bat competitori cu un nume mai puternic.
2.5

Concluzii
Chiar dac "era" procesoarelor dual core abia a nceput, productorii de plci de
baz nu au ntrziat s-i fac simit prezena n toate segmentele de cumprtori.
Produsele prezentate n acest seminar au dat dovad de performane ridicate, diferenele
dintre acestea nefiind extraordinar de mari.

106

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

3 Realizarea overclock-ingului la plcile grafice


3.1

Generaliti despre overclocking-ul la plcile grafice


Ca i n cazul procesoarelor, plcile grafice pot
fi supuse operaiunii de overclocking, adic creterea
frecvenelor pentru obinerea de performane
superioare celor implicite. Ce gamer nu-i dorete
performane mai mari dect cele oferite de sistemul
su dac realizeaz c nu poate juca jocul preferat la
framerate-ul dorit, la rezoluia sau setrile de calitate
preferate? Din pcate, i aici apar riscuri legate de
temperaturi ridicate, deci este necesar o rcire
corespunztoare, nu neaprat suplimentar. O rcire
inadecvat poate duce la arderea GPU-ului, caz extrem de rar fiindc mai toate plcile
recente beneficiaz de rcire activ i/sau exist un minim de airflow n carcas. Fr a
mai vorbi de protecie la supranclzire. O frecven prea mare duce de cele mai multe
ori la blocaje sau un comportament necorespunztor prin apariia de artefacte, astfel c
un utilizator neiniiat, care s-a jucat cu nite setri, poate contribui la umplerea
departamentelor de service ale firmelor de calculatoare pentru probleme inexistente,
singurul lucru care trebuie fcut fiind reducerea frecvenelor.
Att chip-ul ct i memoria plcii pot fi supratactate deoarece fiecare dintre ele
beneficiaz de o anumit frecven de funcionare (ca i n cazul procesoarelor sau a
modulelor de memorie) care influeneaz n mod direct - dar nu exclusiv - performana.
Overclocking-ul este util n momentul n care deinei o plac uor overclock-abil.
De multe ori, productorii reduc artificial frecvena celor dou componente pentru a nu
afecta vnzrile modelelor mai scumpe, sau pur i simplu pentru c chipul respectiv nu
a rezistat la frecvenele fratelui su mai mare dar poate rezista unei frecvene superioare
celei la care este marcat. S lum ca exemplu chip-ul GeForce3 Ti200, cel mai lent chip
din seria GeForce3. Frecvena GPU-ului este de 175 MHz fa de 240 pentru modelul
superior bazat pe aceeai arhitectur i produs n aceeai perioad, GeForce3 Ti500.
Practica a demonstrat c n majoritatea cazurilor ambele chipuri suport o frecven
maxim de circa 250-260 MHz din simplul fapt c procedeul de fabricaie este identic;
ns sunt cunoscute situaii n care un Ti200 nu a suportat nici mcar frecvena lui
Ti500, adic 240 MHz, fapt ce explic marcarea sa ca Ti200. Dar poate c el ruleaz
perfect la 235 MHz, i din start putem spune c s-au pierdut 60 MHz, ce se traduc
poate prin 30-40% n performana real.
Frecvena maxim a chip-ului depinde n mare msur de sistemul de rcire.
Acesta este compus de obicei dintr-un radiator i un ventilator, ultimul putnd lipsi.
Contactul dintre radiator i chip este realizat n cazul ideal prin pasta termoconductoare,
ns muli productori ignor avantajul acesteia i folosesc un adeziv oarecare, slab
conductor termic. n cazul memoriei, problema st cu totul altfel: fiecare productor i
doteaz placa n funcie de model sau chiar de stocul de memorii disponibil la acel
moment (acest ultim caz ntlnindu-se ndeosebi la productori de categoria a doua).
Astfel, dac un Radeon 9550 beneficiaz din start de memorii ce ruleaz la 400 MHz,
frecvena maxim ce poate fi atins poate varia de la model la model sau de la exemplar
la exemplar, diferenele putnd fi foarte mari.
107

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

i comportamentul la overclocking difer fa de GPU. Dac n cazul acestuia


din urm, o frecven prea mare duce de obicei la blocaje, o memorie va trece de regul
mai nti prin stadiul de a prezenta artefacte vizuale, vizibile att n 2D ct mai ales n
3D, care culmineaz, ntr-adevr, cu blocaje. ns putem considera c un singur bit scris
incorect n memoria plcii, ce genereaz astfel un pixel de o culoare incorect,
reprezint o malfuncionalitate. Utilitarul Artifact Tester1 este destinat detectrii acestor
artefacte, ns are dezavantajul de a rula n mod 2D, deci nu utilizeaz nici funciile 3D
ale chip-ului grafic, nici ntreaga memorie video. n schimb, ATITool2 ofer informaii
mult mai precise legate de prezena artefactelor, testul inclus fiind unul foarte riguros i
relevant.
Un set de radiatoare lipite pe memorii poate
duce la scderea temperaturii i, cel puin teoretic, la un
potenial de overclocking mai ridicat. Pe lng acest
factor, dac avei n minte overclocking-ul la
achiziionarea unei plci, ar fi bine s v interesai asupra timpului de acces al memoriei
folosite, informaie ce ar trebui s apar n ofert sau n specificaiile produsului. Chiar
i fr aceast informaie, n cazul n care memoriile nu sunt acoperite, de obicei avei
posibilitatea s descifrai timpul de acces. n imaginea de alturi este reprezentat un
astfel chip de memorie, iar din caracterele nscrise pe el se poate citi la urm valoarea de
3.6 ns, ce corespunde unei frecvene de aproximativ 275 MHz (550 MHz DDR).
Formula de calcul este simpl: 1000/timp de acces=frecven, eventual nmulit 2
pentru c a afla valoarea efectiv, nu real. Aadar, un GeForce FX5500 sau un Radeon
9500 ar corespunde cel mai bine frecvenei, ns dac aceast memorie este prezent pe
un Radeon 9550 (cu frecvena implicit de 400 MHz), rezult un produs cu un potenial
de overclocking ridicat. Exist i situaia contrarie, cnd o plac este dotat cu memorii
mai slabe dect ar trebui, fiind ntlnite de exemplu plci GeForce4 MX440 cu memorii
de 6 (333 MHz) sau chiar 7 ns (286 MHz) n locul celor de 5 ns (400 MHz), rezultnd
frecvene inferioare specificaiilor. Inutil de menionat c plcile respective nu respect
specificaiile NVIDIA i performana lor este mult redus.
Nu trebuie uitat un aspect important: latenele memoriilor. Ca i n cazul
modulelor obinuite de memorie, nu doar frecvena conteaz ci i timing-urile. Avem o
serie ntreag de posibiliti, ce includ att setrile clasice (CAS Latency, TRP, TRCD,
TRAS) ct i altele mai puin obinuite. Utilitarele ATITool (pentru ATI), RaBiT3
(pentru ATI) i NiBiTor4 (pentru NVIDIA) permit ajustarea acestora n mod real-time,
ultimele dou chiar i permanent, prin rescrierea BIOS-ului plcii. Pot exista cazuri n
care o frecvene redus combinat cu nite latene mai mari ofer mai mult
performan dect situaia contrarie. Cine are timp i rbdare, poate testa combinaia
optim pentru placa sa. Trebuie inut cont c rescrierea BIOS-ului plcii poate anula
garania acesteia, pe lng riscurile de rigoare (de multe ori, nici scrierea unui BIOS
editat ca la carte nu garanteaz funcionarea ulterioar a plcii cu acel BIOS).
O situaie mai rar ntlnit dar mult mai spectaculoas o reprezint setarea de
ctre productorul plcii a unor frecvene peste cele recomandate de productorul
chipului. De exemplu, n loc de 250 MHz core i 400 MHz memoria, Abit a setat
frecvenele lui Radeon R9550 XTurbo-Guru la 300/500 MHz, oferind astfel un
1

http://www.xf.ro/downloads/ArtifactTester2.zip
http://www.techpowerup.com/atitool/
3
http://downloads.guru3d.com/download.php?det=872
4
http://www.mvktech.net/component/option,com_remository/Itemid,26/func,selectfolder/cat,92/
2

108

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

overclocking din start. Dar i un produs standard poate atinge aceste frecvene, astfel c
se poate pune ntrebarea: Ce rost are s dau mai muli bani pe o plac overclock-at din
fabric dac pot face acelai lucru i singur?. Rspunsul const att n garantarea de
ctre productor a frecvenelor respective, ct i nzestrarea plcii (uneori) cu o rcire
mai bun i/sau cu memorii mai rapide. n exemplul nostru, placa atinge frecvene de
peste 450 MHz pentru chip i de peste 700 MHz n cazul memoriei, cele mai multe plci
din aceeai familie eund.
De asemenea, unii fabricani reproiecteaz arhitectura
plcii folosind un design propriu sau unul mprumutat de la
alte modele. De exemplu, plcile Albatron GeForce4 Ti4200
din seria Turbo sunt construite pe baza design-ului plcilor
Ti4400 i Ti4600, pe 8 straturi fa de 6, oferind cel puin n
teorie un potenial de overclocking mai ridicat.
3.2

Ce mi trebuie pentru overclocking?


Simplu! ar spune unii. Setez din programul de overclocking frecvenele
maxime la care totul merge ok i cu asta basta. Lucrurile nu stau chiar aa...
Dac avem un sistem de rcire precar, nu avem nici o ans n overclocking.
Elementele eseniale pentru o rcire bun sunt, n ordine:
eficiena radiatorului,
eficiena ventilatorului,
prezena radiatoarelor pe memorii i ,
contactul dintre radiator/radiatoare i chip/chip-uri.
Acesta din urm trebuie s fie realizat cu ajutorul unei paste termoconductoare;
dac dorii s aflai dac productorul v-a rsfat cu o substan de contact de calitate,
trebuie s desfacei sistemul de rcire al chip-ului, riscnd astfel s pierdei garania.
Mai mult, GPU-urile moderne dein o pastil similar procesoarelor Athlon XP, ea
riscnd s se ciobeasc. Trebuie, aadar, avut foarte mult grij, o pastil ciobit
nseamn de foarte multe ori o plac grafic defect.
Totui, dac ai desfcut sistemul de rcire i nu suntei mulumit de el, curai
cu grij urmele vechiului adeziv i aplicai cu grij pasta de bun calitate (de exemplu
Arctic Silver 5), nici prea mult dar nici prea puin, avnd grij ca ea s acopere
ntreaga pastil sau ntregul chip n caz c nu avem de-a face cu o pastil. Clemele de
prindere trebuie s exercite o presiune mare (dar nu exagerat) asupra chip-ului, mai
ales dac suntem n cazul pastilei. Aadar, dac ele slbesc peste msur datorit
manipulrii neglijente, exist anse chiar s ardei placa! n cazul memoriilor, dac ele
sunt dotate cu radiatoare, problema este mai complicat. Ele nu au, de obicei, un sistem
de prindere bazat pe uruburi i n lipsa acestuia au nevoie de un adeziv puternic pentru
a rmne lipite pentru o bun perioad de timp. n plus, importana rcirii memoriilor
este mai redus, deci putei s le lsai linitit n pace. n schimb, dac dorii ataarea
unor radiatoare, trebuie aplicat o substan termoadeziv, care joac att rol de past
termoconductoare ct i de adeziv.
Ventilatorul poate fi sau poate deveni, dup o perioad de uzur, zgomotos i
ineficient. nlocuirea lui nu este deosebit de dificil, trebuie doar s gsii unul care s
se potriveasc din punct de vedere al dimensiunilor. Putei merge mai departe i s
schimbai ntreg sistemul de rcire cu unul pasiv, un exemplu fiind produsele
Thermaltake, dar n acest caz va trebui s renunai cel puin parial la overclocking.
109

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

3.3

Procedura de realizare a overclocking-ului


Este necesar cel puin un utilitar care ori s activeze opiunile existente n
drivere cu privire la acest aspect (dar ascunse din motive lesne de imaginat), ori s
realizeze el nsui overclocking-ul. Pentru plcile NVIDIA, ultimele drivere ForceWare
ne vin n ajutor, ele deinnd (dup deblocarea opiunii n cauz, de exemplu prin
intermediul lui NVTweak5) o funcie de overclocking automat. Alte utilitare bune sunt
PowerStrip6 (ce are avantajul recunoaterii unui numr foarte mare de plci),
RivaTuner7, iar pentru plcile ATI s-au impus RadLinker i ATITool. O funcie
deosebit a acestuia din urm este posibilitatea testrii apariiei artefactelor n mod 3D,
pe lng prezena funciei de overclocking automat. De asemenea, ATITool permite
setarea timing-urilor memoriei.

Dup ce ne-am hotrt asupra soft-ului, urmeaz s cretem cele dou frecvene
progresiv, cu cte 5, 10 MHz sau chiar mai mult, dup bunul plac. De remarcat c
memoriile plcilor din ziua de azi sunt de obicei DDR, deci avem dou frecvene, cea
real i cea efectiv - de dou ori mai mare. La plcile cu chip-uri NVIDIA, referirea se
face de obicei prin cea efectiv, la plcile Radeon invers. Unele soft-uri de overclocking
nu permit dect o plaj de frecvene bine determinat. Uneori, ele pot fi pclite pentru
a afia mai mult, alteori nu, fiind vorba pn la urm de o protecie - dup cum bine
spunea cineva - anti-prost. ns tendina este de a se elimina aceste limitri; de
exemplu, RadLinker nu manifest deloc problema, singura limitare fiind cea hardware,
dar ea este de obicei de ordinul miilor de MHz, de departe imposibil de atins n practic.
Impedimente posibile:
n primul rnd, unele plci ATI sunt protejate la overclocking. Mai exact, plcile
cu chip-uri precum Radeon 9000, 9200, 9500, 9550, 9600 sau 9700 nu permit realizarea
overclocking-ului, driverele blocnd aceast practic. Motivele sunt evidente: chip-urile
enumerate au un potenial de overclocking foarte ridicat, fiind variantele cele mai lente
din serie i productorul canadian s-a temut c acest lucru ar putea afecta vnzrile
suratelor mai rapide (de obicei marcate cu sufixul Pro).
Soluii exist din plin. Cea mai hardcore este rescrierea BIOS-ului cu unul
modificat special n acest sens. Cea mai normal dar mai sigur este folosirea unor
drivere modificate (precum sunt cele Omega sau cele soft-modded8, care nu difer de
cele originale dect prin absena proteciei sus-amintite). De asemenea, sunt disponibile
patch-uri anti-protecie, precum cel livrat de RivaTuner sau cel inclus n ATITool.
RivaTuner permite dou metode, una presupunnd modificarea driverelor (ceea ce
presupune recunoaterea de ctre utilitar a driverului - cele mai noi versiuni de Catalyst
5

http://downloads.guru3d.com/download.php?det=911
http://www.entechtaiwan.net/util/ps.shtm
7
http://www.guru3d.com/index.php?page=rivatuner
8
http://www.techpowerup.com/softmod/downloads.php
6

110

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

s-ar putea s nu fie recunoscute), iar cealalt modificnd o locaie de memorie n care
este stocat informaia despre protecie. ATITool deine i el o funcie n acest sens, aa
cum se poate vedea n imagine.

111

Seminar Evaluarea performanelor sistemelor de calcul

3.4

Seminar 3

Cnd i cum apar artefactele?


n
domeniul
overclocking-ului, totul trebuie
n primul rnd gndit. E drept,
nu totul este logic (cel puin
conform standardelor noastre ale
logicii), de aceea pe lng a
gndi trebuie s existe i a
experimenta. Pe ct posibil fr
aciuni ireversibile, care s ne
goleasc buzunarele sau s ne
pun n valoare talentul de
convingere a vnztorului c nu
eu sunt de vin!!!.
Artefactele sunt elemente
parazite de imagine, care o
deterioreaz progresiv odat cu
creterea frecvenei sau (n mai mic msur) a temperaturii. Practic, este vorba de
rateuri ale unor operaii, similare celor petrecute n cazul procesorului sau a memoriei
sistemului. Dac n cazul memoriei de sistem un bit greit transform (de cele mai multe
ori) o instruciune n alta, urmnd o avalan de rezultate false care culmineaz rapid cu
blocri, memoria video nu reine instruciuni ci informaii grafice (de exemplu culorile
pixelilor).
Memoria grafic este scris atunci cnd este nevoie. n caz contrar, ea pstreaz
informaiile scrise anterior n aceasta. E drept c memoria, ca orice memorie de tip
DRAM, trebuie remprosptat periodic, dar practica a demonstrat c o operaie de
scriere de informaii noi ntr-o memorie care nu funcioneaz corect produce mult mai
multe erori dect o operaie de remprosptare a informaiilor deja existente.
n imagine de mai jos avem o plac grafic a crei memorie tocmai a fost supus
unui overclocking dur, ea rulnd n mod implicit la 200 MHz i oferind un potenial de
overclocking de 250 MHz. Ei bine, am setat 350 MHz, drept pentru care am fost
ntmpinai de efectele care s vd. Fereastra utilitarului ATITool am micat-o puternic,
memoria plcii necesitnd o rescriere repetat. Cu ct micam mai mult fereastra, cu
att artefactele creteau - e normal, o imagine corupt e corupt din nou i din nou...
Cealalt fereastr nu a fost clintit din loc, artefactele fiind astfel mult mai puine.
Concluzia care trebuie tras este c o prim verificare a rezultatului unui overclocking
este micarea puternic a unei ferestre.
O rezoluie de 1024x768 de pixeli cu adncimea de culoare de 32 de bii ocup 3
MB de memorie video, aceasta pentru c fiecare pixel al imaginii pe care o avei acum
n fa trebuie stocat n memoria plcii grafice. Cum avem 1024x768, adic 786432 de
pixeli, nmulim aceast valoare cu numrul de bytes necesari pentru memorarea unui
pixel, adic 32/8=4 bytes, rezultnd exact 3 MB. Acum, apelnd la aceeai logic
intuitiv, putem s ne dm seama c nu toat memoria unei plci este la fel de rezistent
la overclocking. Anumite chip-uri care o alctuiesc pot fi mai sensibile sau numai
anumii tranzistori dintr-un chip pot ceda. De aceea, este clar c cei 3 MB pe care i
privim n mod obinuit nu pot garanta funcionarea corect a memoriei la o anumit
frecven, orict de mult am agita ferestrele. Aadar, este cazul s cretem rezoluia. Cea
mai mare valoare ce poat fi atins cu monitoarele obinuite este de 2048x1536, acum
112

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

avnd ocupai 12 MB. Total insuficieni, dar nu stric o ncercare nainte de a trece la
pasul urmtor.

Att Artifact Tester ct mai ales ATITool pot detecta erorile ce apar datorit
overclocking-ului. ns nici un soft nu poate nlocui testele de ore sau zile petrecute n
compania jocurilor preferate, mai ales c respectivele utilitare folosesc o zon mic de
memorie pe care o testeaz. Pentru a afla ct mai exact frecvena maxim de
funcionare, trebuie s facem n aa fel nct toat memoria, sau cea mai mare parte din
ea, s fie ocupat. Vom seta att o rezoluie mare ct i o setare ct mai nalt de FSAA.
Dac placa este suficient de
lent pentru a nu putea randa
jocuri sau teste noi, vom folosi
teste/jocuri
mai
vechi,
mergnd pn la a rula
3DMark 2000 sau Quake3 n
1600x1200 cu FSAA maxim
sau, dac se poate, 2048x1536.
De asemenea, nivelul de
detalii al texturilor reglabil din
joc are un rol esenial n
ocuparea unei cantiti mai
mari de memorie video. Nu ne
rmne dect s petrecem ceva
timp n jocuri sau, dac avem
rbdare, cu ochii zgii n
113

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

3DMark i s cutm artefacte. De cele mai multe ori, dac dup 10 minute de teste nu
am gsit nimic, este destul de probabil s nu gsim niciodat.
nc un aspect important: deseori, la plcile mai fierbini, dac alegem o
frecven mare la care avem probleme, dup care o coborm, e posibil s avem n acest
caz false probleme datorate ineriei termice. Aadar, va trebui s lsm placa la
frecvene mici pentru a se rci, eventual vom face o pauz de cafea i ne vom uita la
telenovela preferat n timp ce calculatorul st nchis. Lucru valabil i pentru
overclocking-ul GPU-ului. De asemenea, sunt cazuri n care un overclocking prea dur la
memorie duce la persistena artefactelor pn la urmtorul restart, eventual pn la
urmtoarea nchidere/deschidere a sistemului. n cazuri extreme, apar i blocaje.
Nu trebuie reacionat nici n sens invers: o frecven prea redus (setat temporar
pentru rcire sau pentru c pur i simplu nu avem nevoie de 3D i ne dorim o plac rece)
poate genera artefacte, blocaje sau alte probleme. n general, o valoare minim sigur
este cea de 150 MHz (300 MHz DDR), sub care pot aprea (n caz c stabilitatea se
menine) scderi de performan n lucrul 2D!
S exemplificm. Iat nite artefacte uoare (civa pixeli de pe cer colorai
eronat) obinute cu aceeai memorie ca n testul anterior (200 MHz implicit, 250 MHz
maxim), setate la 310 MHz.

Odat cu creterea rezoluiei i cu setarea FSAA, artefactele au crescut n


intensitate, rezultnd aceast imagine

114

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

n care doar partea de sus a fost randat corect. Probabil nite bii cheie (n
funcie de care se decidea randarea complet a scenei) au fost distrui, rezultnd aberaia
n cauz. De subliniat c aceste imagini sunt nite instantanee, urmtorul cadru fiind
afiat corect sau cu alte erori de imagine, memoria video refiind umplut cu informaie
i ali bii fiind nregistrai greit. Mergnd pn la capt (prin setarea frecvenei de 350
MHz), am obinut un talme-balme total.

115

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

Nu trebuie omis faptul c anumite drivere cauzeaz n unele jocuri fenomene


asemntoare cu artefactele, de cele mai multe ori fiind vorba de texturi ce par s
lipseasc din locul n care ar trebui s se afle sau de iluminri incorecte. Uneori
problemele in de joc i nu de driverul plcii grafice, alteori chiar i driverele plcii de
baz joac un rol. Iat cum arat textura podelei din Unreal Tournament pe unele plci
ATI cu ultimele drivere Catalyst dac jocul este setat s ruleze prin OpenGL.

Din alte unghiuri, ea este vzut corect, fr acele pete. Motivul este
incompatibilitatea dintre ultimele drivere i un joc aprut cu muli ani n urm, ce
folosete experimental modul OpenGL.
Dup cum am mai spus, att GPU-ul ct i memoria pot genera artefacte, aadar
cum ne dm seama cine e de vin? O prim regul, la fel de empiric precum toate din
acest capitol, spune c n 99% din situaii artefactele apar de la memorie, GPU-ul
genernd n primul rnd blocaje. Graie lui VPU Recover, plcile ATI beneficiaz de
posibilitatea ca n momentul apariiei unei erori s fie repuse frecvenele implicite,
neexistnd nici un blocaj complet. Aceasta n teorie. i n cazul plcilor NVIDIA, de
multe ori apsarea Ctrl+Alt+Del dezghea core-ul plcii, dnd o ans recuperrii
sesiunii curente de Windows. Iat, totui, nite artefacte generate de GPU.

116

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 3

Observm cei doi muni triunghiulari care nu au ce cuta n scen. Spre


deosebire de artefactele de memorie, ei nu au fost nite instantanee ci au rmas n scen
pn cnd au ieit din cadru, fiind tratai ca nite obiecte reale ale scenei. Chip-ul grafic
i-a inventat din cauza unei erori cauzate de frecvenele prea ridicate.
Un test foarte stresant pentru GPU este Wings of Fury din 3DMark03. Dei bazat
doar pe DirectX 7, el solicit la maxim chip-ul grafic, fiind primul test de stabilitate care
trebuie luat n seam (pe lng, poate testul de scanare a artefactelor oferit de ATITool,
dar care funcioneaz doar pe anumite plci). Dup toate setrile efectuate, nu stric
lsat o noapte ntreag un test precum 3DMark n modul loop. Dac diminea gsii
demo-ul rulnd fr probleme, se poate spune c overclocking-ul a reuit.

117

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

4 Evaluarea display-urilor
4.1

Generaliti
n plin er a dezvoltrii tehnologiei informaiei, persoana care dorete s "in
pasul" cu vremurile trebuie s se "echipeze" cu cel puin un televizor, daca nu chiar un
computer i o legtura la Internet.
Pe de alt parte, se spune c o imagine face ct o mie de cuvinte. Nimic mai
adevrat. Este dovedit faptul c informaia se reine cel mai bine atunci cnd o receptm
vizual. Vom aborda n acest seminar noile tehnologii i tendine ce se manifest n
privina display-urilor, n domeniul tehnologiei informaiei.
Nu ne vom referi la toate dispozitivele de afiare a informaiilor existente peste
tot n jurul nostru, chiar dac tim sau nu s interpretm ceea ce ne "spun" (afiajele
electro-mecanice de la autobuze care indic linia, display-urile ncorporate n aparatura
medical etc.).
Ne vom limita la categoria ecranelor de tip "flat panel", care vor revoluiona n
viitorul deloc ndeprtat viaa oamenilor.
Este destul de greu s oferim o definiie riguroas pentru display-urile de tip
"flat panel", dar nu cred c exist vreo persoan care s nu fi vzut mcar o dat n via
un astfel de ecran. Iniial, acestea au fost proiectate pentru utilizarea n cadrul
laptopurilor, dar caracteristicile i avantajele lor le-au propulsat n faa ecranelor clasice
cu tub catodic (CRT - Cathode Ray Tube).
Ecranele de tip "flat panel" cuprind o varietate larg de tipuri constructive i
tehnologice. Clasificndu-le dup tipul de refresh pe care l necesit, avem:
Display-uri cu refresh continuu:
LCD (Liquid Crystal Display)
Plasma
DLP (Digital Light Processing)
LCOS (Liquid Crystal On Silicon)
OLED (Organic Light-Emitting Diode)
ED (Surface-conduction Electron-emitter Display)
FED (Field Emission Display)
NED (Nano-Emissive Display)

Display-uri bistabile (hrtie electronic):


e-ink
Gyricon
Magink

Dintre toate tipurile de display-uri "flat-panel" enumerate sunt disponibile


comercial doar ecranele cu plasm, LCD, DLP, LCOS i OLED. n 2006 se atepta
lansarea pe pia a display-urilor SED.
Ecranele FED i NED sunt doar n faza de prototip, ncepnd cu luna noiembrie
2005.
Vom trece n continuare n revist cteva detalii despre fiecare dintre aceste
tehnologii..
118

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

PLASMA
Un display cu plasm este un ecran flat-panel n care lumina este creat de
particule fosforescente care sunt excitate de o descrcare de plasm ntre dou suprafee
plate de sticl. Descrcarea gazoas conine un amestec total inofensiv de neon i
xenon.
Totui, ce reprezint aceasta "plasm"? Elementul central dintr-o lumin
fluorescent este plasma, un gaz alctuit din ioni i electroni care "plutesc" liber. n
condiii normale, gazul este alctuit n principal din particule nencrcate cu vreo
sarcin. Dac se aplic un curent electric prin aceast plasm, particulele ncrcate
negativ sunt atrase de partea ncrcat pozitiv a plasmei i invers. n aceast
nvlmeal, particulele se ciocnesc n mod constant unele de altele, fapt ce determin
excitarea atomilor de gaz din plasm. Astfel, se elibereaz fotoni de energie n spaiu,
lund natere lumina fluorescent.
Display-urile de acest tip au fost lansate pe pia pentru prima data n 1997 de
compania Pioneer i au ajuns s fie preferate n momentul de fa n cadrul televiziunii
de nalt definiie (HDTV).
Trebuie spus ca un display cu plasm consum la fel de mult curent electric ca i
unul cu tub catodic, raportat la aceeai suprafa a ecranului. Deocamdat, ns, preul
este destul de restrictiv, dar aa cum se ntmpl n industria IT, progresul tehnologic
aduce cu sine i reducerea preurilor, astfel c este foarte posibil ca display-urile cu
plasm s nlocuiasc vechile ecrane cu tuburi catodice.
Oled
Un display OLED funcioneaz pe baza principiului electroluminiscenei.
Elementul de baz al unui afiaj OLED este luminoforul organic, care determin
aproape toi parametrii pixelului de pe ecran. Nu vom intra n amnunte constructive.
Pe piaa din Romnia, ecranele OLED se ntlnesc n cazul unor MP3-playere (ex.:
Apple iPod, Philips) i a unor modele de telefoane mobile (ex.: Samsung).
Dlp
Digital Light Processing este o tehnologie dezvoltat de compania Texas
Instruments, acesta fiind n continuare singurul productor al acestor ecrane. Un display
DLP se compune, n principal, dintr-o surs de lumina alb, un cip DMD, o lentil de
proiecie i ecranul propriu-zis.
Imaginea este creat de mici oglinzi microscopice dispuse ntr-o matrice pe un
cip din material semiconductor, cunoscut i sub numele de Digital Micromirror Device
(DMD). Fiecare oglind reprezint un pixel din imaginea reconstituit. Oglinzile se pot
poziiona n dou feluri: atunci cnd sunt "oprite", ele sunt aliniate la orizontal i
determin apariia pixelilor negri pe ecran. ns, cnd cineva pornete sistemul, oglinzile
ncep s se mite nainte i napoi de cteva mii de ori pe secund. Ele reflect lumina
printr-o lentil de proiecie direct pe ecran. Cu ct o oglind este mai mult pe poziia de
"pornit", cu att pixelul va fi mai luminos. Acesta este mecanismul de creare a nuanelor
de gri.
Culoarea este adugat prin intermediul unei "roti de culoare" (color wheel),
care este de fapt o roat transparent cu segmente roii, verzi i albastre (RGB) care se
nvrtete. Lumina care trece prin fiecare seciune i schimb culoarea n mod
corespunztor. Procesorul sistemului sincronizeaz roata de culoare cu oglinzile.
Fiecare pixel de lumin de pe ecran este rou, verde sau albastru la orice moment de
timp. Tehnologia se bazeaz pe capabilitatea ochiului uman de a amesteca culorile
pixelilor pentru a forma culoarea corespunztoare imaginii. De exemplu, pentru un
119

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

galben, DMD va reflecta lumina de la segmentele roii i cele verzi ale roii de culoare,
ignornd segmentul albastru. Astfel, un display DLP este capabil sa "creeze" 16
milioane de culori.
O bil neagr pentru aceasta tehnologie este efectul de curcubeu, care apare
tocmai datorit mecanismului vizual de amestecare a culorilor. Desigur, intensitatea
acestuia variaz de la om la om, pentru eliminarea lui folosindu-se roi de culoare care
se rotesc cu viteze mai mari i cu mai multe segmente colorate.
Trebuie spus c exista i display-uri DLP care folosesc trei surse de lumin, colorate
fiecare n cate una dintre culorile de baza: R (rosu), G (verde) i B (albastru). Se elimin
astfel roata de culori i efectul de curcubeu i se creste calitatea imaginii.
LCOS
Liquid Crystal on Silicon este o tehnologie "micro-display" aplicat n general n
cazul televizoarelor cu proiecie. Este asemntoare cu tehnologia reflectiv folosita n
cazul DLP i folosete cristale lichide n locul oglinzilor individuale. Micarea
oglinzilor este nlocuit n acest caz cu starea de polarizare a cristalelor lichide. Acestea
i schimb orientarea la aplicarea unui curent electric, permind reflectarea luminii sau
blocnd-o.
Un microdispozitiv LCOS este alctuit din mai multe straturi, dintre care unul
reflectiv i, deasupra, un strat de cristale lichide.
Funcionare: pe scurt, lumina alb emis de surs este trecut printr-o lentil de
condensare care o focalizeaz i o direcioneaz spre un separator, care transform raza
de lumin alb n trei raze corespunztoare celor trei culori principale: rou, verde i
albastru. Apoi, aceste raze vin n contact cu cele trei microdispozitive LCOS. Lumina
reflectat de acestea este trecut printr-o prism care combin cele trei culori, aceasta
direcionnd i raza printr-o lentil de proiecie, care mrete imaginea i o afieaz pe
ecran.
Cteva dintre dezavantajele acestor sisteme includ: - lipsa capabilitii de
producere a culorii negre, ceea ce duce automat la un contrast sczut, precum i dimensiunile destul de mari n comparaie cu ecranele LCD sau cele cu plasm.
Totui, problema efectului de curcubeu din cazul DLP a fost rezolvat la display-urile
LCOS. Pe plan local, acest tip de display a nceput s ptrund timid, productorul
reprezentat n Romnia cel mai bine fiind Canon.
SED
Surface-conduction Electron-emitter Display este o tehnologie de afiare "flat
panel" care folosete emitori de electroni de conducie superficial pentru fiecare
pixel. Acetia emit electroni care excit un strat de fosfor de pe panoul de afiaj, acelai
principiu de baz prezent i n cazul ecranelor cu tuburi catodice. Aceasta presupune c
display-urile SED vor combina aspectul i dimensiunile ecranelor LCD cu ratele mari
de contrast, refresh-ul i calitatea superioar a imaginii ntlnite la CRT-uri.
Toshiba i Canon au anunat un acord de colaborare avnd ca scop producia n
scop comercial a display-urilor SED pn la sfritul anului 2005, dar se pare c primele
ecrane SED vor fi disponibile totui din 2006.
FED
Field Emission Display este un tip de display "flat panel" care folosete straturi
de fosfor ca medii de emisie. Inventatorul acestei tehnologii este indianul Harjinder
Kamboja. Foarte similare cu CRT-urile, FED-urile au ns doar civa milimetri
grosime, iar n locul folosirii unui singur tun de electroni, ele utilizeaz o reea de
120

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

vrfuri metalice fine, denumite i nanotuburi de carbon, care sunt cele mai eficiente
emitoare de electroni cunoscute vreodat).
NED
Nano-Emissive Display are la baz tot principiul tubului catodic. Prototipul
testat public de Motorola n 2005 este un tub catodic subire i plat cu mii de tunuri de
electroni la fiecare pixel. Prototipul poate reda toate culorile spectrului, are o
luminozitate puternic i se ncadreaz cu uniformitatea i puritatea culorilor n
standardele unui produs comercial.
Punctul cheie este abilitatea celor de la Motorola de a "produce" nanotuburi de
carbon direct pe substratul de sticl al ecranului. n trecut, aceste nanotuburi erau lipite
sau imprimate pe o suprafa, dar calitatea afiajului era dezamgitoare.
Hrtia electronic
Fr ndoial, aceasta este cea mai spectaculoas tehnologie care a aprut n
ultimii ani i care este, n momentul de fa, disponibil pe pia. Cine s-ar fi gndit
acum muli ani c vom putea folosi hrtia ca un ecran?
Ei bine, prima ncercare dateaz nc din anii '70 i a fost realizat de specialitii
de la centrul de cercetare Xerox din Palo Alto. n anii '90 i alte companii au mbriat
aceasta tehnologie, dezvoltnd-o pentru scopurile proprii. Sony a anunat de curnd
disponibilitatea pe piaa a modelului Sony Reader, un succesor al lui LIBRIe, care
folosete tehnologie de hrtie electronic dezvoltat de Philips.
Cerneala electronic (cunoscut i sub denumirea de e-ink, hrtie electronic sau
e-paper) este o tehnologie de afiare proiectat s "imite" cerneala obinuita pe hrtie.
Spre deosebire de ecranele "flat panel" care folosesc o surs de lumin pentru a ilumina
pixelii, hrtia electronic reflect lumina ca o hrtie obinuita i este capabil s
stocheze text i imagini un timp indefinit fr s consume electricitate sau s foloseasc
putere de procesare. Acestea sunt necesare doar pentru a schimba sau a terge imaginea.
Hrtia electronic este, de asemenea, mai uoar, mai durabil i mult mai
flexibil dect alte tehnologii de afiare. i datorit faptului c reflect lumina, ea poate
fi citit din orice unghi.
Aplicaiile n care se va dovedi cu siguran util includ crile electronice,
capabile s stocheze versiuni digitale ale multor opere, cu o singur carte afiat pe
pagini la un moment dat. Posterele electronice i materialele publicitare n magazine i
pe drumuri au fost deja demonstrate.
Avantajele ecranelor flat-panel fata de cele cu tub catodic:
dimensiuni mai mici;
luminozitate mai bun;
forma plat a ecranului ce elimin distorsiunile (dei exist i ecrane CRT plate);
consum redus de energie.

Avantajele i dezavantajele display-urilor OLED


AVANTAJE:
straturile organice i de plastic ale unui OLED sunt mai subiri, mai uoare i
mai flexibile dect straturile cristaline dintr-un LED sau LCD;
substratul unui dispozitiv OLED poate fi flexibil;
display-urile OLED sunt mai luminoase dect cele LCD datorit faptului c
suportul de sticl necesar acestora din urm absoarbe o oarecare cantitate de
lumin;
121

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

nu este necesar o iluminare din spate a ecranului, elementele OLED genernd


ele nsele lumina;
fabricarea ecranelor OLED este mai uoar, chiar i n mrimi mari;
unghiuri de vizualizare foarte bune, de aproximativ 170 de grade.
DEZAVANTAJE:
durata de viata a elementelor albastre OLED este n acest moment de numai
1.000 de ore, ceea ce este mult prea puin pentru cerinele actuale;
procesul de fabricaie este nc destul de costisitor;
apa constituie un pericol pentru ecranele OLED, pentru c le afecteaz
funcionalitatea.
Avantajele i dezavantajele ecranelor DLP
AVANTAJE:
imagini clare, lipsite de jitter (interferene);
adncime a culorii bun;
grosime mai mic dect a ecranelor CRT;
sursa de lumin poate fi schimbat, fapt ce duce la o durat de via mai mare
dect n cazul CRT sau a Plasmelor.
DEZAVANTAJE:
efectul de curcubeu;
grosime mai mare dect n cazul LCD sau a ecranelor cu plasm;
zgomotul ventilatorului de rcire.

4.2

Testarea Diplay-urilor TFT LCD


Ecranele cu cristale lichide normale, precum cele ntlnite n cazul
calculatoarelor de buzunar, conin elemente de imagine separate - se poate aplica o
tensiune peste un segment fr a interfera cu celelalte segmente ale ecranului. Aceast
soluie nu este practic pentru un display de dimensiuni mari (cu muli pixeli), pentru c
necesit milioane de conexiuni - cte dou pentru fiecare culoare primar (rou, verde i
albastru) a fiecrui pixel
Pentru a rezolva aceast problem, pixelii sunt adresai pe linii i coloane, fapt
ce reduce numrul de conexiuni pn la ordinul miilor.
Dac pe toi pixelii de pe un rnd este aplicat o tensiune pozitiv i dac pe toi
pixelii de pe o coloan este aplicat o tensiune negativ, atunci pixelul de la intersecia
liniei cu coloana are cea mai mare tensiune aplicat i este activat. ns i aici exist o
problem - toi pixelii de pe aceeai coloana i de pe aceeai linie sunt 'excitai" cu o
fraciune din tensiunea aplicat, astfel nct nu sunt activai complet li tind sp fie mai
puin luminoi.
S-a ajuns astfel la soluia aplicrii unui tranzistor fiecrui pixel, care permite
controlul individual. Fiecare pixel este un mic condensator cu un strat transparent de
oxid n fa, un strat transparent n spate i un strat izolator de cristale lichide ntre
acestea.
Layout-ul circuitului este foarte similar aceluia folosit n cazul memoriei
DRAM, dar toat structura este realizat pe sticl.
122

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

Datorit costului imens al fabricilor TFT, numrul productorilor de astfel de


ecrane nu este prea mare.
Toate tipurile de monitoare TFT moderne sunt "ludate" cu parametri foarte
buni, ns metodele de msurare permit productorilor s-i prezinte produsul n cea mai
bun lumin. Numeroasele convenii i simplificri introduse n procesul de evaluare au
un rol crucial de multe ori.
Dup cum vom observa, concluzia testelor este clar - nu exist un monitor LCD
"all-purpose" (care poate fi folosit cu succes n orice mprejurare).
n timp ce monitoarele CRT de nalt calitate pot fi utilizate pentru jocuri,
aplicaii office i procesare de imagini, display-urile LCD sunt de obicei specializate pe
cte una dintre aplicaiile enumerate.
4.2.1 Procedura de testare a monitoarelor LCD
Testul de monitoare LCD se desfoar dup o metodologie n care se urmrete
testarea efectiv a aspectelor cele mai importante funcionale ale unui astfel de
dispozitiv.
Per ansamblu, s-au punctat trei lucruri:
testul propriu propriu-zis de calitate a imaginii (60%),
caracteristicile tehnice (30%) i,
ergonomia (10%),
Din adunarea acestor note (cu ponderile corespunztoare) obinndu-se scorul
final. Astfel, orice persoan care i-a stabilit prioritile cu privire la un monitor LCD
(aspectele care conteaz mai mult) se poate ghida dup acestea, aprecierea din aceast
lucrare fiind una global. De exemplu, dac pe cineva nu-l intereseaz capitolul
ergonomie, poate s verifice scorurile de la primele doua categorii i s decid modelul
pe care eventual dorete s-l achiziioneze.
Calitatea imaginii a fost apreciat folosind programele Nokia Monitor Test 2.0 i
Monitor Test 2.2, dar i un trailer al unui film cunoscut, pentru a putea vedea
comportarea monitoarelor n cazul secvenelor video foarte dinamice i claritatea
acestora.
Aspectele punctate au fost:
existena i intensitatea efectului de Moire (apariia unor interferene suprtoare
n cazul dungilor foarte subiri sau a caroiajelor foarte fine) la aplicarea din
program a unor modele cu dungi subiri verticale i orizontale;
existena unor defecte de convergen a ecranului atunci cnd se aplic diverse
mire de verificare;
persistenta pixelilor - se poate aprecia aproximativ timpul de reacie al
monitorului la micarea unor ptrate albe pe fond negru cu diferite viteze;
claritatea imaginii - un monitor TFT ar trebui s ofere o imagine foarte clar n
aproape orice condiii;
existena efectului de zooming - semnific micarea spre margine a unui cadru
alb pe fond negru la aplicarea unui fond alb n interiorul cadrului;
interferenele care apar i intensitatea lor - acestea sunt cauzate de sensibilitatea
monitorului la radiaiile electromagnetice din exterior.

123

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

Caracteristicile tehnice punctate au fost:


timpul de rspuns al monitorului, care este definit ca fiind timpul de aprindere i
de stingere al unui pixel de la negru la alb i napoi la negru. Acest timp este
foarte important, el determinnd n mare msura comportarea monitorului n
diverse aplicaii;
rata de contrast a monitorului - exprim n ce msur un obiect poate fi distins
fa de un alt obiect din fundal; cu ct contrastul este mai mare, cu att imaginea
va fi mai clar
luminozitatea fiecrui model de monitor - exprim nivelul de lumin emis de
monitor i influeneaz, de asemenea, calitatea imaginii;
unghiul de vizualizare - cu ct se apropie de valoarea de 180 de grade, cu att
este mai asemntor, din acest punct de vedere, cu monitoarele clasice CRT;
certificarea internaional - exprim ce standarde de protecie mpotriva
radiaiilor respect fiecare monitor; s-au luat n calcul doar standardele TCO;
conectivitatea - n ziua de astzi, un simplu conector VGA analog (D-Sub) nu
este de ajuns pentru a profita din plin de capabilitile de procesare a plcii video
i de calitatea imaginii ce poate fi afiat de monitor.

ERGONOMIA
n fine, acesta este un capitol din ce n ce mai important pentru unii utilizatori.
Notarea aspectelor care in de ergonomie s-a fcut dup:
posibilitatea ajustrii ecranului n nlime;
posibilitatea pivotrii ecranului (rotire la 90 de grade sau chiar mai mult);
posibilitatea rotirii suportului, pentru a crete gradul de confort al utilizatorului;
dimensiuni i greutate.
4.2.2 Cum s alegem un monitor
Dac v-ai hotrt s achiziionai un monitor, ar trebui s v gndii nainte cu
ce tip de aplicaii l vei folosi. Dorii s v uitai mai mult la filme? Sau vrei s
ncercai ultimele jocuri lansate? Lucrai mai mult la birou n aplicaii office?
n funcie de rspunsurile la aceste ntrebri vei putea alege monitorul LCD
potrivit pentru nevoile dv. Iat n continuare un mic "ndrumar".
Dac filmele sunt preferatele casei i dorii s le vizionai n cel mai bun mod
posibil, trebuie s v orientai dup monitoare LCD cu:
diagonala mare - cel puin 19 inci (aproximativ 48 cm);
timp de rspuns acceptabil - cel mult 12 ms;
rata de contrast mare - cel puin 600:1;
luminozitate mare - cel puin 330 cd/m2;
eventual modul de tuner TV ncorporat - pentru a putea viziona i filmele
transmise de posturile de televiziune;
conectivitate ct mai variat, pentru a putea conecta eventual i camere foto
digitale, camere video etc.;
ergonomie bun - pentru a v fixa monitorul n poziia cea mai bun pentru dv.
Ar trebui s se poat ajusta nlimea i s se roteasc suportul.

124

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 4

Pasionaii de jocuri PC ar trebui s se uite n primul rnd la monitoarele care au,


orientativ, urmtoarele caracteristici:
timp de rspuns mic - cel mult 8 ms;
rata de contrast mare - cel puin 600:1;
luminozitate mare - cel puin 330 cd/m2;
certificare internaional ct mai bun - TCO 03.
n fine, pentru cei care lucreaz mai mult cu aplicaii office i navigheaz pe
Internet, recomandm monitoarele TFT cu:
certificare internaional ct mai bun - TCO 03;
porturi USB ncorporate (eventual), pentru un acces mai comod i mai rapid la
diversele echipamente ce se pot conecta prin intermediul acestor porturi (camere
foto, video, telefoane mobile, stick-uri de memorie etc.;
ergonomie bun - pivotarea la 90 de grade este foarte util mai ales n cazul
editoarelor de texte.
Bineneles, este de la sine neles c toate aceste caracteristici trebuie s fie
nsoite de o calitate ct mai bun a imaginii, aa ca atunci cnd l cumprai este bine s
aruncai o privire comparativ asupra monitoarelor expuse n stand, dac acest lucru
este posibil. Dac nu, mcar o privire individual asupra modelului la care v-ai hotrt.

125

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

5 Metodologia de realizare a overclocking-ului la procesoarele


Intel
5.1

Introducere
Overclockingul reprezint procedeul prin care o component hardware este
forat s funcioneze peste parametrii dai de productor, de exemplu creterea
frecvenei de tact procesorului fr ca acest lucru s duc la instabilitatea sistemului.
Ca o parantez se poate spune c odat cu dezvoltarea tehnicii n domeniul
semiconductorilor, productorii de procesoare blocheaz posibilitile utilizatorilor de a
obine frecvene mai mari dect cele nscrise pe procesoare, motivele sunt multe dar se
pare c cel mai important dintre ele ar fi diferena de pre care trebuie s se justifice prin
calitile procesorului n special prin frecvena la care ruleaz acesta.
Noiunea de overclock apare de fapt nc din procesul de producie al
procesoarelor, prima treapta n fabricarea unui procesor este wafer-ul (un disc subire
din siliciu) pe care se aplic structurile care determina configuraia viitoarelor
procesoare, astfel c pe un asemenea wafer se delimiteaz mai multe chipuri a cror
frecven nu se cunoate pn n momentul n care sunt separate, asamblate i testate.
Dup cum v imaginai pe un wafer se afl procesoare care n ciudata faptului c au
aceeai structur pot rula la frecvene diferite fr s duca la instabilitatea sistemului. n
momentul n care acestea sunt testate se stabilete frecvena de lucru a fiecrui procesor
astfel nct acesta s ruleze corect chiar i n condiii n care nu se asigur o rcire
corespunztoare ori tensiunea de alimentare nu este stabil.
Un asemenea procesor trebuie sa ruleze fr probleme minim 10 ani, din acest
motiv productorii marcheaz frecventa la care chipul a funcionat bine n condiiile
date mai sus. n aceste condiii concluzia este clar, chipurile nu sunt marcate cu
frecvena maxim la care pot funciona fr probleme, se las un spaiu de siguran
pentru ca acestea s funcioneze corect i n condiii extreme.
n ultima vreme, overclock-ul este o practic tot mai des ntlnit, unii zic c
deja a devenit un sport naional, i personal chiar cred acest lucru. Datorit acestui fapt,
muli utilizatori doresc s-i overclockeze procesorul dar nu au suficiente cunotine n
acest domeniu i din acest motiv apar foarte des topic-uri de genul "Overclock, little
help?".
ATENIE : Autorul acestui seminar nu se face responsabil pentru orice
pagub, pierdere de date sau orice alte inconveniente produse sistemului dvs.
folosind tehnicile prezentate aici. V mulumesc pentru nelegere.
5.2

FSB la Intel
Spre deosebire de Athlon64, Intel a pstrat controllerul de memorie n cipset, nu
n procesor, deci pentru cei obinuii cu vechea magistrala FSB am o veste bun: Intel a
pstrat-o. Aceasta este o magistral care conecteaz procesorul de memorii prin
intermediul northbridge-ului (n care se afl controllerul de memorie). Pentru a face un
overclock bun la Intel, trebuie s nelegem cum este generat frecvena procesorului.
Ea este obinut prin nmulirea frecvenei FSB-ului cu multiplicatorul procesorului.
Frecventa FSB-ului este de 100Mhz la primele pentium4, apoi 133 la Northwood
126

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

(urmtoarea generaie de p4) i la unele Prescott-uri (n special Celeroan), de 200 la


Prescott i la Core 2 Duo 4300 i de 266 la Core 2 Duo.
Acum poate o s v ntrebai un lucru: Cum are Core 2 duo numai 266 c eu tiu
c are 1066, i la fel i Prescott are 800Mhz?. Frecvena asta mic este frecvena real a
FSB-ului, care este quad-pumped adic trimite date de 4 ori ntr-un ciclu de ceas i de
aici frecvena efectiv este de 4 ori mai mare: 400 pentru fsb real de 100; 800 pentru fsb
real de 200 i aa mai departe. La generarea frecvenei procesorului se nmulete
frecvena real a FSB-ului nu cea efectiv.
De ex: un Prescott la 3000Mhz are fsb real de 200Mhz i multiplicatorul de 15,
astfel c 200*15=3000. Overclock-ul la Intel se face de cele mai multe ori prin ridicarea
frecvenei FSB-ului, deoarece multiplicatorul este aproape ntotdeauna blocat din
fabric. Practic tehnica de overclock la Intel este destul de simpl, paii care trebuie
urmai fiind uori. n primul rnd, dac avei procesor Core 2 Duo dezactivai toate
opiunile de la CPU, mai puin Execute Disable Bit. Frecvena FSB-ului se
incrementeaz n pai mici (din 5 n 5 Mhz e bine) i de fiecare dat cnd ai urcat cte o
treapt, salvai setarea, i testai stabilitatea sistemului cu programe speciale de
benchmark, de ex: Prime95, StressPrime2004, Orthos, SuperPI, S&M. Din frecvena
FSB-ului deriv i celelalte frecvene ale sistemului, cum ar fi cea a memoriilor (tratata
mai jos), cea PCI, AGP, i PCI-Express.
Dac placa de baz permite, frecvenele acestea trebuie blocate la valorile lor
stock, altfel vei fi puternic limitat n overclock de ele. Valorile stock sunt urmatoarele:
33Mhz pt PCI, 66Mhz pt AGP, 100Mhz pt PCI-Express i tot 100Mhz i pt porturile
SATA.
5.3

Frecventa memoriilor, comarul divizorilor i al latentelor


Aa cum am menionat mai sus, n momentul ridicrii frecvenei FSB-ului va
crete i frecvena memoriilor. Diferena major dintre Intel i AMD64 este c la
AMD64 frecvena procesorului se mprea cu un anumit divizor pentru a obine
frecventa memoriilor, dar la Intel frecvena procesorului nu are nimic de-a face direct cu
frecvena memoriilor, ci frecventa FSB este cea care determin frecvena memoriilor i
divizorii (de fapt sunt nite raporturi) se aplica la FSB. De ex s lum un procesor cu
FSB de 1066Mhz. Nu se lucreaz cu 1066 ci cu frecvena real adic 1066/4~266Mhz.
Dac se folosete un raport de FSB:RAM=1:1 atunci ramii, fiind double-pumped
vor rula ~533Mhz. Dac setam un raport de 4:3 atunci folosind puina matematic
RAM=FSB*3/4 care ne d RAM~200Mhz, deci 400Mhz frecvena efectiv. n funcie
de ce memorii dispunei i de ct de mult suport ele frecvena peste stock, facei un
calcul i setai divizorii potrivii pentru ca memoriile s ruleze la frecvene stabile.
Desigur placa de baza nu permite s setai chiar orice valoare la divizori deci din
acest punct de vedere avem un dezavantaj, dar spre deosebire de AMD, permite rularea
memoriilor mai rapid dect FSB-ul prin setarea unui raport supraunitar, dar acest lucru
nu aduce mai nimic n plus la performan.
De fapt la Intel, spre deosebire de AMD64, n general, memoriile mai rapide nu
aduc un spor foarte mare de performan, deoarece, dac dispunem de nite memorii
foarte rapide se va mari limea de band ntre memorii i northbridge dar acest lucru nu
ajut prea mult deoarece ntre procesor i northbridge tot mic rmne.

127

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

Ca s nelegei cum s umblai cu latentele trebuie nti s nelegei ce sunt ele


de fapt. Pentru aceasta, haidei s facem o analogie cu un concurs de atletism. Gndiiv la cursa cu tafet, acolo fiecare atlet trebuie s alerge o distan i apoi s predea
tafeta. Fiecare atlet alearg distana ntr-un timp anume. Dac unul alearg ntr-un timp
mai lung dect de obicei, nu-i nici o problem, ceilali ateapt dup el, iar tafeta
ajunge la destinaie. n schimb dac unui atlet i se impune s alerge distana mai repede
dect poate atunci el nu ajunge la succesorul su, acesta pleac fr tafet i tot
procesul se duce de rp. Astfel se ntmpl i la memorii, ele au nite laente stock.
Dac setam unele mai mari, scade performana dar stabilitatea rmne. Dac setam
unele mai mici atunci s-ar putea s le suporte dac sunt memorii bune, iar dac nu le
suport atunci se compromite stabilitatea i sistemul fie d Blue Screen, fie nu booteaz
deloc. Sunt patru latene mai cunoscute, deci mai importante. Memoria este structurat
ca o matrice. Latenele sunt:
CAS (cL): aceast laten se refer la timpul necesar din momentul cererii unei
operaii de citire i pn n momentul n care sunt trimise datele ;
RAS-to-CAS (tRCD): aceast laten se refer la timpul care trece din
momentul n care un rnd este activat i pn cnd este executat prima operaie
de citire sau scriere ;
RAS precharge (tRP): este timpul din momentul trimiterii unei comenzi
precharge pentru a nchide un rnd i pn n momentul n care urmtoarea
comand activ poate fi executat;
Active-to-precharge delay (tRAS): Aceast laten se ntinde peste civa pai
n activitatea memoriei. Aceasta se refer la numrul minim de cicluri de ceas
care trebuie s treac de la o comand activ pn la una precharge.
Mai este i Command Rate-ul. Acesta este timpul din momentul n care un chip
este selectat i pn n momentul n care se poate executa prima comanda activ.
Cred c este clar, c cu ct sunt latentele mai mici cu att performana memoriei
este mai mare. La memoriile DDR latenele obinuite ntlnite la cele mai multe module
de memorii sunt 2.5-3-3-6 sau 2.5-3-3-8 i command rate de 2. Cifrele sunt n ordinea
aceasta: CAS, RAS-to-CAS, RAS precharge, Active-to-precharge. Ele nu reprezint
uniti de timp (nanosecunde sau ceva de genul) ci cicluri de ceas. Memoriile cele mai
de calitate de tip DDR pot funciona chiar i la 2-2-2-5 i command rate de 1. Memoriile
DDR2 au latene mai mari de genul 5-5-5-12; 4-4-4-10 etc.
Setri uzuale ale latenelor memoriilor
RAS
Active-toNr.
CAS RAS-to-CAS
Tip memorie
precharge
precharge delay
crt.
(cL)
(tRCD)
(tRP)
(tRAS)
1
DDR normale 2,5 3
3
6
2
DDR normale 2,5 3
3
8
3
DDR best
2
2
2
5
4
DDR2
5
5
5
12
5
DDR2
4
4
4
10

Command
Rate
2
2
1

S vedem acuma ce legtur au latenele cu overclock-ul. n momentul n care


ridicm frecvena memoriilor peste cea stock i ele devin instabile sunt 2 metode de a le
mri stabilitatea. Una este prin supravoltare i este tratat pe larg mai jos, iar cealalt
128

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

este prin modificarea latenelor. Ele trebuiesc mrite pentru a stabiliza memoriile la
frecvene mrite. Ideal este s avem frecvena ct de mare la memorii i latente ct de
mici, aici intervin memoriile de calitate, fcute pentru overclock (ele de altfel
"overclockeaz" i portofelul, deoarece i determin o vitez de golire mult peste cea
stock laughing care suport frecvene mari cu latene mici.
5.4

Voltajele
n primul rnd, dac avei de gnd s supravoltai, nu lsai voltajele pe auto
deoarece placa de baz crete prea mult voltajul la procesor n funcie de FSB-ul setat, i
acest lucru va duce la o uzur prea mare a procesorului. Povestea cu voltajele este
similar ca i la AMD. Singura diferen este c dac overclock-ai un Pentium Prescott,
el se v nclzi foarte tare la ridicarea voltajelor i i va crete mult consumul de curent.
Dac avei un Northwood atunci fii foarte atent la SNDS. SNDS nseamn de fapt
"Sudden Northwood Death Sindrome" i apare atunci cnd voltajul este ridicat peste
1.75V. El const n moartea foarte prematur a procesorului spre deosebire de alte
procesoare supravoltate. Practic procesorul va deveni din ce n ce mai instabil, pn
cnd ntr-o zi brusc nu va mai funciona. Explicaia acestui "sindrom" este n fenomenul
fizic de migraie a electronilor care degradeaz n timp traseele electronice din nucleul
procesorului. Acest fenomen este amplificat i de temperaturi ridicate (De-aia nu-i bine
s se ncing prea tare procesorul), i este prezent la toate procesoarele dar la
Northwood se pare c este mai accentuat.
n primul rnd cnd se supravolteaz o component, este recomandat s nu se
depeasc cu 10% voltajul stock.
S lum de ex procesorul Intel Pentium D805 care are frecvena stock de
2,66Ghz, FSB de 533Mhz (133 real) i multiplicator de 20x. Iniial vom urca n pai
mici cu FSB-ul pn la 160Mhz (640 efectivi) obinnd o frecventa de 3200Mhz. Pn
aici este stabil la voltaj stock (1.24V conform cpu-z).
Dac i dm pana la 1.30V urc pn la 3800Mhz, iar dac suntem duri i i
bgm n el 1.4V trece de 4Ghz dar cu un coolerul box nu prea st mult la frecvena asta
i imediat intr n Throttling i pierde stabilitatea pentru c temperatura ajunge la 80 de
grade n full load. Pentru cei care nu tiu Throttling-ul este tehnologia de protecie a
procesoarelor Intel mpotriva supranclzirii. La nceput ea ncepe s introduc cicluri
IDLE printre ciclurile de ceas ale procesorului, acest lucru urmrind s-i scad
temperatura. Dac ciclurile idle nu scad temperatura suficient, throtlingul ia msuri mai
drastice i i scade multiplicatorul scznd-ui astfel frecvena de lucru i astfel scznd
i mai mult temperatura pn cnd aceasta coboar sub limit. Cred c este evident c
odat intrat n Throttling procesorul va avea penalizri de performan. La procesorul
dat ca exemplu, observam c ctigm destul de muli mhz, n plus prin supravoltare dar
acesta este doar un procesor, altele se comporta diferit la supravoltare, unele s-ar putea
s nu urce mai mult de vreo 200mhz orict voltaj i s-ar da, de fapt dou procesoare
identice nu se overclockeaz la fel.
Supravoltarea uzeaz mai puternic procesorul dect simpla supratactare astfel c
trebuie folosit cu grij, i s urmrii tot timpul s folosii voltajul minim necesar
pentru stabilitate. De ex dac i dai 1.4V, dar el este stabil i la 1.3V atunci lsai-l la
1.3V.
Tot timpul cnd supravoltati FITI CU OCHII PE TEMPERATURI. La Pentium
4 i la Pentium D s nu depeasc 50 n idle i 60 n full, iar la core 2 duo s nu
129

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

treac de 55 cel mult n full i s stea n jur de 4042 n idle. Dac ele depesc aceste
limite va trebui fie s v cumprai un cooler mai performant, fie s mbuntii
ventilaia n carcasa dac aceasta las de dorit (ideal este un ventilator jos n fa care
bag aer i unu sus n spate care scoate. Se mai pot pune ventilatoare i pe capacul
lateral sau n partea de sus a carcasei-"blow-hole").
La memorii se aplic cam acelai principiu, dar i acolo unele s-ar putea s urce
mult dac le mrim voltajul i altele s-ar putea s nu urce aproape de loc mai mult chiar
dac le ndopm cu voltaj.
Dac ai fcut overclock i sistemul nu este stabil, dar din anumite motive tii c
memoriile i procesorul ar putea mai mult (de ex dac le testai cu o alt plac de baza i
cu aia merg mai mult) limitarea vine din placa de baz, mai exact din cipset. Multe plci
de baz ofer opiunea de a mari i voltajul pe cipset, i din nou se aplic cam acelai
principiu ca i la procesor.
5.5

Strap-ul la northbridge
Asemenea unui procesor, northbridge-ul are frecvena intern proprie i latenele
proprii care influeneaz performana sistemului (lucru valabil de la i865 ncoace). Ne
vom referi la frecvena lui prin NBCC (North Bridge Core Clock). Acest NBCC
afecteaz direct performana i stabilitatea memoriilor, deoarece cum am spus mai sus,
la Intel frecvena memoriilor se obine din FSB i nu din frecvena procesorului.
Acest NBCC variaz n funcie de FSB-ul sistemului i de multiplicator. Putei
descoperi NBCC-ul mprind multiplicatorul curent al procesorului cu multiplicatorul
lui stock, i ctul l nmulii cu valoarea FSB-ului (valoarea real, nu cea quadpumped).
S luam un exemplu: luam un Conroe E6600 i i coboram multiplicatorul (nu
toate plcile de baza permit acest lucru, iar nici un procesor Intel n afar de cele
extreme edition nu permit urcarea multiplicatorului) de la 9 la 7 i i dm FSB de
500Mhz. Obinem urmtorul lucru aplicnd formula:
(9/7) * 500=642Mhz sta-i NBCC-ul.
Observm un lucru interesant. Cobornd multiplicatorul sistemului, ar trebui s-i
mrim stabilitatea, dar aici dac l coboram, NBCC-ul va crete i NorthBridge-ul se va
overclocka i deci va deveni mai instabil.
Am vorbit despre frecventa NB-ului. S vedem i ce-i cu latenele lui. Aceste
latene cresc n momentul cnd NBCC-ul atinge valori specifice, mrind astfel
stabilitatea dar scznd performana. Seria de latene care este setat la o valoare
specific a NBCC-ului se numete strap. Este un strap la 1066Mhz, unul la 1333Mhz i
aa mai departe. Productorii de placi de baz totui, schimb valorile la care anumite
strap-uri se seteaz. NBCC-ul declanator pentru fiecare strap difer de la plac de baz
la plac de baz. Putei testa diverse valori ale NBCC-ului folosind SuperPI sau orice alt
program de msurat lime de band pentru a vedea cnd se schimba latenele.
Revenim puin asupra msurilor de recptare a stabilitii. Acestea erau:
supravoltarea procesorului, a memoriei i a NB-ului. Supravoltarea NB-ului se face
cnd acesta provoac instabilitatea. Acest lucru se ntmpl pe capt de strap. De ex
dac suntem n strap-ul de 800Mhz, avem latena mai mare specifica strap-ului i deci
130

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 5

stabilitate. Cnd urcm FSB-ul, va urca i NBCC-ul dar latena va rmne la fel,
devenind la un moment dat prea mic, iar NBCC-ul fiind mare, va rezulta instabilitate.
Sunt 2 moduri de a rezolva aceast problem. Fie mrim FSB-ul pn ajungem
s declanm urmtorul strap (strap-ul de 1066) i astfel se va mri latena i NB-ul se
va stabiliza, sau dac procesorul nu duce FSB-ul mrit atunci vom supravolta NB-ul
pentru a-l stabiliza. Ziceam mai sus c mrind FSB-ul de la 800 n sus la un moment dat
ieim din strap-ul de 800 i intram n strap-ul de 1066Mhz. Intrarea n strap-ul de 1066
nu nseamn c suntem cu FSB-ul la 1066Mhz, ci mai jos. De-aia ziceam mai sus ca
difer NBCC-urile la care se schimb strap-ul n funcie de placa de baz.
S luam un exemplu concret c e mai uor aa (valorile sunt luate la ntmplare,
deci nu tiu la ce plac de baz sunt valabile(poate la nici una)).
Pornim de la 800Mhz FSB deci ne aflam n strap-ul de 800Mhz. S zicem c n
momentul cnd trecem de 950 de Mhz NB-ul trece n strap-ul de 1066 (cum ziceam mai
sus, valoarea declanatoare este mai mic). Asta nseamn c valoarea de 949Mhz este
nc n strap-ul de 800Mhz deci este mai instabil dect 950Mhz care este deja n strapul de 1066Mhz. Asta se ntmpl deoarece 949 este o valoare mare pentru latena strapului de 800Mhz, ns latena strap-ului de 1066 este bun pentru valoarea de 950 i deci
NB-ul este mai stabil.
Mai trebuie tiut c fiecare strap vine cu raporturile lui pentru frecvena
memoriei. Adic:
pentru strapul 800 avem urmtoarele frecvene pentru memorie cu raporturile
corespondente fiecreia:
400=1:1, 533=3:4, 667=3:5, 800=1:2

pentru strapul de 1066 avem aceleai valori de 400, 533, 667 i 800 dar
rapoartele sunt altele:
400=4:3, 533=1:1, 667=4:5, 800=4:6

strapul 1333 are aceleai frecvene la ram dar alte rapoarte:


400=5:3, 533=5:4, 667=1:1, 800=5:6

La unele plci putem gsi opiunea pentru de ex 889 la memorie. Acest lucru se
face prin modificarea forat a strap-ului n care ne aflm.

131

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 6

6 Metodologia de realizare a overclocking-ului la procesoarele


AMD
6.1

Introducere
Pentru nceput, este nevoie de:
un procesor overclockabil;
o plac de baz bun, care s permit modificarea unui numr mare de setri n
BIOS (FSB, HT multiplier, latene/frecvene RAM, voltaje pentru procesor,
memorii i chipset, etc.);
rcire bun pe procesor i preferabil un airflow decent n carcas;
o surs bun, cu destui amperi i care s nu aib fluctuaii de curent;

Soft-uri care ar trebui folosite pentru. monitorizare i testarea stabilitii:


CPU-z1, pentru informaii despre procesor i memorie;
Everest2 /Speedfan3 /SmartGuardian, pentru monitorizarea temperaturilor;
Prim95 / Orthos SP 2004, pentru testarea stabilitii procesorului i memoriei;
Memtest de Windows, pentru testarea memoriei;
SuperPI, un test rapid de performan, dar rezultatele sunt puternic influenate de
tweak-uri;
3D Mark 2001, un test care evalueaz cele mai importante componente ale
calculatorului: procesorul, placa video i memoria;
RivaTuner/ATi Tool, pentru monitorizarea temperaturii core-ului plcii video;

6.2

Procedura de realizare a overclocking-ului


1) n primul rnd din BIOS, se schimb setrile pentru RAM, de pe Auto/SPD
pe Manual i se schimb frecvena, pentru a nu exista o limitare din partea memoriei.
Cum se face asta depinde de BIOS: la unele arat frecvena, la altele divizorul (CPU/9,
CPU/14, etc.). Ideea este c frecvena memoriei trebuie sczut de la 400 MHz la 333
MHz sau chiar 266 MHz (n cazul sk. 754/939) i de la 667 MHz la 533 sau chiar 400
MHz pt. platforma sk. AM2.
2) Tot n BIOS exist opiunea HT Multiplier. Trebuie modificat pe Manual i
sczut valoarea multiplicatorului de la 5x la 4x sau chiar 3x. Din nmulirea HT
Multiplier cu HTT se obine frecvena HT, care nu trebuie s depeasc 1000 MHz (pt.
a fi sigur c stabilitatea nu este afectat de aici).
3) Urmeaz setrile pt. procesor, care, din nou, trebuie puse pe Manual pentru a
permite modificarea voltajului i a HTT-ului. Pentru nceput este recomandat creterea
HTT-ului n pai de 5 MHz pentru a putea testa ct mai corect i sigur dac este sau nu
stabil.

http://www.roclockers.net/monitorizare/cpu-z-1.40.html
http://www.roclockers.net/monitorizare/everest-ultimate-edition-4.00.html
3
http://www.roclockers.net/monitorizare/speedfan-4.32.html
2

132

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 6

4) Se salveaz setrile, se repornete sistemul i se ruleaz un test din cele de


mai sus, de preferat 3D Mark 2001 i/sau un joc pretenios. Ce s-ar putea ntmpla dac
ceva nu e bine sau cnd s-a ajuns prea departe:
sistemul nu POSTeaz, adic nici nu booteaz. n cazul sta probabil a crescut
prea mult frecvena. Soluia este resetarea BIOS-ulului cu jumper-ul de clear
CMOS de pe placa de baz. Toate setrile din BIOS vor reveni la default.
Sau se poate ine apsat tasta "1" n timp ce se apas butonul de reset al PCului. n acest caz BIOS-ul va reveni la setrile de fabric. Nu tiu dac la toate
plcile de baz este valabil aceast procedur, cel puin pe o plac ABIT A8N32X, la fel i pe un DFI NF4 ;
calculatorul pornete, dar nu intr n sistemul de operare. Aici iari nseamn c
s-a mers prea departe, dar se poate intra n BIOS pentru a efectua modificri.
dac pornete sistemul de operare, dar se reseteaz sau apare un BSOD (ecran
albastru) iari nu e bine i trebuie modificate valorile prin BIOS.

5) Testele:
Prime95: se las cel puin o or s ruleze testul "Blend". Recomandat: peste 4
ore.
Memtest de Windows: cel puin 100% cu maximul de capacitate. Recomandat:
peste 1000%.
SuperPI: mcar 16M. Recomandat: dou rulri ale testului 32M.
3D Mark 2001: un singur loop e OK. Recomandat: cteva ore de loop-uri
continue.

Pentru fiecare dintre teste se vor monitoriza temperaturile, inclusiv pe cele ale
plcii video n caz c se ruleaz un test 3D. Temperatura memoriilor se msoar
"degetometric". Dac sunt calde/cldue e OK. Dac ard/frig ncercai s le asigurai o
rcire, eventual cu un ventilator de 8 cm poziionat deasupra.

Cnd se ajunge la limite ar mai fi urmtoarele variante:


creterea voltajului furnizat procesorului, tot din BIOS. Limitele pt. folosirea
zilnic ar fi + 0,15V cu rcirea stock i poate ajunge pn la 0,3V n funcie de
rcire. Asta pe aer, pentru c rcirea pe ap e mai versatil i prefer s nu m
pronun.
o alt limitare ar putea fi memoria. Pentru ca s fim siguri c limitarea nu apare
de aici trebuie ca frecvena memoriei s fie la 400 MHz sau mai jos (sk.
754/939) sau n funcie de frecvena nominal a memoriei, 667 MHz, 533 MHz,
etc. (sk. AM2).
acelai lucru este valabil i pentru HT, care nu trebuie s depeasc 1000MHz.
Nu afecteaz cu nimic performana dac frecvena HT este mai mic de 1000
MHz, aa c poate fi folosit direct multiplicatorul 3x.
este recomandat i creterea voltajului de la chipset-ul plcii de baz.

133

Seminar Evaluarea performanelor sistemelor de calcul

Seminar 6

6.3

FSB la Athlon64
Poate c muli dintre voi tii c un overclock se face ridicnd fsb-ul. La
Athlon64 este puin diferit pentru c odat cu integrarea controlerului de memorie n
procesor nu mai avem FSB ci avem 2 magistrale. Este un memory bus care conecteaz
memoriile de procesor i un HyperTransport Bus care conecteaz procesorul de cipset
prin intermediul creia se trimit comenzi la diverse componente ale sistemului.
Pentru a putea face un overclock bun la Athlon64 trebuie s nelegem cum este
generat frecvena la aceste procesoare. Ele folosesc o frecven de baz care este de
multe ori greit numita ca FSB. Aceasta este de fapt frecvena HyperTransport sau i se
mai spune HT sau HTT. Ea este ntotdeauna 200Mhz. nmulind aceast frecven cu
multiplicatorul procesorului se obine frecvena de lucru.
De exemplu un Athlon64 X2 5000+ merge la 2600Mhz. Ele are frecventa HT de
200Mhz i multiplicatorul de 13. Deci pentru a overclocka un Athlon64 trebuie ridicat
frecventa HT (se poate face overclock i din multiplicator dar acesta este de cele mai
multe ori blocat). Dar, i celelalte frecvene de pe placa de baz deriv tot din frecvena
HTT. Frecvena efectiv a HyperTransport-ului este frecvena de baza multiplicat cu
multiplicatorul HTT. Multiplicatorul HTT este de regula 5x adic 5*200=1000Mhz (sau
2000Mhz sau 4GB/s). Modelele mai vechi de Athlon64 au htt-ul la 800Mhz deci cu
multiplicator de 4x. n momentul n care urcai frecventa de baz trebuie s avei grij
c aceasta multiplicat cu multiplicatorul HTT s nu depeasc maximul permis. De ex
dac urcai la 250mhz de la 200Mhz i multiplicatorul HTT rmne 5x va rezulta o
frecven efectiv a HyperTransportului de 1250 deci peste maxim. Astfel c trebuie
cobort multiplicatorul HTT-ului ca s coboare i frecvena sub limit. n cazul de fa
setnd un multplicator de 4x va rezulta 1000Mhz deci perfect. Nu este nici o problema
dac merge i sub 1000Mhz c nu are un impact vizibil asupra performanei.
O alt frecven care deriv din HTT este i frecvena PCI-express sau AGP
dup caz, i cea PCI. Frecvena PCI-express trebuie s fie 100Mhz cea AGP 66Mhz i
cea PCI 33Mhz. De asemenea porturile SATA necesita frecvena tot de 100Mhz. De
obicei plcile de baz pentru overclock folosesc un clock-generator separat pentru
aceste frecvene i au opiunea de a le bloca la valoarea lor standard.
Orice overclock depinde de placa de baz i de opiunile pe care aceasta le ofer.
Vom ncerca s prezentm ct mai generalizat:
blocai toate componentele la frecvena standard n afar de procesor bineneles
dac v permite placa de baz
punei frecvena de baza pe Manual de pe Auto dac este cazul
incrementai frecvena de baz n pai mici (din 5 n 5 Mhz e ok) verificnd
stabilitatea sistemului de fiecare dat (putei folosi programe specializate pentru
acest lucru cum ar fi: Prime95, Orthos, Stress Prime2004, SuperPI, S&M)
setai multiplicatorul HTT la 4x odat ce ai trecut de 220Mhz
setai multiplicatorul HTT la 3x odat ce ai trecut de 250Mhz
Frecvena efectiv HTT trebuie s stea sub 1000 sau sub 800, depinde de
procesor i de placa de baz.

134

Bibliografie
1. http://www.memtest.org/
2. http://www.mersenne.org/freesoft.htm
3. http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2322
4. http://www.xf.ro/content-62-page1.html
5. http://en.wikipedia.org/wiki/Wire_frame_model
6. http://www.realstorm.com/
7. http://www.memtest.org/
8. http://hcidesign.com/memtest/download.html
9. http://brain-power.net/menus.php?name=Company&c_lang=english
10. http://www.xf.ro/article135.html
11. http://www.guru3d.com/index.php?page=rivatuner
12. http://www.techpowerup.com/downloads/Tweaking/ATITool
13. http://www.techpowerup.com/atitool/
14. http://downloads.guru3d.com/download.php?det=872
15. http://www.mvktech.net/component/option,com_remository/Itemid,26/func,sele
ctfolder/cat,92/
16. http://www.entechtaiwan.net/util/ps.shtm
17. http://www.roclockers.net/monitorizare/cpu-z-1.40.html
18. http://www.roclockers.net/monitorizare/everest-ultimate-edition-4.00.html
19. http://www.roclockers.net/monitorizare/speedfan-4.32.html

135

Cuprins
CUVNT NAINTE

Partea a I-a : Curs


1.

NOIUNI DE BAZ PRIVIND EVALUAREA PERFORMANELOR.....................................5


1.1.
BENCHMARK-UL ORGANIZAIILOR.............................................................................................5
1.1.1. Avantajele benchmarking-ului ..................................................................................................5
1.1.2. Procedura de realizare a benchmark-ului ................................................................................5
1.1.3. Costul benchmarking-ului.........................................................................................................6
1.2.
BENCHMARKING-ULUI N COMPUTERE .......................................................................................6
1.2.1. Scopul benchmarking-ului ........................................................................................................7
1.2.2. Provocri ..................................................................................................................................7
1.2.3. Tipuri de benchmark .................................................................................................................8
1.3.
ARHITECTURA CALCULATOARELOR ...........................................................................................9
1.3.1. Scopurile proiectrii ...............................................................................................................10

2.

EVALUAREA PERFORMANELOR PLCILOR DE BAZ .................................................12


2.1.
PLCILE DE BAZ: FUNCIONARE, ISTORIE...............................................................................12
2.1.1. Definiii de baz: chipset-ul....................................................................................................12
2.1.2. Memoria, tipuri de memorie ...................................................................................................15
2.1.3. Interfeele interne: ISA, VLB, PCI, AGP etc ...........................................................................18
2.1.4. Interfeele externe: serial, paralel, USB etc............................................................................20
2.1.5. Interfeele pentru dispozitive de stocare .................................................................................21
2.2.
TESTAREA PLCILOR DE BAZ SOCKET 939.............................................................................23
2.2.1. Introducere..............................................................................................................................23
2.2.2. Modul de testare .....................................................................................................................24
2.2.3. Testarea efectiv .....................................................................................................................26
2.2.4. Abit AN8 Fatal1ty (nForce4 Ultra).........................................................................................26
2.2.5. Abit AN8 (nForce4).................................................................................................................29
2.2.6. DFI LANParty UT nF4 Ultra-D (nForce4 Ultra)...................................................................30
2.2.7. Gigabyte GA-K8NXP-SLI (nForce4 SLI)................................................................................33
2.2.8. Gigabyte GA-K8NF-9 (nForce4-4X) ......................................................................................35
2.2.9. Rezultate comparative.............................................................................................................36
2.2.10. Concluzii ...............................................................................................................................37

3.

EVALUAREA PERFORMANELOR PROCESOARELOR ....................................................38


3.1.
ARHITECTURA LUI PENTIUM 4 PRESCOTT ................................................................................38
3.1.1. Introducere..............................................................................................................................38
3.1.2. Gestionarea memoriei principale i secundare ......................................................................39
3.1.3. Latena ....................................................................................................................................41
3.1.4. Conductele ..............................................................................................................................42
3.1.5. Calculul matematic .................................................................................................................45
3.1.6. Tensiunile................................................................................................................................45
3.1.7. Ambalarea...............................................................................................................................45
3.1.8. Versiuni de Prescott-uri ..........................................................................................................46
3.1.9. Alte procesoare din familia P4 ...............................................................................................47
3.1.10. Concluzii ...............................................................................................................................48
3.1.11. Anex: Chipset-uri pentru Pentium 4 ...................................................................................49
3.2.
ARHITECTURA PROCESOARELOR AMD64 ................................................................................49
3.3.
TRECUT I PREZENT..................................................................................................................49
3.3.1. Cei 64 de biii..........................................................................................................................50
3.3.2. Memoria gestionat direct din procesor.................................................................................51
136

Cuprins
3.3.3. HyperTransport.......................................................................................................................52
3.3.4. Cache-ul..................................................................................................................................53
3.3.5. Conductele i predicia ...........................................................................................................54
3.3.6. Motentirea de la Intel ............................................................................................................54
3.3.7. Modele de K8, tehnologii de fabricaie i platforme...............................................................55
3.3.8. Concluzii .................................................................................................................................56
3.4.
PROCESOARE DUAL-CORE .......................................................................................................58
3.4.1. Tehnologia Intel dual-core Intel .............................................................................................59
3.4.2. Tehnologia Dual-Core AMD ..................................................................................................60
3.5.
TEST DE PROCESOARE ..............................................................................................................61
3.5.1. Testarea propriu-zis..............................................................................................................64
3.5.2. Procesoare testate: .................................................................................................................66
3.5.2.1.
Socket 939.................................................................................................................66
3.5.2.2.
Socket AM2 ..............................................................................................................66
3.5.2.3.
Socket T (LGA775) ..................................................................................................67

4.

EVALUAREA MEMORIILOR .....................................................................................................70


4.1.
INTRODUCERE ..........................................................................................................................70
4.2.
STANDARDE, HTT, FRECVENE, LIMI DE BAND .................................................................71
4.2.1. Latene ....................................................................................................................................72
4.2.2. Concluzii .................................................................................................................................78
4.3.
MODUL DE TESTARE .................................................................................................................78
4.4.
CHIP-URI DE MEMORIE .............................................................................................................80
4.4.1. A-Data Vitesta DDR500..........................................................................................................81
4.4.2. Corsair TWINX1024-3200C2PT rev 4.2.................................................................................82
4.4.3. Corsair TWINX1024-3200C2PT rev 5.2.................................................................................83
4.4.4. Corsair TWINX1024-3200XLPT rev 1.2.................................................................................83
4.4.5. Corsair TWINX1024-3200C2PRO rev 4.1..............................................................................84
4.4.6. Corsair TWINX1024-4400C25PT rev 1.1...............................................................................84
4.5.
CONCLUZII ...............................................................................................................................85

5.

EVALUAREA PLCILOR GRAFICE .........................................................................................86


5.1.
INTRODUCERE ..........................................................................................................................86
5.2.
FRECVENE I LATENE ...........................................................................................................87
5.2.1. Frecvene ................................................................................................................................87
5.2.2. Latene ....................................................................................................................................88

6.

EVALUAREA HARD DISCURILOR ...........................................................................................91


6.1.
INTRODUCERE ..........................................................................................................................91
6.2.
STRUCTUR I FUNCIONARE...................................................................................................91
6.2.1. Transferul datelor la memorie ................................................................................................92
6.2.2. Interfee i controlere..............................................................................................................92
6.3.
CARACTERISTICI ......................................................................................................................93
6.3.1. Optimizarea timpilor de cutare.............................................................................................94
6.3.2. Optimizarea latenelor de rotaie............................................................................................94
6.3.3. Tehnologia NCQ .....................................................................................................................95
6.3.4. Hard discuri...puin mai silenioase........................................................................................96
6.3.5. Criptare nativ pentru hard discuri........................................................................................96
6.3.6. Hard discuri liliputane............................................................................................................97

137

Evaluarea performanelor sistemelor de calcul

Partea a II-a : Seminarii


1

METODOLOGIA DE EVALUARE PENTRU PLCI DE BAZ .............................................98


1.1
1.2
1.3
1.4

EVALUAREA PLCILOR DE BAZ DUAL CORE ...............................................................102


2.1
2.2
2.3
2.4
2.5

OBIECTIVE: ............................................................................................................................102
CONSIDERAII TEHNICE..........................................................................................................102
PROCEDURA DE TESTARE .......................................................................................................103
PLCI DE BAZ TESTATE ........................................................................................................104
CONCLUZII .............................................................................................................................106

REALIZAREA OVERCLOCK-INGULUI LA PLCILE GRAFICE.....................................107


3.1
3.2
3.3
3.4

OBIECTIVE: ..............................................................................................................................98
INTRODUCERE ..........................................................................................................................98
CEI CINCI PAI N EVALUAREA OBIECTIV ................................................................................99
CONSIDERAII FINALE / NOTA FINAL ...................................................................................101

GENERALITI DESPRE OVERCLOCKING-UL LA PLCILE GRAFICE ..........................................107


CE MI TREBUIE PENTRU OVERCLOCKING? .............................................................................109
PROCEDURA DE REALIZARE A OVERCLOCKING-ULUI ..............................................................110
CND I CUM APAR ARTEFACTELE? .......................................................................................112

EVALUAREA DISPLAY-URILOR.............................................................................................118
4.1
GENERALITI .......................................................................................................................118
4.2
TESTAREA DIPLAY-URILOR TFT LCD ...................................................................................122
4.2.1
Procedura de testare a monitoarelor LCD.......................................................................123
4.2.2
Cum s alegem un monitor ...............................................................................................124

5
METODOLOGIA DE REALIZARE A OVERCLOCKING-ULUI LA PROCESOARELE
INTEL .....................................................................................................................................................126
5.1
5.2
5.3
5.4
5.5

INTRODUCERE ........................................................................................................................126
FSB LA INTEL ........................................................................................................................126
FRECVENTA MEMORIILOR, COMARUL DIVIZORILOR I AL LATENTELOR................................127
VOLTAJELE ............................................................................................................................129
STRAP-UL LA NORTHBRIDGE ..................................................................................................130

6
METODOLOGIA DE REALIZARE A OVERCLOCKING-ULUI LA PROCESOARELE
AMDEROARE! MARCAJ N DOCUMENT NEDEFINIT.
6.1
6.2
6.3

INTRODUCERE ........................................................................................................................132
PROCEDURA DE REALIZARE A OVERCLOCKING-ULUI ..............................................................132
FSB LA ATHLON64 ................................................................................................................134

BIBLIOGRAFIE............................................................................................................................135

CUPRINS........................................................................................................................................136

138

S-ar putea să vă placă și