Sunteți pe pagina 1din 1

3.

1.a. Ce diferenta exista intre 2 procesoare superscalare generice, unul


cu executie
Rolul structurii Data Write Buffer ( Store buffer) intr-o IN ORDER si altul cu executie OUT OF ORDER. CUm reuseste
arhitectura superscalara. Avantaje. fiecare dintre ele sa extraga si sa creasca paralelismul la nivelul
instructiunii. Care sunt principalele
Raspuns: elemente structurale care compun modelul de executie OUT OF
ORDER. Ce functii
DWB este o coadă FIFO (First In First Out) de lungime realizeaza aceste elemente?
parametrizabilă, a cărei valoare trebuie să fie minim IRmax, şi
care s-a ales aici de 32 locaţii. Fiecare locaţie conţine adresa de Raspuns:
memorie (virtuală) şi data de scris. Considerăm că DWB conţine
suficiente porturi de scriere pentru a susţine cea mai defavorabilă Arhitecturile cache unificate (Princeton), au la bază
situaţie (STORE-uri multe, independente şi simultane în implementarea unui mecanism realist de lansare în execuţie a
fereastra IRmax fiind deci posibile), oferind deci porturi de instrucţiunilor din bufferul de prefetch, de tip In Order şi care
scriere virtuale multiple. În schimb D-Cache va conţine un ţine cont de hazardurile RAW între instrucţiunile din acest
singur port de citire (LOAD) şi un singur port de scriere buffer. Practic, primele IRmax instrucţiuni din bufferul de
(STORE), reflectând o situaţie cât mai reală. Considerăm latenţa prefetch constituie fereastra curentă de execuţie. Se lansează în
de scriere a datelor în DWB de 1 tact iar latenţa de scriere a execuţie simultan N instrucţiuni independente RAW, N 
datelor în D-Cache este de 2-3 tacte (parametrizabilă). Cu DWB IRmax, în paralel cu aducerea următoarelor FR instrucţiuni din
sunt posibile deci STORE-uri simultane, fără el acestea trebuind cache. Apoi, ţinând cont de eventualele instrucţiuni netrimise în
serializate cu penalităţile de rigoare. În plus DWB va putea execuţie din cadrul ferestrei curente, se construieşte noua
rezolva prin "bypassing" foarte elegant hazarduri de tip "LOAD fereastră de execuţie, formată iarăşi din primele IRmax
after STORE" cu adrese identice, nemaifiind deci necesară instrucţiuni din bufferul de prefetch, după care procesele de
accesarea sistemului de memorie de către instrucţiunea LOAD. execuţie şi fetch se repetă întocmai.
Creşterea latenţei procesorului de ieşire DWB de la 2 la 3 cicli
determină o diminuare a performanţei de 11.63%. Rezultă cu cât O execuţie In Order a instrucţiunilor de tip LOAD şi STORE,
va fi făcut mai rapid procesul de scriere al DWB în cache-ul de simulează o nouă restricţie constând în incapacitatea totală a
date în cazul hit-ului, se va îmbunătăţi rata de procesare. schedulerului de a face analiză antialias a referinţelor la memoria
Utilizarea a două porturi de citire faţă de numai unul singur duce de date, ceea ce va duce la o scadere de performanta extrem de
la o scădere a ratei de procesare cu aproximativ 5%. O concluzie ridicata.
desprinsă în urma simulării este aceea că folosirea DWB în
scopul rezolvării hazardurilor de tip "LOAD after STORE" este Prin execuţia Out of Order a instrucţiunilor LOAD / STORE.
utilă doar în 5 din 8 cazuri, pentru 3 din benchmark-uri Schedulerele actuale nu permit sau permit în limite foarte strînse
neexistând hazarduri de date la memorie. Studiind în condiţii acest lucru, întrucât problema dezambiguizării (analiză antialias)
egale - cu DWB şi fără DWB - (latenţa_DWB=1=latenţa referinţelor la memorie nu este încă pe deplin rezolvată. Din
instrucţiunilor executate cu hit în cache-ul de date, un singur port păcate un scheduler pur static nu poate distinge întotdeauna dacă
de citire şi unul de scriere în cache-ul de date) rezultă avantajul două referinţe la memorie sunt permanent diferite pe timpul
concludent al buffer-ului DWB asupra performanţei execuţiei programului. În fine, o altă limitare de acest tip o
procesorului, prin tehnica de bypassing, determinând o creştere a constituie latenţa mare a unor instrucţiuni sau memorii care se
ratei de procesare cu 17.87%. aşteaptă să fie reduse în viitor prin progrese arhitecturale sau / şi
tehnologice.

1.b.
Selective Victim Cache - SVC
Definiti mecanismul de colapsare (combining) a instructiunii.
Avantaje si dezavantaje SVC este o memorie cache de tip selectiv (Selective Victim
Cache - SVC). În cadrul acestei noi arhitecturi cache, blocurile
Raspuns: aduse din nivelul superior de memorie pot fi stocate în memoria
cache principală, cu mapare directă, sau în SVC, bazat pe
Aceste instrucţiuni provin din sinteza, realizată prin mijloace probabilitatea de a fi utilizate în viitor. Astfel, blocurile care au o
hardware de tip colapsare "run-time" sau software (static, prin probabilitate de utilizare în viitor relativ scăzută, vor fi introduse
scheduler), a două instrucţiuni dependente RAW într-una singură în SVC, cele cu o probabilitate relativ ridicată, în memoria cache
mai complexă. Nu este absolut necesar ca cele două instrucţiuni principală. Similar, în cazul unui miss în cache-ul principal
combinate să fie consecutive, ci doar succesive în program. Este coroborat cu un hit în SVC, se va aplica un aşa numit algoritm
însă necesar ca unităţile funcţionale din cadrul CPU să permită de predicţie, cu scopul de a determina dacă este sau nu nevoie de
execuţia acestor instrucţiuni combinate, care pot avea 3 operanzi o interschimbare a blocurilor conflictuale (unul în cache-ul
sursă în loc de doi. principal, celălalt în SVC). Evident, algoritmul de predicţie
impune determinarea probabilităţii de utilizare a blocului
4.a. respectiv în "viitorul apropiat", pe o bază euristică rezultată din
procesarea unei informaţii de stare pe 2 biţi, după cum se va
Ce reprezinta si ce rol are un simulator dedicat unei arhitecturi arăta.
de calcul? Ca şi cache-ul victimă simplu (VC), SVC este o memorie de
Metodologii de simulare cunoscute. Avantaje; dezavantaje. capacitate redusă, cu un grad sporit de asociativitate, interpusă
între cache-ul principal cu mapare directă şi nivelul superior de
Raspuns: memorie. Memoria cache principală (MCP) şi SVC-ul sunt
baleiate în paralel la orice acces la memorie al procesorului.
Simulatorul permite atât analiza unor arhitecturi superscalare Latenţa SVC este considerată - în baza articolului original
având busuri şi cache-uri separate pe spaţiile de instrucţiuni şi [Sti94]- mai mare decât cea a MCP dar mai mică decât latenţa
date (Harvard) cât şi a unor arhitecturi cu busuri şi cache-uri nivelului superior de memorie. Acest lucru are sens în opinia
unificate (non-Harvard sau Princeton). mea, numai dacă se consideră o MCP adresată cu adrese virtuale
O metodologie de investigare este de tip "trace driven (cache virtual, avantajos dar dificil de implementat) şi o SVC
simulation" si face o cercetare efectuată asupra unor arhitecturi adresată cu adrese fizice, fapt necesar având în vedere că în
cache avansate, exclusiv de tip Harvard de această dată, cu general această memorie este complet asociativă.
mapare directă, integrate în cadrul unui procesor paralel.

S-ar putea să vă placă și

  • Prezentare Thomas Kearns
    Prezentare Thomas Kearns
    Document14 pagini
    Prezentare Thomas Kearns
    Bianca Gliga
    Încă nu există evaluări
  • Intrebari
    Intrebari
    Document58 pagini
    Intrebari
    Bianca Gliga
    Încă nu există evaluări
  • Intrebari
    Intrebari
    Document58 pagini
    Intrebari
    Bianca Gliga
    Încă nu există evaluări
  • Grupul Tinta
    Grupul Tinta
    Document1 pagină
    Grupul Tinta
    Bianca Gliga
    Încă nu există evaluări
  • Subiecte FINAL
    Subiecte FINAL
    Document21 pagini
    Subiecte FINAL
    Bianca Gliga
    Încă nu există evaluări
  • Rezolvare Model2 Subiect
    Rezolvare Model2 Subiect
    Document4 pagini
    Rezolvare Model2 Subiect
    Bianca Gliga
    Încă nu există evaluări
  • Examen
    Examen
    Document2 pagini
    Examen
    Bianca Gliga
    Încă nu există evaluări
  • Sub9 06 09
    Sub9 06 09
    Document1 pagină
    Sub9 06 09
    Bianca Gliga
    Încă nu există evaluări
  • Rezolvare Model Subiect
    Rezolvare Model Subiect
    Document4 pagini
    Rezolvare Model Subiect
    Bianca Gliga
    Încă nu există evaluări
  • Subiecte A&d APD 13.06.2008
    Subiecte A&d APD 13.06.2008
    Document1 pagină
    Subiecte A&d APD 13.06.2008
    Bianca Gliga
    Încă nu există evaluări
  • Teme Proiect Audio
    Teme Proiect Audio
    Document1 pagină
    Teme Proiect Audio
    Bianca Gliga
    Încă nu există evaluări
  • Proiect DSP Cerinte
    Proiect DSP Cerinte
    Document2 pagini
    Proiect DSP Cerinte
    Bianca Gliga
    Încă nu există evaluări
  • Indrumar PDS
    Indrumar PDS
    Document139 pagini
    Indrumar PDS
    Iulian Ciolacu
    Încă nu există evaluări
  • Subiect e
    Subiect e
    Document1 pagină
    Subiect e
    Bianca Gliga
    Încă nu există evaluări
  • RRRRR
    RRRRR
    Document1 pagină
    RRRRR
    Bianca Gliga
    Încă nu există evaluări