Documente Academic
Documente Profesional
Documente Cultură
Cuprins
Prezentarea Conferintei de presa din 2017
- Ansel
Arhitectura Pascal
Ansel
Ansel vine in ajutorul celor pasionati in arta gaming-ului, astfel incat iti permite sa creezi
screenshot-uri artistice prin multitudinea de functii. Aceasta tehnologie este implementata
direct in driverele placilor si aduce ca si concept, dar si realitate, un free-
camera virtual ce are rolul de a capta fotografii de calitate inalta, ajustand
imaginea si facand-o pe placul tau.
Free Camera
Abilitatea de a de tolosi de un free-camera virtual, in-game, pentru a iti cauta
un unghi de fotografiere perfect si totodata pentru a avea o experienta de
vizualizare a intregii lumi printr-un free-camera. Acesta este implementat
direct din driver, driver-ul activeaza modul free-camera si iti activeaza un
mod de vizionare in-game pentru a-ti cauta cadrul perfect. Acest featuring nu
presupune a avea implementat in sursa jocului un free-camera, ci acesta
poate fii activat pe orice joc disponibil pentru Nvidia Ansel.
Filters
Dupa ce utilizatorul si-a ales un loc unde poate face screenshot-ul, acesta se poate
folosi de filtre pentru a face totul mai artistic. Ansel include o multitudine de
moduri in care iti poti ajusta imaginea (filtru alb-negru / filtru de ajustare a
densitatii luminii si culorilor / dof / greenscreen / stickers / letterbox si altele).
Practic, iti poti transforma jocul dintr-un simplu frame intr-o poveste, adaugandu-I
filtre, facand corectii de culoare ori adauga un emoji, de a scrie ceva peste
imagine ori greenscreen pentru a-ti adauga propriul content peste frame.
Activand modul Filter, acesta iti pune la dispozitie preset-urile de mai sus si un
submeniu in care iti poti ajusta cum vrei setarile din preset-ul respectiv.
FXR
FXR este o tehnologie din cadrul Ansel ce-ti permite sa creezi o
imagine HDR si apoi sa o exporti in format RAW. Formatele RAW sunt
folosite cel mai adesea in industria design-ului foto, deoarece acesta
reprezinta o imagine de o dimensiune mai mare, ce retine o
multitudine de detalii in format HDR.
Super Rez
Super Rez aduce posibilitatea de a randa imaginea din rezolutia nativa a jocului in
rezolutie mai mare (upscalling). CEO-ul Nvidia a mentionat faptul ca, placa video va
randa imaginea in timp real la rezolutii mai mari, cum ar fi 2k sau 4k. Super-Rez are o
limita, de aceea acesta permite un upscalling de pana la x13 (pentru a evita efectul de
extra-sharping in care texturile se pot vedea prea crispy si urat).
Putem compara tehnologia cu dea de DLSS, doar ca DLSS se bazeaza pe core-uri fizice
si aduce un salt mare in performanta in-game, comparativ cu super-rez care este doar
la nivel estetic si disponibil doar pentru Ansel.
O tehnologie asemanatoare gasim si in driverele AMD, “sharpness”, doar ca acesta se
mentine pe tot parcursul gameplay-ului.
Arhitectura Pascal
Arhitectura Pascal, este succesorul microarhitecturii Maxwell, nume de cod “GP10X”.
Ca si schimbari, Pascal aduce un GPU Die mai marit si mult mai bogat, gratie microarhitecturii
pe 16nm (28 pe Maxwell). Avem cu doua Streaming Multiprocessors mai multe per GPC , asta
insemnand cu pana la 8 SM-uri mai multe decat pe arhitectura precedenta. In functie de
modelul placilor video, numarul de SM-uri / GPC / CUDA / TMU pot varia.
Streaming Multiprocessors
SM se refera la un grup de core-uri, un cache si un fisier de
registrii si alte componente ce faciliteaza procesarea in
paralel. SM se ocupa cu fetching -> decoding -> processing
si transfering de informatii in paralel. Aceasta o gasim sub
denumirea de “Streaming Multiprocessor” pe Nvidia, iar
apoi adus termenul de “Compute Unit” pe AMD.
Un Streaming Multiprocessor include core-uri CUDA.
Fiecare core executa aceleasi seturi de instructiuni
simultan. Pe fiecare SM avem un Shared Memory si registrii de memorie.
Toate sub-componentele unui SM, dar si cele dinafara lui, sunt interconectate intre ele, facand
schimb de informatii (GPC aduce informatia in SM, SM-ul asista la pre-procesarea CUDA si
apeleaza la cache si memoria lor independenta pentru a stoca ori retine informatii pentru
procesare, sau stocheaza permanent date repetitive ce urmeaza a fi apelate mai tarziu). Fiecare
core CUDA dintr-un SM se numeste Warp
CUDA Core
Core-urile CUDA sunt constituite intr-un SM si actioneaza ca si niste CPU Cores
Componentele totale unui CUDA sunt:
CUDA Driver (inclus in pachetul de drivere ale placii video, este un firmware ce face
posibila comunicarea dintre hardware-ul cuda si instructiunile / codul oferit de
program).
CUDA Architecture (Arhitectura CUDA continuta in arhitectura Pascal ori altele ce
include CUDA-uri).
CUDA Toolkit (Compilatoare, librarii)
Memory Controllers
Memory Controller-ul interactioneaza in mod indirect cu memoria principala a PC-ului, prin PCI-
E buses. Acesta preia informatiile din memoria RAM si o transfera catre GPU si invers. Pe
arhitectura Pascal, s-a splituit, astfel incat controller-ul de memorie devine mai fluidizant si intr-
un numar mai mare (8 pe pascal, 4 pe maxwell). Sa ne gandim al un scenariu si sa asimilam
memory controller-ul cu peretele celular (acesta lasa sa intre si sa iasa doar informatii ce
urmeaza a fi procesate de catre GPU, din memoria primara).
Citirea specificatiilor GPU (Pascal)
GTX 1080 (Pascal)
20 SM (5 SM * 4 GPC = 20 SM) – De luat in calcul faptul ca, pana pe generatia Ampere SM-urile au
ramas unificate intr-un GPC (gasesti un SM de sus pana jos unificat), iar apoi de la Ampere incoace,
numarul de Streaming Multiprocessors
s-au dublat din cauza divizarii lor VS 16
(Maxwell)
L2 Cache – Cache de nivel L2 ce constituie mijlocul prin care fiecare SM / ROP are acces la memoria de
stocare same cu Maxwell
Benchmarkt-uri
(GTX 1080 - Pascal Versus GTX 980ti – Maxwell)
In aceste 4 jocuri, GTX 1080 a reusit sa scoata o medie totala de 77 FPS-uri, in timp ce 980TI
61FPS-uri, in total, diferenta de performanta in gaming dintre aceste doua modele a fost de
aproximativ 16 FPS-uri (pe preset-uri maximizate, dar rezolutii diferite). Diferenta de framerate
este mai mica pe rezolutii mai inalte, insa de bagat in seama. Average-ul diferentei in 1080p a
fost de aproximativ 20-25 FPS-uri, in 2K, 10-15 FPS-uri si in 4K aproximativ 7-10 FPS-uri
diferenta.
In 3DMARK FireStrike diferenta a fost de ~2000 de puncte pe 1080p extreme, iar in 4K Ultra
punctajul a fost de aproximativ 1040 diferenta
PCI-Express-ul este standardizat, de aceea ofera un numar limitat de latime de banda si lane-
uri. NVLink este o tehnologie ce interconecteaza mai multe GPU-uri, cu pana la 12X mai multa
latime de banda. Exista algoritmi speciali folositi in servere numite FFT, alta decat procesarea
GPU normala, ce necesita tehnologia NVLink pentru a nu creea bottleneck la nivel de procesare
GPU.
Cum functioenaza?
NVLink-ul se foloseste de o tehnologie de lagatura a nodurile astfel incat informatia sa fie share-
uita pe fiecare nod la viteze egale.
*in SLI In cazurile in care se folosesc mai mult decat doua GPU-
uri, acesta lucreaza printr-un GPU master (GPU0), iar celalalte
(GPU1, GPU2 …. GPU N) isi impart sarcinile in mod egal, GPU0
avand rolul de a face el cheduling-ul de frame-uri si de a asigura
ca celalate GPU-uri lucreaza in mod egal si constant
Concluzii
Arhitectura Pascal cat si tehnologiile noi anuntate avea sa aduca un pas destul de important
privind schimbarea viziunii unui GPU. Arhitectura in sine a fost putin modificata fata de seria
precedenta (Formatul GPU die-ului este aproape identic cu seria Turing). In zilele de azi,
aproape orice utilizator ce doreste sa isi achizitioneze o placa video, ori ca e destinata gaming-
ului sau productiei, in cea mai mare parte devin cele mai vandute si “bagate in seama” placile
video de la Pascal incoace, pentru ca performanta este mult mai crescuta decat pe Maxwell (si
precedentele) si pentru ca s-a imbunatatit experienta de paralelism privind procesarea CUDA,
aducand performante mult mai crescute in productie. Pot spune personal ca atat Pascal cat si
Turing sunt generatiile mele preferate, din cauza schimbarilor masive aduse.
Surse: Techpowerup
Nvidia.com – (Pascal GP100 Architecture Whitepaper)