Sunteți pe pagina 1din 5

Laboratorul 7

Programare Paralela
Exercitiu laborator 6
Exercitiu laborator 6
Exercitiu laborator 6
Indicatii

Pentru parcurgerea kernerului 2D se va folosi structura:


int id_i = threadIdx.x + blockDim.x * blockIdx.x;
int id_j = threadIdx.y + blockDim.y * blockIdx.y;

Pentru functiile sinus si cosinus se va utiliza biblioteca <math.h>

Parametrii kernerului vor fi setati in modul urmator:


dim3 threadsPerBlock(16, 16);

dim3 blocks2D((N + threadsPerBlock.x - 1) / threadsPerBlock.x, (N +


threadsPerBlock.y - 1) / threadsPerBlock.y);

dim3 blocks1D((N * N + 256 - 1) / 256, 256); // Utilizăm formula pentru a asigura


acoperirea întregului set de date

S-ar putea să vă placă și