: __global__ void movaIM11(float *input1, float *output1)
: {
: int col = blockIdx.x*blockDim.x+threadIdx.x; // x 表示 column
: int row = blockIdx.y*blockDim.y+threadIdx.y; // y 表示 row
因為你現在呼叫kernel只有1個block 所以blockIdx.x和blockIdx.y都會是0
不過還是寫正確一點比較好
: output1[row*NNx+col] = input1[row*NNx+col+1];
index應該是這樣吧[row*(NNx-1)+col]
: //printf("%f ", output1[row*NNx+col]);
: //printf("\n");
: }
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.120.40.234
※ 編輯: lgen7604 來自: 122.120.40.234 (02/22 20:27)