推 dulcet:看不懂你的舉例 你要做vector sum 還是 sum filter? 06/18 17:14
→ dulcet:vector sum 直接做不會有bank conflict 06/18 17:16
→ dulcet:sum filter用shared memory,thread個數開跟loading的個數 06/18 17:20
→ dulcet:一樣就不會global memory的bank conflict 06/18 17:22
※ 編輯: rick209 來自: 140.113.152.194 (06/18 17:29)
→ rick209:抱歉 剛剛寫錯 修改過了 06/18 17:30
推 dulcet:所以說是sum filter,那就用shared memory 06/18 17:33
→ dulcet:@@看錯是vector sum 06/18 17:33
→ dulcet:把for loop 幹掉 k=threadIdx.x 這樣才對吧? 06/18 17:35
※ 編輯: rick209 來自: 140.113.152.194 (06/18 17:40)
→ rick209:感謝提醒 06/18 17:40