推 littleshan: __syncthreads()? 04/21 16:37
※ 編輯: evilned 來自: 140.123.106.104 (04/21 17:19)
※ 編輯: evilned 來自: 140.123.106.104 (04/21 17:19)
推 littleshan:你這個問題是典型的 reduction 04/21 17:54
→ littleshan:去找一些講 parallel computing 的教科書應該都會講 04/21 17:56
推 ironhead:1000x1000? in 1.x, thread id x*y*z must <= 512 ... 04/21 21:08
→ ironhead:BTW...you need thread sync & share memory 04/21 21:11
推 littleshan:它的1000x1000應該是指乘上block後的總數 04/21 21:33
→ evilned:有人有明確一點的說明嗎? 感謝 04/21 22:03
→ evilned:可能大家有點誤會了 我想問的是CUDA本身有防這種錯誤的機 04/21 22:09
→ evilned:制嗎?還是遇到了只能自己處理? 04/21 22:10
推 lgen7604:你想問的該不會是atomicAdd吧 04/21 22:46
推 xxxx9659:有誰可以告訴我 if(idx >= range || idx+range >= size) 05/23 05:00
→ xxxx9659:|| 後面的 idx+range >= size 再做什麼 看不懂@@ 05/23 05:02
→ xxxx9659:推錯篇了 是回覆那篇= = 05/23 05:04