看板 CodeJob 關於我們 聯絡資訊
發案人:男 聯絡方式1:站內信 聯絡方式2: 所在地區 :新竹或網路上 有效時間:之後1禮拜內 專案說明:我所有kernel都寫完了,也有利用blockDim※blockIdx等錯開方式優 化過kernel。 目前我想讓60種不同參數的同個演算法跑的更快,每一種參數依序跑太慢了,不知到有沒 有更快的方式可以一起下去跑,進而節省時間。 我是交大的學生,教我怎麼做或是幫我做使我的Monte carlo演算法可以跑的更快。 ----------------------------------------- 目前程式碼 for(i=0;i<100000;i++) { kernel1() cudaDeviceSynchronize(); kernel2() <--會用到kernel1算出來的值 cudaDeviceSynchronize(); kernel3() <--會用到kernel2算出來的值 cudaDeviceSynchronize() kernel4() <--會用到kernel3算出來的值 cudaDeviceSynchronize() }   預算:2500~3000 接案者要求:   附註: -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.199.227 ※ 文章網址: https://www.ptt.cc/bbs/CodeJob/M.1527107747.A.C50.html ※ 編輯: FermiDirac (49.216.199.227), 05/24/2018 04:37:14 ※ 編輯: FermiDirac (49.216.199.227), 05/24/2018 04:37:58 ※ 編輯: FermiDirac (49.216.199.227), 05/24/2018 04:38:18
zeus83157: 開多台機器跑平行 05/24 23:28