→ lantw44: 前提應該是要能編譯成功?以前聽說有點麻煩? 10/07 01:18
推 tjjh89017: 聽說可以快得很誇張,不過真的沒試過XD 10/07 10:25
→ x000032001: 不一定 你編看看拿去跑就知道了 10/07 10:42
推 littleshan: 沒用,你的bottleneck是userspace的浮點運算啊 10/07 12:32
→ littleshan: kernel那邊能動的就是改scheduler避免context switch 10/07 12:33
→ littleshan: 讓你的process可以儘可能用滿cpu resource 10/07 12:34
→ littleshan: 還有想辦法把運算轉到GPU上,這才是比較有效率的方向 10/07 12:35
推 Killercat: er...為什麼樓上這樣就能看出那麼多細節 XD 10/07 13:06
推 tjjh89017: @lit大<(_ _)> 10/07 13:21
推 loveflames: 也可以多用SIMD指令 10/07 13:51
→ loveflames: little大的意思應該是process分成kernel space跟 10/07 13:53
→ loveflames: user space,原po這樣做頂多增進kernel space的效能 10/07 13:54
→ loveflames: user space的效能還是要看程式碼本身 10/07 13:55
推 loveflames: 原po要做的是盡量以CPU與GPU平行運算,提高cache hit 10/07 14:01
→ loveflames: 善用浮點指令集(E5-2670好像只有AVX,沒FMA) 10/07 14:02
→ carylorrk: 同上,昨天看直覺也是覺得增進 kernel 效能可能沒用 10/07 15:17
→ carylorrk: 但是不知道他的詳細是怎樣,是同時很多人在用那個 10/07 15:18
→ carylorrk: service 嗎?或是會不會用 MPI 之類的做 HPC XD 10/07 15:19
推 loveflames: MPI的話要注意使用的數學庫是否支援指令集 10/07 16:05