看板 ASM 關於我們 聯絡資訊
看起來這邊討論 8051 比較多,不知道該不該在這邊問 @@ 由於工作的需要,要對某段Assembler Code做最佳化 上頭希望用MMX/SSE指令集來加速,而我目前也有個可行程式碼 程式可以跑了,不過效果不如原本Native X86版本 希望有些工具 or 教學文件告訴我 Bottleneck 在哪,看能否進一步改進 不行的話也好對上頭交差 XD 不知道是否有人有類似的經驗,可否指導一二,謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.36.22.235
menspower:是Intel CPU? 可以找找VTune等Tools~ 07/13 23:16
windows2k:頗難上手 orz,大概是我資質淺 07/13 23:18
menspower:以及或許會用到Intel C Compiler~ 07/13 23:18
menspower:不過也沒辦法...要tune出那個平台的最佳效能...就只能 07/13 23:19
menspower:用它官方的工具來作...才有最佳效果~ 07/13 23:19
menspower:不然就是先用Intel C Compiler作最佳化編譯 -O3 07/13 23:22
menspower:然後轉出assembly跟你的code比對~或許是個不錯作法~ 07/13 23:23
windows2k:X86版本就是某種程度的最佳化 07/13 23:32
windows2k:不過上面一直要降低CPU Usage,只好轉往SIMD方向來做 07/13 23:32
windows2k:不過Data Dependency實在是太高了 XD 07/13 23:33
menspower:我記得Intel C Compiler有選項是跟SSE有關的~ 07/14 21:47
menspower:但沒實際使用過...不過可以確定的是ICC最佳化做得還不錯 07/14 21:48
wowtiger:MMX SSE 適合於可以同時處理的東西 可以先規畫向量取向 07/17 00:24