推 purpose:Intel VTune 似乎可以分析,沒用過,看其他高手怎麼說 12/03 14:58
→ tropical72:用shift代替div未必比較快(因complier關係),即使是這樣 12/03 15:05
→ tropical72:是否代表還是要分析出來的asm才是較為準確的? 12/03 15:06
推 purpose:從asm去比較哪個快,要高手才能做到,一般人用Profiler測 12/03 15:27
→ purpose:看哪個比較花的時間比較少,指令週期比較少就好了 12/03 15:28
推 ericinttu:可以講一下為何要算cycle time嗎? 12/03 15:36
→ tropical72:to eric:我真正目的是要比較我寫的函式速度和math.h提 12/03 15:42
→ tropical72:供的速度誰跑得比較快,一派做法是用計時器去計時;另一 12/03 15:43
→ tropical72:派做法是分析哪個func所用的clock time最少. 12/03 15:43
推 johnlinvc:clock cycle 受到的干擾比較少 但實際跑和branch 12/03 15:47
→ johnlinvc:prediction 的優化也有關係 12/03 15:47
→ tropical72:組語真是讓我頭大啊~~謝謝p大和j大指導,過幾天把我測出 12/03 15:48
→ tropical72:來的po上來.. 謝謝各位. 12/03 15:49
→ purpose:你讓我想到了這篇開根號取倒數 12/03 16:04
推 ericinttu:我比較推p大上上推的連結那種方式,不用完全用組語的角度 12/03 16:14
→ ericinttu:去研究怎麼優化c codes. 12/03 16:15
→ tropical72:p 大給的網址太強了,MHAKEMEMC 有好多噁心的數字啊~~ 12/03 16:28
→ ericinttu:numerical programming, 或許對你也有幫助. 12/03 16:30
→ tropical72:嗯,這陣子就是在摸類似的東西,謝謝樓上建議. 12/03 16:32