推 brahmsliu: np.apply_along_axis? 04/13 08:17
推 niki25672729: 我之前使用vectorize感覺起來是平行的耶 把值印出 04/13 10:59
→ niki25672729: 來並不會照原本array的順序 原來是for loop嗎 04/13 10:59
完整原文是這樣:
The vectorize function is provided primarily for convenience, not for
performance. The implementation is essentially a for loop.
→ niki25672729: 樓上那個應該是for loop 我試驗的結果跟vectorize 04/13 11:00
→ niki25672729: 效率差很多 04/13 11:00
那可能就視問題而定吧
我查stackoverflow上也有vectorize速度沒改善的討論
→ ThxThx: 我記得subtraction的ufunc已經是有optimized過了!? 04/13 12:55
→ ThxThx: 可以用batch的方式丟進GPU來算 04/13 12:57
→ ThxThx: 使用mp會有多次data copy的overhead我覺得不划算 04/13 13:04
了解
這種overhead加上去可能也佔不到便宜
我看有篇討論是說在大矩陣的運算上
中間運算的部分會重複去蓋掉cache中的值所以反而會比較慢
然後我的for loop是用掉一次subtract後這輪的減數就不會再用到了所以就沒這個問題
所以我猜是他雖然有做優化但是因為彼此蓋掉cache的關係反而會降低速度
只是我猜啦... 我沒測試小圖會不會就可以比for loop快就是了
※ 編輯: goldflower (140.113.215.35), 04/13/2018 17:29:07