http://nopaste.csie.org/5a06b
這裡是用一維數組做矩陣 矩陣是column major(內部的注解有錯)
就是和fortran一樣 和C反過來
住意到這些指令 是四筆資料一起處理
所以這些資料必須要連序 但矩陣乘法
必然會讓輸入的兩個矩陣其一資料不連續 所以先做轉秩(A -> tA)
就一個命令就處理矢量中的四個元素
所以這才叫矢量機 (單一指令 多筆資料)
不要忘了乘完還要再算和 算和目前x86沒直接對應的命令(AVX2才會有)
若看不懂 先不要管 SSE3在幹嘛 那那邊用了水平移動這技巧
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 180.176.99.49
※ 編輯: DrStein 來自: 180.176.99.49 (01/03 01:12)