看板 C_and_CPP 關於我們 聯絡資訊
http://nopaste.csie.org/5a06b 這裡是用一維數組做矩陣 矩陣是column major(內部的注解有錯) 就是和fortran一樣 和C反過來 住意到這些指令 是四筆資料一起處理 所以這些資料必須要連序 但矩陣乘法 必然會讓輸入的兩個矩陣其一資料不連續 所以先做轉秩(A -> tA) 就一個命令就處理矢量中的四個元素 所以這才叫矢量機 (單一指令 多筆資料) 不要忘了乘完還要再算和 算和目前x86沒直接對應的命令(AVX2才會有) 若看不懂 先不要管 SSE3在幹嘛 那那邊用了水平移動這技巧 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 180.176.99.49 ※ 編輯: DrStein 來自: 180.176.99.49 (01/03 01:12)