推 moonshade:能不能把ori 的值印出小數一下... 03/18 19:21
→ moonshade:用float 的問題不是以前就發生過了 03/18 19:22
→ moonshade:喔,我看到了XD 03/18 19:23
→ moonshade:我就說了算出來答案就不一樣了...做floor ceil 當然不一 03/18 19:23
→ moonshade:樣... 03/18 19:23
推 moonshade:我覺得可以不用gcc再試一次,不然用sizeof 看一下 03/18 19:25
→ moonshade:float 的大小,搞不好linux跟solaris 不一樣 03/18 19:26
推 Donnie:用 double 看看? 03/18 21:50
推 gwliao:我有用double! Sun和x86一樣 03/18 23:47
→ gwliao:先做A=i1*f1和B=i2*f3, 再做F=A+B. 03/18 23:48
→ gwliao:跟一次做完(i1*f1+i2*f2)的結果(x86的機器)不一樣. XD 03/18 23:48
i1*f1+i2*f2 3594998.250000000000000000000000000000
A+B 3594998.000000000000000000000000000000
推 moonshade:這個應該就是compiler處理的方式了XD 03/18 23:51
我覺得沒問題 XD
秀asm code給你看.
f3=i1*f1;
f4=i2*f2;
f5=f3+f4;
f55=i1*f1+i2*f2;
fildl -72(%ebp)//i1*f1;
fmuls -80(%ebp)
fstps -40(%ebp)//f3 <=
fildl -68(%ebp)//i2*f2;
fmuls -76(%ebp)
fstps -36(%ebp)//f4 <=
flds -40(%ebp)//f3+f4;
fadds -36(%ebp)
fstps -32(%ebp)//f5 <=
fildl -72(%ebp)//i1*f1;
fmuls -80(%ebp)
fildl -68(%ebp)//i2*f2
fmuls -76(%ebp)
faddp %st, %st(1)//*
fstps -28(%ebp)//f55 <=
flds -32(%ebp)
subl $4, %esp
leal -8(%esp), %esp
fstpl (%esp)
pushl $.LC13//f5
call printf
addl $16, %esp
flds -28(%ebp)
subl $4, %esp
leal -8(%esp), %esp
fstpl (%esp)
pushl $.LC14
call printf/f55
addl $16, %esp
這一段asm code, 我只加空白行和註解.
推 gwliao:我用gcc-4沒有-O的flag, 不過一加-O就都一樣. 03/18 23:56
→ gwliao:前面的結果被forward到後面. 03/18 23:58
→ gwliao:都跟Sun的結果一樣 03/18 23:59
※ 編輯: gwliao 來自: 140.112.230.125 (03/19 00:15)
推 gwliao:所以我覺得是X86的register-forwarding的實做有關. 03/19 00:15
→ gwliao:眼睛瞎了faddp %st,%st(1)怎麼是乘, 應該是加的運算. 03/19 00:17
推 moonshade:好傷眼睛的code啊Orz...不過我看不太懂CISC的asm 03/19 00:27
→ moonshade:(在地上打滾) 03/19 00:28
→ moonshade:新的x86 asm我已經看不懂了Orz 03/19 00:29
推 gwliao:那是AT&T式的asm code, 跟MASM的不同. 那算x86而已. 03/19 00:47
→ gwliao:沒MMX/3D now/SSE....等, 看到就暈.... 03/19 00:48
→ gwliao:不過.......剛剛那些就讓我眼睛瞎過一次. Orz 03/19 00:48