看板 NTUGIEE_EDA 關於我們 聯絡資訊
※ 引述《yellowfishie (喵喵喵喵~~~)》之銘言: : 測試程式 & 結果: : cout << "ori: " << F << endl; : cout << "cast_i: " << cast_i << endl; : cout << "cast_floor_i: " << cast_floor_i << endl; : cout << "cast_ceil_i: " << cast_ceil_i << endl; printf("\n\n"); printf("ori: %2.30lf\n", F); printf("cast_i: %-30d\n",cast_i); printf("cast_floor_i: %-30d\n",cast_floor_i); printf("cast_ceil_i: %-30d\n",cast_ceil_i); : return 0; : } : linux: : ori: 3.595e+06 : cast_i: 3594998 : cast_floor_i: 3594998 : cast_ceil_i: 3594999 : solaris: : ori: 3.595e+06 : cast_i: 3594998 : cast_floor_i: 3594998 : cast_ceil_i: 3594998 正確答案是3594998.074 (這是我用整數算出來的) float版本 Linux:(應該說x86) ori: 3.595e+06 cast_i: 3594998 cast_floor_i: 3594998 cast_ceil_i: 3594999 ori: 3594998.250000000000000000000000000000 cast_i: 3594998 cast_floor_i: 3594998 cast_ceil_i: 3594999 (這個很正常, 因為x86就是比Sun多了0.25) solaris: ori: 3.595e+06 cast_i: 3594998 cast_floor_i: 3594998 cast_ceil_i: 3594998 ori: 3594998.000000000000000000000000000000 cast_i: 3594998 cast_floor_i: 3594998 cast_ceil_i: 3594998 double: x86跟Sun都一樣 ori: 3.595e+06 cast_i: 3594998 cast_floor_i: 3594998 cast_ceil_i: 3594999 ori: 3594998.074000000022351741790771484375 cast_i: 3594998 cast_floor_i: 3594998 cast_ceil_i: 3594999 還有提醒你, cout預設的輸出位數跟本不能用來討論這問題. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.230.125 ※ 編輯: gwliao 來自: 140.112.230.125 (03/18 17:36)
moonshade:能不能把ori 的值印出小數一下... 03/18 19:21
moonshade:用float 的問題不是以前就發生過了 03/18 19:22
moonshade:喔,我看到了XD 03/18 19:23
moonshade:我就說了算出來答案就不一樣了...做floor ceil 當然不一 03/18 19:23
moonshade:樣... 03/18 19:23
moonshade:我覺得可以不用gcc再試一次,不然用sizeof 看一下 03/18 19:25
moonshade:float 的大小,搞不好linux跟solaris 不一樣 03/18 19:26
Donnie:用 double 看看? 03/18 21:50
gwliao:我有用double! Sun和x86一樣 03/18 23:47
gwliao:先做A=i1*f1和B=i2*f3, 再做F=A+B. 03/18 23:48
gwliao:跟一次做完(i1*f1+i2*f2)的結果(x86的機器)不一樣. XD 03/18 23:48
i1*f1+i2*f2 3594998.250000000000000000000000000000 A+B 3594998.000000000000000000000000000000
moonshade:這個應該就是compiler處理的方式了XD 03/18 23:51
我覺得沒問題 XD 秀asm code給你看. f3=i1*f1; f4=i2*f2; f5=f3+f4; f55=i1*f1+i2*f2; fildl -72(%ebp)//i1*f1; fmuls -80(%ebp) fstps -40(%ebp)//f3 <= fildl -68(%ebp)//i2*f2; fmuls -76(%ebp) fstps -36(%ebp)//f4 <= flds -40(%ebp)//f3+f4; fadds -36(%ebp) fstps -32(%ebp)//f5 <= fildl -72(%ebp)//i1*f1; fmuls -80(%ebp) fildl -68(%ebp)//i2*f2 fmuls -76(%ebp) faddp %st, %st(1)//* fstps -28(%ebp)//f55 <= flds -32(%ebp) subl $4, %esp leal -8(%esp), %esp fstpl (%esp) pushl $.LC13//f5 call printf addl $16, %esp flds -28(%ebp) subl $4, %esp leal -8(%esp), %esp fstpl (%esp) pushl $.LC14 call printf/f55 addl $16, %esp 這一段asm code, 我只加空白行和註解.
gwliao:我用gcc-4沒有-O的flag, 不過一加-O就都一樣. 03/18 23:56
gwliao:前面的結果被forward到後面. 03/18 23:58
gwliao:都跟Sun的結果一樣 03/18 23:59
※ 編輯: gwliao 來自: 140.112.230.125 (03/19 00:15)
gwliao:所以我覺得是X86的register-forwarding的實做有關. 03/19 00:15
gwliao:眼睛瞎了faddp %st,%st(1)怎麼是乘, 應該是加的運算. 03/19 00:17
moonshade:好傷眼睛的code啊Orz...不過我看不太懂CISC的asm 03/19 00:27
moonshade:(在地上打滾) 03/19 00:28
moonshade:新的x86 asm我已經看不懂了Orz 03/19 00:29
gwliao:那是AT&T式的asm code, 跟MASM的不同. 那算x86而已. 03/19 00:47
gwliao:沒MMX/3D now/SSE....等, 看到就暈.... 03/19 00:48
gwliao:不過.......剛剛那些就讓我眼睛瞎過一次. Orz 03/19 00:48
muxiv: 我有用double! http://yaxiv.com 07/19 11:04