[心得] 個人的 x86 組合語言觀念筆記

作者purpose (purpose)

看板ASM

標題[心得] 個人的 x86 組合語言觀念筆記

時間Wed Oct 13 17:02:20 2010

※ [本文轉錄自 C_and_CPP 看板 #1Cis6A7c ] 作者: purpose (purpose) 看板: C_and_CPP 標題: Re: [問題] C/C++ 中的 asm 該如何學起？時間: Tue Oct 12 03:12:07 2010 發篇筆記一、[簡介] 機器語言與80x86 二、[觀念] 組合語言—Intel Style 與 AT&T Style、MASM 與 NASM 三、[教學] 簡單連結範例—NASM 組合語言與 C/C++ (Windows 平台) ------------------------------------------------------------- 一、[簡介] 機器語言與80x86 大家家裡用的計算機器叫做個人電腦 (PC)。可以拿來安裝 Windows、Linux，甚至 Mac OS X...等作業系統。個人電腦的 CPU 演變歷史，可以說就是 Intel 的歷史。從最早的16位元CPU：「8088/8086 -> 80286」，再演化到32位元的 80386、80486... 後來因為商標不能用數字註冊，Intel 不使用 80586 命名，從586開始，改名為歷史上的 Pentium CPU。 AMD 也差不多是在 Pentium 時代開始慢慢成為 Intel 在個人電腦處理器上的競爭者。可以想見 Intel 就是個人電腦處理器的「唯一制定者」，Intel自己做新的 CPU 也要向後相容以前的東西，就像 Windows 7 也得要能執行 Windows XP 的程式一般。你在 286 寫的程式，拿去給 486 的 CPU 也要能跑。所以「個人電腦 CPU = x86 家族」...好啦，可能有人不認同這句話。你跟美國人講話就要講英文、跟法國人講法文；跟 x86 家族的處理器講話，就要講「x86 機器語言」；跟 Intel 8051 單晶片處理器溝通，就講「8051 機器語言」；在算盤本裡面介紹的處理器是「MIPS」家族，就用「MIPS 機器語言」跟其溝通。所有處理器裡面，x86家族功能當然是最強，每一代都有增加新功能，又要向後相容，所以其實該語言最複雜、不規則、不好學。但只用些基本的功能的話，還是過得去的。二、[觀念] 組合語言—Intel Style 與 AT&T Style、MASM 與 NASM 機器語言因為電路關係，原始形式就是 010101 這種二進位形式，但你喜歡也可以轉成十六進位寫出來給別人看。下面這是一個 x86 機器語言指令 (instruction)： 05 0A 00 00 00 (十六進位表示) 用人類說法就是你告訴某顆 x86 家族的 CPU：「把你的 eax 暫存器內容取出，將其跟10相加，再把結果寫回 eax 暫存器」用C語言表示法就是：「eax += 10;」機器語言形式顯然太麻煩了。於是發明了「助憶符號」，比如用 add 代表「相加這個運算動作」；減法動作，用符號 sub 標記；將資料從A處複製過去B處的動作，就用 mov 助憶符號標記。 add, sub, mov...等是運算子，而 eax 暫存器跟 10 是運算參與單元 (運算元)。如果綜合以上講的運算子跟運算元，想要寫出完整指令時，還會有一個問題！若有 eax, ecx 兩個運算元，想要把 eax 的值取出，複製到 ecx 去到底該寫 mov eax, ecx 還是 mov ecx, eax ？哪邊來源？哪邊目的？ AT&T、Intel 各自有一套語法慣例。詳細資料參考這裡： http://www.ibm.com/developerworks/library/l-gas-nasm.html C語言 Intel AT&T 指派運算子的靠最左邊的運算元靠最右邊的運算元左邊是目的地是目的地。是運算結果放置處。 int eax = 4; mov eax, 4 movl $4, %eax (暫存器名稱前，需加 % 符號；而且4這個立即數值前，需加 $ 符號；且用 movl 表示 move long 這麼長) 西瓜靠大邊，跟大家一起用 Intel 慣例的寫法就好。像上面 mov eax, 4 這樣子的指令形式，都叫「組合語言」，說穿了只是把當初的「x86 機器語言」寫成比較容易看懂的形式而已。既然這樣，那 x86 機器語言就一套，助憶符號跟暫存器也固定那幾個。為什麼最後卻搞出 MASM、TASM、NASM、FASM...這麼多種組合語言呢？ MASM，軟體界霸主微軟推行的組合語言 (雖然微軟最近變心去搞 MSIL 的樣子？) NASM，在台灣是僅次於微軟的選擇方案，而且跨多個作業系統平台。文件完整、有中文書籍在講它，而且狀態穩定。 ※ FASM，較新，類似於NASM，聽說比較快？ ※ TASM，老牌子，現在很少人用了，但是有 Turbo Debugger 很強大，可以對 16 位元執行檔做偵錯，偶爾也值得一用。上面提到的組合語言都是 Intel Style，而 AT&T 會看到的地方，就是使用「gcc -S」功能時會出現。但是可以用 objdump 去看 Intel Style 的組語。如果是 gdb 偵錯則直接就有選項 disassembly-flavor intel 可以切換到 Intel 風格組語。分別用 VC 跟 GCC ，一樣寫個 C 語言動態函式庫，把某個函數輸出，我用 VC 時，可以在函數前面加上 __declspec(dllexport) 告知 VC 將該函數輸出。也可以寫個「模組定義檔」(*.def) 去記載哪些函數要輸出。但是這兩個方法都是 VC 特有，不是 C 語言規定的。同樣狀況在組合語言亦同，MASM 也有一些組譯器指令是其專有，而 NASM 沒有。甚至在語法上，兩者也有差異。詳細資料：http://www.nasm.us/doc/nasmdoc2.html#section-2.2 NASM 對於「LABEL 符號」是有分大小寫的，MASM 沒有分。 (這不包含暫存器名稱，沒必要非寫 eax 而不寫 EAX，也不包含 NASM 的假指令，比如 SECTION 大小寫都可以。) 而且 MASM 有些遭詬病的語法規範，NASM 有對其改進之。對於 MASM 「某符號」要拿來「當成記憶體位址」用時，需加上 offset 修飾。對於 NASM 覺得微軟這樣太麻煩，直接寫就一定是當位址用，不用加 offset。 MASM 的毛病是如果寫組譯器指令如下，去定義兩個符號： (MASM、NASM 都支援這兩個假指令) foo equ 1 bar dw 2 equ 指令很類似 #define pi 3.141421356 (...偷用別人的梗) dw 這個假指令，是告訴組譯器把現在這個地方，所對應的記憶體位址，取別名叫 bar，並且寫入 double-word (4位元組) 到此處，存放值為 0x 00 00 00 02。此時，如果 MASM 有兩個指令如下： mov eax, foo ; foo 因為是 equ 設定出來的值，所以 eax 會得到 1 mov eax, bar ; bar 因為是「組合語言變數」，故 eax 得到值是 2 上面兩個指令，語法格式看起來完全一致，但如果沒去觀看 foo 跟 eax 的假指令定義，就不能判定機器碼該翻成哪個。如果是用 NASM，因為他強制規定只要是「間接取值」者，一律需加上中括號 []。這個間接取值，意思是第一次取到的值，不是我要的，第二次取到的值才是我要的。可以想成「間接取值 = 二次取值」。換言之 mov eax, foo mov eax, bar 對於 NASM 來說，不需要去看假指令定義，因為 bar 跟 foo 都沒有用中括號，所以兩個都做一次取值就好。亦即 mov eax, bar 會得到 bar 對應的記憶體位址，而不是 bar 的存放內容 2。可是 MASM 很沒規律，因為 foo 是 equ 所定義，所以 eax 得到 1 (沒間接取值)；因為 bar 是一個 dw 定義的「組合語言變數」，所以將會做「間接取值」，先取得 bar 所對應的記憶體位址後，再到該位址再取一次值。抓4位元組得到 2 來傳給 eax。三、[教學] 簡單連結範例—NASM 組合語言與 C/C++ (Windows 平台) 存成檔案 xx.c --------------------------------------- #include <stdio.h> int plusTen(int val); int plusEleven(int x) { return x+11; } int main() { printf("return = %d\n", plusEleven(1)); printf("return = %d\n", plusTen(0x00123456)); return 0; } --------------------------------------- 用 VC 編譯器的話，執行指令 cl /c xx.c 可以獲得對應的目的檔「xx.obj」從 Visual Studio 200X 命令提示字元，去下這個 cl 指令，以省略環境變數的設定存成檔案 fun.asm --------------------------------------- section .text global _plusTen _plusTen: push ebp ;函數初始化工作 mov ebp, esp ;函數初始化工作 mov eax, 0 mov ax, word [ebp+8] add eax, 10 pop ebp ;函數結尾工作 ret ;返回呼叫函數 (caller)，eax 是存放返回值用 --------------------------------------- 去下載 NASM http://www.nasm.us/pub/nasm/releasebuilds/2.09.02/win32/nasm-2.09.02-win32.zip 解壓縮後，執行指令 nasm -f win32 D:\Desktop\fun.asm 就能獲得一樣是 COFF 格式的目的檔 fun.obj。簡單來說就是這個目的檔跟 cl /c 得到的目的檔有一樣格式。最後再去「Visual Studio 200X 命令提示字元」下指令 link xx.obj fun.obj 就能得到 xx.exe 完成 C/C++ 跟 NASM 函數的連結了。 ※對原理有興趣可以參考《程式設計師的自我修養》一書。 section .text 是 NASM 假指令，表示從這行指令以下的內容，翻譯成機器碼後都要放到 .text 區去。每個 *.obj、*.exe 內部都有 .text 區段。 global 是 NASM 假指令，在這裡表示要把 _function 標籤包括的機器碼視為全域函數。在 C/C++ 你預設寫個函數，像上面的 plusEleven() 就自然會是這裡說的這種「全域函數」。使用 dumpbinGUI 工具，跳去 xx.obj、fun.obj 查看符號表，就可看到 external 字眼。表示 xx.obj 可以調用 fun.obj 裡面寫 external 的符號，反之則反。 mov ax, word [ebp+8] 這個 ebp+8 是代表 plusTen() 函數的「參數1」查一下 stack frame 的觀念，再用偵錯軟體觀察「函數呼叫」進入前後的堆疊、暫存器變化，應該就能理解。要說明的是，[ebp+8] 是「二次取值」，當第一次取值得到 ebp+8 位址假設是 0x0012FF74，接著要在這個地方做二次取值，在 C/C++ 要取幾個位元組的值是看該指標的資料型態。如果是在 MASM，則是在中括號前寫 word ptr [ebp+8] 代表 2位元組；若寫 byte ptr [ebp+8] 則代表 1位元組。而 NASM 跟 MASM 差不多，但必須拿掉 ptr 字眼，否則會組譯錯誤。因C語言還沒公開前，就已經留下一堆目的檔、一堆函數，他們都用正常的命名，一些好記的名字都被用過了，所以 C 語言在使用函數時，其實一律自動加 _ 來命名。因此原本的 C 函數呼叫雖然是 plusTen，但在 fun.asm 裡輸出的全域函數要寫成 _plusTen 才能讓 xx.c 可以連結到。 ------------------------------------ 關於「目的檔」，參考這篇： http://en.wikipedia.org/wiki/Object_file 都只講微軟平台在 DOS 時代目的檔名稱也都是 *.obj；執行檔名稱也都是 *.exe，但這裡的 *.obj 其實是 OMF 格式 (Relocatable Object Module Format)。跟你在 Windows 用 VC 編譯出來的目的檔 *.obj 不同。用 nasm -f obj fun.asm 應該就是產生 OMF 格式的目的檔？用 nasm -f win32 fun.asm 則是產生 COFF 格式的目的檔。更精確來說這個 COFF 格式是微軟修改過的變種 COFF 格式。你也可以叫它 PE/COFF 格式，甚至叫他 PE 格式也行，要解讀 PE 格式，其第一選擇當然也是微軟提供 dumpbin，而軟體 dumpbinGUI 是圖形介面的前端。真要說的話 dumpbin 也是一個前端，其實是呼叫 VC 的 link.exe，給隱藏選項 link /DUMP /ALL xx.obj。 http://en.wikipedia.org/wiki/Portable_Executable PE 格式不一定是 *.exe 執行檔，也可以是 *.dll 也可以是 *.obj...等。因為 VC 編譯出的目的檔都是 PE 格式，而 VC 的 link.exe 不能處理古早的目的檔 OMF 格式，所以上面需要叫 nasm 用 -f win32 選項去產生 PE 目的檔。也許會有某個很強的連結器，可以把 OMF 跟 PE 目的檔連結成 PE 執行檔吧？甚至把 gcc 編出來的目的檔跟 PE 目的檔 link 成 PE 執行檔？看有沒有人知道囉 ------------------------------------ MASM 組譯器指令清單 http://msdn.microsoft.com/en-us/library/8t163bt0.aspx 剛好看到，補充上來。 ------------------------------------ (怕以後忘記，再寫篇記錄，上文不變動，新增內容於下) 16位元記憶體模型—Segment:Offset (分段記憶體模型) 32位元記憶體模型—Flat Memory Model 加 Paging ( http://en.wikipedia.org/wiki/X86_architecture ) 個人電腦 x86 家族的 CPU，在 16 位元時代是 8088/8086/80286 這三位；而 x86 家族第一個 32 位元始祖是劃時代的 80386。 8088跟8086的位址匯流排都有20條線，每條線都是一端連接記憶體，一端連接處理器，在高低電位變化下 (0、1)，總共可有 2^20 種控制變化。換言之，依照每個記憶體位址對應一個位元組的慣例，可以定位 2^20 大小的記憶體位址； 80286 則進化到 24 條位址線，定址能力達 2^24，即 16M 記憶體。省麻煩，把它當成跟 8088/8086 一樣，只能定址到 1M 記憶體就好。 ※ 在 x86 的術語中，記憶體位址可以分成三種：邏輯位址、線性位址、真實位址(物理位址) 必須先「邏輯位址→線性位址」，然後接著才是「線性位址→真實位址」。自從32位元 CPU 出現 (自 80386 後)，記憶體 Model 變成 Flat Memory，邏輯位址就已經等於線性位址了。然後是因為有「分頁機制」武力介入，所以需要先透過分頁機制轉換，線性位址才會變成真正的物理位址。而分頁機制是從 80386 開始使用 (保護模式的完整版也是從 80386 開始)。那為什麼 16 位元處理器，不使用 Flat Memory Model？為什麼當初的邏輯位址要先經過轉換才會變成線性位址？因為16位元CPU內部，參與運算的暫存器當時都還停留在16位元 (如：ax, bx, cx, dx)，甚至最重要的指令暫存器 (IP) 也是 16 位元，故只有定位到 0~65535 也就是 64K 記憶體的能力。 Intel 用額外提供的四個「分段暫存器」(CS、DS、ES、SS)，搭配其他暫存器後，使得每次記憶體定址方式其實是 Segment:Offset，此時這種位址表達法叫邏輯位址。 CS 是 Code Segment、DS 是 Data Segment、SS 是 Stack Segment ... 邏輯位址→線性位址，公式是：「Segment Register * 0x10 + Offset」假設我們有個程式，裡面的「全域變數」(不是放在堆疊的那種區域變數)，有個很大的整數陣列，總共有 128K。當程式執行時，這些資料區段假設放在「線性位址=物理位址」的 0x0 ～ 0x1FFFF 這段連續的記憶體空間裡。在邏輯位址(以寫程式的角度去觀看的位址)，這 128K 資料會被分成兩段，第一段是 DS=0 且 offset = 0x0000～0xFFFF，第二段是 DS=1 且 offset = 0x0000～0xFFFF。換言之，如果我要把某陣列元素移到 ax 暫存器，指令可能長這樣 mov ax, word ptr[0x1234] 如果執行這行時 DS=0，則會取到物理記憶體位址 0x01234 處 (第一段)；如果執行這行時 DS=1，則會取道物理記憶體位址 1*0x10 + 0x1234 = 0x11234。若要讀取最後一個位元組到ax，只要執行以下指令即可： mov ds, 1 mov al, byte ptr[0xFFFF] 因為不知道當時的 DS 值為多少，所以保險點，先設定 DS，然後因為 ax 是 16 位元，不必用到這麼大。所以用 al 存放即可。 al 就是 ax 暫存器低 8 位元別名。 (ax 在 32 位元以上的 CPU 時，其實也是 eax 暫存器的低16位元處別名) 現今的執行檔，比如 PE 執行檔，往往內部都有分 .text (.code)、.data，可能就是承襲當初的記憶體分段機制？ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 124.8.140.240

推 JUSTLOVEAYU:大推~ 10/12 03:15

→ xam:gcc 吃 at&t 喔, intel 未必比較大邊.. 10/12 03:16

→ tropical72:大推大推..不過我想我需要一些時間吸收這篇文章吧.. 10/12 03:43

→ tropical72:看完後覺得想看的書似乎又更多了.. 10/12 03:43

→ king19880326:有啥好大不大邊的, 寫 assembly 第一件事就是看 10/12 03:44

→ king19880326:assembler 的 document. 10/12 03:44

→ tropical72:所以..要學組語的話,"程式設計師的自我修養"、算盤書 10/12 03:49

→ tropical72: 將會是我的第一步？ 10/12 03:49

推 nand:讚啦!! 10/12 04:07

推 loveflames:原po如果發到ASM板的話，就能m起來了 10/12 04:16

推 xatier:大推!學了很多<(_ _)> 10/12 07:26

推 VictorTom:推一下:) 10/12 07:41

推 bill42362:推! 10/12 09:53

推 snoopy0907:推推推~~ 10/12 09:55

推 linjack:推薦這篇文章 10/12 10:04

→ purpose:學組語就買教組語的書來學。你可以多買幾本，交叉對照。 10/12 10:25

→ purpose:我對 AT&T 的偏見太深了...感謝指正 10/12 10:26

→ purpose:補充一下，我第一次修x86組語被當，第一本買的組語書完全 10/12 10:29

→ purpose:看不懂，不是每個人都是一次學懂，腦子累積的東西夠多，回 10/12 10:30

→ purpose:去看以前不會的組語，就開竅了，書多買多對照一樣有幫助。 10/12 10:30

推 stupid0319:我都用ollydbg學組語,很容易看數值怎麼跑 10/12 10:40

推 loveflames:但是ollydbg只能看ring 3 10/12 11:16

→ purpose:Win 三大偵錯軟體：IDA、OD、WinDbg (功能最強介面最囧) 10/12 11:34

推 stupid0319:有沒有可以在Nprotect下跑的debugger? 10/12 11:56

推 stupid0319:以一般的程式設計師需要看ring0嗎? 10/12 12:01

→ stupid0319:功能最強介面最囧是SoftIce吧 10/12 12:04

→ purpose:搞硬體、搞系統、搞XX的會需要ring0。Softice聽說不能在 10/12 12:17

→ purpose:新版 Windows 跑了，至於有沒有人修正就不知道囉 10/12 12:17

推 richliu:其實 MASM 很強, 當年寫 MASM 可以寫到像是 C 語言 10/12 12:55

推 loveflames:if跟while都有，else忘了有沒有 10/12 13:00

推 loveme00835:所以我不算錯啊 0.0 程式設計師的自我修養就是這樣寫 10/12 13:05

→ purpose:PE 其實大家都很隨便在講，廣義認定跟狹義認定的區別而已 10/12 13:16

→ purpose:有 if、while 喔...現在才知道 10/12 13:18

推 herman602:是有if跟 while, 可是好像是假指令吧(?) 10/12 17:54

→ herman602:組語上機考的時候老師說禁止使用xd 10/12 17:55

→ loveflames:我跟樓上相反，結果沒幾個人用jxx 10/12 18:04

→ tropical72:非常感謝purpose與各位的解釋,小弟我上網search tool, 10/12 19:26

→ tropical72:發現了這麼的東西..http://www.emu8086.com/ 10/12 19:27

→ tropical72:突然覺得很方便,不然p大所提供的tool info.我會再去學 10/12 19:28

→ tropical72:怎用的,謝謝各位的指教,感激不盡!! 10/12 19:28

推 tropical72:網址裡點進去還有Crystal FLOW for C(++),似乎很有趣.. 10/12 19:37

→ purpose:程式碼打好，或者貼上去，按下「emulate」就開始執行 10/12 19:42

→ purpose:第一行寫假指令 org 100h 是 *.COM 的格式，意思是當一個 10/12 19:43

→ purpose:*.COM 被執行，DOS會把他放置到 IP = 0x100 的地方 10/12 19:44

→ purpose:http://free.prohosting.com/~heko/assembly.html 10/12 19:45

→ purpose:這個軟體只能模擬8086 CPU，我以前寫boot sector也用過 10/12 19:45

推 suhorng:推耶! 10/12 19:48

推 loveflames:*.com也沒分code段跟data段 10/12 19:50

→ purpose:沒有保護模式，沒有虛擬記憶體的...美好時代? 10/12 19:51

推 richliu:有 segment 的概念.. 還有 IO 其實 x86 指令很鳥.... 10/12 23:30

推 hpo14:我超弱，看得好頭痛 10/13 01:34

※ 編輯: purpose 來自: 124.8.128.171 (10/13 12:00)

推 tropical72:請問,89C51在設計時需要額外的ROM IC存放程式碼,到 10/13 12:08

→ tropical72:89S51時放置程式於同一IC中,至於x86所謂的code seg.與 10/13 12:11

→ tropical72:data seg.現行應都做於同一IC?? 另,8051系列似乎都可進 10/13 12:12

→ tropical72:行燒錄之動作,這些資料都算多,那x86市面上是否有提供燒 10/13 12:13

→ tropical72:錄器與可程式化IC可購？ 10/13 12:13

→ purpose:code&data seg. 都是在主記憶體上。什麼燒錄器可程式化IC 10/13 12:29

→ purpose:我這輩子都沒碰過，不知道那什麼，你可以去電機版或組語版 10/13 12:29

推 tropical72:我在ASM發問,#1CjJU9xN,得到 WolfLord 以下解釋 10/13 13:59

→ tropical72:186-xxxx家族是SOC 然後也有一些廠商用X86CORE作SOC 10/13 13:59

→ tropical72:不過X86本身LICENSE就貴，作SOC其實很不合算，因此並 10/13 13:59

→ tropical72:不常見，而X86的SOC要ISP都要頗貴的特殊工具而且僅能 10/13 14:00

→ tropical72:洽原廠 #end#, 最後謝謝purpose解決我許多疑惑. 10/13 14:00

→ purpose:去看了看不懂。現在才發現loveflames大是ASM板板主，失敬 10/13 16:57

-- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 124.8.128.171

→ purpose:錯誤的地方，還請各位專業的前輩不吝批評、指正，感謝 10/13 17:02

推 afai:感謝! 推~ 10/13 23:26

推 sorkayi:不常用x86 組語還是推一個 10/17 09:31

推 Ross0916:mov ds, 1 是不行的頂多是 pop ds 不過這是硬挑的XD 10/18 07:15

推 loveflames:要mov ds,ax才行 10/18 07:23

→ purpose:mov ds,1 沒驗證過就打了出來，謝謝樓上大大指正 10/18 11:50

→ purpose:回想起來，我之前也這樣寫過，被組譯器擋了下來改過就忘了 10/18 11:53

→ eva19452002:所有處理器裡面，x86家族功能當然是最強? 10/19 11:14

→ eva19452002:就算功能最強，也不表示執行效能最好 10/19 11:14

→ eva19452002:你是不是把複雜跟功能強畫上等號啊? 複雜不等於功能強 10/19 11:17

→ purpose:>10/19 11:14 小弟見識淺薄，沒見過什麼世面，僅能評論自 10/19 12:12

→ purpose:己見識過的處理器，讓前輩們看笑話了，感謝指正 10/19 12:13

→ purpose:>10/19 11:17 我覺得x86處理器跟Windows API狀況很像，因 10/19 12:14

→ purpose:為有舊有包袱，為了相容而把一些事情搞得很複雜，但是他們 10/19 12:14

→ purpose:每一代還是會推出些更好的新功能，比如新一代處理器的SIMD 10/19 12:15

→ purpose:指令集(如:SSE)，一次可以處理多個資料，讓效率提昇很多 10/19 12:15

→ purpose:因為這些新功能的不斷提供，讓我覺得他們的功能很強 10/19 12:16

推 asususer: \⊙▽⊙/~by PTTNOW~ 04/14 01:51