《從零開始學IDA逆向》學習筆記-14(程序脫殼簡介)

什麼是加殼？#

本章演示了對 upx 加殼程序進行脫殼。

加殼是指通過一種壓縮或者加密的手段將程序的可執行代碼隱藏起來，避免被輕易的逆向。加殼會在程序中加入額外的區段（STUB，存根），在程序開始運行後，將加密的文件進行解密並保存到內存中其他區段，或者創建原程序中的區段，然後跳轉到解密後的代碼執行。

大部分通過破壞 IAT（import table）也就是導入函數表，以及文件頭（HEADER）來保護文件。它們會加入反調試代碼來避免被脫殼出原始文件。

通過 die 查看是否加殼。

上圖可以知道是 upx 3.91 版本加殼，程序是 32 位，i386 架構。

加載加殼文件#

加載加殼文件時，取消勾選創建輸入段，勾選手動加載。

點擊 ok 後，彈出如下窗口，點擊確定。

加殼後程序的入口

原始程序入口

加殼後程序的入口，地址是 0x409BE0，而原始文件的地址是 0x401000。

文件和內存佔用#

對比這 2 個文件的區段，在加殼文件的文件頭下面有個 upx0 的區段，佔用的內存比原始文件中的其他區段要大。

原始文件

加殼文件

加殼文件的 upx0 區塊結束於0x409000，而在原始文件 header 以下區段從0x401000到0x408200，當一個程序執行時，它在硬盤上可能只佔用 1k，但在內存中可能佔用 20k 或者更大。

如上圖，在原始文件 CODE 區段的起始地址是0x401000，區段文件的大小 (Section size in file) 為 0x600 字節，而內存大小 (Virtual size) 佔用 0x1000 字節。

轉到加殼文件中，如上圖，upx0 區段的起點是0x401000，upx0 區段在硬盤的大小為 0，而內存佔用卻是 0x8000 字節，程序在這裡佔用了足夠大的空間來保存原始的程序代碼，然後跳轉過來執行。

加殼文件 0x401000 處的跳轉

0x401000 前置的 dword_表示數據類型為 DWORD，"?" 號表示只佔用了內存位置而未保存任何內容，dup 表示 0xc00 個 dword，也就是 0x3000 字節。0x404000 同樣也佔用了 0x1400 字節。

那麼總共就是 0x8000 個字節用於存儲原始代碼的內容。

如下圖，在 0x401000 處，按 x 鍵，可以看到此處有兩個引用（稍後回來看這部分內容）。

可執行代碼的引用

upx1 區段文件佔用是 0xe00，內存佔用是 0x1000。

upx1 區段的文件及內存佔用

可能程序使用了一些簡單的加密隱藏了原始代碼，對於這個區段的起點 0x409000 有幾處引用。

0x409000 的引用

有一處引用來自（下方，down）可執行部分，點擊跳轉到該處。

程序入口

stub 和 oep#

上圖程序入口之後的 stub 中，ESI 寄存器傳入 0x409000 這個地址，如下圖所示，可執行代碼在原始文件已加殼代碼的下方，同屬於 upx1 區塊，所以在 upx1 區塊中，存在原始文件加密後保存的內容以及 0x409be0 之後的 stub 代碼。

跟蹤到的可執行代碼

下圖中，可以發現，程序從 0x409000 處開始讀取內容，通過某種運算之後再保存到0x401000(EDI=ESI-0x8000)。程序讀取 ESI 指向的內容作為來源，然後執行操作後，再存儲到 EDI 指向的內容，恢復成原始代碼。

回到 upx0 區段，在 upx0 區段處，有一處引用

0x401000 處的引用

下圖中有一處無條件跳轉到 0x401000 處，也就是上圖中的 0x401000 處的引用。

jmp near是直接向之後的地址數跳轉的指令，那麼這裡執行完 stub 並且生成原始代碼後，程序會跳轉到 0x401000 處 (OEP,original entry point)，也就是原始程序的入口（程序最開始執行的地方），相應的存根入口 (stub entry point) 是 0x409be0。

之後原始程序入口直接叫做ORIGINAL ENTRY POINT或OEP。如果是一個加殼之後的程序，無法知道它的具體位置，而在此程序中，程序實有 OEP 的，OEP 就是 0x401000。