篇二 C/C++程序編譯步驟詳解 C/C++程序編譯步驟詳解 C/C++語言很多人都比較熟悉,這基本上是每位大學生必學的一門編程語言,通常還都是作為程序設計入門語言學的,并且課程大多安排在大一。剛上大學,孩子們還都很乖,學習也比較認真,用心。所以,C/C++語言掌握地也都不錯,不用說編譯程序,就是寫個上幾百行的程序都不在話下,但是他們真的知道C/C++程序編譯的步驟么? 我想很多人都不甚清楚,如果他接下來學過“編譯原理”,也許能說個大概。VC的“舒適”開發環境屏蔽了很多編譯的細節,這無疑降低了初學者的入門門檻,但是也“剝奪”了他們“知其所以然”的權利,致使很多東西只能死記硬背,遇到相關問題就“丈二”。實際上,我也是在學習Linux環境下編程的過程中才逐漸弄清楚C/C++源代碼是如何一步步變成可執行文件的。 總體來說,C/C++源代碼要經過:預處理、編譯、匯編和連接四步才能變成相應平臺下的可執行文件。大多數時候,程序員通過一個命令就能完成上述四個步驟。比如下面這段C的“Hello world!”代碼: File: hw.c #include stdio.h> int main(int argc, char *argv[]) { printf("Hello World!\n"); return 0; } 如果用gcc編譯,只需要一個命令就可以生成可執行文件hw: xiaosuo@gentux hw $ gcc -o hw hw.c xiaosuo@gentux hw $ ./hw Hello World! 我們可以用-v參數來看看gcc到底在背后都做了些什么動作: Reading specs from /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/specs Configured with: /var/tmp/portage/sys-devel/gcc-3.4.6-r2/work/gcc-3.4.6/configure --prefix=/usr --bindir=/usr/i686-pc-linux-gnu/gcc-bin/3.4.6 --includedir=/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/include --datadir=/usr/share/gcc-data/i686-pc-linux-gnu/3.4.6 --mandir=/usr/share/gcc-data/i686-pc-linux-gnu/3.4.6/man --infodir=/usr/share/gcc-data/i686-pc-linux-gnu/3.4.6/info --with-gxx-include-dir=/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/include/g++-v3 --host=i686-pc-linux-gnu --build=i686-pc-linux-gnu --disable-altivec --enable-nls --without-included-gettext --with-system-zlib --disable-checking --disable-werror --enable-secureplt --disable-libunwind-exceptions --disable-multilib --disable-libgcj --enable-languages=c,c++,f77 --enable-shared --enable-threads=posix --enable-__cxa_atexit --enable-clocale=gnu Thread model: posix gcc version 3.4.6 (Gentoo 3.4.6-r2, ssp-3.4.6-1.0, pie-8.7.10) /usr/libexec/gcc/i686-pc-linux-gnu/3.4.6/cc1 -quiet -v hw.c -quiet -dumpbase hw.c -mtune=pentiumpro -auxbase hw -version -o /tmp/ccYB6UwR.s ignoring nonexistent directory "/usr/local/include" ignoring nonexistent directory "/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../../i686-pc-linux-gnu/include" #include "..." search starts here: #include ...> search starts here: /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/include /usr/include End of search list. GNU C version 3.4.6 (Gentoo 3.4.6-r2, ssp-3.4.6-1.0, pie-8.7.10) (i686-pc-linux-gnu) compiled by GNU C version 3.4.6 (Gentoo 3.4.6-r2, ssp-3.4.6-1.0, pie-8.7.9). GGC heuristics: --param ggc-min-expand=81 --param ggc-min-heapsize=97004 /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../../i686-pc-linux-gnu/bin/as -V -Qy -o /tmp/ccq8uGED.o /tmp/ccYB6UwR.s GNU assembler version 2.17 (i686-pc-linux-gnu) using BFD version 2.17 /usr/libexec/gcc/i686-pc-linux-gnu/3.4.6/collect2 --eh-frame-hdr -m elf_i386 -dynamic-linker /lib/ld-linux.so.2 -o hw /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../crt1.o /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../crti.o /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtbegin.o -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6 -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6 -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../../i686-pc-linux-gnu/lib -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../.. /tmp/ccq8uGED.o -lgcc --as-needed -lgcc_s --no-as-needed -lc -lgcc --as-needed -lgcc_s --no-as-needed /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtend.o /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../crtn.o 稍微整理一下,去掉一些冗余信息后,如下: cc1 hw.c -o /tmp/ccYB6UwR.s as -o /tmp/ccq8uGED.o /tmp/ccYB6UwR.s ld -o hw /tmp/ccq8uGED.o 以上三個命令分別對應于編譯步驟中的預處理+編譯、匯編和連接。預處理和編譯還是放在了一個命令(cc1)中進行的,可以把它再次拆分為以下兩步: cpp -o hw.i hw.c cc1 hw.i -o /tmp/ccYB6UwR.s 一個精簡過的能編譯以上hw.c文件的Makefile如下: .PHONY: clean all: hw hw: hw.o ld -dynamic-linker /lib/ld-linux.so.2 -o hw /usr/lib/crt1.o \ /usr/lib/crti.o \ /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtbegin.o \ hw.o -lc \ /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtend.o \ /usr/lib/crtn.o hw.o: hw.s as -o hw.o hw.s hw.s: hw.i /usr/libexec/gcc/i686-pc-linux-gnu/3.4.6/cc1 -o hw.s hw.c hw.i: hw.c cpp -o hw.i hw.c clean: rm -rf hw.i hw.s hw.o 當然,上面Makefile中的一些路徑是我系統上的具體情況,你的可能與我的不同。 接下來我們按照編譯順序看看編譯器每一步都做了什么。 首先是預處理,預處理后的文件hw.i: # 1 "hw.c" # 1 "" # 1 "" ... __extension__ typedef __quad_t __off64_t; __extension__ typedef int __pid_t; __extension__ typedef struct { int __val[2]; } __fsid_t; ... extern int remove (__const char *__filename) __attribute__ ((__nothrow__)); extern int rename (__const char *__old, __const char *__new) __attribute__ ((__nothrow__)); ... int main(int argc, char *argv[]) { printf("Hello World!\n"); return 0; } 注:由于文件比較大,所以只留下了少部分具有代表性的內容。 可以看見預處理器把所有要包含(include)的文件(包括遞歸包含的文件)的內容都添加到了原始的C源文件中,然后把其輸出到輸出文件,除此之外,它還展開了所有的宏定義,所以在預處理器的輸出文件中你將找不到任何宏。這也提供了一個查看宏展開結果的簡便方法。 第二步“編譯”,就是把C/C++代碼“翻譯”成匯編代碼: .file "hw.c" .section .rodata .LC0: .string "Hello World!\n" .text .globl main .type main, @function main: pushl %ebp movl %esp, %ebp subl $8, %esp andl $-16, %esp movl $0, %eax addl $15, %eax addl $15, %eax shrl $4, %eax sall $4, %eax subl %eax, %esp subl $12, %esp pushl $.LC0 call printf addl $16, %esp movl $0, %eax leave ret .size main, .-main .section .note.GNU-stack,"",@progbits .ident "GCC: (GNU) 3.4.6 (Gentoo 3.4.6-r2, ssp-3.4.6-1.0, pie-8.7.10)" 這個匯編文件比預處理后的C/C++文件小了很多,去除了很多不必要的東西,比如說沒用到的類型聲明和函數聲明等。 第三步“匯編”,將第二步輸出的匯編代碼翻譯成符合一定格式的機器代碼,在Linux上一般表現為ELF目標文件。 深圳專業嵌入式ARM、Linux、單片機技術實訓提升,詳情咨詢郭老師,QQ754634522 xiaosuo@gentux hw $ file hw.o hw.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped 最后一步“連接”,將上步生成的目標文件和系統庫的目標文件和庫文件連接起來,最終生成了可以在特定平臺運行的可執行文件。為什么還要連接系統庫中的某些目標文件(crt1.o, crti.o等)呢?這些目標文件都是用來初始化或者回收C運行時環境的,比如說堆內存分配上下文環境的初始化等,實際上crt也正是C RunTime的縮寫。這也暗示了另外一點:程序并不是從main函數開始執行的,而是從crt中的某個入口開始的,在Linux上此入口是_start。以上Makefile生成的是動態連接的可執行文件,如果要生成靜態連接的可執行文件需要將Makefile中的相應段修改: hw: hw.o ld -m elf_i386 -static -o hw /usr/lib/crt1.o \ /usr/lib/crti.o \ /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtbeginT.o \ -L/usr/lib/gcc/i686-pc-linux-gnu/3.4.6 \ -L/usr/i686-pc-linux-gnu/lib \ -L/usr/lib/ \ hw.o --start-group -lgcc -lgcc_eh -lc --end-group \ /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/crtend.o \ /usr/lib/gcc/i686-pc-linux-gnu/3.4.6/../../../crtn.o 至此,一個可執行文件才最終創建完成。通常的項目中并不需要把編譯過程分得如此之細,前三步一般是合為一體的,在Makefile中表現如下: hw.o: hw.c gcc -o hw.o -c hw.c 實際上,如果對hw.c進行了什么更改,那么前三步大多數情況下都是不可避免的。所以把他們寫在一起也并沒有什么壞處,相反倒可以用--pipe參數告訴編譯器用管道替代臨時文件,從而提升編譯的效率。深圳專業嵌入式ARM、Linux、單片機技術實訓提升,詳情咨詢郭老師,QQ754634522 |