volatile的重要性對于搞嵌入式的程序員來說是不言而喻的,對于volatile的了解程度常常被不少公司在招聘嵌入式編程人員面試的時候作為衡量一個應聘者是否合格的參考標準之一,為什么volatile如此的重要呢?這是因為嵌入式的編程人員要經常同中斷、底層硬件等打交道,而這些都用到volatile,所以說嵌入式程序員必須要掌握好volatile的使用。 其實就象讀者所熟悉的const一樣,volatile是一個類型修飾符。在開始講解volatile之前我們先來講解下接下來要用到的一個函數,知道如何使用該函數的讀者可以跳過該函數的講解部分。 原型:int gettimeofday ( struct timeval * tv , struct timezone * tz ); 頭文件:#include 功能:獲取當前時間 返回值:如果成功返回0,失敗返回-1,錯誤代碼存于errno中。 gettimeofday()會把目前的時間用tv所指的結構返回,當地時區的信息則放到tz所指的結構中。 [cpp] view plaincopytimeval結構定義為: struct timeval{ long tv_sec; long tv_usec; }; timezone 結構定義為: struct timezone{ int tz_minuteswest; int tz_dsttime; }; 先來說說timeval結構體,其中的tv_sec存放的是秒,而tv_usec存放的是微秒。其中的timezone成員變量我們很少使用,在此簡單的說說它在gettimeofday()函數中的作用是把當地時區的信息則放到tz所指的結構中,在其中tz_minuteswest變量里存放的是和Greenwich 時間差了多少分鐘,tz_dsttime日光節約時間的狀態。我們在此主要的是關注前一個成員變量timeval,后一個我們在此不使用,所以使用gettimeofday()函數的時候我們把有一個參數設定為NULL,下面先來看看一段簡單的代碼。 [cpp] view plaincopy#include #include int main(int argc, char * argv[]) { struct timeval start,end; gettimeofday( &start, NULL ); /*測試起始時間*/ double timeuse; int j; for(j=0;j ; gettimeofday( &end, NULL ); /*測試終止時間*/ timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_sec - start.tv_sec ; timeuse /= 1000000; printf("運行時間為:%f\n",timeuse); return 0; } 運行結果為: [cpp] view plaincopyroot@ubuntu:/home# ./p 運行時間為:0.002736 現在來簡單的分析下代碼,通過end.tv_sec - start.tv_sec 我們得到了終止時間跟起始時間以秒為單位的時間間隔,然后使用end.tv_sec - start.tv_sec 得到終止時間跟起始時間以微妙為單位的時間間隔。因為時間單位的原因,所以我們在此對于( end.tv_sec - start.tv_sec ) 得到的結果乘以1000000轉換為微秒進行計算,之后再使用timeuse /= 1000000;將其轉換為秒。現在了解了如何通過gettimeofday()函數來測試start到end代碼之間的運行時間,那么我們現在接下來看看volatile修飾符。 通常在代碼中我們為了防止一個變量在意想不到的情況下被改變,我們會將變量定義為volatile,這從而就使得編譯器就不會自作主張的去“動”這個變量的值了。準確點說就是每次在用到這個變量時必須每次都重新從內存中直接讀取這個變量的值,而不是使用保存在寄存器里的備份。 在舉例之前我們先大概的說下Debug和Release 模式下編譯方式的區別,Debug 通常稱為調試版本,它包含調試信息,并且不作任何優化,便于程序員調試程序。Release 稱為發布版本,它往往是進行了各種優化,使得程序在代碼大小和運行速度上都是最優的,以便用戶很好地使用。大致的知道了Debug和Release的區別之后,我們下面來看看一段代碼。 [cpp] view plaincopy#include void main() { int a=12; printf("a的值為:%d\n",a); __asm {mov dword ptr [ebp-4], 0h} int b = a; printf("b的值為:%d\n",b); } 先分析下上面的代碼,我們使用了一句__asm {mov dword ptr [ebp-4], 0h}來修改變量a在內存中的值,如果有對這句代碼功能不清楚的讀者可以參考我之前的一篇《C語言的那些小秘密之堆棧》,在此就不做過多的講解了。前面已經講解了Debug和Release 編譯方式的區別,那么我們現在來對比看下結果。注:使用vc6編譯運行,如無特殊說明,均在linux環境下編譯運行。讀者自己在編譯的時候別忘了選擇編譯運行的模式。 使用Debug模式的結果為: [cpp] view plaincopya的值為:12 b的值為:0 Press any key to continue 使用Release模式的結果為: [cpp] view plaincopya的值為:12 b的值為:12 Press any key to continue 看看上面的運行結果我們發現在Release模式進行了優化之后b的值為了12,但是使用Debug模式的時候b的值為0。為什么會出現這樣的情況呢?我們先不說答案,再來看看下面一段代碼。注:使用vc6編譯運行 [cpp] view plaincopy#include void main() { int volatile a=12; printf("a的值為:%d\n",a); __asm {mov dword ptr [ebp-4], 0h} int b = a; printf("b的值為:%d\n",b); } 使用Debug模式的結果為: [cpp] view plaincopya的值為:12 b的值為:0 Press any key to continue 使用Release模式的結果為: [cpp] view plaincopya的值為:12 b的值為:0 Press any key to continue 我們發現這種情況下不管使用Debug模式還是Release模式都是一樣的結果。現在我們就來分析下,在此之前我們先說了Debug和Release 模式下編譯方式的區別。 先分析上一段代碼,由于在Debug模式下我們并沒有對代碼進行優化,所以對于在代碼中每次使用a值得時候都是從它的內存地址直接讀取的,所以在我們使用了__asm {mov dword ptr [ebp-4], 0h}語句改變了a的值之后,接下來使用a值的時候從內存中直接讀取,所以得到的是更新后的a值;但是當我們在Release模式下運行的時候,發現b的值為a之前的值,而不是我們更新后的a值,這是由于編譯器在優化的過程中做了優化處理。編譯器發現在對a賦值之后沒有再次改變a的值,所以編譯器把a的值備份在了一個寄存器中,在之后的操作中我們再次使用a值的時候就直接操作這個寄存器,而不去讀取a的內存地址,因為讀取寄存器的速度要快于直接讀取內存的速度。這就使得了讀到的a值為之前的12。而不是更新后的0。 第二段代碼中我們使用了一個volatile修飾符,這種情況下不管在什么模式下都得到的是更新后的a的值,因為volatile修飾符的作用就是告訴編譯器不要對它所修飾的變量進行任何的優化,每次取值都要直接從內存地址得到。從這兒我們可以看出,對于我們代碼中的那些易變量,我們最好使用volatile修飾,以此來得到每次對其進行更新后的值。為了加深下大家的印象我們再來看看下面一段代碼。 [cpp] view plaincopy#include #include int main(int argc, char * argv[]) { struct timeval start,end; gettimeofday( &start, NULL ); /*測試起始時間*/ double timeuse; int j; for(j=0;j ; gettimeofday( &end, NULL ); /*測試終止時間*/ timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_usec -start.tv_usec; timeuse /= 1000000; printf("運行時間為:%f\n",timeuse); return 0; } 與之前我們測試時間的代碼一樣,我們只是增大了for()循環的次數。 先來看看我們不使用優化的結果: [cpp] view plaincopyroot@ubuntu:/home# gcc time.c -o p root@ubuntu:/home# ./p 運行時間為:0.028260 使用了優化的運行結果: [cpp] view plaincopyroot@ubuntu:/home# gcc -o p time.c -O2 root@ubuntu:/home# ./p 運行時間為:0.000001 從結果顯然可以看出差距如此之大,但是如果我們在上面的代碼中修改一下int j為int volatile j之后再來看看如下代碼: [cpp] view plaincopy#include #include int main(int argc, char * argv[]) { struct timeval start,end; gettimeofday( &start, NULL ); /*測試起始時間*/ double timeuse; int volatile j; for(j=0;j ; gettimeofday( &end, NULL ); /*測試終止時間*/ timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_usec -start.tv_usec; timeuse /= 1000000; printf("運行時間為:%f\n",timeuse); return 0; } 先來看看我們不使用優化的運行結果為: [cpp] view plaincopyroot@ubuntu:/home# gcc time.c -o p root@ubuntu:/home# ./p 運行時間為:0.027647 使用了優化的運行結果為: [cpp] view plaincopyroot@ubuntu:/home# gcc -o p time.c -O2 root@ubuntu:/home# ./p 運行時間為:0.027390 我們發現此時此刻不管是否使用優化語句運行,時間幾乎沒有變化,只是有微小的差異,這微小的差異是由于計算機本身所導致的。所以我們通過對于上面一個沒有使用volatile和下面一個使用了volatile的對比結果可知,使用了volatile的變量在使用優化語句是for()循環并沒有得到優化,因為for()循環執行的是一個空操作,那么通常情況下使用了優化語句使得這個for()循環被優化掉,根本就不執行。就好比編譯器在編譯的過程中將i的值設置為大于或者等于10000000的一個數,使得for()循環語句不會執行。但是由于我們使用了volatile,使得編譯器就不會自作主張的去動我們的i值,所以循環體得到了執行。舉這個例子的原因是要讓讀者牢記,如果我們定義了volatile變量,那么它就不會被編譯器所優化。 當然volatile還有那些值得注意的地方呢?由于訪問寄存器的速度要快過直接訪問內存的速度,所以編譯器一般都會作減少對于內存的訪問,但是如果將變量加上volatile修飾,則編譯器保證對此變量的讀寫操作都不會被優化。這樣說可能有些抽象了,再看看下面的代碼,在此就簡要的寫出幾步了。 main() { int i=o; while(i==0) { …… } } 分析以上代碼,如果我們沒有在while循環體結構里面改變i的值,編譯器在編譯的過程中就會將i的值備份到一個寄存器中,每次執行判斷語句時就從該寄存器取值,那么這將是一個死循環,但是如果我們做如下的修改: main() { int volatile i=o; while(i==0) { …… } } 我們在i的前面加上了一個volatile,假設while()循環體里面執行的是跟上一個完全一樣的操作,但是這個時候就不能說是一個死循環了,因為編譯器不會再對我們的i值進行"備份"操作了,每次執行判斷的時候都會直接從i的內存地址中讀取,一旦其值發生變化就退出循環體。 最后給出一點就是在實際使用中volatile的使用的場合大致有以下幾點: 1、中斷服務程序中修改的供其它程序檢測的變量需要加volatile; 2、多任務環境下各任務間共享的標志應該加volatile; 3、存儲器映射的硬件寄存器通常也要加volatile說明,因為每次對它的讀寫都可能有不同意義。 對于volatile的講解我們到此就結束了。由于本人水平有限,博客中的不妥或錯誤之處在所難免,殷切希望讀者批評指正。同時也歡迎讀者共同探討相關的內容,如果樂意交流的話請留下你寶貴的意見。 |