作者:paradoxfx 來源:電子產品世界 在我們使用C/C++對DSP進行編程的時候,函數無疑是功能模塊劃分的重要組成部分,這些函數之間則通過顯式地調用或者中斷等方式來共同工作。除了對特定的RTS庫中的函數(例如某些數學函數)的調用按照它們內置規則進行分配外,我們自定義的函數之間的調用則需要遵循一定的規則,了解這一過程對理解程序的執行和調試也是十分有幫助的,下面我們就來解讀一下函數的調用過程,并且可以從其中了解到CPU寄存器、FPU寄存器以及棧(stack)在這一過程中的作用。 一.父函數調用子函數 在父函數調用子函數(被調函數)時,通常會執行以下的步驟: 1.如果寄存器不是SOE類型的(入口保存,save on entry),即它的值沒有被被調用函數占用,但是在被調用函數返回值之后又會用到該寄存器的值的話,則該寄存器的值被保存在棧中。 2.如果被調函數返回一個結構體,則調用函數會為結構體分配空間,并且把這段空間的地址作為第一個參數傳遞給被調函數,被調函數需要創建一個該結構體的本地副本。 3.傳遞給被調函數的參數一般情況下會保存在寄存器中,在必要的情況下則會保存在棧中,因為寄存器的數量有限;具體的規則是: (1)如果目標器件是FPU,并且傳遞的有32位的浮點從那時,則前4個浮點參數被保存在R0H-R3H這4個FPU寄存器中(注意與CPU寄存器AR0H-AR3H相區別)。 (2)如果有64位的整形(longlong)參數,則第一個64位整形參數的高32位存入ACC寄存器中,低32位存入P寄存器中,其它的64位整形參數按照逆序(函數聲明中參數列表里最左邊的參數最后被壓入棧中)保存在棧中。 此外,如果P寄存器被用于參數傳遞,則對該函數的裝入(prolog)和排空(epilog)的提取的優化功能(通過減小性能達到減小程序尺寸)被禁止。 (3)如果參數中有任何的32位長整形或者浮點型,則第一個會放入ACC寄存器中,其它的32位參數則按照逆序保存在棧中。 (4)指針參數被放入CPU寄存器XAR4和XAR5中,其它的指針則存入棧中。 (5)剩余的16位的參數在CPU寄存器AL,AH,XAR4和XAR5可用的情況下,按照這一寄存器的順序被保存在它們中。 4.任何沒有被存入寄存器的參數都會被以逆序壓入棧中,所有的32位參數在壓入棧中時都會對齊到偶數地址。 如果一個函數的參數中使用了省略號,即參數個數是可變的,則最后一個顯式聲明的參數在壓入棧中之后,它在棧中的地址可以用來定位未顯式聲明的參數。 5.棧指針SP必須在父函數調用子函數之前偶對齊。如果不是偶對齊,則需要把SP加1. 6.父函數使用LCR指令(使用返回程序指針寄存器RPC的方式來進行22位的長調用)來調用子函數,在調用時RPC寄存器的值會被壓入棧中,從而可以把返回地址保存在RPC寄存器中。 7.最后,棧被對齊到函數的邊界上。 二.子函數響應父函數 在子函數被調用時,通常會執行以下的步驟: 1.如果被調函數修改了XAR1、XAR2或者XAR3的值,則必須保存它們的值,因為在調用前后,父函數假設這3個寄存器的值在被返回之前是被保留的。如果目標是FPU,并且在被調函數中修改了R4H-R8H的值,則同樣需要保存它們的值。 2.被調用的函數需要在棧中為所有的本地變量、臨時存儲區域已經任何被調用的參數分配足夠的空間。在通過為SP寄存器加偏移量跳轉到被調函數之后,這段存儲空間就立刻被分配了。 3.棧被對齊到函數的邊界上。 4.如果被調用的函數參數中有結構體,則它實際接收到的是該結構體的指針。如果在被調函數中對該結構體進行了寫操作,則必須在棧中分配空間以創建該結構體的副本,在完成操作之后把本地結構體通過指針復制回原有的結構體。如果在被調函數中不對傳入的結構體參數進行寫操作,則可以通過對其指針的操作來完成參數的引用。 5.完成參數傳入之后,被調函數執行它本身的代碼。 6.功能執行完成之后,被調函數返回值,根據返回值的類型,它們值的保存位置分別為: 16位整數:AL寄存器 32位整數:ACC寄存器 64位整數:ACC和P寄存器 16位或者22位指針:XAR4寄存器 FPU下的32位浮點數:R0H寄存器 結構體:其指針保存在XAR4寄存器中 在返回結構體的情況下,例如s=f(x),其中s為結構體,f為函數,則可以直接用f(&s,x)的方式在父函數中調用子函數f,通過結構體指針,被調函數可以自動返回結構體的值了。 7.通過把SP中減去調用子函數時加的偏移量,SP寄存器可以重新指向父函數。 8.被調函數恢復所有在第一步中保存的建城七隊值。 9.被調函數使用LRETR(使用PC指針返回)指令返回,PC寄存器的值被置為RPC寄存器中的值,即返回地址,然后RPC寄存器中的原有值被推出棧并重新保存在RPC寄存器中。 通過以上的描述,可以看出棧在函數調用前后起著非常關鍵的中繼作用。所以,如果在調用時傳遞的參數非常多,例如傳遞了一個很長的數組,或者有多個64位的參數,則棧很有可能沒有足夠的空間來完成參數的暫存,造成棧的溢出,甚至造成程序運行結果的異常或者錯誤的輸出結果,因為編譯器無法檢查棧的溢出錯誤(除非我們自己編寫某些代碼來檢測),所以要為棧分配一個相對較大的存儲空間,它的默認值是1K字。即使是非常小的程序,常用例程里棧的長度也往往能達到0x400這樣的長度。 |