1.前言
本應(yīng)用筆記基于STM32L476平臺(tái),通過(guò)實(shí)際測(cè)量來(lái)評(píng)定使能FPU時(shí)浮點(diǎn)運(yùn)算效率的情況。
2.測(cè)試工具
3.測(cè)試方法 MCU 運(yùn)行頻率設(shè)置為16MHz,根據(jù)下面公式1 做N 次浮點(diǎn)運(yùn)算,分使能FPU和禁止FPU兩種情況,測(cè)試完成相同運(yùn)算所需要的時(shí)間。在例程中通過(guò)翻轉(zhuǎn)IO PB13 來(lái)標(biāo)定完成運(yùn)算所需要的時(shí)間。 3.1 測(cè)試代碼 根據(jù)公式1,分別定義A、B、C 三個(gè)常量,如下: /* Private constants---------------------------------------------------------*/ #define A_CONSTANT(0.285f) #define B_CONSTANT(0.443f) #define C_CONSTANT(0.698f) 根據(jù)公式做對(duì)應(yīng)的運(yùn)算并通過(guò)GPIOC Pin0 輸出,測(cè)定對(duì)應(yīng)消耗時(shí)間: HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_SET); temp = A_CONSTANT*x*x +B_CONSTANT*x + C_CONSTANT; HAL_GPIO_WritePin(GPIOB,GPIO_PIN_13, GPIO_PIN_RESET);
3.2 代碼分析 根據(jù)測(cè)試用的一元二次方程,經(jīng)過(guò)IAR 編譯后,匯編結(jié)果如下:
3.2.1 FPU 使能 從匯編代碼可以看出,使能FPU 的情況下,完成一元二次方程的運(yùn)算只需要7 條單周期指令,總共耗時(shí)為7 個(gè)Clock 周期。通過(guò)IAR 的方針模式運(yùn)行,需要的CPU cycles 為7.
3.2.2 FPU 禁止 從匯編代碼可以看出,未使能FPU 的情況下,完成該一元二次方程的運(yùn)算需要執(zhí)行14 條指令,其中包括3 條兩周期指令,6 條單周期指令,5 條程序跳轉(zhuǎn)指令。通過(guò)IAR 的方針模式運(yùn)行,需要的CPU cycles 為207.
4.測(cè)試數(shù)據(jù)及結(jié)論 IO完成兩次翻轉(zhuǎn)耗時(shí)6.48 uS; 使能FPU 時(shí),除去IO 翻轉(zhuǎn)耗時(shí),完成一次運(yùn)算時(shí)間為6.52 uS(13 uS -6.48 uS), 如下圖示:
禁止FPU 時(shí),除去IO 翻轉(zhuǎn)耗時(shí),完成一次運(yùn)算時(shí)間為87.4 uS(93.88 uS -6.48 uS),如下圖示:
小結(jié)下,根據(jù)上面相關(guān)測(cè)試數(shù)據(jù)大致可得出如下結(jié)論:
• 完成同樣的一元二次方程運(yùn)算,禁止FPU時(shí)所消耗的時(shí)間約為使能FPU時(shí)消耗時(shí)間的13.4 倍左右。
文章來(lái)源:微信公眾號(hào) 融創(chuàng)芯城(一站式電子元器件、PCB、PCBA購(gòu)買服務(wù)平臺(tái),項(xiàng)目眾包平臺(tái),方案共享平臺(tái))
|