逐步回歸是回歸分析中的重要內容,也是統計建模的主要實現手段之一,在大學的統計課程中是必講的內容。不過,與簡單線性回歸相比,逐步回歸的概念更為復雜,計算量也更加繁瑣。雖然學校辦公室的電腦里安裝了Minitab軟件,計算起來方便了一些,但總覺得不順手,很多要求都無法實現,講課的時候學生也不容易理解。所以這兩年來我一直在尋找一個理想的統計課程教學軟件,并能更好地實現逐步回歸的功能。 工夫不負有心人,一個偶然的機會北大有位老師向我推薦了SAS公司的JMP軟件, 效果果然不同凡響,試用一段時間就愛不釋手了。下面就小心地以軟件自帶的案例數據為例,比較一下這兩個軟件吧。 例:初學統計學課程的學生參加了一個簡單的試驗。每個學生都記錄了其身高、體重、性別、是否吸煙、平時活動水平以及靜息脈搏。他們全都投擲了硬幣,其硬幣頭像朝上的學生原地跑步一分鐘。然后,整個班級的學生再次記錄了其脈搏。現在要找出第二次脈搏的最佳預測變量。 先來看看Minitab。 菜單操作的路徑是:Stat>Regression>Stepwise Regression,它的自定義功能(如是前向法、后向法、還是混合法,門限值分別是多少等等) 都是通過菜單對話框中一個叫“Methods”的選項來控制的(如圖一)。輸出結果出現在另一個Session窗口中,包括回歸的最終次數(此例中為4 次)、每次增減的變量(此例中分別為脈搏1、跑步、性別、活動)、變量的回歸系數及其檢驗統計量(如圖二)。 圖一 Minitab逐步回歸的自定義選項 圖二 Minitab逐步回歸的輸出結果 這樣的結果中規中矩,但最大的問題是無法讓人體會到逐步回歸是如何“逐步”實現的。對于初學者或者是具有鉆研精神的學生來說,這不能不說是個缺憾。 再來看看JMP。 菜單操作的路徑是:Analyze>Fit Model>Personality: Stepwise。從分析的初始界面(如圖三)就可以看出JMP和一般統計軟件的不同:JMP的逐步回歸自定義選項(圖三的上半部分)與最終回歸變量的估計量(圖三的下半部分)都是在同一個報表中出現的。而且通過一個“Step”的按鈕把每一次回歸模型改變后各個變量的估算結果(包括回歸系數、平方和、F 比率、P值等)一一表現出來,同步性和交互性非常強,可以讓學生們迅速體會到逐步回歸的工作原理,而不是僅僅得到一個最終結果。當然,如果覺得一步一步地做太慢,也不想觀察逐步回歸的具體過程,按一個“Go”的按鈕就直接進行到最終的模型(如圖四所示)。 圖三 JMP逐步回歸的初始界面 圖四 JMP逐步回歸的輸出結果 JMP和Minitab的計算結果幾乎完全一致(就是小數位數保留的不同,JMP更精確一些)。從操作界面的友好性來看,JMP更加人性化、客戶化,更適合逐步回歸的統計教學,這也正是我所迫切期望解決的一個問題。 以上主要是從提高教學質量的角度來比較兩個軟件的差異。其實,如果換個角度,從科學研究的角度看,JMP的分析功能更強大,優勢很明顯。例如,在JMP的逐步回歸中,對變量類型沒有特別的限制,但在Minitab中,只允許變量是離散變量,不然就根本無法執行下去。有興趣的朋友試一下就知道了,我就不羅嗦了。 好東西自然要和大家分享,各位從事統計分析的同仁們,無論你是做理論研究的,還是做實際應用的,都會或多或少地接觸到逐步回歸,建議你也可以JMP(與 JUMP諧音)一下。 |