一套自稱能“測謊”的學位論文檢測系統,于2008年底悄然在一些高校推廣,不期然竟掀起了一場軒然大波。新技術與學術沉疴之間的抗衡,到底會有怎樣電光石火的碰撞?3月23日,華中科技大學發布通知,對所有全日制、非全日制研究生的論文使用“學位論文學術不端行為檢測系統”。相關處罰中,最輕的一條是“一年后重新申請學位”。
剽竊,反剽竊,反反剽竊
論文“測謊儀”引發“高校地震”
“又有兩人被查出抄襲,停止其畢業程序”。5月8日,韓彥坤收到了導師吳天的一條短信,正在公司開會的他一時忘記了會場紀律,騰地站了起來,大喊一聲:“我靠,不會吧!”
在領導和同事們詫異的目光下,韓彥坤連聲說著“對不起”坐回了原位,但內心再也平靜不下來。
韓彥坤是四川大學文學與新聞學院傳播班的碩士研究生,他是應屆生里的幸運兒,早在2009年2月就被天津高速公司錄取了,其時,學院里只有大約20%應屆生簽了工作合約。
來自導師的短信,讓他擔心自己論文的命運,進而擔心自己的前程。此前,他已經接到同宿舍的李嘉打來的電話,說學院4月23日送出去盲審的論文已經陸續發回來了,結果還不知道,據小道消息稱,有些外審學校會使用一套“測謊”軟件,專查學位論文抄襲。
5月8日當晚,韓彥坤訂了次日返校的機票。他原本訂好一張10天后回成都的特價機票,D字級的,不能改簽也不能退票,他等不及了,只能白白損失400塊錢。
同一時期,與韓彥坤情況相似的張晴也拖著行李匆忙趕回武漢。
在研一還沒結束的時候,張晴就已經完成學分離開華中科技大學,一邊實習,一邊找工作。算下來,這兩年她在學校里呆著的時間,加起來還不到8個月。
張晴的畢業論文早在一個月之前已向導師提交了初稿,遲遲沒有回音。4月初,她從QQ群郵件里得知,今年學校要引入一個論文“反剽竊系統”。QQ群郵件,也是她離開學校之后獲知學校信息的唯一手段。
與韓彥坤一樣,回到學校的張晴親眼目睹了這場“反剽竊系統”引發的大地震。
一群受到驚嚇的“白鼠”
那套引起恐慌的反剽竊軟件,正式名稱是“學位論文學術不端行為檢測系統”(TMLC),學生們習慣稱其為“測謊儀”。最初的傳聞里,它功能強大,面對學位論文有一雙火眼金睛。
韓彥坤的畢業論文是關于奢侈品廣告的,4.2萬字的論文,他用了不到兩個月時間完成。這速度算不上快,師兄師姐在介紹“經驗”時說,一個星期就可以搞定,方法是直接找一篇現成的論文,在那上面進行一些修補刪減,變成“自己的東西”,再拷貝一點其他論文的觀點,就OK了。
師兄張橫還告訴韓彥坤,一定要放寬心,很好過,“大家都是這么過來的。”
韓彥坤周圍的大部分同學都是用“拷貝粘貼法”寫論文的。對于他們而言,還有比這個更現實更迫切的任務:實習、找工作。
張晴同樣認為論文抄襲不值得小題大做。4月底,她所在的學校有五名學生因學位論文抄襲被追回了學位,其中有兩名博士。“那肯定是抄得太離譜了,不然怎么可能被取消學位?”
近幾年,因為論文抄襲而被取消學位的新聞屢見報端。而新華網針對論文抄襲事件的調查顯示,44.25%的投票者認為這是“普遍現象,屢見不鮮”,24.28%的投票者在評價此事的社會影響時選擇了“不抄白不抄,大家都這樣”。
武漢大學信息管理學院碩士生導師沈陽副教授,曾申請和獲得多項反剽竊專利授權,他自主研發的
“ROST反剽竊系統”軟件,目前已在全國20多所高校院系和100多家期刊社使用。沈陽在接受《中國新聞周刊》采訪時表示,他曾檢測一所部屬高校學生和
教師的自由命題論文,783篇論文中,涉嫌抄襲者過半。全文剽竊的論文有161篇,占20.4%;段落剽竊256篇,占33.2%。而他對一所重點院校的
450名本科生進行了“剽竊行為的自我評估”調查。認為自己“經常”剽竊的學生占到了32.84%,還有46.15%的學生認為自己“較多”剽竊。
在國內某些高校推廣的,是由中國學術期刊電子雜志社與清華同方知網共同研制的另一套學術“測謊儀”,即TMLC。
3月23日,華中科技大學發布通知,對所有全日制、非全日制研究生的論文使用“學位論文學術不端行為檢測系統”。相關處罰中,最輕的一條是“一年后重新申請學位”。
僅在武漢,據不完全統計,至少有華中科技大學、武漢大學等6所高校引進了這個系統。武漢大學抽檢10%的學位論文,其余的學校都是全檢。
華中科技大學的校園BBS“白云黃鶴”里,“研究生苑”版前所未有的熱鬧,有學生戲稱這一屆畢業的學生是“小白鼠”——成為了此系統的實驗品。
“被雷得外焦內嫩”
張晴所在的院系,除了教務在4月份時通知過一次“被系統檢測出30%的,直接不授予學位”之外,所有關于此系統的討論,都是“據說”——
“據說有的院系掛了三分之一!”
“據說有的院系65個人,掛了27個!”
沒有人證實這些說法,但恐慌在蔓延。
韓彥坤所在班的QQ群里,頗有點“哀鴻遍野”的景象。此前,這個群里的談話內容多數是班級里
飯局的邀約和八卦的調侃,而5月8日這天,氣氛驟然變得緊張起來,大家的發言無一例外用上了大量的問號和感嘆號,還有哭泣的表情,對“測謊”越描越玄的猜
測,更加深了眾人的恐懼。有人甚至還編了一首打油詩,在群里廣為流傳:
“天災人禍躲不脫,金融危機還未過,測謊機器又來作,到底讓活不讓活。”
而韓彥坤的同學馬平就在這天收到了一條讓她覺得“霉起冬瓜灰”(成都方言,意為很倒霉)的通知:論文外審沒有通過,延遲答辯。這意味著她不能和同學們同期畢業,畢業證和學位證要延遲到12月份才可能拿到。
問題出在外審老師使用的學術不端“測謊儀”上。那篇沒通過答辯的論文,據說已經亮起了“紅燈”,用“行話”解釋,就是3.6萬字的論文里的文字復制比例超過了30%,有段落抄襲的嫌疑。
更驚人的消息是,四川大學外國語學院前期送出去盲審的11篇論文中,有6篇沒有通過。
早早訂好的“散伙飯”,被一次次無限期延遲;西區食堂門口,平素同學間打招呼的“吃了嗎”悄
然換成了“你過了嗎?”有的學生開始頻繁往來于圖書館、宿舍和食堂,對于其中一些人而言圖書館是陌生的,甚至都不知道學校的文科圖書館在文科樓對面,而理
工類的圖書館集中在研究生院,因此大費周折。
四川大學東區七舍已經很久沒這么熱鬧了。在過去的大半年時間里,班里70%的同學都散落在全國各地,忙著實習,忙著找工作。大部分的時候,樓內都是冷冷清清的。現在,這里的緊張氣氛如同臨戰指揮部。
“據說每段抄襲不超過兩百字就算過關,咱們趕緊改,哪怕改成199個字也成!”
“那我把‘媒體’改成‘大眾傳播工具’成不成?”
“好像不成,那玩意兒能查出來。”
⋯⋯
一群女生嘰嘰喳喳地商量著對策,上躥下跳。
馬平收到了研一的師妹發來的短信:“師姐加油!我們年級已經通知了,從下學期開始,我們的論文從選題就開始抓起,要大力整風。我們有的忙了!”
與恐慌同時蔓延的,是抱怨和懷疑。
“本來想抄書上的理論,就找了幾本課本,結果發現,哼,幾本書,相關章節一個字不差,這出版
書的大牛們都這樣,卻來檢測我們這些學生。先把他們的書送去‘不端’,100%
!”還有人稱,“知網庫的每一篇論文都來個檢查,看有多少人掛掉,總拿學生開刀,還打著捍衛學術腐敗的旗幟⋯⋯”
在“白云黃鶴”,有學生看到“測謊儀”的檢測報告后宣稱自己“被雷得外焦內嫩”,因為檢測報告中認定“高度相似”的部分,怎么看都不像是抄襲的,他宣稱“正式進入機器玩人的時代!”
學校管理者如何看待“測謊儀”?華中科技大學研究生院主任蔡子安表示,“這肯定是一個好事
情”,但現在還不便接受采訪。四川大學文學與新聞學院副院長吳建并不認同反剽竊只針對學生的說法,他說西南民族大學學報和四川大學學位辦都引進了這套系
統,老師投稿的論文也要接受檢測。
吳建還表示,近年各大高校曝出的學術丑聞越來越多,引進學術檢測系統不僅能敦促學生提高學術上的修養,也能預先減少“抄襲”的產生,這對于學校來說是雙贏的。
零星的自省
華中科技大學光電實驗室的周恩波在BBS上發了一帖,打破了單調而喧囂的抱怨氣氛。周恩波的態度是:“如果一個字都不是抄的。哥們放心大膽的。就算檢測系統誤判,學位委員會也會糾正的。在這里擔心受怕的應該是些什么人,大家心里清楚。”
他的帖子迅速遭致圍攻。周恩波稱,他的博士論文寫了4個月。有人回敬他:“相信大多數和我一樣的學生,在提高自己和把精力耗在一個根本不可能出太多學術價值的論文之間,會選擇前者,貌似我們有點現實,而你們有點理想。”
周恩波在接受《中國新聞周刊》采訪時稱,“當我發現辯解的論題居然是,誠信因為其他現實問題是否可以放棄時,我覺得很可悲。也許現在社會的問題就是如此。”
在“測謊儀”引起的恐慌中,很少有人會像周恩波這樣,進行關于學術誠信的反思和追問。
為什么要抄襲?在許多人眼里不成其為一個話題。四川大學法學院06級碩士張蕓的觀點是,就業的壓力遠遠大于完成學位論文的壓力,“現在就業形勢這么嚴峻,如果我把大量的時間用在寫論文上了,哪里還有時間找工作?”她的想法代表了相當一部分大學生的意見。
作為傳道授業者,四川大學文學與新聞學院副院長吳建對自身進行了反思,他認為,導師對于學生學位論文的寫作,往往在前期缺乏有效的監督;另外,在論文選題上把關不嚴,有些論題顯得大而空,學生實際操作起來很難下手。
在華中科技大學舉辦關于“反剽竊”系統的講座時,沈陽希望學生們更多地從學術倫理的角度思考。他講了一個希臘作家把作品當作孩子的例子,當另一作家剽竊他的作品,他以偷竊兒童的罪名提起控訴。
沈陽不認為這套軟件成為反剽竊的利器,他倒是更希望它引起人們對學術道德的關注,現在看來,除去“增加了抄襲的成本”,它還遠未實現其他愿景。耐人尋味的是,作為反剽竊系統的研究者,沈陽卻感到自己“壓力巨大”。
全部通過
“測謊儀”引起的軒然大波,迅速轉化為一股對抗與破解的力量。在韓彥坤的校園里,在張晴的校園里,“小白鼠”們討論最多的,是如何應對這個系統。
有人探討抄書的可行性,覺得書不會進論文庫。其想法很快被否定,“誰能保證你抄的這本書N年前沒有被別人抄過?”
有人跳出來說,那個系統沒這么強大,只要把抄來的句子改成自己的表述,就沒問題了。事實上,
多數人的選擇也確實是對自己的論文“大興土木”,逐字逐句地進行顛覆性的修改,勞動強度甚至超過當初完成論文。有人舉例說明,一句“物質決定意識”如何被
改成了“自己的語言”——“我們知道,在物質與意識的關系上,認為后者能夠決定前者是不正確的,馬克思主義者得出的結論與上述結論是恰恰相反的。前者只能
反作用后者,后者起到了決定性的作用。”
對于這樣的修改,有人認為很好,認為“避免抄襲,又多了字數”,也有人認為,“計算機不認可廢話,可能還是過不了”。一個大家公認的結論是——“論文水平直線下降”,因為要“寫出優質的長篇廢話”。
離畢業答辯的期限越來越近。已有人拋棄掉這種“原始”的修改論文的方式,直接想出了更加高明的辦法——“答辯交一個紙質版本;給系統檢測的時候送審另外一個版本的電子版”;還有更高明的——把一部分文字變成圖片格式,系統就檢測不出來了。
在接受《中國新聞周刊》采訪時,沈陽并不否認,在人腦與系統的“測謊”博弈中,后者處于劣勢。
在四川大學,韓彥坤的論文經過修改,通過了檢測,馬平則要像其他14位本科生和20多位博士生一樣,要延遲半年答辯了。
在華中科技大學,已經被張晴改得面目全非的論文最終通過了答辯,但是被批為“毫無學術含量”。一天以后,張晴所在的院系,接到教務的通知,“全院通過論文檢測。”他們對“測謊儀”的戰績非常優異。
包括張晴在內一批同學在QQ群里互相恭喜——“這是個皆大歡喜的結局”。★
(部分受訪者為化名)
對話“反剽竊”軟件開發者、武漢大學副教授沈陽
“如果都揭出來不亞于一場政治運動”
文/凌冰
中國新聞周刊:武大版的軟件在推廣的過程中遇到了怎樣的阻力,為什么沒有率先推廣?
沈陽:國內研究這個的有六七家,真正能夠給社會提供實用服務的,可能就只有我們和清華同方。2008年4月完成它的時候,還是希望能推廣,但是推了一圈之后發現,問題比較大。很多人一聽這個東西,第一是不相信,第二呢,他害怕。沒有誰不怕這個東西,哪怕是教授博導之類的。
中國新聞周刊:華中科技大學這邊的情況是,學生們為了應付這個系統,想出了不少“高招”。比如加入一些字節,就不會被查出來。是這樣嗎?
沈陽:是的。這個技術暫時還不可能靠語義來辨別。不過在加的不多的情況下,系統還是可以模糊匹配,給出一個很高的相似度。
中國新聞周刊:許多人質疑:為什么只針對學生,不針對老師?
沈陽:這個軟件并非針對學生的。至于為什么沒有查老師(的論文),這個問題我把他叫作“學術
原罪”,就是說,經過50萬篇論文的抽樣發現,這個(指老師的論文抄襲)量非常大,抄襲的人非常多,嚴重抄襲的人非常多。這就是說,如果都揭露出來,會不
亞于一場政治運動。所以我想這個問題可能還需要去討論。
中國新聞周刊:是什么導致學術不端行為越來越嚴重?
沈陽:社會網絡中,這個現象叫做“偏好依附”,就是看到某個人做了這個事情,還得了利,別的人也跟著學,所以最終呢,就是越抄越猛。
中國新聞周刊:評價論文一般涉及兩個問題,一個是學術水平高低,另一個是誠信。但這個軟件只能檢測出后一個問題。
沈陽:它不是水平評價軟件。我們很多時候對技術的期望值過高,希望世界上有一種東西能夠包治百病,但是反剽竊軟件只是簡單的字符串的對比軟件。在很多情況下,人都不能評價人的水平高低,何況是電腦。
中國新聞周刊:這個系統在國外推行的時候也是很容易破解嗎?
沈陽:這個問題在國際上也都是有的。但是國外還有的人從另外一個角度來分析這個問題。就是說,對于本科生而言,或者對于低端的碩士生而言,他利用這種系統來做改寫,對能力的鍛煉也很有價值——就是不完全從反剽竊的角度來考慮了。
中國新聞周刊:你如何判斷這個博弈的走向?是系統占上風還是人的破解力量更強大?
沈陽:從中國的情況來看,今后反剽竊軟件推廣后,學界抄襲現象依然不容樂觀。今后高校將大量
出現首先拷貝他人論文,然后修改得面目全非、文理不通的奇觀,還是抄,只是抄得更加隱蔽,更加辛苦而已。國外的大學里面,他們平常的作業和小論文如果是抄
的,被發現都會被退學,更不用說是答辯的論文了。國外對學者的要求是非常高的,這就是國內和國外的學術廉恥心以及整體學術環境的區別。技術只能跟著人走。
中國新聞周刊:這樣的博弈,會不會讓你覺得很沮喪?
沈陽:學生在拼命修改他們的論文,我也希望逐步去修改我們的軟件。這是事物發展的正常規律,
我很能理解這種情況,只要我們的剽竊的根源還存在的話,那么這種現象是肯定得不到根治的。所以從技術角度而言,我們只是想著怎樣去把這個軟件做得更好一
點,在技術上做更多的探討。 ★
“反剽竊”在路上
本刊特約撰稿/凌冰 李渝
國內對學術論文“造假”的監督并非始自今日。2000年3月,上海師范大學法商學院的何云峰教授單槍匹馬地建了一個“好漢網”,豪氣十足地叫板校園里勢頭漸旺的剽竊抄襲等不良學風。
同年,著名“打假斗士”方舟子也創辦了中文學術打假網站“新語絲立此存照”,陸續揭露了
500多起學術涉假案例,其中包括“核糖核酸”、清華大學醫學院“劉輝造假事件”等引起廣泛關注的學術造假和腐敗事件。方舟子們的學術打假多通過網友檢
舉,并沒有專業的儀器進行技術支撐。
2003年,武漢大學信息管理學院副教授沈陽在國家自然科學基金的資助下,研發了一套與“學
位論文學術不端檢測系統”功能相似的系統——ROST反剽竊系統,也稱為“學術不端行為檢測系統”,并于2008年4月研制成功,目前已在全國20多所高
校院系推廣和100多家期刊社使用,但沒有大規模推廣。用沈陽的話說,“就像原子彈一樣,它是大規模殺傷性武器,這需要核軍控的”。
在2009年“兩會”前夕,爆出兩起院士涉嫌學術不端行為的事件。6名教授聯名投訴中國工程
院院士劉興土涉嫌“抄襲剽竊”。此前不久,浙江大學原副教授賀海波盜用他人研究結果發表多篇論文。賀海波的博士后合作導師、中國工程院院士、浙江大學藥學
院院長李連達的名字也出現在這些“問題論文”上。隨后,教育部部長周濟就“賀海波論文造假”事件及處理結果表示,對學術不端行為要像體育界反興奮劑一樣
“零容忍”。
2009年3月19日,教育部發出了《關于嚴肅處理高等學校學術不端行為的通知》,這是我國
教育部門首次就處理學術不端行為發出通知。通知明確高校對本校有關機構或者個人的學術不端行為的查處負有直接責任,應建立健全處理學術不端行為的工作機
構。整個學術界頗有山雨欲來的感覺。
正是在這樣的背景下,由中國學術期刊(光盤版)電子雜志社與清華同方知網共同研制的“學位論文學術不端檢測系統”(簡稱“TMLC”)開始在高校推廣。
檢測的方法涉及一個專業術語——“自適應多階指紋”。什么是信息指紋?沈陽副教授打了個比
方,就是每個人說話都有口頭禪,這個口頭禪就是你的一個特征,這個特征就叫信息指紋。具體到一篇文章來說,比如研究金庸小說,金庸喜歡用什么字,用字的規
律是多少,每個字在整個文章出現的概率是多少,這就是一個指紋。CNKI科研誠信管理系統研究中心主任孫雄勇向《中國新聞周刊》記者介紹,如果說得通俗一
點,就是兩篇文章,如果有一個句子相同,哪怕有一些改寫,都能檢測出來。
“測謊”工具的檢測工作需要強大的后臺數據庫支持,TMLC的后臺是覆蓋了超過5000萬的學術文獻數據庫。
“測謊”技術在目前來說,已經是一個成熟技術了,國外早已廣泛應用于多所高校及科研機構。
在一系列反剽竊網站中,最為出色、應用最廣泛的莫過于“Turnitin”,中文意思是“交上來”,它也是全球第一個檢測剽竊行為的網站。該網站目前已阻止了世界范圍內將近600萬的學生和教育者的剽竊行為,在使用高峰期,每天可收到2萬篇論文。
“Turnitin”通過三個數據庫的內容來檢測交上來的作品:公眾可以查到互聯網上所有存
檔的文件(超過45億頁,每天更新4000萬頁);成百萬的已經出版的作品,包括商業數據庫、期刊摘要等,還有上萬本電子書籍,包括古登堡經典文獻收藏;
成百萬篇學生交到網站的論文。
在中國,數據庫也在不斷完善之中。不過,“反剽竊”系統要面對的,似乎遠遠不是技術難題。
|