諾貝爾經濟學獎得主艾塞默魯(Daron Acemoglu)說「非常棒」,奧托(David Autor)更表示被「震撼到了」。
這是MIT經濟系博士生艾丹·托納-羅傑斯(Aidan Toner-Rodgers)發表的震撼論文《人工智慧、科學發現與產品創新》獲得的評價,該論文聲稱AI讓研究人員發現材料數量增加44%、專利申請增加39%。
當所有人還在為AI能否真正提升科學生產力爭論不休時,托納-羅傑斯直接拋出了震撼數據:AI不只有用,而且效果驚人,但只對頂尖研究者有效。
完美騙局的誕生
這篇論文聲稱基於一家美國大型企業R&D實驗室1,018名材料科學研究人員的隨機對照實驗。數據看起來完美無瑕:AI輔助的研究團隊不只發現更多材料,這些化合物還具有更新穎的化學結構,並促成更激進的發明。
更吸引人的是論文的核心發現:AI對不同能力研究者的影響天差地別。
底層三分之一的科學家幾乎沒有受益,但頂尖研究者的產出幾乎翻倍。這個結果完美符合經濟學理論,也為AI會加劇收入不平等的擔憂提供了「科學證據」。
問題是,這一切都是假的。
2025年5月16日,MIT正式發聲明表示「對該論文數據的來源、可靠性和有效性沒有信心,對論文研究的真實性也沒有信心」。托納-羅傑斯已經不再是MIT學生,論文也被要求從arXiv撤下。
為什麼連諾貝爾獎得主都被騙了?
這起事件最令人震驚的不是造假本身,而是如此多優秀學者都沒有發現問題。艾塞默魯和奧托不只是MIT教授和AI研究專家,還是托納-羅傑斯的指導老師,他們詳細討論過這篇論文,甚至一起接受媒體訪問。
直到一位材料科學背景的電腦科學家來信詢問技術細節,兩人才驚覺論文可能有問題。
造假為何如此逼真?
托納-羅傑斯雖然只是博士一年級學生,但對相關文獻非常熟悉,論文寫作也相當專業。這可能與他在進入MIT前曾在紐約聯邦儲備銀行工作有關,讓他有機會熟讀文獻並建立學術人脈。
但真正的挑戰在於數據造假的技術難度。這不是簡單修改表格數字,而是要創造出內部一致、邏輯完整的完整資料集。各個統計分析結果必須首尾連貫,能夠應對審稿者的各種質疑。
事後檢視發現,多個統計表格中的p值確實顯得不太合理,但有很多原因可能造成這種現象,未必能夠發現是偽造數據。
造假的規模令人震驚
托納-羅傑斯並非只是修改部分數據,而是根本沒有進行任何實驗,所有數據都是完全偽造的。由於論文投稿的是頂級期刊《經濟學季刊》,如果編輯要求原始數據,偽造的圖表將無所遁形。
這意味著托納-羅傑斯必須編造出完整的資料集,如果沒有AI或程式的協助,很難想像有人能夠捏造出如此完美的數據。
更誇張的是,托納-羅傑斯甚至在2025年1月註冊了corningresearch.com網域,企圖讓人以為研究來自康寧公司。真正的康寧公司發現後提出網域爭議,托納-羅傑斯敗訴。
學術界的完美風暴
符合期待的「好論文」
這篇論文之所以不受懷疑,因為它完美符合學者對「好研究」的期待:對重要議題提出大致符合預期但又有意外發現的結果。
AI對科學發展有正面影響是多數學者的預期,但其具體效果大小正是學界關注焦點(例如艾塞默魯和奧托對AI生產力的分歧)。而「AI對頂尖研究者助益更大」這個發現,恰好與其他研究的結論相反,增加了論文的新穎性。
MIT的Erik Brynjolfsson等人今年在同一期刊發表的研究發現,生成式AI對經驗較少和技能較低的客服人員幫助最大,經驗豐富的員工反而受益較少。托納-羅傑斯的發現正好相反,讓專家們耳目一新。
時機的巧合
在Google DeepMind的哈薩比斯和強普因AlphaFold獲得2024年諾貝爾化學獎的背景下,很多人對專屬AI在專業研究中的應用產生興趣。托納-羅傑斯的論文恰好填補了這個知識空白。
權威光環的影響
MIT的金字招牌加上兩位頂尖教授的背書,讓人們降低了警覺。更何況其中一位還是諾貝爾獎得主!這種權威效應讓媒體和學者都更容易接受論文的結論。
被忽略的警訊
事後回顧,這篇論文其實存在多個可疑之處:
不合理的研究規模
有哪個雇用超過1000名材料科學家的實驗室,會讓一個博士一年級學生進入公司取得如此多關鍵數據? 論文聲稱基於1,018位研究人員的數據,但沒有解釋一個初入學界的學生如何獲得如此大規模企業研究的完整數據。
數據的完美程度
多個統計圖表看起來過於完美和工整,特別是研究者自我評估與AI使用效果的相關性圖,「每個經濟學家的夢想」般完美呈現了比較優勢原理。
公司身份的模糊
論文描述的公司需要同時在生物材料、金屬合金等多個差異極大的材料領域有大規模研究,符合這種描述的公司極少,包括3M、杜邦、陶氏化學和康寧等,但都不完全吻合。
學術造假的系統性問題
造假規模持續擴大
根據《自然》雜誌2023年的研究,學術論文造假情況一年比一年嚴重。僅2023年就有超過10,000篇已發表論文遭撤回,創下歷史新高。
2022年發表的論文中,被撤回比例超過0.2%,也就是每500篇論文就有一篇因造假遭撤回。這個數字比20年前多了10倍,比10年前增加超過3倍。
競爭環境的影響
論文造假與大學研究機構強調的高度競爭環境有關。過去20年被撤回論文最常來自沙烏地阿拉伯、巴基斯坦、俄羅斯和中國,反映了不同學術體系的壓力。
審查機制的漏洞
遭撤回論文高度集中在某些審查較不嚴格的期刊。2023年被撤回的超過10,000篇論文中,有超過8,000篇來自知名出版集團Wiley旗下的Hindawi。
Wiley調查發現造假有大規模系統性操作跡象,最終將19種Hindawi期刊停刊,估計損失3,500萬到4,000萬美元。
AI時代的新挑戰
造假工具的進步
托納-羅傑斯能夠創造出如此完美的假數據,很可能得到AI工具的協助。這個諷刺的事實提醒我們:AI不只改變科學研究,也改變了造假的可能性。
預印本的風險
真正的麻煩是同行評議期刊不再是新聞發生的地方。新聞在arXiv的預印本中,配上一條推文。預印本讓重要發現能夠快速傳播,但也為造假提供了更大舞台。
媒體傳播的放大效應
這篇論文獲得《華爾街日報》、《自然》、《大西洋月刊》等主流媒體大幅報導,甚至出現在Freakonomics和NPR的節目中。媒體的廣泛報導讓假論文產生了真實的影響力。
LAIDO觀點
這起事件揭露了學術界在AI時代面臨的三重危機:
首先是造假技術的躍進。AI工具讓數據造假變得更容易、更精密,傳統的統計檢驗可能無法識別。
其次是評估機制的失效。當連諾貝爾獎得主都被騙過,我們需要重新思考同行評議的有效性。
最重要的是認知偏誤的放大。托納-羅傑斯的論文之所以成功,不是因為數據完美,而是因為結論符合學界期待。在AI熱潮中,我們更容易相信支持AI效用的「證據」。
記住:在科學聲稱與商業利益高度重疊的領域,健康的懷疑精神比盲目的權威崇拜更有價值。
註:本文所有資料均來自可確認的公開來源,包括MIT官方聲明、TechCrunch、The Decoder等媒體報導 相關連結:MIT Economics Department Statement
評論