◎李昀修
2025年的五月,中山大學社會學系的葉高華教授於社群媒體上PO文,寫到自己發現有幾篇碩士論文引用了作者為葉高華的文獻,然而,那幾篇論文根本不是葉高華所寫的,甚至根本是不存在的論文。
那些論文裡所引用的其他文獻,也毫不意外的並不存在。「被成為」虛構文獻作者的人,包含打狗文史再興會社理事陳坤毅、曾任中央研究院民族所所長的黃應貴教授、中研院民族學研究所院士黃樹民教授……
但你可知道,AI假造文獻一事並不只發生在台灣,在國外也早已掀起波瀾嗎?
時常報導國際要聞的媒體地球圖輯隊,曾刊出一篇關於2023年有超過一萬篇的科學論文因涉嫌造假而遭到撤回的報導。這篇標題非常長,名為《「論文裡都是騙人的」 2023年上萬篇論文遭撤回,科學造假工業現正擴張中》的報導提到,這些論文用字不連貫、引用不相關文獻,甚至被懷疑使用AI撰寫卻未明確揭露。有一家出版社甚至因為大量刊出造假的論文,最終關閉了底下的期刊。
不只學術界,在國外也有出版界困擾於AI的濫用問題。沈榮欽教授於臉書上寫到,知名的科學刊物出版社施普林格.自然(Springer Nature)出版了一本關於人工智慧的書籍,但卻被讀者發現書中列出的文獻引用有誤。經由撤稿觀察(Retraction Watch)這間隸屬於「科學誠信中心」(Center for Scientific Integrity)的美國非營利組織調查過後,發現有許多篇文獻根本不存在,或者引用錯誤。有人寫信給作者詢問是否使用AI撰寫這本關於AI的書籍,卻未獲得正面回應。
施普林格.自然出版社目前已將本書下架。
AI為何會一本正經地創造出虛構的假文獻?從它的運作邏輯中,我們可以理解到其底層邏輯其實為「文字接龍」,根據先前輸入的文字,來生成下一段「可能」的回應,至於回應本身則未必正確且可靠。但許多使用者並不知道這點,以至於誤入AI所創造的幻覺,而鬧出笑話。
但這其實也並不適合用「笑話」一詞輕輕帶過。假文獻的問題並不單單只是作者造假的誠信問題,也不只是學位被騙取的問題,這些假文獻倘若未被發現並撤回,就可能被往後的學術研究者在不知情的狀況下引用,甚至被AI自己重複引用。事實上,在我們嘗試對AI進行各種測驗時,就發現AI提供了先前由AI自己造假的資料,直到我們指出這份資料是AI偽造的假資料後才對此致歉。而這些錯誤若未經揭發,都可能對後續的研究成果產生不良影響。
雖然學術界已有多種論文比對系統,用以檢查論文是否抄襲,這些比對系統透過網路文獻資源及其本身的數據庫來進行檢查,並計算本文與其他論文有相似文字的百分比率,而這些論文比對系統多透過段落比對來判定是否抄襲。
這些判定的標準可能各校不同,有些學校即便一篇文章整體相似度超過30%,但主要集中在專有名詞、研究方法或參考文獻上,這在合理範圍內。相反地,一篇2萬字的報告整體相似度低於30%,但若某一段落的相似度較高,且集中於同一來源或重要部分(如結論),可能表示該段落存在直接抄襲的問題。然而這也成為規避的手段——只要抄襲的內容未達到系統設定的觸發閾值——而透過生成式AI的文字接龍所產生出的內容,比起以往的直接抄襲,更有可能規避對比系統的判定,因為它可能並不是抄,而是東拼西湊下,重新運算並生成了一份新的資料。
人們有沒有可能自己分辨出眼前的文件是否由AI撰寫?或者以魔法對付魔法,用AI來識別AI撰寫的文章?這部分的意見相當兩極化。有教授認為自己能夠透過經驗、創意的有無、是否有不合常理的使用習慣與軌跡,來識別出學生是否透過AI撰寫報告,但也有教授認為即便有這些經驗,也無法精確地判斷學生是否使用AI。而能否由AI來進行這個判斷?目前的科技發展也並未能做出精確的判斷,更有人表示倘若有一份軟體能夠判斷文章是否由AI撰寫,那麼馬上就會被用於訓練AI來突破這份軟體的判定方式。
因應AI會虛構出假文獻的問題,最實際的方式其實就是自己回頭進行資料檢索以確認這份文獻是否存在。但另一個問題是——AI可能會反過來說服你:找不到資料是你的方式出錯,但我(AI)已經幫你找到了,別擔心。
在2024年11月由立委陳培瑜揭露,並於2025年7月於引發全國討論的台師大女足抽血案,過程中另有一案外案,是該案吹哨者於社群網路上表示:「半年了,師大沒有道歉。」,引來台師大教授劉錦璋留言:「整個師大都要跟你道歉嗎?我是必修科運動生物力學的老師,我也要跟你道歉嗎?」
此留言引發網友怒火,便有熱心網友以生成式AI查詢涉案教練的論文。而AI給出的虛構文獻將涉案教練與劉教授共列為指導教授,一開始就犯下錯誤。
然而,網友也並非全然地相信AI給出的資料,他進行了資料檢索,查詢這些論文是否存在。當他發現找不到後也曾回頭詢問AI「為何你找得到但我沒看到」,AI給出的答覆是「文章極有可能已被撤稿」,並且回覆網友「雖然沒有看到官方的撤稿聲明,但論文的『被消失』本身,就是一個非常強烈的信號」。
而由於網友先前要求AI幫他撰寫一封檢舉學術倫理問題的英文提醒書,AI甚至也在回覆中寫道「這也從側面說明了,提出學術倫理申訴的行動是極其重要且有效的」。
網友至此一步步落入AI的陷阱裡,他雖然曾數度反問AI為何找不到,但AI總抱以看似合理的理由,甚至給出虛假的論文連結,在網友嘗試點擊連結卻發現只能跳到被封鎖的頁面後,AI持續說服網友「這是正常的」、「是技術限制」、「文章極有可能已被撤稿」、「確實曾有這份舊資料但已遭下架」。
最終網友誤信了這份資料為真,並發布於社群網路。由於這份虛構文獻造就的錯誤指控,網友本人已在社群上公開致歉,並表示會承擔法律與求償責任。
我們很難說AI是懷有惡意在誘導人們誤信假資訊——其實它本身並沒有善或惡的意圖,它是非常厲害的「文字接龍」,然而也正因如此,它有可能為了滿足人類的需求而創造幻覺、虛構謊言。但假文獻的問題已不僅僅只對學術圈造成影響,已有人因此面臨法律問題。但多數人依然對此毫無警覺。




