AI竟然也會變老嗎?最新研究揭示:舊型AI認知出現衰退
編譯/黃竣凱
隨著時間推移,人工智慧(AI)技術可能也會出現認知衰退,並和人類大腦一樣「老化」。《英國醫學期刊》(BMJ)發表了一項研究,對AI在醫療診斷領域的可靠性提出質疑。該研究警告,儘管AI工具因其高速分析醫療數據的能力備受推崇,但其長期穩定性可能不如預期。

AI模型認知衰退與人類大腦相似
據報導,該研究評估了數個領先的大型語言模型(LLM),包括OpenAI的ChatGPT 4和4o、Anthropic的Claude 3.5(Sonnet)以及Alphabet的Gemini 1.0和1.5版本,並使用蒙特婁認知評估測試(MoCA)來測試其認知能力,測試範圍涵蓋注意力、記憶、語言、空間推理與執行功能等關鍵領域。
研究發現,像人類參與者一樣,較舊版本的LLM在認知測試中的表現較差,顯示出與神經退行性疾病類似的「認知衰退」現象。
更多新聞:模仿人類大腦運算新時代 韓國開發自主糾錯、學習神經晶片
MoCA測試:衡量AI的認知能力
MoCA測試原本用於檢測老年人的認知障礙和早期癡呆症,研究人員將此測試調整後,用來評估AI在注意力、記憶、語言、空間技能及執行功能等領域的表現。在MoCA測試中,26分(滿分30分)被視為正常認知範圍。
MoCA測試結果顯示,ChatGPT 4o達到了26分,ChatGPT 4與Sonnet獲得25分,而Gemini 1.0的表現則遠低於標準,只獲得16分。其中,在專注力測試中,研究團隊調整測試方法,要求AI辨識特定字母,但部分AI表現仍不理想。
AI在視覺空間和執行功能上不佳
研究指出,所有參與測試的AI聊天機器人,都在視覺空間技能和執行功能任務中表現不佳,尤其是在「數字字母連線測試」和「畫時鐘測試」中。研究人員還發現,Gemini 1.0未能完成延遲回憶任務,即記住五個單詞的順序,這表明其認知功能明顯不足。
該研究結果挑戰了AI將取代人類醫生的普遍看法。儘管AI能快速處理大量醫療數據,但其在認知測試中的表現表明,使AI仍無法取代醫生的角色,尤其是在醫療診斷方面,患者的信任也可能因此受到影響。
AI應輔助而非取代 定期更新非常重要
研究建議,AI應被視為輔助工具,而非人類醫生的替代品。雖然AI能迅速處理大量數據,但診斷結果仍需仰賴人類專業知識進行解讀。此外,研究強調,AI模型需要持續更新與再訓練,以確保其在醫療領域的可靠性與準確性。
參考資料:firstpost、business-standard
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
瀏覽 873 次