靠AI模型協助診斷反而失準?史丹佛大學研究證實
記者/劉閔
日前來自史丹佛大學醫學院的研究發現,醫師若透過大語言模型ChatGPT-4輔助進行診斷的正確率為76.3%,而這結果與使用傳統診斷方法的正確率73.7%相差不多。不過,單獨使用ChatGPT-4診斷推理,其正確率竟然高達92%,凸顯出醫師與AI的合作還需要培訓和臨床整合。該研究發表於近期的《JAMA Network》醫學期刊上。
招募50名醫師進行分組比對
據了解,本項研究共招募50名醫師,且其中包含24名主治醫師與26名住院醫師。首先研究人員將受試醫師隨機分為2組,且分別使用傳統診斷資源加上ChatGPT-4輔助、以及僅使用傳統診斷資源(包含醫療手冊或網路搜尋),並於1小時內針對6個臨床案例進行診斷推理,包含患者實際病史、體檢數據和實驗室生化數據。
更多新聞:科學家創造「智慧晶體」 不用任何能源就可從空氣中收集水
單獨用AI診斷的正確率更高
最終試驗結果顯示,搭配ChatGPT-4組的醫師和僅使用傳統診斷組的醫師其診斷推理,正確的比率平均分別為76.3%以及73.7%,而前者在每個案例花費平均時間為519秒,比起傳統診斷的平均花費快了約1分鐘。然而令人訝異的是,單獨以ChatGPT-4進行診斷推理的正確率則為92%。
研究團隊領導人史丹佛醫學院Ethan Goh博士指出,ChatGPT-4十分有潛力成為醫療診斷的強大工具,然而結果卻顯示醫師作為輔助使用時卻無法改善臨床病例診斷,凸顯兩者合作還有進一步改善的空間。不過最後他也認為,若透過有效的培訓和臨床整合,相信大語言模型最終可以讓患者受益。
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
瀏覽 127 次