Google攜手史丹佛大學 皮膚病狀圖片資料集SCIN補足臨床不足
記者/竹二
為了補充臨床皮膚疾病資料集的不足,Google與史丹佛大學醫學院攜手合作,收集涵蓋各種膚色、身體部位皮膚病狀的照片,創建了皮膚病狀圖片資料集(SCIN),該資料集的收集的來源是網路,因此也可反映出民眾常在線上搜尋的常見皮膚問題,可以藉此補充臨床皮膚疾病資料集的不足,並提高人工智慧工具的泛用性。
SCIN資料集可解決種族資訊欠缺
健康資料集在研究和醫學教育領域都是很重要的一環,不過,研究團隊表示,要創建可以代表現實世界的資料集具有相當的挑戰性,像是皮膚問題的外觀和嚴重程度各有不同,現有皮膚科影像資料集也缺乏民眾常出現的皮疹、過敏和感染等病狀的圖片,加上多是淺色皮膚也欠缺種族資訊,都讓研究人員難以評估差異和創建通用解決方案。
而SCIN資料集經過設計後,可以收集廣泛條件的圖片,並具有詳細貢獻者的資訊、專業皮膚科醫師標注。據悉,SCIN資料集一共收錄了超過1萬張皮膚、指甲和頭髮狀況的圖像,這些圖像都是由本人自願貢獻,並被要求拍攝特寫與稍遠距離的圖像。
SCIN資料集採用群眾外包新方法
SCIN資料集的組成主要是常見的過敏、發炎和感染性疾病,資料集中的大多數圖像展示了皮膚病的早期狀況,超過一半的皮膚病狀在照片拍攝一星期內會出現,甚至有30%的症狀是在圖像拍攝不到一天內出現。
研究人員提到,在創建SCIN資料集時採用了群眾外包新方法,藉由在網頁搜尋結果頁面投放廣告,吸引網路參與者,這個方法擴大了參與者的範圍,確保可以從廣泛且多元的人群中收集資料。結果也顯示,超過97.5%的貢獻都是真實的皮膚狀況圖像,也有約一半的貢獻者回報了人口統計資訊,有80%包含皮膚狀況的自我評估,像是膚質、持續時間以及其他症狀描述等。
瀏覽 10,482 次