企業極缺全面AI人才!國科會TAIDE專家蔡宗翰:應訓練更多人建置LLM
記者/李琦瑋
1111人力銀行與Amazon Web Services(AWS)13日共同舉辦「AI驅動、未來職場」研討會,揭示企業如何借助AI進行決策,在業界保持領先優勢。國科會TAIDE專案主責專家成員、中央大學資工系教授蔡宗翰提到,企業製作自己專用的AI模型非常必要,但目前極缺同時具備領域專業、AI素養、資料處理與治理的全面AI人才,社會應訓練更多人參與AI建設、協助建置企業內部LLM(大型語言模型)。
1111人力銀行與AWS共同策畫「AI驅動、未來職場」研討會,13日於政大公企中心登場,蔡宗翰以「AI教育與創新實踐的結合:如何打造AI時代的人才」為題,探討AI人才的培育。
延伸閱讀:1111攜手AWS「AI驅動 未來職場」研討會 呂正華:AI學習、證照增強競爭力!
蔡宗翰首先科普引爆生成式AI熱潮的ChatGPT本質並非聊天機器人、資料庫、搜尋引擎,而是LLM,簡單來說就是飽讀詩書的「文字接龍器」,從應聲蟲到可以實際應用,就像教小孩一樣,需要養成的過程,變換不同訓練教材,在基礎教育階段給予幾十兆大量語料,讓模型反覆練習文字接龍,中等教育、高等教育階段都要給予幾十萬筆資料,從可以回應指令,到學會人類偏好,給予品質更高的回應。
蔡宗翰指出,現在會用ChatGPT寫文案,已非企業所需人才,能夠因應企業所需,建置內部LLM的,才是接下來更搶手的AI人才。而AI人才必須清楚LLM的3大分類,包括ChatGPT、Gemini等「閉源商用通用大模型系統」,開發成本達百億美金,在一般應用場景下可直接使用;參數量2B-400B,開發成本約千萬至數億美金,具基礎知識,還需要微調或結合搜尋才能實際應用的「開源大模型」,如Llama、Gemma;台灣的TAIDE則屬「本地化大模型」,在上述模型基礎上進行本地語料的持續訓練,有本地特色,並保有部分原始模型的能力。
蔡宗翰說,若企業想要使用「開源大模型」、「本地化大模型」都得找專家幫忙、持續訓練。而企業導入LLM原則,可以依循這4點,對於非敏感任務具成本效益可以使用「閉源LLM」;內部優先,然後在外部部署之前熟悉的LLM;先低風險,然後高風險,耐心等待技術成熟;內外協作。
至於企業該如何建構專用模型?蔡宗翰建議必須要有模型開發團隊加上企業的AI人才,內外協作才會知道企業需要什麼任務及功能的LLM,資料組負責盤點並蒐集所有可用資料、對資料進行前處理、設計任務並製作微調資料(針對每一任務、設計一些指令)、製作完畢的大量(指令、回應)配對,要用於微調模型;評估組則要針對每一任務設計評估用的指令、準備測試模型用的指令。
蔡宗翰表示,統整以上內容,企業AI人才需擁有5大能力,包括需要理解LLM原理並善用;動手寫程式處理資料,轉換為LLM學習教材;為LLM訂出任務;根據任務設計指令;設計評估LLM效能。而企業目前最欠缺的是同時具備領域專業、AI素養、資料處理與治理的全面AI人才。
最後他分享,在開發TAIDE LLM時,經常需要和需求單位溝通,即使上過課、開過會,但對方沒實際動手做過,過程中容易產生誤會,因此他決定在台大開設「2024數位人文技術與應用專題課程」,帶領文學院學生做出文史LLM,教導文科生進行任務設計、資料製作、評估方法,由助教幫忙訓練模型,培育更多能夠協作LLM的人才。學生回饋說,能夠親手運用自己的領域知識(Domain knowledge),動手寫程式轉成AI能讀的教材,成就感實在太高了!
※探索職場,透視薪資行情,請參考【科技類-職缺百科】幫助你找到最適合的舞台!
瀏覽 368 次