國科會今釋出TAIDE-LX-7B模型提供產學研以臺灣文化的大型語言模型導入生成式AI

波新聞─陶泰山／台北

因應2022年底ChatGPT帶來廣泛且巨大的影響，國科會自去(2023)年初即推動可信任生成式AI發展先期計畫（Trustworthy AI Dialogue Engine，簡稱TAIDE），國科會主委吳政忠今(15)日宣布釋出 TAIDE-LX-7B模型，這是一款結合臺灣文化的大型語言模型，透過此次模型釋出，將能更進一步協助我國政府在生成式AI模型發展路上，提供更多元與多樣化的服務，幫助產學研快速導入生成式AI。

資源整合與學界合作應用案例

TAIDE-LX-7B模型釋出版相當於汽車的引擎，後續搭配各式零件、組裝車殼，就可以化身成不同用途的車輛運具，提供消費者使用。例如TAIDE已與高雄大學合作，透過吳俊興教授及其團隊開發的開源生成式AI應用平臺(Kuwa GenAI OS)，將TAIDE模型預載內建於Kuwa平台，開發者可靈活組合串接週邊功能，使用者則是透過簡易的Web介面與後端模型互動。其他應用案例，包含臺南大學的TAIDE台語對話機器人、中興大學神農TAIDE、中研院行政常見問題回應、民間公司智慧客服等。

該模型具有「臺灣特色」與「可信任性」

與現今其他大型語言模型不同之處，TAIDE-LX-7B模型具有繁體中文的文本生成能力，在Meta Llama-2-7B的基礎上，透過額外擴充繁體中文字元、字詞，使得生成的文本更加流暢、精準，並且更具有「臺灣特色」。為達成前述目標，訓練模型所使用的文本資料，皆以合法取得授權之文本數據進行訓練，此一過程確保模型本身強調的「可信任性」，透過「可信任性」的文本協助TAIDE-LX-7B模型加強臺灣文化、用語與國情等知識，從而產生豐富多樣的文本內容。另加強訓練5大功能，包括自動摘要、寫信、寫文章、中翻英、英翻中等，並開發出多輪問答的對話能力，讓模型可以透過已生成的文本內容，接續使用者的指令，產出更符合需求的文本。

藉由公開釋出，可望於近期看到TAIDE語言模型在公部門或民間機構的各類應用（包含商業應用），有效擴散整個語言模型的發展。現在即可以進入 TAIDE官方網站（https://taide.tw/），了解模型發展目標與歷程，並點入網站上「TAIDE模型」連結(https://taide.tw/index/download-model)，再進入該頁面中提供的Huggingface連結下載，就可開始使用並體驗具有臺灣特色的大型語言模型。

圖／國科會科技大樓，維基百科，由 Chongkian – 自己的作品, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=27383580