晴時多雲

自由開講》主權AI崛起 TAIDE捍衛數位主權

◎廖明輝

隨著人工智慧技術的快速發展,主權AI(Sovereign AI)成為許多國家保障數位主權的重要議題。國家需要透過自主發展與掌控AI技術與基礎設施,避免對外國技術的依賴,確保國家經濟、文化與社會不受他國影響。面對來自中國的AI產品與技術時,台灣必須謹慎應對並積極發展屬於自己的主權AI,才能確保國家安全與科技自主權。

為了捍衛數位主權,台灣建構台版對話引擎TAIDE(圖取自TAIDE官網)為了捍衛數位主權,台灣建構台版對話引擎TAIDE(圖取自TAIDE官網)

在台灣,OpenAI的ChatGPT雖然提供中文選項,但在實際應用上,仍然存在一些問題。由於台灣和中國在幅員、人口以及網路資源數量上的差異,來自台灣的本地資料能進入AI模型訓練數據的比例相對較少。

台灣本地資料能進入AI模型訓練數據 偏少

結果是,ChatGPT的語氣、詞彙和文化背景都更偏向中國的用法。舉例來說,在ChatGPT的輸出,像「精實」變成「精益」、「數位轉型」變成「數字轉型」、「永續發展」變成「可持續發展」、「透過」變成「通過」等。這些細微的差異可能會逐漸影響台灣使用者的語言和文化偏好。中國近年來積極發展自己的AI技術,推出如「文心一言」的大型語言模型。

當台灣的使用者開始大量使用這類產品時,中國不僅可以了解台灣用戶的思維模式,還可透過AI技術影響台灣的社會文化與價值觀。這樣的文化滲透和影響力,不僅對台灣的數位主權構成威脅,更有可能損害台灣的民主韌性。

為了捍衛數位主權,臺灣必須著手發展自己的AI技術與基礎設施。國科會所主導的「可信任生成式AI對話引擎」(Trustworthy AI Dialogue Engine, TAIDE)是一個重要的嘗試。TAIDE在Meta的開源語言模型Llama 3基礎上,進一步以繁體中文資料進行訓練,使TAIDE在處理繁體中文對話時具備一定的本地語言優勢。

透過此舉,臺灣能夠避免外來技術對語言文化的侵蝕,並提供更符合本地需求的AI服務。然而,TAIDE的Llama 3-TAIDE-LX-8B-Chat-Alpha1的模型訓練資料與規模仍存在不足之處,尚需要更多的本地化數據支持,才能進一步提升其理解與溝通能力。

多國推動主權AI 開發符合本國語言與文化的AI技術

從全球視角來看,許多國家都在推動主權AI的發展。歐洲國家如法國與英國紛紛投入資源,開發符合本國語言與文化的AI技術,法國的Mistral AI和英國的BritGPT就是典型例子。同樣地,新加坡也與NVIDIA合作,開發專為東南亞語言和文化設計的SEA-LION LLM模型,展示主權AI發展的重要性。

同時,政府的角色不容忽視。政府可以透過公共服務的數位化來引領AI發展。新加坡的「Pair」專案就是成功的案例,運用生成式AI減輕公務員的工作負擔,並確保資料安全,值得臺灣借鑒。臺灣可以大膽實驗並落實AI技術,提升公共服務效率,為TAIDE的進一步發展提供更多實際應用場景。在國際競爭中保持自主性,並抵禦外來技術對文化與社會的影響。

(作者為中華經濟研究院輔佐研究員)

自由開講》是一個提供民眾對話的電子論壇,不論是對政治、經濟或社會、文化等新聞議題,有意見想表達、有話不吐不快,都歡迎你熱烈投稿。請勿一稿多投,文長700字內為優,
來稿請附真實姓名(必寫。有筆名請另註)、職業、聯絡電話、E─mail帳號。
本報有錄取及刪修權,不付稿酬;錄用與否將不另行通知。投稿信箱:LTNTALK@gmail.com

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

相關新聞

編輯精選

載入中