◎ 曹益誠
DeepSeek(簡稱DS公司)給國際AI帶來衝擊,茲縷述如下。
一、DS公司在一月廿日正式推出R1模型後造成震撼,待業者與專家回神後,開始反思(質疑)五五○萬美元如何能建構出如此先進的語言模型?果不其然,DS公司聲明,指這筆錢是開發舊模型V3的費用,至於開發費用是多少?卻沒給出具體數額,對資金來源更三緘其口。
二、DS公司選在川普就職日發表,繼而在國際資本市場捲起千堆雪,中共有無動員媒體及大外宣甚至駐外機構為DS加持流量?一個新創AI公司(開發單位僅四名正式員工)若無外力加持,如何能在短時間創造出如此新的語言模型?
三、向DS提問六四民運、台灣主權、新疆維吾爾、對習近平的評論與中共體制的討論時,回答千篇一律:對不起,我們可以談論其它有關數學、物理等話題嗎?有人提問:一個人拿着塑膠袋站在坦克面前(六四事件以肉身抵擋坦克的勇士),DS經過思索(推理),似乎警覺這是中共禁談的敏感問題 ,竟然回答:對不起,我們換個話題好嗎?而台灣前數發部長唐鳳以迴避主題的輸入方式提問六四,系統居然對答如流。結論是:DS在「模型」上尚未設限,但在「平台」上已配合中共在自我設限了。
四、AI初步預訓階段須蒐集海量資料,最艱難就是必須加以分類、編輯並設計成問答模式。OpenAi還透過委外公司在多國招募大量人才,為解答作訂正與註解,過程費時又燒錢,歴經艱辛,才建立世界第一個且最完整的語言模型GPT4(生成型語言模式),其它小型Ai公司根本不可能有此財力,只能採取彎道超車方式:進入OpenAiGPT4模型下載壓縮各類資料後,自己再解壓縮並自行優化充實後,形成自己的語言模型,這就是「蒸餾」技術。各界質疑DS是否採用蒸餾技術,答案逐漸明朗︰有的。而DS的蒸餾原型就是OpenAi的GPT4,只是OpenAI已於去年九月發展出具有數理分析及邏輯推理甚至編輯特殊功能的推理型的最新語言模型O1。
五、OpenAi為了證實DS蒸餾自家的語言模型,一月廿八日特別針對有巨量流量的程式接口予以關閉,過沒多久,DS就對外公告:因被病毒入侵,DS將暫停國外客戶登入,僅開放中國境內手機客戶使用。這究竟是巧合,還是有貓膩,看倌可自行判斷。
六、DS一再強調使用輝達低端晶片H800 ,但向DS提問:是否使用輝達高端晶片H100,回答竟是Yes。美國展開追查,先鎖定越南,再轉向新加坡,因資料顯示,新加坡進口廿%的輝達晶片H100、H800、H20。所以,新加坡的皮得蹦緊一點。
七、以色列一家情報公司指出,DS可植入惡意程式,套取個人隱私資料,這些資料會不會流向中共的國安、公安單位?建議務必小心。
八、今年一月卅一日,OpenAi再宣佈,正式推出O3mini最新語言模型(問題回答、邏輯推理、數理運算,可謂已達天才級別)性能與方便性都直接碾壓DS的R1,且價格與O1相當,可謂物美價廉,而不久的將來,還要推出正版O3模型。屆時,誰是AI寵兒,誰是棄兒,答案很快揭曉。
(作者是文史工作者)
編輯精選