麻省理工學院博士生 JS Tan 在 China Talk 的文章。
他認為DeepSeek 之所以成功,並不是因為它尋求中國政府支持,而是因為它完全打破了常規。DeepSeek 幾乎不是中國創新體系的產物。該公司既不是國家主導的項目,也不是中國人工智慧產業政策的直接受益者。相反,它是由一位前對沖基金經理人自籌資金創立的,並且是從中國科技領域的邊緣企業中崛起的。
他討論 deepseek 對中國真正的意義,在於改變創新文化。過去我們熟知的山寨模式是由 996 的勞資規範,員工必須遵守嚴格的報告要求(週報甚至日報),並且打卡上下班,以防止他們「偷竊資方的時間」。資方設定了嚴格的關鍵績效指標 (KPI),並實行「堆疊排名」,即一種對員工相互進行排名的績效管理系統。事實上,速度和快速迭代的能力在數位轉型至關重要,當時企業專注於積極的用戶成長和市場擴張。主要目標是快速、持續地推出新功能和新產品,以超越競爭對手並佔領市場占有率。
這種不懈的擴張追求需要一支像運作良好的機器一樣運作的勞動力。結果,員工不再被視為創新者,而更像是機器中的齒輪,各自扮演狹義的角色,為公司整體成長目標做出貢獻。但是 DeepSeek 完全相反,自 2023 年成立以來,deepseek 一直避開中國科技業等級森嚴、控制力強的管理實務標準。
DeepSeek 刻意創造小型團隊規模,約 150 名員工,而且沒有管理角色。研究小組是根據特定的目標而組成的,沒有固定的等級制度或嚴格的角色。團隊成員專注於自己擅長的任務,自由協作,並在遇到挑戰時諮詢跨小組專家。這種方法可以確保每個有潛力的想法都能獲得其蓬勃發展所需的資源。為此,DeepSeek 積極避免傳統技術工作場所的表演面。沒有每週報告,沒有讓員工相互競爭的內部競賽,而且顯然也沒有 KPI 。
年輕勞動力獲得高度解放,DeepSeek 的許多研究人員,包括那些為突破性的 V3 模型做出貢獻的研究人員,都是剛從頂尖大學畢業後加入公司的,通常幾乎沒有任何工作經驗。他們非常重視教育背景和比賽成績。眾所周知,該公司會拒絕那些在程式設計或數學競賽中沒有獲得金牌的候選人。除了對開源的文化承諾之外,DeepSeek 還透過金錢和計算來吸引人才,其提供的薪水高於字節跳動,並承諾將計算分配給最好的想法,而不是最有經驗的研究人員。
另外一個重要關鍵,在於資源投入的平行世界想法,現在普遍認為中國創新注定失敗的原因,來自於他們無法獲得關鍵運算資源。從這個角度來看,中國經濟有可能將美國的技術禁令、制裁、關稅和其他障礙視為中國經濟成長的促進劑,而不是障礙。從這個角度來看,這種限制迫使中國企業創新、升級和開發自主的技術解決方案,最終增強中國的自力更生能力和長期競爭力。
這代表著中國科技產業逐漸從西方技術轉移,而非自主創新,所以需要國外網絡(留學生與專家系統)彌補不足的現象。事實上,華為 5G 通訊系統以及其他涉足的資通訊產業裡,大量獲得外國技術已經是個常態,現在人工智能時代裡,更需要外國人才投入,因此字節、阿里巴巴、騰訊皆在矽谷或其他國外生態系有辦公室。不過,DeepSeek 不依賴外國訓練的專家或國際研發網絡,而是只使用中國本地人才。創辦人本身也從未在中國以外的地方學習或工作過。
這表現出,未依賴國外網絡也能獲得關鍵技術一事,造成西方世界的恐慌,本來以為能夠控制中國技術發展的期待落空,這也反映在各項討論上。不過, JS Tan 最後認為任何技術創新都會從前者獲取經驗,吸收成為養分後,才能再次突破,因此技術喘疑與自主研發創新並不是互相排斥的行為,是同一連續進程的一部分。DeepSeek 迄今尚未獲得政府的直接支援,某種程度代表著一種自主性。
DeepSeek讓中國看起來似乎已經在未來的人工智慧領域站穩了腳跟,但聲稱 DeepSeek 的成功證明了整個中國創新體系的有效性還為時過早。DeepSeek 仍在進程,發表後我們看到 OpenAI、Google、Anthropic 等逐漸封閉型的人工智能公司改變立場,提供各項資料接口(API)半開放的提供模型運算資源。這或許也代表著,開源或是封閉本身或許不是個議題,而是更適合人類發展的人工智能到底在哪裡,這點值得仔細思考。
我有想法..