Kimi 和 Minimax,爭奪“下一個 DeepSeek”心智
近日,在 36 氪 WAVES 舉辦的大會上,一個有趣的環節引發了人們的熱議:主辦方讓 Kimi 與 Minimax 兩家的投資人進行了對談。
隨著 DeepSeek 的橫空出世,整個中國大模型的牌局已天翻地覆。 行業龍頭的格局,從原來的大模型六小龍,逐漸演變成了今天的基模五強。
當六小龍不再是市場的焦點時,安靜很久的 Kimi 和 Minimax 在 前不久 不約而同有了新動作: Kimi 開源了程式設計模型 Kimi -Dev,它的第一個 Agent Kimi -Researcher 深度研究也開啟小範圍測試。 而 Minimax 則開源了首個推理模型 Minimax -M1,並完成連續五天 包含大模型、視頻生成、音訊生成等多個方向的更加 。
從產品側來看,Kimi 將重心聚焦到 agent,以深度研究為主要方向,似乎有意向金融、學術等方向發力,這條路線雖然已經有了智譜等競爭者,但遠離了以生活服務為主的大廠射程,疊加原本不錯的基礎模型能力,Kimi 似乎找到了自己的舒適區。
而另一邊,Minimax 則似乎想要彌補自身的遺憾,在沒有接入 DeepSeek 之後,繼續發力全方向的佈局。
這似乎也意味著,大模型競爭進入下半場之後,更多的變數正在醞釀之中,而從各項評測來看,Kimi 與 Minimax 的新產品,似乎都有著不錯的效果。
在沒等來 R2 之後的緩衝期,六小龍中的代表們,正在試圖攜帶著各自的大招,開啟下半場。 而從報導來看,無論是頻繁與 DeepSeek 撞論文的 Kimi,還是曾經和 DeepSeek 賭同一個技術路徑的 Minimax,似乎都帶著一絲不甘心。
而 在大廠 先後加入 大模型賽道 后 ,六小龍中, Kimi 和 Minimax 正試圖 找到自己的生存方式。 從某種程度來說,競爭的模式正在發生改變,而 在泡沫消散之後,越來越懂經營的六小龍們,也在期待著下一個周期的開始 。
01 Kimi 和 Minimax 接連放大招
“ 一年前,就是比投放、比用戶,現在則回到技術前沿,回到強認知,我相信反而更適合以技術大牛為核心的創業團隊。 因為比投放,其實是大廠的機會,所以我覺得他們狀態還挺好的。 “在這次對談上,真格基金合夥人戴雨森在談到 Kimi 與 Minimax 時如是說。
正如其所言, 近日,相較於在教育、醫療等垂類應用場景中爭奪的大廠,Kimi 與 Minimax 似乎更希望在基礎技術上展現自身的底色。
6 月 20 日,Kimi 官方發佈消息, Kimi -Researcher(深度研究) ,開始小範圍灰度測試。 據官方消息透露, 模型即 Agent, Kimi -Researcher 是基於端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代 Agent 模型,也是一個專為深度研究任務而生的 Agent 產品。
做為內測使用者,可以看到的是,Kimi 這次試圖去打造的就是“高實用性”以及“靠譜”的產品。
按照官方的數據, 每個任務平均進行23步推理,自主梳理並解決需求 , 平均規劃74個關鍵詞,找到206個網址,由模型判斷並篩選出資訊品質最高的前3.2%內容,剔除冗餘、低質資訊 。 報告的平均長度在萬字以上, 平均引用約26個高品質、可溯源的信源 。
很明顯,Kimi 此次直指需要低幻覺類的垂類賽道。 從小紅書等社交媒體反饋來看,論文黨、甚至如金融、法律等高頻需要深度探索的方向,都對 Kimi-researcher 有著不錯的評價。
專業評測博主 mactalk 評價道:深度研究不算什麼新創新,但 Kimi 生成的內容,在信源和形式上確實不錯,Kimi 的深度研究功能,除了給到一份分析報告外,還會生成一個網頁。 看到網頁的那刻,給人的感受是,網頁也應該成為一種和文本同等重要的交互方式。
與此同時,Minimax 也用全新的模型在展示自身的肌肉。 根據極客公園報導, 作為推理模型, Minimax -M1 在長上下文理解能力上,是目前包括所有閉源和開源模型在內,能力全球前二的模型,且在訓練和推理成本上 有 極高的性價比。
M1 仍然延續著 MoE 架構,而在注意力機制上和強化學習演算法上的創新讓 M1 鮮明 地 區別於其他推理模型。 模型總參數達到 4560 億參數,原生支援 100 萬 token 的上下文長度輸入,以及目前所有模型中最長的 80ktoken 的輸出長度。
在 專業上下文能力的測評 中,M1 的表現遠超包括 DeepSeek -R1-0528 和 Qwen3-235B 在內的所有開源模型,甚至超越 OpenAI o3 和 Claude 4 Opus,僅小幅落後 SOTA 的 Gemini 2.5 Pro。
除了基礎模型的進展,Minimax 在 agent 以及多模態等多個領域也是亮點頻出。 “ 大家最近刷抖音有沒有看到 ' 吳彥祖教你學英語 ' ? 其實是 Minimax 在提供背後的技術支援。 我第一次聽的時候,也難以分辨到底是真人還是 AI,直到後來才知道是 Minimax 的客戶,感歎這真的挺厲害的。 “雲啟資本合夥人陳煜提到。
實用性超強的 agent,能力出眾的大模型,Kimi 和 Minimax 試圖開啟的是一場全方位的競速,而從更深層次上來看,兩家公司更希望表達的則是,打破大眾對於大模型賽道的固有心智。
02 渴望一場 DeepSeek 式的勝利
相較於 DeepSeek 的光芒萬丈,不得不說,此刻回頭來看,Kimi 與 Minimax 是兩家曾充滿遺憾的公司。
楊植麟 清華出身, 同時在 卡內基梅隆大學(CMU)語言技術研究所(LTI)讀博,導師是蘋果 AI 負責人 Ruslan Salakhutdinov 和 Google AI 首席科學家 William W. Cohen,這樣的學術背景,在技術可信度上遠超普通創業者。
而且他 在迴圈智慧等方面的創業經歷 ,已經在企業級 AI 落地方面證明過自己。 這 更能 讓資本相信,這個人不只是懂技術,還會做生意。 高頻快速的融資,讓其估值迅速爬升。
技術背景,管理經驗,同時具有大量子彈,這讓楊植麟成為前 DeepSeek 時代的明星。
更重要的是, Kimi 的第一仗還打的漂亮, 把長文本技術提升到了“中國 AGI 突破口”的高度,精準匹配了資本對 其的期待。
但不可否定的是, DeepSeek 的爆火,一定程度上掩蓋了 Kimi 的部分聲量。
不過,即便是到當下,仍然可以看出,Kimi 在技術實力上,仍然不遜於 DeepSeek。 在基礎研究環節, 2 月 18 日, DeepSeek 和月之暗面幾乎同時發佈了他們各自最新的論文,而主題直接「撞車」—— 都是挑戰 Transformer 架構最核心的注意力機制,讓它能更高效的處理更長的上下文。 而更有趣的是,兩家公司的技術派明星創始人的名字 , 出現在各自的論文和技術報告里。
而在近日,兩者撞車的事件又頻頻發生。 在法律、醫療等方向招聘上的相似,潛移默化的讓外界覺得,似乎 Kimi 仍然是能與 DeepSeek 並駕齊驅的存在。
而另一邊 Minimax 的遺憾,則來的更為直接。 在媒體的報導中,Minimax 其實更早的啟用了與 DeepSeek 相同的技術路線。 2023 年下半年,大部分國內大模型廠商還在繼續反覆運算稠密模型(dense model)之際, Minimax 創始人兼 CEO 閆俊傑就把 80%以上的研發和算力資源 , 投到了一件不確定的事情上—— MoE(Mixture of Experts 混合專家模型)。
2024 年 1 月, Minimax 上線的 abab6,成為國內首個 MoE 大模型。 此後,MoE 架構徹底取代稠密架構,成了大模型領域技術反覆運算的新方向, 而 年初爆火出圈的 DeepSeek , 應用的正是 MoE。 雖然無法一概而論的將兩者在此維度上進行比較,但可以驗證的卻是兩者間肉眼可見的落差。
客觀來說,與 DeepSeek 技術實力難分伯仲的 Kimi 與 Minimax,在市場中早已無法得到與之匹配的影響力。
而從這個維度上來看,沒有被大廠打敗,而是被 DeepSeek 超越,也讓兩家在下一個週期即 agent 的爭奪中,渴望著一場真正意義上的翻身仗。
正如戴雨森所言「 我們不是因為大模型投資 Kimi ,而是投資團隊。 現在是技術革命的早期,他們仍然是擁有中國最優秀團隊的 AI 創業公司之一,以及擁有最多資源的 AI 創業公司之一。 如果我們相信 AI 是一件非常大的事,你有最好的團隊,又有最多資源,仍然能夠做出很多有意思的事來。 “ 而 AI 的下半場,是否仍會按照當下大廠主導,DeepSeek 重點突破的模式演繹,似乎仍然是一道謎題。
03 AI 公司的生存邏輯正在重構
進入 6 月,AI 圈似乎達到了比以往更為熱鬧的情景。 羅永浩數位人直播帶貨拿下天量成交,誇克與元寶在高考報志願競逐,同時,豆包上線了 AI 播客功能,美團高層點了第一杯 AI 外賣咖啡,AI 的想像力與應用正在不斷加速地滲透至生活的各個角落。
這一切的快速演變,似乎讓人看到了紅杉 AI 峰會中所提到的, 下一輪 AI,賣的不是工具,而是收益。
但與此同時,對於 agent 未來演變的辯論也在持續。 拾象 CEO 李廣密曾坦言 Agent 與當前模型能力的匹配程度。 他認為, 今天 Agent 80%的能力依賴於模型這個引擎。 比如,GPT 到了 3.5,多輪對話的通用範式出現了,Chatbot 這種產品形態就行得通了。 Cursor 的崛起也是因為模型發展到了 Claude 3.5 的水準,它的代碼補全能力才得以成立。
而 AI Research Lead 鍾凱祺 則認為:通用 Agent 的需求基本上就是資訊檢索和輕度代碼編寫這兩類,而 GPT-4o 已經完成得非常好了。 因此,通用 Agent 市場基本上是大模型公司的主戰場,創業公司很難僅僅通過服務於通用需求來做大。 而創業公司基本都聚焦在垂直(Vertical)領域。
回到本文的主角: 當 Kimi 用深度研究 Agent 叩開垂類專業場景的大門,當 Minimax 以推理模型 M1 刷新開源能力邊界, 兩家公司的每一步動作都在印證同一個事實:大模型競爭早已超越 「參數比拼」 的初級階段,進入到 “心智佔領” 的核心戰場。
DeepSeek 的崛起證明,在大廠與創業公司的博弈中,技術突破與市場定位的精準耦合,足以重塑行業認知 —— 而這正是 Kimi 與 Minimax 此刻最迫切的目標。
從技術路徑看, Kimi 押注「垂直 Agent」,試圖用「深度研究」的專業標籤切割出差異化賽道; Minimax 則 試圖用 線性注意力機制 打出差異化 ,通過多模態能力構建全場景滲透的想像空間。 兩者的策略差異,本質是對「AI 下半場生存法則」的不同解讀:前者選擇在大廠尚未重兵佈防的垂類紮根,用「高實用性」對抗大廠的流量優勢; 後者則延續「全棧佈局」的野心,試圖以技術性價比彌補生態短板。
但這場爭奪的關鍵,或許正如戴雨森所言——“投資團隊而非模型”。 當 DeepSeek 用技術敘事改寫資本邏輯, Kimi 與 Minimax 的核心競爭力,仍在於創始團隊對技術趨勢的預判能力(如楊植麟對長文本技術的堅持、閆俊傑對 MoE 架構的提前佈局)。 在大廠憑藉資源優勢加速內卷的當下,創業公司的破局點從來不是 「硬碰硬」,而是像 DeepSeek 那樣,在某個技術維度建立不可替代的認知優勢,進而佔領用戶心智。
如今的 AI 下半場,既是技術落地的“馬拉松”,也是心智認知的“閃電戰”。 Kimi 與 Minimax 的每一次開源、每一個 Agent 的反覆運算,都是在為 “下一個 DeepSeek ” 的敘事加碼。 而當行業泡沫逐漸消散,真正能穿越週期的,或許正是那些既能在技術深水區紮根,又能在用戶心智中刻下獨特標籤的團隊。 這場沒有硝煙的戰爭,才剛剛開始。
參考資料:
字母榜,《閆俊傑不甘心》
字母榜,《minimax 的好日子來了? 》
王智遠,《 Kimi 還能找到月之亮面嗎? 》
鳳凰網財經,《 Kimi 和 DeepSeek 又撞車? 》
暗湧,《 一年後,當 Kimi 和 MiniMax 投資人再坐到一起 》
極客公園,《 巨頭博弈下,Agent 的機會和價值究竟在哪裡? 》
36 氪,《 開源還要 IPO? MiniMax 不想被遺忘在這個夏天 》
月之暗面,《 模型即 Agent,Kimi-Researcher(深度研究)開啟內測 》
極客公園,《 MiniMax-M1 登場,MiniMax 再次證明自己是一家模型驅動的 AI 公司 》
本文來自微信公眾號 「科技新知」(ID:kejixinzhi),作者:櫻木,36 氪經授權發佈。