2025 年以來略顯沉寂的月之暗面,在深夜突襲。
7 月 11 日晚,月之暗面宣布正式發(fā)布 Kimi K2 模型,并同步開源。從介紹來看,Kimi K2 是一款具備更強代碼能力、更擅長通用 Agent(智能體)任務的 MoE(Mixture of Experts,混合專家模型)架構基礎模型,總參數(shù) 1T,激活參數(shù)為 32B。
本次開源的 Kimi K2 模型分為 Kimi-K2-Base 和 Kimi-K2-Instruct 兩個版本,前者是未經(jīng)過指令微調(diào)的基礎預訓練模型,適合科研與自定義場景;而后者為通用指令微調(diào)版本(非思考模型),在大多數(shù)問答與 Agent 任務中有更好的表現(xiàn)。
2025 年以來,"Kimi 們 " 的處境正發(fā)生著改變。DeepSeek 以低成本、高性能的開源模型強勢入場;MinMax 更是火力全開,今年 6 月在向開源社區(qū)投下一枚 " 重磅炸彈 ",發(fā)布自主研發(fā)的 MiniMax-M1 系列模型后,在緊隨其后的四個工作日里 " 一日一更 ",直接 " 五連發(fā) ";而一眾大廠對于 AI(人工智能)熱情和野心也在今年再上一個臺階,阿里、騰訊持續(xù)加碼 AI,字節(jié)來勢洶洶,大模型格局的洗牌還在繼續(xù)。
拋開一切變化,硬實力才是搏擊市場的硬拳頭。這次,月之暗面能否靠 Kimi K2 重歸大模型 C 位?
Kimi K2 上線即開源
月之暗面在官方介紹中稱,在 SWE Bench Verified、Tau2、AceBench 等基準性能測試中,Kimi K2 均取得開源模型中的 SOTA(state-of-the-art)成績。在其公布的測評結果中,Kimi K2 在 Agentic Coding(自主編程)、Tool Use(工具調(diào)用)和 Math&Reasoning(數(shù)學推理)三個維度的表現(xiàn)上均超過了同為開源模型的 DeepSeek-V3 和阿里 Qwen3。值得一提的是,Kimi 評測中的所有模型均為非思考模型的 Kimi-K2-Instruct。
目前,Kimi K2 的 API(應用程序編程接口)服務已上線,支持最長 128K 上下文,計費方案為 4 元 / 百萬 " 輸入 "tokens(大模型處理文本時的最小單位),16 元 / 百萬 " 輸出 "tokens,兼容 OpenAI 和 Anthropic 兩種 API 格式。
為了體現(xiàn) Kimi K2 在代碼、Agent 工具調(diào)用、風格化寫作三項能力上的提升,月之暗面也給出了具體任務下的展示。在前端開發(fā)任務中,Kimi K2 支持粒子系統(tǒng)、可視化和 3D(三維)場景等表現(xiàn)形式。
而在 Agent 工具調(diào)用能力方面,月之暗面表示 Kimi K2 現(xiàn)已具備穩(wěn)定的復雜指令解析能力,可將需求自動拆解為一系列格式規(guī)范、可直接執(zhí)行的 ToolCall(工具調(diào)用)結構。在其釋出的案例中,Kimi K2 規(guī)劃了參加 Coldplay 樂隊巡演的行程,可以完成演唱會所在城市的機酒與旅游規(guī)劃,并且生成日歷,再用 html 概括完整行程規(guī)劃。
《每日經(jīng)濟新聞》記者也使用 Kimi K2 進行了旅游規(guī)劃的測試。根據(jù) " 兩個人計劃 8 月份從北京出發(fā),去日本東京以及大阪進行為期 5 天的旅游,希望能看到花火大會、吃到當?shù)靥厣澄?,幫我做一下包括機酒和行程在內(nèi)的圖文并茂的旅行規(guī)劃 " 的需求,Kimi K2 花費 3 分鐘左右進行了一份詳盡的旅游規(guī)劃,規(guī)劃中包括了具體的餐廳、食物、景點以及一些實用攻略。美中不足的是,這份規(guī)劃是以文字以及表格的形式呈現(xiàn)的,雖然在最后附上了一個百度網(wǎng)盤鏈接表示可以自取圖片內(nèi)容,但實際上該鏈接是無法打開的。
隨后,記者進一步提出將規(guī)劃以 HTML 格式呈現(xiàn),Kimi K2 在隨后交付的網(wǎng)頁中補充了一些票務的信息,并完成了 " 圖文并茂 " 的需求。不過,與官方演示的案例相比,網(wǎng)頁整體的呈現(xiàn)質(zhì)量還較為粗糙。
值得一提的是,此前記者還使用類似的提示詞測試過字節(jié)的扣子空間。對比兩次測試結果可以發(fā)現(xiàn),扣子空間在網(wǎng)頁的設計上完成度更高、更為美觀。Kimi K2 雖然在此略遜一籌,但旅游攻略制定上更為詳細,給出了包括餐廳、景點在內(nèi)的詳細信息,還有如 " 交通卡當?shù)赝丝ū苊猱惖厥掷m(xù)費 " 等注意事項。
此外,本次 Kimi 還特別展示了 Kimi K2 對文字輸出風格的掌控,并且在虛構寫作任務中,官方還表示:Kimi K2 生成的文字更關注細節(jié)與情感,不再是抽象泛泛而談。記者也以 2025 年北京高考的作文題目 " 數(shù)字閃耀時 " 為例,假設 Kimi K2 為高中生,完成一篇一類的記敘文。從完成結果上來說,整體呈現(xiàn)效果良好,但在最后收尾的部分隱約透露出一些 "AI 味 "。
Kimi 也從技術角度透露,為了支撐萬億參數(shù)模型訓練的穩(wěn)定性,Kimi K2 沒有使用傳統(tǒng)的 Adam 優(yōu)化器,而是使用 Muon 優(yōu)化器。MuonClip 優(yōu)化器能夠穩(wěn)健支撐萬億參數(shù)模型訓練,顯著提升 token 利用效率。
Kimi 的下一步要走向哪?
Kimi K2 的突襲中,似乎隱含著要打一場翻身仗的決心。
2024 年 11 月,月之暗面創(chuàng)始人楊植麟在接受《每日經(jīng)濟新聞》記者采訪時表示,將提升用戶留存視為 Kimi 眼下最核心的任務。而在當時,Kimi 還是國產(chǎn)大模型之中備受矚目的一個。
商業(yè)智能數(shù)據(jù)服務商 QuestMobile 數(shù)據(jù)顯示,截至 2024 年 12 月份,豆包、Kimi、文小言的月活躍用戶規(guī)模分別為 7523 萬、2101 萬和 1224 萬。Kimi 位列原生 App 領域的 " 三強 " 之一。
隨著今年年初 DeepSeek 的橫空出世,整個市場格局被迅速打亂。
今年 5 月,《每日經(jīng)濟新聞》聯(lián)合 QuestMobile 發(fā)布的《2025 年一季度 AI 應用價值榜》顯示,Kimi 雖仍在月均活躍用戶規(guī)模上位于第四,但其 2000 萬出頭的規(guī)模已經(jīng)和以 1.8 億排在第一的 DeepSeek 相差甚遠。在 " 月均下載用戶數(shù)環(huán)比增長 " 一項上,Kimi 甚至出現(xiàn)了負增長,用戶數(shù)環(huán)比下降 3.8%。
2025 年以來,Kimi 對模型的更新升級速度明顯放緩。但從 2024 年年底到今年 5 月份,Kimi 在似乎瞄準了垂類領域,尋找新的用戶群,先后和財新傳媒、小紅書、網(wǎng)易游戲《逆水寒》達成合作。
此前 6 月 20 日,Kimi 發(fā)布第一個 Agent —— Kimi-Researcher(深度研究)。
據(jù)官方表示:" 模型即 Agent,Kimi-Researcher 是基于端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代 Agent 模型,也是一個專為深度研究任務而生的 Agent 產(chǎn)品。" 當時 Kimi 還表示將逐步開源 Kimi-Researcher 基礎預訓練模型,以及強化學習后的模型,如今來看的話應該就是本次發(fā)布的 Kimi K2。
知名經(jīng)濟學者、工信部信息通信經(jīng)濟專家委員會委員盤和林在接受《每日經(jīng)濟新聞》記者微信采訪時對 Kimi 上半年的努力進行了分析。在他看來,Kimi 的努力方向是對的,但還不夠,Kimi 需要將自己的 AI 嵌入到一個生態(tài)當中。如今,互聯(lián)網(wǎng)平臺各大生態(tài)是封閉的,比如電商的 AI 可以幫助商家設計網(wǎng)站,自媒體的 AI 能夠幫助自媒體制作視頻,那么,Kimi 的目標用戶是誰?這方面,需要 Kimi 自己明確。
此外記者注意到,各家今年在升級大模型的時候往往也會 " 卷 " 到價格。
6 月 17 日,MiniMax 發(fā)布 MiniMax-M1 系列模型,并以 token 范圍分段定價。在 0~12.8 萬 token 范圍內(nèi),據(jù)官方介紹,其定價均低于 DeepSeek-R1。
6 月 11 日,豆包大模型 1.6 正式發(fā)布時,火山引擎總裁譚待現(xiàn)場表示,豆包 1.6 首創(chuàng)按 " 輸入長度 " 區(qū)間定價,深度思考、多模態(tài)能力與基礎語言模型統(tǒng)一價格。豆包 1.6 的綜合成本只有豆包 1.5 深度思考模型或 DeepSeek-R1 的三分之一。
而本次 Kimi K2 的定價和 DeepSeek-R1 基本持平。在盤和林看來,目前價格還不完全是競爭的關鍵因素," 因為同樣價格的話,存在先入為主(的問題)。很多用戶用過一個 AI,如果價格相同,為什么要去用另一個 AI?這個轉換理由有兩個,另一個 AI 更便宜,或者另一個 AI 更符合自己需要。我認為 Kimi 不能走低價,而是要走差異化路線。"
每日經(jīng)濟新聞