小米 MiMo-V2-Pro:重新定義 AI Agent 時代的旗艦大腦

2026 年 3 月 19 日12 分鐘閱讀

一場震撼 AI 界的深夜發布

一如小米一貫的風格——大膽、快速、毫不猶豫——這家公司在 2026 年 3 月 19 日深夜,一口氣發布了三款全新自研 AI 模型MiMo-V2-ProMiMo-V2-OmniMiMo-V2-TTS。三者之中,旗艦款 MiMo-V2-Pro 成為所有人熱議的焦點。而這熱度,絕對是實至名歸。

MiMo-V2-Pro 究竟是什麼?

MiMo-V2-Pro 是小米專為現實世界高強度 Agent 工作場景打造的旗艦基座模型,在無需人工干預的情況下,編排複雜工作流程、驅動生產級工程任務,並可靠地交付最終成果。

它是前一代開源模型 MiMo-V2-Flash(3090 億總參數 / 150 億活躍參數,MIT 授權,Intelligence Index:41 分)的重大升級。值得注意的是,MiMo-V2-Pro 的模型權重尚未開放,目前僅可透過小米官方 API 使用。

核心規格一覽

  • 總參數量:超過 1 兆(1T+)
  • 活躍參數:420 億(約為 MiMo-V2-Flash 的 3 倍)
  • 架構:混合注意力機制,比例升級至 7:1(Flash 版為 5:1)
  • 上下文視窗:最高支援 100 萬 tokens
  • 模態:僅支援文字輸入與輸出(不支援多模態)
  • 多 Token 預測(MTP):輕量層加速生成

「Hunter Alpha」謎案——發布前已引爆社群

在正式公告的整整一週前,一個代號為 「Hunter Alpha」的匿名模型悄悄上架了全球最大 API 聚合平台 OpenRouter——沒有宣傳,沒有新聞稿。呼叫量穩步攀升,Hunter Alpha 連續多天登上每日排行榜榜首,累計使用量突破 1 兆 tokens——而此時沒有任何人知道這是小米的模型。

在根據真實使用反饋持續迭代一週後,MiMo-V2-Pro 正式發布,長上下文能力和 Agent 場景穩定性均有顯著提升。

基準測試表現:全球第 8,夾在巨頭之間

根據 Artificial Analysis Intelligence IndexMiMo-V2-Pro 得分 49,全球排名第 8,國內大模型排名第 2

精確的排行榜位置如下:

模型Intelligence Index 得分
GLM-5(推理版)50
MiMo-V2-Pro49
GPT-5.2 Codex(xhigh)49
Grok 4.20 Beta(推理版)48
Kimi K2.5(推理版)47
Qwen3.5 397B A17B(推理版)45
MiMo-V2-Flash(推理版)41

MiMo-V2-Pro 緊接在 GLM-5 之後,領先 Kimi K2.5、Qwen3.5 和 Grok 4.20 Beta,穩居全球前 10。

Agent 基準測試(小米官方)

基準測試MiMo-V2-ProClaude Sonnet 4.6Claude Opus 4.6
PinchBench84.086.986.3
ClawEval61.566.366.3

深度解析:MiMo-V2-Pro 真正閃耀之處

真實世界 Agent 任務(GDPval-AA)

MiMo-V2-Pro 在 GDPval-AA 基準測試中以 Elo 1426 領跑同級模型,超越 GLM-5 推理版(1406)、Kimi K2.5 推理版(1283)和 Qwen3.5 397B(1209)。作為參照,GPT-5.4(xhigh)和 Claude Sonnet 4.6(最大努力)分別為 1667 和 1633。

低幻覺率(AA-Omniscience)

MiMo-V2-Pro 在 AA-Omniscience 指數上得分 +5,憑藉極低的幻覺率領先 GLM-5 推理版(+2)、Kimi K2.5 推理版(-8)和 Qwen3.5 397B(-30)。Claude Opus 4.6(+14)和 Gemini 3.1 Pro Preview(+33)在此項目仍保持領先。

Token 效率

MiMo-V2-Pro 的 Token 效率優於同級模型,完成完整 Intelligence Index 評測僅使用了 7700 萬個輸出 tokens——遠少於 GLM-5 推理版(1.09 億)和 Kimi K2.5 推理版(8900 萬)。這對實際部署成本具有重要意義。

定價:前沿智能,以極低成本實現

MiMo-V2-Pro 的 API 定價僅為 Claude Sonnet 4.6 的五分之一

上下文範圍輸入價格輸出價格
256K tokens 以內$1 / 百萬 tokens$3 / 百萬 tokens
1M tokens 以內$2 / 百萬 tokens$6 / 百萬 tokens

執行完整 Artificial Analysis Intelligence Index 評測,MiMo-V2-Pro 僅需花費 348 美元——相比之下,GPT-5.2(xhigh)需 2,304 美元,Claude Opus 4.6(最大努力)需 2,486 美元。儘管得分僅比 GLM-5 低 1 分,其運行成本卻低於 GLM-5。這樣的性價比,實屬罕見。

為 Agent 時代而生——從 Coding 到 Claw

MiMo-V2-Pro 針對 Agent 場景進行了深度優化,在複雜多樣的 Agent Scaffold 上進行了 SFT 和 RL 訓練,是 OpenClaw 的原生大腦

核心 Agent 能力包括:

  • 複雜工作流編排,無需人工干預
  • 長程規劃,跨越多步驟任務
  • 精準工具調用,穩定性與準確性大幅提升
  • 100 萬 token 上下文,從容應對高強度真實應用流
  • 前端開發:在 OpenClaw 中,單次查詢即可生成精美、功能完整的網頁

此外,MiMo-V2-Pro 還與 五大 Agent 開發框架——OpenClaw、OpenCode、KiloCode、Blackbox 和 Cline——達成合作,為全球開發者提供一週免費 API 體驗

已全面部署上線

MiMo-V2-Pro 不只是一個研究模型——它已正式投入使用:

  • 小米 MiClaw(小米自有 Agent 平台)
  • MiMo Studio
  • 金山 WebOffice(Word、Excel、PPT、PDF,完整 WPS 生態)
  • 小米瀏覽器
  • 可透過 OpenClaw、OpenCode、KiloCode、Blackbox 和 Cline 接入

我的看法:這是小米迄今最嚴肅的 AI 宣言

MiMo-V2-Pro 是小米宣告自己躋身全球 AI 前沿的一份聲明。 不是追隨者,不是平價替代品——而是一個全球排名前 10、夾在 GLM-5 與 Kimi K2.5 之間的頂尖玩家。

「Hunter Alpha」的隱身上線策略讓產品在行銷之前先開口說話。兆級參數規模、百萬 token 上下文、Agent 優先設計、全球前 10 排名、同級最低幻覺率、卓越 Token 效率,加上僅需 348 美元即可完成完整智能基準評測(相比 Claude Opus 4.6 的 2,486 美元)——這樣的組合,實在難以被輕易忽視。

AI 競賽不再是美國實驗室之間的雙雄對決。小米剛剛用行動證明了這一點。

正在評估 AI 代理或 MiMo 整合方案?

我們可協助您選擇並整合適合工作流程的模型——從 MiMo、OpenClaw 到 Claude、GPT。歡迎聯繫我們,獲取策略與實作支援。