小米 MiMo-V2-Pro:重新定義 AI Agent 時代的旗艦大腦

一場震撼 AI 界的深夜發布
一如小米一貫的風格——大膽、快速、毫不猶豫——這家公司在 2026 年 3 月 19 日深夜,一口氣發布了三款全新自研 AI 模型:MiMo-V2-Pro、MiMo-V2-Omni 和 MiMo-V2-TTS。三者之中,旗艦款 MiMo-V2-Pro 成為所有人熱議的焦點。而這熱度,絕對是實至名歸。
MiMo-V2-Pro 究竟是什麼?
MiMo-V2-Pro 是小米專為現實世界高強度 Agent 工作場景打造的旗艦基座模型,在無需人工干預的情況下,編排複雜工作流程、驅動生產級工程任務,並可靠地交付最終成果。
它是前一代開源模型 MiMo-V2-Flash(3090 億總參數 / 150 億活躍參數,MIT 授權,Intelligence Index:41 分)的重大升級。值得注意的是,MiMo-V2-Pro 的模型權重尚未開放,目前僅可透過小米官方 API 使用。
核心規格一覽
- 總參數量:超過 1 兆(1T+)
- 活躍參數:420 億(約為 MiMo-V2-Flash 的 3 倍)
- 架構:混合注意力機制,比例升級至 7:1(Flash 版為 5:1)
- 上下文視窗:最高支援 100 萬 tokens
- 模態:僅支援文字輸入與輸出(不支援多模態)
- 多 Token 預測(MTP):輕量層加速生成
「Hunter Alpha」謎案——發布前已引爆社群
在正式公告的整整一週前,一個代號為 「Hunter Alpha」的匿名模型悄悄上架了全球最大 API 聚合平台 OpenRouter——沒有宣傳,沒有新聞稿。呼叫量穩步攀升,Hunter Alpha 連續多天登上每日排行榜榜首,累計使用量突破 1 兆 tokens——而此時沒有任何人知道這是小米的模型。
在根據真實使用反饋持續迭代一週後,MiMo-V2-Pro 正式發布,長上下文能力和 Agent 場景穩定性均有顯著提升。
基準測試表現:全球第 8,夾在巨頭之間
根據 Artificial Analysis Intelligence Index,MiMo-V2-Pro 得分 49,全球排名第 8,國內大模型排名第 2。
精確的排行榜位置如下:
| 模型 | Intelligence Index 得分 |
|---|---|
| GLM-5(推理版) | 50 |
| MiMo-V2-Pro | 49 |
| GPT-5.2 Codex(xhigh) | 49 |
| Grok 4.20 Beta(推理版) | 48 |
| Kimi K2.5(推理版) | 47 |
| Qwen3.5 397B A17B(推理版) | 45 |
| MiMo-V2-Flash(推理版) | 41 |
MiMo-V2-Pro 緊接在 GLM-5 之後,領先 Kimi K2.5、Qwen3.5 和 Grok 4.20 Beta,穩居全球前 10。
Agent 基準測試(小米官方)
| 基準測試 | MiMo-V2-Pro | Claude Sonnet 4.6 | Claude Opus 4.6 |
|---|---|---|---|
| PinchBench | 84.0 | 86.9 | 86.3 |
| ClawEval | 61.5 | 66.3 | 66.3 |
深度解析:MiMo-V2-Pro 真正閃耀之處
真實世界 Agent 任務(GDPval-AA)
MiMo-V2-Pro 在 GDPval-AA 基準測試中以 Elo 1426 領跑同級模型,超越 GLM-5 推理版(1406)、Kimi K2.5 推理版(1283)和 Qwen3.5 397B(1209)。作為參照,GPT-5.4(xhigh)和 Claude Sonnet 4.6(最大努力)分別為 1667 和 1633。
低幻覺率(AA-Omniscience)
MiMo-V2-Pro 在 AA-Omniscience 指數上得分 +5,憑藉極低的幻覺率領先 GLM-5 推理版(+2)、Kimi K2.5 推理版(-8)和 Qwen3.5 397B(-30)。Claude Opus 4.6(+14)和 Gemini 3.1 Pro Preview(+33)在此項目仍保持領先。
Token 效率
MiMo-V2-Pro 的 Token 效率優於同級模型,完成完整 Intelligence Index 評測僅使用了 7700 萬個輸出 tokens——遠少於 GLM-5 推理版(1.09 億)和 Kimi K2.5 推理版(8900 萬)。這對實際部署成本具有重要意義。
定價:前沿智能,以極低成本實現
MiMo-V2-Pro 的 API 定價僅為 Claude Sonnet 4.6 的五分之一。
| 上下文範圍 | 輸入價格 | 輸出價格 |
|---|---|---|
| 256K tokens 以內 | $1 / 百萬 tokens | $3 / 百萬 tokens |
| 1M tokens 以內 | $2 / 百萬 tokens | $6 / 百萬 tokens |
執行完整 Artificial Analysis Intelligence Index 評測,MiMo-V2-Pro 僅需花費 348 美元——相比之下,GPT-5.2(xhigh)需 2,304 美元,Claude Opus 4.6(最大努力)需 2,486 美元。儘管得分僅比 GLM-5 低 1 分,其運行成本卻低於 GLM-5。這樣的性價比,實屬罕見。
為 Agent 時代而生——從 Coding 到 Claw
MiMo-V2-Pro 針對 Agent 場景進行了深度優化,在複雜多樣的 Agent Scaffold 上進行了 SFT 和 RL 訓練,是 OpenClaw 的原生大腦。
核心 Agent 能力包括:
- 複雜工作流編排,無需人工干預
- 長程規劃,跨越多步驟任務
- 精準工具調用,穩定性與準確性大幅提升
- 100 萬 token 上下文,從容應對高強度真實應用流
- 前端開發:在 OpenClaw 中,單次查詢即可生成精美、功能完整的網頁
此外,MiMo-V2-Pro 還與 五大 Agent 開發框架——OpenClaw、OpenCode、KiloCode、Blackbox 和 Cline——達成合作,為全球開發者提供一週免費 API 體驗。
已全面部署上線
MiMo-V2-Pro 不只是一個研究模型——它已正式投入使用:
- 小米 MiClaw(小米自有 Agent 平台)
- MiMo Studio
- 金山 WebOffice(Word、Excel、PPT、PDF,完整 WPS 生態)
- 小米瀏覽器
- 可透過 OpenClaw、OpenCode、KiloCode、Blackbox 和 Cline 接入
我的看法:這是小米迄今最嚴肅的 AI 宣言
MiMo-V2-Pro 是小米宣告自己躋身全球 AI 前沿的一份聲明。 不是追隨者,不是平價替代品——而是一個全球排名前 10、夾在 GLM-5 與 Kimi K2.5 之間的頂尖玩家。
「Hunter Alpha」的隱身上線策略讓產品在行銷之前先開口說話。兆級參數規模、百萬 token 上下文、Agent 優先設計、全球前 10 排名、同級最低幻覺率、卓越 Token 效率,加上僅需 348 美元即可完成完整智能基準評測(相比 Claude Opus 4.6 的 2,486 美元)——這樣的組合,實在難以被輕易忽視。
AI 競賽不再是美國實驗室之間的雙雄對決。小米剛剛用行動證明了這一點。
正在評估 AI 代理或 MiMo 整合方案?
我們可協助您選擇並整合適合工作流程的模型——從 MiMo、OpenClaw 到 Claude、GPT。歡迎聯繫我們,獲取策略與實作支援。