MiniMax-M3 是 MiniMax 公司推出的多模態基礎模型。支援文字、圖像和視訊輸入,並輸出文本,擁有 100 萬個標記的上下文窗口,適用於長期智能體工作、編碼等。
性能基準
- MiniMax M3 在編碼和智能體基準測試中取得了頂尖的效能,具備自主任務分解、工具調用和多步驟推理能力,為 AI 編碼助理和自動化工作流程提供了可靠的基礎。
- M3 採用專有的 MiniMax 稀疏注意力 (MSA) 架構,支援高達 100 萬個 token 的上下文窗口,並保證最小 token 數為 51.2 萬。這 100 萬個 token 的上下文視窗是遠端代理任務、遠端編碼和長視訊理解的基礎架構。
- 這是一個原生多模態模型。整個資料管道都經過重建,將預訓練資料規模擴展到 100T+,從一開始就採用多模態訓練,實現了文字語義空間和視覺語義空間之間的深度對齊。多模態是其原生核心功能,而非表面附加功能。
在 BrowseComp 測驗中,M3 得分 83.5,超過了 Opus 4.7 (79.3),展現出強大的自主瀏覽和資訊檢索能力。 - 此前,只有少數閉源模型能夠同時實現前沿編碼能力、百萬級上下文和多模態功能。 M3 是第一個將完整的前沿能力帶入開源世界的模型。
MSA 架構支援原生超長上下文預訓練。 M3 支援高達100萬個 token 的上下文窗口,並保證至少 51.2 萬個 token,從而在極長的上下文長度下實現卓越的推理延遲和吞吐量。 100 萬個 token 的上下文是遠端智能體任務、遠端編碼和長視訊理解的基礎架構。
MiniMax 為 M3 提供了四個僅經過預訓練的基礎模型,並要求它在 12 小時內自主完成整個流程——數據合成、訓練、評估和迭代——使模型能夠執行數學推理、程式碼生成和知識品質保證等任務。整個過程無需人工幹預。 M3 的得分為 37.1 分,總排名第三,僅次於 Opus 4.7 (42.4) 和 GPT-5.5 (39.3),顯著領先所有其他模型。
https://www.minimax.io/models/text/m3
Picture Source
MiniMax