Mistral AI 不斷推動開放模型(Mistral Small、Mistral Large、Pixtral 等)以及企業模型(Mistral OCR、Mistral Saba、Ministral 3B / 8B 等)的前沿。從Mistral 7B 開始,我們的模型就一直展現出明顯更重、更昂貴的模型的性能。今天,我們很高興地宣布 Mistral Medium 3,它將進一步提高語言模型的效率和可用性。
特色
1. Mistral Medium 3 引入了一個新的模型,可以平衡
- SOTA 性能
- 成本降低 8 倍
- 更簡單的部署以加速企業使用
2. 該模型在編碼和多模式理解等專業用例中處於領先地位
3. 該模型提供了一系列企業功能,包括:
- 混合或本地/VPC 內部署
- 客製化後期訓練
- 整合到企業工具和系統中
Mistral Medium 3 具有卓越的性能,但價格便宜得多。例如,該模型在基準測試中的表現達到或超過 Claude Sonnet 3.7 的 90%,而且成本明顯較低(每 M 個令牌輸入 0.4 美元/輸出 2 美元)。
在性能上,Mistral Medium 3 也超越了領先的開放模型,例如 Llama 4 Maverick 和企業模型,例如 Cohere Command A。在定價上,該模型在 API 和自部署系統中都擊敗了 DeepSeek v3 等成本領先者。
此外,Mistral Medium 3 還可以部署在任何雲端上,包括四個 GPU 及以上的自架環境。
Mistral Medium 3 的設計處於領先地位,特別是在專業用途領域。在下面的評估中,我們會使用其他供應商先前報告的數字(如果有),否則我們會使用我們自己的評估工具。所有基準的性能準確度都是透過相同的內部評估流程獲得的。 Mistral Medium 3 在程式設計和 STEM 任務中表現尤為突出,在這些任務中它的表現接近其體型龐大且速度慢得多的競爭對手。
https://mistral.ai/news/mistral-medium-3
Picture Source
Mistral.AI