Mistral AI 發布首個推理模型 Magistral

Magistral 是一種雙重發布模型,專注於現實世界的推理和回饋驅動的改進。

人類最優秀的思維並非線性的——它交織著邏輯、洞察力、不確定性和探索。推理語言模型使我們能夠增強並委託人工智慧進行複雜的思維和深度理解,從而提高我們解決需要精確、循序漸進的思考和分析的問題的能力。

但這個領域仍處於萌芽階段。缺乏特定領域問題所需的專業深度、有限的透明度以及所需語言的推理不一致——這些只是早期思維模型已知的局限性中的一些。

今天,我們很高興地宣布,我們的最新成果——Magistral——我們的第一個推理模型,將為人工智慧研究做出貢獻。Magistral 現已發布開放版和企業版,旨在以我們熟悉的方式進行全面思考,同時融合跨專業領域的專業知識、易於遵循和驗證的透明推理,以及深度的多語言靈活性。

https://www.youtube.com/watch?v=99xd7kHx80U

Magistral 是一種雙重發布模型,專注於現實世界的推理和回饋驅動的改進。

  • 我們發布了兩種版本的型號:Magistral Small(24B 參數開源版本)和 Magistral Medium(功能更強大的企業版本)。

  • Magistral Medium 在 AIME2024 的得分為 73.6%,其中多數投票為 64%,得分為 90%。 Magistral Small 的得分分別為 70.7% 和 83.3%。
  • 天生推理-Magistral 的思路鏈適用於全球語言和字母。
  • 適用於廣泛的企業用例—從結構化計算和程序邏輯到決策樹和基於規則的系統。
  • 透過 Le Chat 中的新思考模式和 Flash Answers,您可以獲得比大多數競爭對手快 10 倍的回應。
  • 該發布得到了我們最新論文的支持,該論文涵蓋了對 Magistral、我們的培訓基礎設施、強化學習演算法以及訓練推理模型的新觀察的全面評估。
  • 隨著 Magistral Small 開源,我們歡迎社群對其架構和推理流程進行研究、修改和構建,以進一步加速思維語言模型的誕生。我們早期的開放模型已被社群應用於 ether0 和 DeepHermes 3 等令人興奮的專案。

專為透明推理而設計

與通用模型不同,Magistral 針對多步驟邏輯進行了微調,提高了可解釋性,並以使用者的語言提供了可追溯的思考過程。

我們的目標是從此版本開始快速迭代模型。預計模型將持續改進。

多語言靈活性

該模型擅長在多種語言中保持高保真推理。 Magistral 尤其適合用於英語、法語、西班牙語、德語、義大利語、阿拉伯語、俄語和簡體中文等語言的推理。

https://mistral.ai/news/magistral

Picture Source:
mistral.ai