伊隆馬斯克的 xAI 發布其最新旗艦型 Grok 3

伊隆馬斯克的人工智慧公司 xAI 週一晚些時候發布了其最新旗艦人工智慧模型 Grok 3,並揭曉了 Grok iOS 和 Web 應用程式的新功能。

伊隆馬斯克的人工智慧公司 xAI 週一晚些時候發布了其最新旗艦人工智慧模型 Grok 3,並揭曉了 Grok iOS 和 Web 應用程式的新功能。

Grok是 xAI 對OpenAI的GPT-4o 和谷歌的 Gemini等模型的回應 ,它可以分析圖像和回答問題,並為馬斯克的社交網絡 X 上的許多功能提供支援 。

週一的發布是一次雄心勃勃的舉措。

xAI 一直在使用位於孟菲斯的大型資料中心,該中心包含大約 200,000 個 GPU 來 訓練Grok 3 。

馬斯克在周一的直播演示中表示:“Grok 3 的功能比 Grok 2 高出一個數量級。” “它是一種最大限度尋求真相的人工智能,即使真相有時與政治正確相悖。”

準確地說,Grok 3 是一個模型系列。 Grok 3 的較小版本 Grok 3 mini 可以更快地回應問題,但會犧牲一些準確性。 Grok 3 的模型和相關功能尚未全部推出(部分處於測試階段),但它們已於週一開始推出。

xAI 聲稱 Grok 3 在包括 AIME(評估模型在數學問題樣本上的表現)和 GPQA(使用博士級物理、生物和化學問題評估模型)在內的基準測試中擊敗了 GPT-4o。 xAI 表示, Grok 3 的早期版本在Chatbot Arena中也獲得了相當有競爭力的得分,這是一項眾包測試,讓不同的 AI 模型相互競爭,並讓用戶投票選出他們喜歡的答案。

新的 Grok 3 家族中的兩個模型 Grok 3 Reasoning 和 Grok 3 mini Reasoning 可以仔細「思考」問題,類似於 OpenAI 的o3-mini和中國 AI 公司 DeepSeek 的R1等「推理」模型。推理模型在給出結果之前會嘗試自我核實事實,這有助於它們 避免 通常會絆倒模型的一些陷阱。

xAI 聲稱,Grok 3 Reasoning 在幾個流行的基準測試中超越了 o3-mini 的最佳版本——o3-mini-high,其中包括一個名為 AIME 2025 的較新的數學基準測試。

https://techcrunch.com/2025/02/17/elon-musks-ai-company-xai-releases-its-latest-flagship-ai-grok-3/

Picture Source:
xAI