伊隆馬斯克的 xAI 發布其最新旗艦型 Grok 3

2025-02-19 IT Dept

本篇文章可能經由機器翻譯或第三方服務翻譯而成，為避免翻譯品質落差造成語意上的誤解，建議參閱原文章內容。由 AI 判讀的觀點不代表原文章之語意表達或事實之陳述，僅做為參考與研究之用。

伊隆馬斯克的人工智慧公司 xAI 週一晚些時候發布了其最新旗艦人工智慧模型 Grok 3，並揭曉了 Grok iOS 和 Web 應用程式的新功能。

Grok是 xAI 對OpenAI的GPT-4o 和谷歌的 Gemini等模型的回應，它可以分析圖像和回答問題，並為馬斯克的社交網絡 X 上的許多功能提供支援。

週一的發布是一次雄心勃勃的舉措。

xAI 一直在使用位於孟菲斯的大型資料中心，該中心包含大約 200,000 個 GPU 來訓練Grok 3 。

馬斯克在周一的直播演示中表示：“Grok 3 的功能比 Grok 2 高出一個數量級。” “它是一種最大限度尋求真相的人工智能，即使真相有時與政治正確相悖。”

準確地說，Grok 3 是一個模型系列。 Grok 3 的較小版本 Grok 3 mini 可以更快地回應問題，但會犧牲一些準確性。 Grok 3 的模型和相關功能尚未全部推出（部分處於測試階段），但它們已於週一開始推出。

xAI 聲稱 Grok 3 在包括 AIME（評估模型在數學問題樣本上的表現）和 GPQA（使用博士級物理、生物和化學問題評估模型）在內的基準測試中擊敗了 GPT-4o。 xAI 表示， Grok 3 的早期版本在Chatbot Arena中也獲得了相當有競爭力的得分，這是一項眾包測試，讓不同的 AI 模型相互競爭，並讓用戶投票選出他們喜歡的答案。

新的 Grok 3 家族中的兩個模型 Grok 3 Reasoning 和 Grok 3 mini Reasoning 可以仔細「思考」問題，類似於 OpenAI 的o3-mini和中國 AI 公司 DeepSeek 的R1等「推理」模型。推理模型在給出結果之前會嘗試自我核實事實，這有助於它們避免通常會絆倒模型的一些陷阱。

xAI 聲稱，Grok 3 Reasoning 在幾個流行的基準測試中超越了 o3-mini 的最佳版本——o3-mini-high，其中包括一個名為 AIME 2025 的較新的數學基準測試。

https://techcrunch.com/2025/02/17/elon-musks-ai-company-xai-releases-its-latest-flagship-ai-grok-3/

Picture Source:
xAI

需要登入

本篇文章為會員專屬內容，需要登入後才能觀看完整內文。

請透過連結登入會員中心。立即登入

功能列表

需要登入

Need Assistance?

Live Chat With