OpenAI 發布 GPT-5.2 模型

OpenAI 正式推出 GPT 5.2 系列模型,包含 Instant、Thinking 和 Pro 版本。

OpenAI 正式推出 GPT 5.2 系列模型,包含 Instant、Thinking 和 Pro 版本,專注創建電子表格、製作簡報、編寫程式碼、識別圖像、理解長篇上下文、使用工具以及處理複雜的多步驟專案方面都表現更出色。GPT 5.2 首先開放給付費用戶。

  • GPT-5.2 Instant:適用於日常工作和學習,在資訊檢索問題、操作指南和教程、技術寫作和翻譯方面均有顯著改進。
  • GPT-5.2 Thinking:處理更複雜的任務,如開發程式、總結長文件、回答有關上傳文件的問題、逐步進行數學和邏輯運算。
  • GPT-5.2 Pro:企業級性能,可應付長時間、複雜的任務。

GPT-5.2 Thinking 是迄今為止最適合實際專業應用的模型。在 GDPval 評估中取得了新的最高分,並且為首個性能達到或超越人類專家程度的模型,GPT-5.2 Thinking 在 GDPval 知識工作任務的比較中,有 70.9% 的比較結果優於或與行業頂尖專家持平。

GPT-5.2 的思考方式在前端軟體工程方面也優於 GPT-5.1。早期測試人員發現,它在前端開發和複雜或非常規的 UI 工作(尤其是涉及 3D 元素的工作)方面表現顯著更強,使其成為全端工程師的得力助手。

在用於衡量通用推理能力的基準測試 ARC-AGI-1(已驗證)上,GPT-5.2 Pro 是第一個突破 90% 閾值的模型,比之前的87%有了顯著提升。(在新視窗中開啟)去年透過 o3-preview 實現了這一性能,同時將實現該性能的成本降低了約 390 倍。

在難度更高、更能體現流暢推理能力的 ARC-AGI-2(已驗證)測試中,GPT-5.2 Thinking 模型在思維鏈模型方面取得了 52.9% 的優異成績,達到了新的最高水平。 GPT-5.2 Pro 模型表現較佳,得分高達 54.2%,進一步提升了模型處理新穎抽象問題的能力。

https://openai.com/index/introducing-gpt-5-2/

Picture Source
worthview.com