OpenAI 發布 GPT-5.5

OpenAI 團隊發布最新的 GPT-5.5 系列,這是一個專門為 Agent 設計的模型,包含 GPT-5.5 和 GPT-5.5 Pro。

OpenAI 團隊發布最新的 GPT-5.5 系列,這是一個專門為 Agent 設計的模型,包含 GPT-5.5 和 GPT-5.5 Pro,該版本能以更少的詞元和更少的重試次數獲得更高品質的輸出,在人工智慧分析的編碼指數 (AIA) 中,GPT-5.5 以競爭對手前沿編碼模型一半的成本,提供了最先進的智慧。

GPT-5.5 擅長編寫和調試程式碼、線上搜尋、分析資料、建立文件和電子表格、操作軟體,以及在不同工具間靈活切換直至完成任務。在安全方面,OpenAI 團隊利用全套安全和準備框架對該模型進行了評估,與內部和外部的紅隊成員合作,針對高級網路安全和生物學能力進行了專項測試,並從近 200 家值得信賴的早期訪問合作夥伴處收集了關於實際用例的反饋,除了保障安全措施,也減少濫用。

GPT 5.5 在 Terminal-Bench 2.0 規劃、迭代和工具協調的複雜命令列工作流程測試中,其準確率達到了最先進的 82.7%。在 SWE-Bench Pro 測試中,該模型評估了 GitHub 上真實問題的解決能力,準確率達到了 58.6%,並且在單次測試中能夠完成比以往模型更多的端到端任務。Expert-SWE 測試中,該模型是 OpenAI 內部針對長期編碼任務的前沿評估,其人類完成任務的平均預計時間為 20 小時,GPT-5.5 的表現也優於 GPT-5.4。在所有三項評估中,GPT-5.5 在使用較少標記的情況下,得分均高於 GPT-5.4。

ChatGPT 中的 GPT-5.5 思維模式能夠更快地幫助使用者解決更複雜的問題,提供更聰明、更簡潔的答案,從而更有效率地完成複雜的工作,GPT-5.5 Pro 的回覆更加全面、結構清晰、準確、相關且實用,尤其在商業、法律、教育和數據科學領域表現突出。

GPT-5.5 已向 Plus、Pro 計畫使用者開放,API 即將上線。

https://openai.com/index/introducing-gpt-5-5/

Picture Source
OpenAI