OpenAI 提供兩種類型的模型:推理模型(例如 o1 和 o3-mini)和GPT 模型(如 GPT-4o)。這些模範家庭的行為各有不同。
推理模型與 GPT 模型
與 GPT 模型相比,我們的 o 系列模型擅長不同的任務並且需要不同的提示。一個模範家庭並不比另一個更好——他們只是不同而已。
我們訓練我們的 o 系列模型(「規劃者」)對複雜任務進行更長時間、更深入的思考,使其能夠有效地制定策略、規劃複雜問題的解決方案,並根據大量模糊資訊做出決策。這些模型還可以高精度地執行任務,使其成為數學、科學、工程、金融服務和法律服務等原本需要人類專家的領域的理想選擇。
另一方面,我們的低延遲、更具成本效益的 GPT 模型(「主力」)旨在實現直接執行。應用程式可能會使用 o 系列模型來規劃解決問題的策略,並使用 GPT 模型來執行特定任務,尤其是在速度和成本比完美的準確性更重要時。
如何選擇
對於您的用例來說什麼是最重要的?
- 速度和成本→GPT 模型速度更快,而且成本更低
- 執行明確定義的任務→GPT 模型可以很好地處理明確定義的任務
- 準確性與可靠性→ o 系列模型是可靠的決策者
- 解決複雜問題→ o 系列模型解決模糊性和複雜性
如果速度和成本是完成任務時最重要的因素,而您的用例由簡單、定義明確的任務組成,那麼我們的 GPT 模型最適合您。但是,如果準確性和可靠性是最重要的因素,並且您需要解決非常複雜、多步驟的問題,那麼我們的 o 系列模型可能適合您。
大多數 AI 工作流程都會結合使用這兩種模型——o 系列用於代理規劃和決策,GPT 系列用於任務執行。
何時使用我們的推理模型
以下是我們從客戶和 OpenAI 內部觀察到的一些成功使用模式。這並不是對所有可能用例的全面回顧,而是對測試我們的 o 系列模型的一些實用指導。
1. 處理模糊任務
推理模型特別擅長利用有限的資訊或不同的訊息,並透過簡單的提示,理解使用者的意圖並處理指令中的任何差距。事實上,推理模型在做出無根據的猜測或試圖填補資訊空白之前,通常會提出澄清問題。
2. 大海撈針
當你傳遞大量非結構化資訊時,推理模型擅長理解並提取最相關的資訊來回答問題。
3. 在大型資料集中尋找關係和細微差別
我們發現推理模型特別擅長推理包含數百頁密集、非結構化資訊的複雜文檔,例如法律合約、財務報表和保險索賠。這些模型特別擅長在文件之間進行類比,並根據數據中所代表的不言而喻的事實做出決策。
4. 多步驟代理規劃
推理模型對於代理規劃和策略發展至關重要。我們已經看到了成功,當推理模型被用作「規劃者」時,它會為問題提供詳細的多步驟解決方案,然後根據高智慧或低延遲是否最重要,為每個步驟選擇和分配正確的 GPT 模型(「執行者」)。
5.視覺推理
截至目前,o1 是唯一支援視覺功能的推理模型。它與 GPT-4o 的不同之處在於,o1 甚至可以掌握最具挑戰性的視覺效果,例如結構模糊的圖表和表格或影像品質不佳的照片。
6. 審查、調試和改進程式碼品質
推理模型在審查和改進大量程式碼方面特別有效,由於模型的延遲較高,因此通常在後台運行程式碼審查。
7. 其他模型響應的評估和基準測試
我們還發現推理模型在基準測試和評估其他模型響應方面表現良好。資料驗證對於確保資料集的品質和可靠性非常重要,尤其是在醫療保健等敏感領域。傳統的驗證方法使用預先定義的規則和模式,但像 o1 和 o3-mini 這樣的高階模型可以理解資料的上下文和推理,從而實現更靈活、更聰明的驗證方法。
https://platform.openai.com/docs/guides/reasoning-best-practices
Picture Source:
openai.com