Gemma 系列開放式模型是我們致力於讓有用的 AI 技術普及的基礎。上個月,我們慶祝了 Gemma 的一歲生日,這個里程碑標誌著它的採用率達到了驚人的水平——下載量超過 1 億次——並且它還擁有一個充滿活力的社區,創建了超過 60,000 個 Gemma 變體。這個Gemmaverse繼續激勵著我們。
今天,我們推出了 Gemma 3,這是一系列輕量級、最先進的開放模型,採用與 Gemini 2.0 模型相同的研究和技術構建。這些是我們迄今為止最先進、最便攜、最負責任地開發的開放模型。它們旨在直接在手機、筆記型電腦和工作站等設備上快速運行,幫助開發人員在人們需要的任何地方創建人工智慧應用程式。 Gemma 3 有多種尺寸(1B、4B、12B 和 27B),可讓您根據特定硬體和效能需求選擇最佳型號。
開發人員可以使用 Gemma 3 的新功能
- 採用世界上最好的單加速器模型構建: Gemma 3 以其尺寸提供了最先進的性能,在 LMArena 排行榜上的初步人類偏好評估中超越了 Llama3-405B、DeepSeek-V3 和 o3-mini。這可以幫助您創建可適應單一 GPU 或 TPU 主機的引人入勝的使用者體驗。
- 使用 140 種語言走向全球:建立使用客戶語言的應用程式。 Gemma 3 為超過 35 種語言提供開箱即用的支持,並為超過 140 種語言提供預訓練支持。
- 打造具備高階文字與視覺推理能力的AI:輕鬆建構分析圖片、文字、短影片等應用,開啟互動智慧新可能1。
- 使用擴展的上下文窗口處理複雜任務: Gemma 3 提供 128k 令牌上下文窗口,讓您的應用程式處理和理解大量資訊。
- 使用函數呼叫建立 AI 驅動的工作流程: Gemma 3 支援函數呼叫和結構化輸出,以協助您自動執行任務並建立代理體驗。
- 透過量化模型更快實現高效能: Gemma 3 引入了官方量化版本,減少了模型大小和運算要求,同時保持了高精度。
嚴格的安全協議,負責任地建造 Gemma 3
我們相信開放模型需要仔細的風險評估,我們的方法是在創新與安全之間取得平衡——根據模型能力調整測試強度。 Gemma 3 的開發包括廣泛的資料治理、透過微調和強大的基準評估與我們的安全政策保持一致。雖然對功能更強大的模型進行全面測試通常可以為我們對功能較弱的模型的評估提供參考,但 Gemma 3 增強的 STEM 性能促使我們進行特定的評估,重點關注其在濫用製造有害物質方面的可能性;他們的結果顯示風險程度較低。
隨著業界開發出更強大的模型,共同開發與風險相稱的安全方法將至關重要。隨著時間的推移,我們將繼續學習和改進開放模型的安全實踐。
https://blog.google/technology/developers/gemma-3/
Picture Source:
Google