Google for Developers

Gemma 3n 预览版发布:强大、高效、移动优先的AI

2025年5月20日

Lucas Gonzalez Product Manager Rakesh Shivanna Senior Staff Software Engineer

在激动人心的 Gemma 3Gemma 3 QAT 发布之后,我们正在进一步推进我们对可访问AI的愿景。Gemma 3 为开发者提供了强大的功能,我们现在正在将这一愿景扩展到能够在您每天使用的设备(手机、平板电脑和笔记本电脑)上直接运行的、功能强大的实时AI。

为了支持下一代设备端AI并支持各种应用,包括提升 Gemini Nano 的功能,我们设计了一种新的、前沿的架构。这一代的基础架构是与 Qualcomm Technologies、MediaTek 和 Samsung System LSI 等移动硬件领导者紧密合作创建的,并针对闪电般快速、多模态的AI进行了优化,从而可以直接在您的设备上实现真正个人化和私密的体验。

Gemma 3n 是我们基于这种突破性的共享架构构建的第一个开放模型,开发者可以立即通过早期预览版开始试验这项技术。同样先进的架构也为下一代 Gemini Nano 提供支持,从而将这些功能带到 Google 应用和我们的设备端生态系统的广泛功能中,并将在今年晚些时候推出。 Gemma 3n 使您可以开始在此基础上进行构建,该基础将应用于 Android 和 Chrome 等主要平台。

Chatbot Arena Elo scores 此图表按 Chatbot Arena Elo 分数对 AI 模型进行排名;较高的分数(顶部数字)表示用户偏好更高。 Gemma 3n 在流行的专有模型和开放模型中排名很高。

Gemma 3n 利用了 Google DeepMind 的一项名为 Per-Layer Embeddings (PLE) 的创新技术,该技术显着减少了 RAM 使用量。虽然原始参数计数为 5B 和 8B,但此创新技术使您可以在移动设备上运行更大的模型或从云端进行实时流式传输,而内存开销与 2B 和 4B 模型相当,这意味着这些模型可以在仅 2GB 和 3GB 的动态内存占用空间下运行。在我们的文档中了解更多信息。

通过探索 Gemma 3n,开发者可以提前预览开放模型的核心功能和移动优先的架构创新,这些创新将通过 Gemini Nano 在 Android 和 Chrome 上提供。

在这篇文章中,我们将探讨 Gemma 3n 的新功能、我们负责任的开发方法,以及您今天如何访问预览版。

Gemma 3n 的关键功能

Gemma 3n 专为在本地运行的快速、低占用空间的 AI 体验而设计,具有以下特点:

MMLU performance 此图表显示了 Gemma 3n 的 mix-n-match(预训练)功能的 MMLU 性能与模型大小的对比。

解锁新的移动体验

Gemma 3n 将通过以下方式赋能新一波智能的移动应用程序:

  1. 构建实时、交互式体验,了解并响应用户环境中的实时视觉和听觉提示。
  2. 利用组合的音频、图像、视频和文本输入来增强理解 和上下文文本生成——所有这些都在设备上私下处理。
  3. 开发高级的以音频为中心的应用程序,包括实时语音转录、翻译和丰富的语音驱动交互。

以下是您可以构建的体验类型的概述:

Link to Youtube Video (visible only when JS is disabled)

共同构建负责任的AI

我们对负责任的 AI 开发的承诺至关重要。与所有 Gemma 模型一样,Gemma 3n 经过了严格的安全评估、数据治理以及与我们的安全策略相符的微调对齐。我们以谨慎的风险评估方法对待开放模型,并在 AI 格局不断发展的同时不断改进我们的实践。

开始使用:立即预览 Gemma 3n

我们很高兴通过从今天开始的预览版将 Gemma 3n 交到您手中:

初步访问(立即提供):

Gemma 3n 标志着民主化访问尖端、高效 AI 的下一步。我们很高兴看到您将构建什么,因为我们正在逐步提供这项技术,从今天的预览开始。

从 5 月 22 日开始,在 io.google 上探索此公告和所有 Google I/O 2025 更新。