Gemma 3n
在您的手机上直接运行强大的多模态AI
2025-06-27

Gemma 3n是谷歌推出的新型开放模型,专为设备端多模态AI优化。其创新的MatFormer架构支持强大而高效的模型(如2B/4B变体),可在手机和笔记本电脑上本地运行。支持图像、音频和视频。
Gemma 3n是谷歌最新的开源AI模型,专为手机和笔记本电脑上的设备端多模态任务优化。采用创新的MatFormer架构构建,它能在本地高效运行图像、音频和视频处理,提供2B和4B参数的变体以满足灵活性需求。该模型包含每层嵌入(PLE)以节省内存,以及KV缓存共享以加速如流媒体等长输入的快速处理。其先进的音频编码器支持多语言语音任务,而MobileNet-V5视觉编码器在边缘设备性能上表现卓越。Gemma 3n能与Hugging Face和Ollama等流行工具无缝集成,鼓励开发者创新。谷歌还发起了Gemma 3n影响力挑战赛,邀请创作者构建有影响力的应用程序,奖金总额达15万美元。此次发布标志着在易用、强大的设备端AI领域的一大飞跃。
Open Source
Artificial Intelligence
Development