
梦晨 发自 凹非寺
量子位 | 公众号 QbitAI31B开源模型,甩开比他大几十倍的模型,挤进竞技场开源前三。
谷歌刚刚放出的Gemma 4有点猛了。

它赢过的是Qwen3.5-397B和DeepSeek v3.2-671B,参数量都比它大了10-20倍。
赢过它的是GLM-5(745B)和Kimi K2.5(1T),都是26年最新旗舰。
31B做到这个份上,够了。

这次Gemma 4整个系列一共四个尺寸,基于Gemini 3同款技术打造,全系列支持多模态:
E2B、E4B、26B MoE、31B Dense。
最小的2B版手机、树莓派上都能跑,而且跑出来的成绩,也不像是个小模型能干出来的事。
手机不联网,都能跑多模态龙虾处理语音、视频了。
31B打败20倍对手,26B 只激活3.8B参数四个模型,四个定位,但有一个共同点,效率优先。
最大的31B Dense模型,作为密集模型,适合拿去做微调。
26B MoE模型,推理时只激活3.8B,它排在全球开源第6,更追求速度,用最少的激活量换取最快的推理。
他它们的硬件门槛也不高。
未量化的bfloat16权重,单张80GB的H100就能跑起来。量化后的版本,普通消费级GPU也能本地运行。
根据谷歌官方博客,Gemma 4家族重点强化了六大核心能力:
高级推理:支持多步规划和深度逻辑,数学和指令遵循基准测试表现大幅提升
Agent工作流原生支持:内置函数调用、结构化JSON输出、系统指令原生支持,能直接搭自主代理
代码生成:支持高质量离线代码生成,直接把工作站变成本地AI代码助手
视觉和音频处理:全系列可原生处理视频和图像,支持可变分辨率,OCR、图表理解都不在话下;小版本还支持原生音频输入
长上下文支持:端侧版上下文窗口128K,大参数版最高256K,一次性就能读完整段代码仓库
140+语言支持:原生在140多种语言上训练,做全球化应用不用再单独做本地化
手机离线跑多模态,树莓派也能带得动再重点说两个专为端侧设计的小模型。
E2B和E4B里的“E”是Effective的意思,也是走的低激活率MoE路子。
E2B实际上有远多于2B的参数量,但推理时只激活其中2B的部分。
它们的任务很明确,在手机和IoT设备上,原生处理音频和视觉。
意味着手机可以完全不联网,直接用摄像头看东西、用麦克风听声音,然后给你回复。
零延迟,零云端依赖。
谷歌这次还拉上了自家的Pixel手机,以及高通、联发科一起做了全链路优化,从芯片到模型到设备,整条链路打通了。
回头看一眼Gemma系列进化路线就更清楚这次更新的价值。
Gemma 1在2024年2月发布,2B和7B两个尺寸,只能处理纯文本。
Gemma 2在同年6月跟上,2B、9B、27B,依然是纯文本。
Gemma 3到2025年3月才开始支持多模态,但端侧的1B版本能力有限。
现在E2B和E4B直接把多模态塞进了端侧小模型,能力边界完全不一样了。
除了多模态,这两个模型还支持完整的智能体工作流。函数调用、结构化JSON输出、系统指令。
手机可以变成一个完全本地的AI代码助手,耗电养虾,token自由。
Apache 2.0协议,社区的呼声被听见Gemma 4全面采用Apache 2.0协议。
可以概括成三个字:随便用。
过去,Google开源模型的许可证一直被诟病”不够纯粹”。Gemma一代和二代用的自定义许可协议,虽然也允许商用,但条款措辞让法务提心吊胆。
这次你可以拿它做商业产品,不需要给Google交一分钱。你可以把模型部署在任何环境,公有云、私有机房、边缘设备,都行。
在官方博客里,Google DeepMind团队写到过去两年,社区反复在GitHub issue、论坛、社交媒体上喊:
我们要 Apache 2.0。
Google这次听到了。
Hugging Face的CEO也第一时间表态,他认为这并非一个简单的许可证变更,而是开源AI社区的一个分水岭。
Gemma 4在Apache 2.0协议下发布,是一个巨大的里程碑。我们非常激动能在第一天就在Hugging Face上支持Gemma 4全系列模型。
截至目前,Gemma系列模型累计下载量超过 4 亿次。社区贡献的模型变体超过10万个。
One More Thing开源模型的价值,不只是让开发者少花钱。
耶鲁大学的研究团队已经用Gemma作为基座模型,开发了一个叫Cell2Sentence-Scale的项目。
他们把单细胞基因表达数据转化为语言模型的输入序列,让AI直接”阅读”细胞状态。
结果在癌症治疗靶点发现上,找到了几条此前被传统方法忽略的新路径。
没有Gemma,这个项目可能要花几百万美元买API调用。
但现在,一个几十B参数的小模型,就推动了真正的科学发现。
下一次你听到“AI 改变了什么”这样的故事,起点可能就是一个开源小模型。
参考链接:
[1]https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/?utm_medium=social&utm_content=[2]https://x.com/victormustar/status/2039739591276581118?s=20[3]https://x.com/billtheinvestor/status/2039805141876871376?s=20长宏网提示:文章来自网络,不代表本站观点。