近期谷歌悄然上线Gemini全新用量限额规则,颠覆性的计费与限额调整引发全球用户集体不满,在知乎、Reddit、Linux社区等各大平台掀起大规模吐槽热潮。不少付费Pro用户反馈,日常对话仅几轮就触发用量上限,被迫停止使用,此次版本更迭的争议声持续发酵。
在此次改版前,Gemini采用简单的按条计费、按日刷新机制,规则清晰透明、用户体验稳定。免费用户每日可使用5次,Pro付费用户每日拥有100次额度,无论用户是发起简单的日常提问,还是下达复杂的代码开发指令,均统一单次计数。彼时付费权益优势十分明显,花钱即可享受足额、稳定的使用权限,层级差异清晰直观。

自2026年5月20日起,谷歌彻底推翻原有规则,将Gemini全面切换为算力消耗制计费模式,这也是本次用户争议的核心导火索。新机制不再统一计数,而是根据对话场景动态扣除额度:系统会综合研判用户指令复杂度、对话篇幅、功能调用类型等多重因素核算算力消耗。简单的文字翻译、日常问答消耗额度极低,而代码编写、图片生成、视频创作等功能则会大幅占用算力、快速消耗额度。
最让用户诟病的是,谷歌并未公开任何明确的算力核算标准。官方仅模糊表示,限额触发条件由模型类型和功能负载决定,用户无法提前知晓单条指令的Token消耗、算力扣除数值,全程处于“盲用盲扣”的状态。这种不透明的计费规则,彻底打破了用户对产品的信任。
除计费规则革新外,Gemini同时上线了双重叠加限额机制,进一步收紧使用权限,且该限制覆盖全体用户,免费、付费Pro用户无一例外,大量用户在新规上线首日便直接触达用量上限。第一层为5小时滚动限额,额度耗尽后需等待5小时刷新恢复;第二层为每周总量限额,一旦单周算力消耗触顶,只能等待下周重置,双重限制彻底锁死了用户高频、深度使用的可能性。

根据网友实测总结,新机制下的可用额度大幅缩水。普通Pro用户的5小时滚动额度,仅能支撑3次低质量视频生成、2次低质量图片创作加5轮简单问答;若以常规文字问答为主,仅可完成20至30轮非复杂提问,若涉及图片、代码等场景,可用次数会进一步缩减至20轮以内。额度耗尽后,系统会自动将用户降级至低配的Flash-lite模型,付费权益大幅缩水。

付费用户心态彻底失衡的关键,在于会员权益的断崖式贬值。改版前,Gemini会员层级权益差距悬殊,Pro用户用量是免费版的33倍,Ultra用户更是达到免费版的166倍,付费即可享受极致的使用自由度。

而改版后,权益标准大幅缩水:8美元/月的Plus用户用量仅为免费用户的2倍,20美元/月的Pro用户也仅为免费用户的4倍。高额付费换来的权益微乎其微,不少用户直言付费沦为“鸡肋”,甚至不如注册多个免费账号轮换使用。

此次算力限额收紧并非只针对Gemini,谷歌旗下AI编程工具Antigravity也同步陷入用户吐槽浪潮,服务降级问题愈发突出。作为谷歌主打AI编程的核心产品,Antigravity支持IDE、CLI两种使用形态,其最大核心卖点,是允许Gemini Pro、Ultra订阅用户免费切换调用Claude Sonnet、Claude Opus、GPT-OSS等多款第三方顶级模型,无需额外付费、无需接入API,这也是众多用户高价订阅谷歌会员的核心原因。
但新规落地后,所有模型共享统一算力额度池,大幅拉低了使用体验。实测显示,Pro用户仅5轮对话就可消耗50%的5小时额度,连续高频使用10分钟便会触达限额。事实上,Antigravity的限额收紧早于Gemini,自2025年12月便已悄然启动,2026年3月更是将高级模型的5小时刷新周期,直接调整为周度刷新,权限持续收缩。

面对汹涌的用户负面舆情,谷歌紧急做出让步,短短两天内连续两轮将额度提升至原先3倍。但网友实测核算后发现,即便经过两次扩容,整体可用额度仍远低于改版前水平,用户不满情绪并未缓解,大规模退订诉求持续高涨。


值得注意的是,谷歌的策略调整并非个例,全球头部大模型厂商已集体开启“收紧模式”,AI行业的订阅模式正在彻底迭代。2026年4月,OpenAI将Codex从按条消息计费,改为Token计费+积分体系,同时拆分出100美金、200美金两档Pro套餐,超额使用需单独购买积分包。Anthropic的Claude也同步调整规则,将Agent SDK、GitHubActions等核心功能从订阅权益中剥离,单独设立月度积分限额体系。
至此,主流头部AI厂商已全面告别“月费买断、自由使用”的传统模式,统一转向“基础月费+按量计费”的混合定价体系,AI订阅正式对标云计算按需付费的逻辑,固定月租仅成为基础使用门槛,高频、深度功能均需消耗额外算力额度。目前超半数头部大模型企业,均已落地按量计费或混合定价规则。
这场全行业的规则变革,核心根源是全球高端AI算力供需失衡。即便手握自研TPU算力芯片、同时为Anthropic等竞品提供400亿美元级TPU算力供应的谷歌,也难逃算力短缺困境。据悉,谷歌内部DeepMind核心研究团队都需要排队申领算力资源,算力不足甚至导致多名核心科研人员出走。
归根结底,此次Gemini限额大改引发的舆论海啸,并非单纯是谷歌的单次产品调整,而是标志着AI行业低价普惠、无限使用的订阅蜜月期彻底终结,算力稀缺时代的商业化新格局已然成型。
[1]Google Antigravity Plans:https://antigravity.google/docs/plans
[2]OpenAI Help,using Codex with your ChatGPT plan:https://help.openai.com/en/articles/20001106
[3]Anthropic,Higher limits for Claude Code with SpaceX Colossus:https://www.anthropic.com/news/higher-limits-spacex
[4]Claude Support,use the Claude Agent SDK with your Claude plan:https://support.claude.com/en/articles/15036540-use-the-claude-agent-sdk-with-your-claude-plan
[6]linux.do,Ultra 3小时后5h额度剩20%:https://linux.do/t/topic/1760337
[7]linux.do,3x补丁被质疑“先缩水再补”:https://linux.do/t/topic/2219076/11
[8]linux.do,周限触发后刷新变4天:https://linux.do/t/topic/1538942/5
[9]linux.do,rate limits/quota/token池换算讨论:https://linux.do/t/topic/2219076
本文来自微信公众号:夕小瑶科技说,作者:夕小瑶编辑部
