美国时间12月11日,OpenAI成立十周年的特殊节点,新一代AI模型GPT-5.2正式亮相。这场发布早已被蒙上“背水一战”的色彩——一个月前谷歌Gemini 3刚以“世界最佳”的姿态搅动市场,对手的产品攻势与挖角动作双管齐下,迫使CEO山姆·奥特曼在公司内部拉响最高级别的“红色警报”,暂缓广告业务、AI Agent等非核心项目,集中所有资源聚焦核心产品能力提升。
作为“红色警报”下的关键产物,GPT-5.2的登场不仅关乎OpenAI能否稳住市场地位,更标志着全球AI产业的竞争格局正式迈入“短兵相接”的混战阶段。两周内测周期中,来自行业不同领域的体验者,早已勾勒出这款新模型的核心轮廓。

上面是OpenAI在X上晒出来的一张基准测试图(官方新闻稿甚至都没这张图)
HyperWrite联合创始人兼CEO马特·舒默的评价极具代表性:“它的推理能力堪称顶尖,能花一小时啃下最难的专业难题并交出出色答卷,我已经完全离不开它。但短板也同样明显,响应速度偏慢且应用场景过于单一,目前仅能通过ChatGPT接入。”硅谷AI专家艾莉·米勒则将其定义为“专业研究员”,她指出,GPT-5.2在深度思考与复杂问题解决上展现出极致的“严肃感”与“专业性”,内容输出结构严谨,但这种特质使其对追求快速、简洁及拟人化交流的普通用户并不友好,“只有复杂工作、头脑风暴或专业分析时,我才会优先选择它”。
AI开发者Dp Singh的观察更贴近产业落地场景,他强调这是AI首次在制作演示文稿、处理电子表格、分析专业图表等日常专业任务中达到专家级产出水平,而非停留在单纯的技术演示层面。这种与人类研究员平齐的专业能力,也引发了学界的高度关注。宾夕法尼亚大学沃顿商学院人工智能专家伊桑·莫利克直言:“即便今天AI发展戛然而止,未来十年社会与经济仍将迎来巨变,因为人类会穷尽一切方式挖掘现有模型的潜力。更何况,AI的进化绝不会就此止步。”
OpenAI对GPT-5.2的定位清晰而直接:“迄今为止最适合现实世界专业用途的模型”。为佐证这一定位,其在社交平台X上发布了自主研发的GDPval基准测试数据,显示该模型在70.9%的明确任务上达到或超越顶尖人类专家水平,不仅较8月发布的GPT-5(38.8%)实现跨越式提升,也领先于Anthropic的Claude Opus 4.5(59.6%)和谷歌Gemini 3 Pro(53.5%)。
但行业对这份“成绩单”的态度普遍审慎。一方面,GDPval作为OpenAI自研的基准测试,本身就存在天然的倾向性;另一方面,基准测试的选择本身就有“操作空间”——OpenAI此次仅选取了8项表现优异的测试数据,而谷歌在Gemini 3发布时引用的基准测试多达20项。若将多方公开的测试数据整合为折线图可见,在多数核心基准测试中,GPT-5.2与Gemini 3、Claude Opus 4.5等顶尖模型的差距微乎其微。《纽约时报》援引行业专家观点指出:“OpenAI所谓的AI基础模型与其他公司产品之间的技术差距,实际上已不复存在。”

具体应用案例更能印证这种“势均力敌”的竞争态势。OpenAI官方展示的“海浪模拟器”网页,与相同提示词在Gemini中生成的页面各有千秋,前者逻辑严谨性更优,后者在交互流畅度上略胜一筹。这种胶着状态,也意味着OpenAI短期内难以在产品与模型层面彻底解除“红色警报”。对此,应用业务首席执行官菲吉·西莫解释道:“红色警报是一种资源聚焦与优先级确认的信号,并非生死存亡的宣告。”事实上,GPT-5.2早在数月前就已完成研发,选择在十周年节点发布,更多是出于战略层面的考量。
相较于内部的紧张氛围,奥特曼在外部则表现得谨慎乐观。他在接受CNBC采访时表示:“Gemini 3对我们业务指标的实际影响,可能低于预期。”并预计OpenAI将在2026年1月“以非常强势的地位”解除“红色警报”状态。但外界更关心的是,除了GPT-5.2这款未能拉开差距的产品,奥特曼手中是否还有更具突破性的“底牌”。内部消息显示,公司首席研究官Mark Chen已向部分同事透露代号为“Garlic”的新模型,其修复了GPT-4.5早期结构问题,预计明年初以GPT-5.5身份发布,或许这才是OpenAI真正的后手。
十周年的时间节点,本应是OpenAI回顾辉煌的时刻。官网发布的纪念视频中,黄仁勋赠予的首台DGX-1服务器上留存着各路大佬的签名,背景墙的格言依旧醒目:“关键的问题不在于我们‘知道什么’,而在于我们如何‘运用所知’……我相信,我们每个人的责任都是——在行动时,要把自己当成全世界的命运都维系在自己肩上一样。”十年间,OpenAI凭借ChatGPT、Sora等产品震撼全球,奥特曼的全球布道与硅谷巨头的算力捆绑,让其一度成为AI领域的绝对领跑者。但如今,从大幅领先到被对手追平甚至局部超越,这家公司正站在茫然的十字路口。
创立初期,OpenAI以“以最可能造福全人类的方式推进数字智能,不受财务回报需求限制”的非营利理念立足。但斯塔福德郡大学AI伦理学家凯瑟琳·弗利克尖锐指出,这一初心早已发生巨变。“如今的OpenAI背后,是利益错综复杂的营利性实体,它已完全卸下对社会效益的责任,转而信奉不惜一切代价增长的信条。”而这一切的根源,在于生成式AI革命前沿的巨大商业利益。红色警报声中,OpenAI将产品体验置于商业化之上,看似是为生死存亡考量,实则也关乎奥特曼的远大理想——十年后可能实现的超级智能,但这种愿景在公司内部并非绝对共识。
技术竞赛的背后,是OpenAI难以回避的商业化与盈利压力。奥特曼曾提出,目标在2025年底实现相当于每年200亿美元收入的月度营收,但他也坦言距离整体盈利“仍有很长一段路要走”。更庞大的压力来自基础设施投入,OpenAI承诺未来几年将投入高达1.4万亿美元用于计算基础设施建设,汇丰银行研报显示,即便在最乐观假设下,其到2030年仍可能面临2070亿美元的资金缺口,围绕其的债务总额已逼近1000亿美元大关。
用户增长放缓则让盈利前景雪上加霜。Sensor Tower数据显示,2025年11月ChatGPT全球月活用户达8.1亿,但8-11月增速仅为6%,远低于2024年同期40%以上的水平,全球市场份额四个月内也从38%降至35%。目前,ChatGPT是OpenAI的营收生命线,每周超8亿活跃用户中,约6%的用户每月支付20美元使用高级服务。为挖掘更多价值,OpenAI曾计划在ChatGPT中引入广告,但在“红色警报”下被迫暂停;同时探索的还有交易分成模式,即用户通过聊天机器人购物时从中抽成。西莫还证实,公司计划明年第一季度上线“成人模式”,在此之前会先引入用户年龄预测功能以保护青少年。

企业软件市场成为OpenAI的重点突破方向,其目标是同时覆盖消费者与企业两大客户群体。GPT-5.2在编码、法律、金融等专业领域的性能提升,正是为了吸引高价值企业客户——目前其企业订阅用户已达300万,且实现数月50%的惊人增长,连Moderna、T-Mobile等巨头都已成为其客户。但这片市场早已是巨头林立,谷歌的Google Workspace、微软的Microsoft 365凭借成熟的生态捆绑占据主导地位。更微妙的是,OpenAI与“金主爸爸”微软已陷入正面竞争:微软耗资数十亿美元打造的Copilot基于OpenAI模型构建,但许多企业员工更青睐迭代更快、灵活性更高的ChatGPT,甚至连微软自身员工都私下使用后者,Amgen等客户也从Copilot转向ChatGPT。
商业化的激进推进,也让OpenAI陷入一系列安全与伦理困境。GPT-5.2发布前夕,公司遭遇新的诉讼,被指控ChatGPT与心理困扰用户的互动间接导致康涅狄格州一起谋杀-自杀惨剧,此类诉讼并非首次。OpenAI回应称事件“令人心碎”,并承诺持续改进系统对心理困扰迹象的识别与应对能力。与此同时,《纽约时报》起诉OpenAI及其合作伙伴微软侵犯版权的案件仍在审理中,凸显AI训练数据合法性这一行业根本性难题。
当下OpenAI与谷歌的较量,早已超越单纯的技术参数比拼,演变为一场涵盖技术迭代、生态构建、商业模式、安全治理和资本耐力的全方位战争。技术层面,基准测试“榜首”争夺日趋白热化,OpenAI研究副总裁艾丹·克拉克承认在预训练环节持续改进,回应了“预训练潜力耗尽”的质疑;而谷歌则迅速推出基于Gemini 3 Pro的Deep Research深度研究智能体,其幻觉率降低40%,价格仅为GPT-5 Pro的十分之一,在多项权威评测中斩获佳绩。
生态层面的博弈同样激烈。OpenAI计划推出自有浏览器挑战谷歌Chrome,还密谋在ChatGPT中植入文档协作、即时通讯功能,试图打造从底层模型到上层应用的完整生态闭环,甚至剑指微软Office的核心市场;谷歌则凭借庞大的产品矩阵整合协同优势,将Deep Research智能体能力逐步接入Google Search、NotebookLM等核心产品。AI模型评估平台LMArena公司Wei-Lin Chiang指出:“通用模型用户增长已触及瓶颈,下一个增长极必然来自垂直领域,竞争核心已从用户扩张转向行业解决方案的落地能力。”
战略文化层面的转变更为深刻。OpenAI从非营利研究机构向高估值商业实体的快速转型,以及对盈利的迫切追求,正在重塑内部文化。早期员工引以为傲的、与谷歌广告驱动模式的区别,在现实压力下逐渐模糊。Vals AI首席执行官拉扬·克里希南的论断精准概括了当前格局:“这是一场将在多条战线上展开的竞赛。”
总体来看,GPT-5.2的发布是OpenAI在专业领域的一次有力技术宣示,但绝非终局。它未能与对手拉开实质性差距,甚至公司自身都预计要到2026年1月才能解除“红色警报”。更重要的是,即便这场短期危机得以缓解,整个AI行业的最高强度竞争警报,已然长鸣不止。从技术突破到生态构建,从商业化落地到伦理治理,OpenAI与谷歌等巨头的博弈还将持续,而这场战争的走向,将深刻定义未来十年全球数字智能的发展轨迹。
本文来自微信公众号: 腾讯科技 ,编辑:徐青阳,作者:值得关注的
