褪去流量滤镜:阿里、腾讯共识下,AI进入制造业重资产生意时代

收录于 金融财经 持续更新中
本轮财报季中,阿里与腾讯对AI业务的表述,透露出行业极具标志性的共识转变。两家互联网头部企业不约而同跳出固有思维,摒弃沿用多年的流量分析框架,明确释放信号:AI业务无法再用传

本轮财报季中,阿里与腾讯对AI业务的表述,透露出行业极具标志性的共识转变。两家互联网头部企业不约而同跳出固有思维,摒弃沿用多年的流量分析框架,明确释放信号:AI业务无法再用传统互联网的流量逻辑定义、估值、算账
阿里吴泳铭在财报电话会上,将AI业务锚定在制造业产业语境中,提出AI训练工厂、AI推理工厂的核心布局思路。训练工厂负责打磨底层模型能力,推理工厂则将成型的模型能力,转化为可落地、可交付的智能化服务。这套业务体系绝非轻量化互联网产品,而是依托AI数据中心、高性能GPU、高速网络、专属电力系统与智能调度体系搭建而成的重型算力工厂。
腾讯刘炽平则从商业变现维度,印证了同一行业判断:互联网时代以DAU(日活跃用户数)为核心的增长逻辑,完全不适用于AI行业。不同于传统产品近乎零成本的用户增量,每一次AI交互、每一轮模型推理,都会产生实打实的算力损耗,成本伴随服务交付同步产生,不存在免费的流量分发模式。
综合两家企业的研判可以得出清晰结论:当下AI产品虽保留互联网入口、软件应用的外在形态,但底层商业逻辑已发生本质变革,制造业属性深度嵌入财务模型。行业评判标准不再局限于用户规模、使用时长等流量指标,产能利用率、单位生产成本、资产折旧、现金回款等制造业核心指标,成为衡量AI业务价值的关键标尺。
本文以1000P级别推理算力集群为测算样本,依托公开行业数据,拆解AI算力集群的成本构成、收入模型与单位经济模型(UE),通过量化数据剖析核心逻辑:为何国内互联网巨头集体摒弃流量思维,以制造业视角重构AI业务。


一、逻辑迭代:从轻资产流量生意,到重资产制造生意

1.1 传统互联网:边际成本趋近于零的流量经济

传统互联网属于典型的轻资产流量模式,产品研发上线后,新增用户带来的边际成本极低。行业变现路径清晰,依托广告投放、会员订阅、游戏充值、电商佣金、金融科技等模式实现盈利,核心商业公式简单直观:
互联网收入 = 用户数 × 使用时长 × 变现效率
互联网成本 = 内容成本 + 带宽存储成本 + 运营成本 + 研发费用
这种商业模式的核心优势在于可无限复制分发。一条资讯、一段视频完成生产后,可被无数用户重复浏览观看,平台无需二次生产成本。规模效应持续放大,用户体量越高,单用户分发成本越低,盈利空间随之拓宽。


1.2 AI行业:每一次交互都有成本的智能生产经济

AI彻底打破了传统互联网的低成本分发逻辑。人机对话、代码生成、文档解析、智能体执行等一切交互行为,本质都是一次智能化生产过程。每一次智能产出,都需要完成模型加载、数据运算、内容生成、缓存调度、安全审核、工具调用等一系列流程,算力消耗不可规避。对应的商业公式完全重构:
AI收入=Token调用量 × 单位Token价格 + 企业定制服务/智能体服务费
AI成本=固定资产折旧 + 电力能耗 + 人工运维 + 网络存储 + 推理平台运营成本
对比可见,AI行业逻辑完全贴合制造业特征:前期投入巨额资本搭建生产工厂、购置生产设备,形成固定产能;后期依靠业务订单提升产能利用率,摊薄固定资产成本。唯一区别在于,传统制造业产出实体工业品,而AI算力工厂生产Token数据流、智能化服务、智能体执行任务。
基于此,AI行业诞生核心经营准则:用户调用行为必须覆盖智能产出成本。低价值的免费闲聊场景中,DAU越高,算力无效损耗越严重,亏损规模持续扩大;代码研发、商务客服、行业投研、营销策划、合同风控等高价值场景,同等Token调用量才能转化为企业利润。流量规模不再是核心追求,调用质量才是盈利关键。


二、成本拆解:1000P算力集群,重资产模式下的刚性支出

为直观呈现AI行业成本结构,本文搭建标准化基准测算模型,以1000P FP16理论峰值算力的推理集群为测算对象,结合行业公开报价、白皮书数据,精准核算全链条投入成本。


2.1 一次性资本开支:硬件基建构筑高门槛壁垒

本次测算选用英伟达H100 SXM显卡,单卡FP16算力为1.979P,搭建1000P算力集群需配置512张显卡,按照行业通用8卡服务器标准,合计64台服务器。集群一次性资本开支主要分为四大板块:

(1)服务器与GPU:核心硬件最大成本项

受出口管制影响,H100显卡采购渠道、合规成本差异较大,市场报价透明度偏低。结合证券时报行业报道、AIDC算力白皮书双重数据校验,8卡H100服务器公允单价为240万元。核算可得:64台服务器硬件总成本达1.536亿元。

(2)高速网络设备:算力转化产能的核心枢纽

算力集群并非显卡简单堆砌,网络带宽直接决定算力利用效率。带宽不足会导致数据拥堵、显卡闲置,理论算力无法转化为实际产能。网络设备包含高速交换机、智能网卡、光模块、专用线缆等,参照行业千卡集群测算标准,单卡网络配套成本2.5万元,512张显卡合计网络成本1280万元。

(3)存储与安全设备:保障业务稳定运行

推理集群无需超高规格训练级存储,但需留存模型权重、交互日志、计费数据、审计资料以及企业知识库缓存。本次测算配置1PB可用存储容量,企业级分布式存储搭配安全防护设备,综合单价5000元/TB,总成本512万元,与行业白皮书测算标准高度吻合。

(4)平台软件与机房改造:适配高密度算力运行

软件层面包含算力调度、API网关、计费风控、监控审核、推理引擎等配套系统;硬件改造涵盖液冷散热、高密度机柜、电力配电、温控管路等基础设施。行业通用改造标准为单卡1万元,512张显卡合计投入512万元。
综上,该1000P推理集群一次性资本总开支约1.77亿元,重资产属性凸显,行业准入门槛极高。


2.2 年度运营成本:刚性支出持续产生,无闲置缓冲空间

硬件基建完成后,集群长期运营仍存在多项刚性成本,即便业务调用量不足,折旧、运维等费用依旧正常产生,进一步加重企业资金压力。

(1)资产折旧:固定资产核心摊销成本

服务器、网络、存储设备使用寿命按4年折算,平台软件与机房改造工程使用寿命按5年折算,综合核算得出,集群年度折旧费用约4390万元。


(2)电力能耗:算力运行基础消耗

单张H100显卡功耗700W,结合整机设备、液冷散热能耗,综合能耗系数为2.0;按照全年不间断运行、工业电价0.6元/度测算,基础电费377万元。叠加网络、存储设备能耗与PUE波动,基准年度电费核定为500万元。

(3)人工运维:专业技术团队固定开支

集群需配置运维、算法工程、平台研发、客户服务等专业人员,标配团队规模20人,行业人均年度综合成本60万元,年度人工开支1200万元。同时,硬件备件维修、平台升级、带宽服务、安全防护等杂项费用,按固定资产原值1.5%测算,年度支出600万元。
汇总各项开支,该算力集群年度刚性运营总成本为6690万元。成本结构清晰印证:AI不存在轻资产运营模式,唯有提升产能利用率,才能摊薄固定成本,实现盈利平衡。


三、收入测算:摒弃流量变现,以智能产出核定营收

基于上述成本模型,继续测算1000P推理集群年度营收能力,核心统计Token有效产出量,结合市场公允定价核算营收,直观判断商业化盈利水平。

3.1 产能核算:多重因素制约实际有效产出

公开行业测试数据显示,单张H100显卡运行Llama 3.1 8B模型,每秒Token吞吐峰值可达3621枚。考虑模型差异、上下文长度、任务调度、工程损耗等现实因素,本次测算保守取值3000枚/秒/卡。同时结合大厂行业水平,设定50%GPU利用率、80%智能调度效率。
经公式核算:512张显卡全年有效Token产出量约19.4万亿枚。该数据为理论可计费产能,最终营收取决于市场定价与客户结构。


3.2 定价与营收:中低端定价下的营收天花板

本次测算采用国内主流API公允中端定价,参考DeepSeek V4 Pro公开折扣价:输入Token单价3元/百万枚,输出Token单价6元/百万枚。结合行业通用7:3的输入输出占比,加权综合单价为3.9元/百万枚。
为保证测算结果严谨保守,本次基准营收仅统计标准化Token调用收入,暂不纳入企业私有化部署、专属定制、智能体席位等高附加值服务收入。最终核算得出,集群年度Token营收约7560万元
营收逻辑清晰直白:AI营收依托一次次智能交互产生,吞吐规模、利用率、定价直接决定营收上限。低价赛道中,企业只能依靠高吞吐摊薄成本;高价值场景下,差异化定价才能放大盈利空间。


四、UE模型研判:盈利边际薄弱,制造业属性彻底实锤

整合成本、营收数据,可得出该算力集群完整单位经济模型,直观展现当下AI行业的真实盈利现状。
项目经营利润=年度营收7560万元-年度总成本6690万元=870万元
项目经营利润率≈11.5%
 
需要特别说明,该利润为单一算力集群经营利润,未扣除总部管理、市场销售、综合研发、税务等额外费用,并非企业最终净利润。即便如此,该测算结果仍具备极强参考价值,精准诠释阿里、腾讯的行业共识。
从盈利数据来看,AI行业容错率极低。基准模型下利润率仅11.5%,一旦Token单价下调、GPU利用率下滑、调度效率降低,集群将快速陷入亏损。这正是制造业典型特征:重资产投入、变量敏感度高、盈利空间狭窄、规模依赖度极强。
也正因如此,阿里深耕算力工厂搭建产能底座,腾讯严控无效低价值调用。AI行业的核心逻辑从来不是盲目做高用户体量,而是精准做大高价值调用占比,让有限算力产生更高商业收益。


五、行业研判:看懂AI企业的六大核心估值变量

当AI彻底转型为产能驱动的制造型生意,传统互联网DAU、留存率等流量指标参考价值大幅弱化。研判AI企业长期价值,需聚焦六大核心变量,直击行业盈利本质。

5.1 单卡GPU产出效率

同等硬件条件下,模型规格、推理优化技术直接决定产出能力。7B小模型与70B大模型的Token吞吐差距可达数倍。模型蒸馏、量化压缩、MoE混合架构、推理引擎迭代,核心目的均为提升单卡产出,降低单位折旧成本,最大化挖掘固定资产价值。


5.2 GPU综合利用率

利用率是衡量算力资产运营能力的核心指标。显卡闲置期间,折旧成本照常产生;满载运行时,固定成本可分摊至更多Token。头部大厂实现“无空卡”运营,本质是通过业务协同、资源整合消除算力闲置,这也是重资产模式下最基础的盈利要求。


5.3 智能调度效率

利用率代表是否有业务订单,调度效率代表订单能否高效落地。显存碎片、任务排队、模型切换、多租户隔离等问题,都会造成算力隐性损耗。前缀缓存、KV缓存、大小模型智能路由、连续批处理等技术,是提升调度效率、减少资源浪费的关键手段。


5.4 Token市场化定价

定价是营收端最敏感的变量。通用基础模型极易陷入低价内卷,仅能覆盖基础生产成本;长上下文、强推理、代码生成、行业定制等高阶服务,具备更高定价权限。企业需摒弃单纯追求调用量的思维,聚焦提升高单价业务占比。


5.5 高价值场景与企业服务占比

纯Token调用业务壁垒极低,价格战持续压缩利润空间。企业私有化部署、专属智能体、行业知识库、定制化工作流等服务,可将计费模式从流量计费升级为席位计费、项目计费、结果计费,无需线性增加算力消耗,即可大幅提升单客户营收(ARPU),是企业利润的核心弹性来源。


5.6 资产折旧年限与技术迭代节奏

AI硬件迭代速度远高于传统服务器,新型芯片、模型架构、推理技术持续更新,极易造成存量设备价值缩水。企业不仅要考量硬件采购成本,更要测算投资回收周期,把控技术迭代带来的资产减值风险,优化长期资本开支规划。


六、行业终局:算力成为新时代核心生产资料

当下资本市场普遍将AI企业的算力投入简单定义为“烧钱”,这种认知过于片面。当前行业所处阶段,本质是新产业萌芽期的产能基建阶段:企业先行投入资本搭建算力工厂,打磨产线运营能力,后期依靠高价值业务订单提升利用率,持续摊薄单位生产成本。
短期来看,高额资产折旧会压制企业账面利润,资本开支会造成现金流承压;长期来看,优质算力并非单纯成本损耗,而是AI时代不可或缺的生产资料。
回望产业发展历程,工业时代,机械与电力放大人类体力;互联网时代,网络与平台放大人类注意力;AI时代,算力与模型正在放大人类的知识储备、判断能力与执行效率。
这场行业变革没有华丽的营销口号,所有变化都沉淀在企业财务报表之中:资本开支转化为算力产能,产能承接业务调用,调用产生营收,营收最终沉淀为企业利润。
AI最核心的价值,并非快速实现暴利盈利,而是完成智能化能力的标准化、可计量、可商业化落地。当智能成为一种可建设、可量产、可优化的工业产品,属于人工智能的产业时代,才真正拉开序幕。


资料来源与关键假设

NVIDIA H100 官方规格:H100 SXM FP16 Tensor Core 1,979 TFLOPS。

澎湃新闻、第一财经等对吴泳铭电话会表述的报道:AI 更像制造业、训练工厂和推理工厂。

新京报对腾讯刘炽平表述的报道:AI 服务每次交付均有成本,不能只看 DAU,高价值用例更重要。

《2025 年中国 AIDC 产业发展白皮书》:H100 千卡集群算力设备、网络、存储、安全、平台软件和液冷改造投入测算。

证券时报报道:8 卡 H100 整机价格约 230 万—240 万元。

中国信通院《智算基础设施发展研究报告》:10 万 GPU 集群功率超过 150MW,年耗电近 16 亿度。

DeepSeek 官方 API 价格页:DeepSeek V4 Pro 当前折扣价格输入 3 元 / 百万 token、输出 6 元 / 百万 token。

VALDI H100 Llama 3.1 8B benchmark:单 H100 平均吞吐约 3621 token/s;本文基准采用 3000 token/s / GPU。

 

本文所有利用率、调度效率、人员成本、维修平台成本、输入输出比例等均为模型假设,不代表行业均值。

推荐金融财经

苏公网安备 11011xxxxx号 苏ICP备2025192616号-1