褪去流量滤镜：阿里、腾讯共识下，AI进入制造业重资产生意时代

本轮财报季中，阿里与腾讯对AI业务的表述，透露出行业极具标志性的共识转变。两家互联网头部企业不约而同跳出固有思维，摒弃沿用多年的流量分析框架，明确释放信号：AI业务无法再用传统互联网的流量逻辑定义、估值、算账。
阿里吴泳铭在财报电话会上，将AI业务锚定在制造业产业语境中，提出AI训练工厂、AI推理工厂的核心布局思路。训练工厂负责打磨底层模型能力，推理工厂则将成型的模型能力，转化为可落地、可交付的智能化服务。这套业务体系绝非轻量化互联网产品，而是依托AI数据中心、高性能GPU、高速网络、专属电力系统与智能调度体系搭建而成的重型算力工厂。
腾讯刘炽平则从商业变现维度，印证了同一行业判断：互联网时代以DAU（日活跃用户数）为核心的增长逻辑，完全不适用于AI行业。不同于传统产品近乎零成本的用户增量，每一次AI交互、每一轮模型推理，都会产生实打实的算力损耗，成本伴随服务交付同步产生，不存在免费的流量分发模式。
综合两家企业的研判可以得出清晰结论：当下AI产品虽保留互联网入口、软件应用的外在形态，但底层商业逻辑已发生本质变革，制造业属性深度嵌入财务模型。行业评判标准不再局限于用户规模、使用时长等流量指标，产能利用率、单位生产成本、资产折旧、现金回款等制造业核心指标，成为衡量AI业务价值的关键标尺。
本文以1000P级别推理算力集群为测算样本，依托公开行业数据，拆解AI算力集群的成本构成、收入模型与单位经济模型（UE），通过量化数据剖析核心逻辑：为何国内互联网巨头集体摒弃流量思维，以制造业视角重构AI业务。

一、逻辑迭代：从轻资产流量生意，到重资产制造生意

1.1 传统互联网：边际成本趋近于零的流量经济

传统互联网属于典型的轻资产流量模式，产品研发上线后，新增用户带来的边际成本极低。行业变现路径清晰，依托广告投放、会员订阅、游戏充值、电商佣金、金融科技等模式实现盈利，核心商业公式简单直观：
互联网收入 = 用户数 × 使用时长 × 变现效率
互联网成本 = 内容成本 + 带宽存储成本 + 运营成本 + 研发费用
这种商业模式的核心优势在于可无限复制分发。一条资讯、一段视频完成生产后，可被无数用户重复浏览观看，平台无需二次生产成本。规模效应持续放大，用户体量越高，单用户分发成本越低，盈利空间随之拓宽。

1.2 AI行业：每一次交互都有成本的智能生产经济

AI彻底打破了传统互联网的低成本分发逻辑。人机对话、代码生成、文档解析、智能体执行等一切交互行为，本质都是一次智能化生产过程。每一次智能产出，都需要完成模型加载、数据运算、内容生成、缓存调度、安全审核、工具调用等一系列流程，算力消耗不可规避。对应的商业公式完全重构：
AI收入=Token调用量 × 单位Token价格 + 企业定制服务/智能体服务费
AI成本=固定资产折旧 + 电力能耗 + 人工运维 + 网络存储 + 推理平台运营成本
对比可见，AI行业逻辑完全贴合制造业特征：前期投入巨额资本搭建生产工厂、购置生产设备，形成固定产能；后期依靠业务订单提升产能利用率，摊薄固定资产成本。唯一区别在于，传统制造业产出实体工业品，而AI算力工厂生产Token数据流、智能化服务、智能体执行任务。

基于此，AI行业诞生核心经营准则：用户调用行为必须覆盖智能产出成本。低价值的免费闲聊场景中，DAU越高，算力无效损耗越严重，亏损规模持续扩大；代码研发、商务客服、行业投研、营销策划、合同风控等高价值场景，同等Token调用量才能转化为企业利润。流量规模不再是核心追求，调用质量才是盈利关键。

二、成本拆解：1000P算力集群，重资产模式下的刚性支出

为直观呈现AI行业成本结构，本文搭建标准化基准测算模型，以1000P FP16理论峰值算力的推理集群为测算对象，结合行业公开报价、白皮书数据，精准核算全链条投入成本。

2.1 一次性资本开支：硬件基建构筑高门槛壁垒

本次测算选用英伟达H100 SXM显卡，单卡FP16算力为1.979P，搭建1000P算力集群需配置512张显卡，按照行业通用8卡服务器标准，合计64台服务器。集群一次性资本开支主要分为四大板块：

（1）服务器与GPU：核心硬件最大成本项

受出口管制影响，H100显卡采购渠道、合规成本差异较大，市场报价透明度偏低。结合证券时报行业报道、AIDC算力白皮书双重数据校验，8卡H100服务器公允单价为240万元。核算可得：64台服务器硬件总成本达1.536亿元。

（2）高速网络设备：算力转化产能的核心枢纽

算力集群并非显卡简单堆砌，网络带宽直接决定算力利用效率。带宽不足会导致数据拥堵、显卡闲置，理论算力无法转化为实际产能。网络设备包含高速交换机、智能网卡、光模块、专用线缆等，参照行业千卡集群测算标准，单卡网络配套成本2.5万元，512张显卡合计网络成本1280万元。

（3）存储与安全设备：保障业务稳定运行

推理集群无需超高规格训练级存储，但需留存模型权重、交互日志、计费数据、审计资料以及企业知识库缓存。本次测算配置1PB可用存储容量，企业级分布式存储搭配安全防护设备，综合单价5000元/TB，总成本512万元，与行业白皮书测算标准高度吻合。

（4）平台软件与机房改造：适配高密度算力运行

软件层面包含算力调度、API网关、计费风控、监控审核、推理引擎等配套系统；硬件改造涵盖液冷散热、高密度机柜、电力配电、温控管路等基础设施。行业通用改造标准为单卡1万元，512张显卡合计投入512万元。
综上，该1000P推理集群一次性资本总开支约1.77亿元，重资产属性凸显，行业准入门槛极高。

2.2 年度运营成本：刚性支出持续产生，无闲置缓冲空间

硬件基建完成后，集群长期运营仍存在多项刚性成本，即便业务调用量不足，折旧、运维等费用依旧正常产生，进一步加重企业资金压力。

（1）资产折旧：固定资产核心摊销成本

服务器、网络、存储设备使用寿命按4年折算，平台软件与机房改造工程使用寿命按5年折算，综合核算得出，集群年度折旧费用约4390万元。

（2）电力能耗：算力运行基础消耗

单张H100显卡功耗700W，结合整机设备、液冷散热能耗，综合能耗系数为2.0；按照全年不间断运行、工业电价0.6元/度测算，基础电费377万元。叠加网络、存储设备能耗与PUE波动，基准年度电费核定为500万元。

（3）人工运维：专业技术团队固定开支

集群需配置运维、算法工程、平台研发、客户服务等专业人员，标配团队规模20人，行业人均年度综合成本60万元，年度人工开支1200万元。同时，硬件备件维修、平台升级、带宽服务、安全防护等杂项费用，按固定资产原值1.5%测算，年度支出600万元。
汇总各项开支，该算力集群年度刚性运营总成本为6690万元。成本结构清晰印证：AI不存在轻资产运营模式，唯有提升产能利用率，才能摊薄固定成本，实现盈利平衡。

三、收入测算：摒弃流量变现，以智能产出核定营收

基于上述成本模型，继续测算1000P推理集群年度营收能力，核心统计Token有效产出量，结合市场公允定价核算营收，直观判断商业化盈利水平。

3.1 产能核算：多重因素制约实际有效产出

公开行业测试数据显示，单张H100显卡运行Llama 3.1 8B模型，每秒Token吞吐峰值可达3621枚。考虑模型差异、上下文长度、任务调度、工程损耗等现实因素，本次测算保守取值3000枚/秒/卡。同时结合大厂行业水平，设定50%GPU利用率、80%智能调度效率。
经公式核算：512张显卡全年有效Token产出量约19.4万亿枚。该数据为理论可计费产能，最终营收取决于市场定价与客户结构。

3.2 定价与营收：中低端定价下的营收天花板

本次测算采用国内主流API公允中端定价，参考DeepSeek V4 Pro公开折扣价：输入Token单价3元/百万枚，输出Token单价6元/百万枚。结合行业通用7:3的输入输出占比，加权综合单价为3.9元/百万枚。
为保证测算结果严谨保守，本次基准营收仅统计标准化Token调用收入，暂不纳入企业私有化部署、专属定制、智能体席位等高附加值服务收入。最终核算得出，集群年度Token营收约7560万元。
营收逻辑清晰直白：AI营收依托一次次智能交互产生，吞吐规模、利用率、定价直接决定营收上限。低价赛道中，企业只能依靠高吞吐摊薄成本；高价值场景下，差异化定价才能放大盈利空间。

四、UE模型研判：盈利边际薄弱，制造业属性彻底实锤

整合成本、营收数据，可得出该算力集群完整单位经济模型，直观展现当下AI行业的真实盈利现状。
项目经营利润=年度营收7560万元-年度总成本6690万元=870万元
项目经营利润率≈11.5%

需要特别说明，该利润为单一算力集群经营利润，未扣除总部管理、市场销售、综合研发、税务等额外费用，并非企业最终净利润。即便如此，该测算结果仍具备极强参考价值，精准诠释阿里、腾讯的行业共识。

从盈利数据来看，AI行业容错率极低。基准模型下利润率仅11.5%，一旦Token单价下调、GPU利用率下滑、调度效率降低，集群将快速陷入亏损。这正是制造业典型特征：重资产投入、变量敏感度高、盈利空间狭窄、规模依赖度极强。
也正因如此，阿里深耕算力工厂搭建产能底座，腾讯严控无效低价值调用。AI行业的核心逻辑从来不是盲目做高用户体量，而是精准做大高价值调用占比，让有限算力产生更高商业收益。

五、行业研判：看懂AI企业的六大核心估值变量

当AI彻底转型为产能驱动的制造型生意，传统互联网DAU、留存率等流量指标参考价值大幅弱化。研判AI企业长期价值，需聚焦六大核心变量，直击行业盈利本质。

5.1 单卡GPU产出效率

同等硬件条件下，模型规格、推理优化技术直接决定产出能力。7B小模型与70B大模型的Token吞吐差距可达数倍。模型蒸馏、量化压缩、MoE混合架构、推理引擎迭代，核心目的均为提升单卡产出，降低单位折旧成本，最大化挖掘固定资产价值。

5.2 GPU综合利用率

利用率是衡量算力资产运营能力的核心指标。显卡闲置期间，折旧成本照常产生；满载运行时，固定成本可分摊至更多Token。头部大厂实现“无空卡”运营，本质是通过业务协同、资源整合消除算力闲置，这也是重资产模式下最基础的盈利要求。

5.3 智能调度效率

利用率代表是否有业务订单，调度效率代表订单能否高效落地。显存碎片、任务排队、模型切换、多租户隔离等问题，都会造成算力隐性损耗。前缀缓存、KV缓存、大小模型智能路由、连续批处理等技术，是提升调度效率、减少资源浪费的关键手段。

5.4 Token市场化定价

定价是营收端最敏感的变量。通用基础模型极易陷入低价内卷，仅能覆盖基础生产成本；长上下文、强推理、代码生成、行业定制等高阶服务，具备更高定价权限。企业需摒弃单纯追求调用量的思维，聚焦提升高单价业务占比。

5.5 高价值场景与企业服务占比

纯Token调用业务壁垒极低，价格战持续压缩利润空间。企业私有化部署、专属智能体、行业知识库、定制化工作流等服务，可将计费模式从流量计费升级为席位计费、项目计费、结果计费，无需线性增加算力消耗，即可大幅提升单客户营收（ARPU），是企业利润的核心弹性来源。

5.6 资产折旧年限与技术迭代节奏

AI硬件迭代速度远高于传统服务器，新型芯片、模型架构、推理技术持续更新，极易造成存量设备价值缩水。企业不仅要考量硬件采购成本，更要测算投资回收周期，把控技术迭代带来的资产减值风险，优化长期资本开支规划。

六、行业终局：算力成为新时代核心生产资料

当下资本市场普遍将AI企业的算力投入简单定义为“烧钱”，这种认知过于片面。当前行业所处阶段，本质是新产业萌芽期的产能基建阶段：企业先行投入资本搭建算力工厂，打磨产线运营能力，后期依靠高价值业务订单提升利用率，持续摊薄单位生产成本。
短期来看，高额资产折旧会压制企业账面利润，资本开支会造成现金流承压；长期来看，优质算力并非单纯成本损耗，而是AI时代不可或缺的生产资料。
回望产业发展历程，工业时代，机械与电力放大人类体力；互联网时代，网络与平台放大人类注意力；AI时代，算力与模型正在放大人类的知识储备、判断能力与执行效率。
这场行业变革没有华丽的营销口号，所有变化都沉淀在企业财务报表之中：资本开支转化为算力产能，产能承接业务调用，调用产生营收，营收最终沉淀为企业利润。
AI最核心的价值，并非快速实现暴利盈利，而是完成智能化能力的标准化、可计量、可商业化落地。当智能成为一种可建设、可量产、可优化的工业产品，属于人工智能的产业时代，才真正拉开序幕。

资料来源与关键假设

NVIDIA H100 官方规格：H100 SXM FP16 Tensor Core 1,979 TFLOPS。

澎湃新闻、第一财经等对吴泳铭电话会表述的报道：AI 更像制造业、训练工厂和推理工厂。

新京报对腾讯刘炽平表述的报道：AI 服务每次交付均有成本，不能只看 DAU，高价值用例更重要。

《2025 年中国 AIDC 产业发展白皮书》：H100 千卡集群算力设备、网络、存储、安全、平台软件和液冷改造投入测算。

证券时报报道：8 卡 H100 整机价格约 230 万—240 万元。

中国信通院《智算基础设施发展研究报告》：10 万 GPU 集群功率超过 150MW，年耗电近 16 亿度。

DeepSeek 官方 API 价格页：DeepSeek V4 Pro 当前折扣价格输入 3 元 / 百万 token、输出 6 元 / 百万 token。

VALDI H100 Llama 3.1 8B benchmark：单 H100 平均吞吐约 3621 token/s；本文基准采用 3000 token/s / GPU。

本文所有利用率、调度效率、人员成本、维修平台成本、输入输出比例等均为模型假设，不代表行业均值。