AI 视频生成 “两极” 走向:小厂以产品为核,大厂以生态为纲

收录于 AGI 持续更新中
当北京爱诗科技 6000 万美元 B 轮融资的消息打破国内视频生成领域融资纪录,当生数科技获百度、启明创投等加持完成数亿元 A 轮融资,当快手可灵带着 “一张图 + 文字 / 音
当北京爱诗科技 6000 万美元 B 轮融资的消息打破国内视频生成领域融资纪录,当生数科技获百度、启明创投等加持完成数亿元 A 轮融资,当快手可灵带着 “一张图 + 文字 / 音频生成 1080p/48FPS 数字人视频” 的新功能登场,AI 视频生成赛道的 “军备竞赛” 已进入白热化阶段。从资本输血到技术破壁,行业看似已为爆发蓄力,但 “谁能领跑” 的答案,仍藏在大小玩家的战略分野与行业变革的迷雾之中。


赛道格局初显:国产玩家霸榜背后的 “大小厂差异”

自 2023 年 2 月 OpenAI 发布 Sora 模型点燃行业热情,AI 视频生成赛道历经近两年爆发,全球头部阵营逐渐清晰。据国际测评机构 Artificial Analysis 与国内顶尖高校联合发布的 AGI-Eval 榜单显示,当前全球排名前 10 的视频生成模型中,除谷歌外,其余均被国产玩家包揽 —— 这一 “国产霸榜” 现象,既凸显了国内技术实力,也暴露了赛道的核心玩家阵营:以快手可灵、字节、阿里为代表的互联网大厂,以及以爱诗科技(PixVerse V5)、MiniMax(Hailuo 02 Pro)为代表的初创企业。
但榜单数据背后,却藏着一个反直觉的趋势:2024 年 6 月至 8 月的模型更新中,无论是文生视频还是图生视频,爱诗科技这类 “小厂” 的排名反超字节等大厂。这种技术表现的错位,本质是大小玩家对赛道的战略 “分野”—— 小厂押注 “产品尖刀”,大厂布局 “生态壁垒”,两条路径的选择,早已注定了不同的生存逻辑。


小厂:聚焦 C 端工具,却陷 “工具困境”

对爱诗科技等初创企业而言,“资源有限” 是无法回避的现实,这也让它们天然倾向 “产品主义”:将所有精力集中在模型性能打磨上,从提升视频生成速度、优化画面质量,到强化指令遵从度,每一步都瞄准 “让普通人零技术也能做视频” 的目标。正如爱诗科技创始人王长虎所言,其产品定位是 “视频生成界的 Canva”—— 区别于专业工具 Photoshop、Figma,走轻量化、大众化路线。
但 “工具型产品” 的天花板,从互联网时代就已显现:墨迹天气曾靠天气查询积累海量用户,却因功能被手机厂商整合逐渐边缘化;WiFi 万能钥匙、豌豆荚等工具 APP,也因商业模式单一、用户粘性低,难以突破增长瓶颈。AI 视频生成工具虽有 “内容社区” 的转型可能,但当前技术距离 “一句话生成一部大片” 仍有差距,且社区化尝试已暴露明显短板:
  • 同质化与审美疲劳:当平台内容全由 AI 生成,画风、叙事逻辑趋同,用户 “刷十几个视频就会腻”,内容吸引力快速衰减;
  • “人味” 缺失的社区氛围:创作者难以从纯粹的技术流社区中获得物质回报或精神认可,最终选择将 AI 视频搬运到抖音、快手、B 站等成熟平台 ——AI 内容制作平台与内容分发平台,被用户自发 “割裂”,工具的流量价值难以沉淀。


大厂:生态优先,在协同与探索中变现

与小厂的 “单点突破” 不同,谷歌、字节、快手等大厂的布局,始终围绕 “生态” 展开。它们不满足于做一个孤立的视频生成工具,而是试图将技术嵌入既有业务闭环,同时探索新的商业化场景,形成 “技术 - 业务 - 收入” 的正向循环。

向内:绑定原有业务,激活协同效应

大厂的核心优势,在于能将 AI 视频生成技术与存量业务深度融合,降低试错成本的同时快速落地。谷歌的最新视频生成模型 Veo 3.0,并未独立推出,而是被整合进 AI 电影制作工具 Flow 中 ——Flow 同时汇集了文生图模型 Imagen 与通用大模型 Gemini,用户可从文本故事出发,完成镜头控制、视频生成的全流程创作,实现 “AI 无缝创作闭环”;字节则围绕 “豆包大模型 - 即梦 - 剪映 - Seedream 4.0 - 抖音” 构建生态,从内容生产到分发、消费、商业化,每一环都有 AI 技术渗透,形成 “生产工具 - 流量平台 - 变现渠道” 的完整链路。

向外:探索独立场景,解锁商业想象力

在绑定原有业务的同时,大厂也在主动挖掘 AI 视频生成的独立商业化空间。快手可灵的探索尤为典型:2024 年 6 月,其与快手星芒短剧联合出品全球首部 AI 单元故事集《新世界加载中》,全球播放量近 2 亿次,验证了 AI 在内容创作领域的流量潜力;8 月又与网易《逆水寒》合作,将 AI 视频生成能力植入游戏,丰富社交玩法。
更关键的是,快手可灵已实现 “商业化落地” 的突破:据天眼查数据,2024 年二季度,可灵 AI 单季度收入达 2.5 亿元,较一季度环比增长 66.67%,不仅将 2025 年全年收入目标翻倍,还实现了毛利率为正 —— 这在仍以 “烧钱” 为主的 AI 视频生成行业,堪称罕见。


行业未到终局:技术、竞争与时代变革的三重不确定性

尽管头部阵营初显、部分玩家实现商业化,但 AI 视频生成行业远未到 “开香槟庆祝” 的时刻。技术演进的未知、潜在对手的入局、互联网行业的整体转型,都让 “领跑者” 的位置充满变数。

技术:没有永恒的领先者

当前各大模型的性能仍处于 “快速迭代期”,今天的技术优势可能明天就被颠覆。无论是视频生成的清晰度、时长,还是数字人的情绪控制、口型同步,距离 “理想状态” 仍有差距 —— 比如生成 1 分钟以上的长视频仍面临逻辑连贯度问题,复杂场景下的细节还原度不足。在技术快速迭代的赛道上,没有玩家能保证 “一直领先”,任何一次模型更新都可能改写格局。

竞争:潜在对手随时可能 “入场摘果”

现在的赛道玩家,并非全部 “实力派”—— 不少 AI 大模型巨头仍在观望。百度就是典型案例:此前李彦宏曾表示 “AI 视频生成商业化需 5-10 年”,因此未跟进 Sora,但随着行业加速,手握爱奇艺这一内容平台的百度,是否会加码布局?腾讯的动向同样值得关注:在语言大模型领域,腾讯曾长期观望,直到 DeepSeek 出世后才迅速推出 “元宝” 并整合进微信,最终抢占市场。若腾讯、百度等巨头下场,凭借其技术储备、流量优势与生态资源,很可能重塑赛道格局。

时代:互联网向 “AI 公司” 转型的必然冲击

从科技股大涨到巨头密集加码 AI,一个明确的趋势正在显现:互联网公司的未来,必然是 “AI 公司”—— 不是用 AI 赋能广告、电商,而是让 AI 业务成为核心收入来源。百度 2024 年二季度数据显示,其在线营销收入同比减少 15%,非在线营销收入(以智能云为主)同比增长 34%,若计入爱奇艺,非营销业务营收占比已超 50%;腾讯近期宣布 “全面开放 AI 能力”,从 “微信连接一切” 转向 “AI 连接一切”;阿里、亚马逊、谷歌等企业则纷纷加大债券融资与资本开支,为 AI 竞赛储备 “粮草”—— 谷歌甚至将 2024 年资本开支上调至 850 亿美元,同比增加 100 亿美元。
在这一背景下,AI 视频生成赛道的竞争,早已不只是 “技术比拼”,而是 “谁能更快成为 AI 时代的核心玩家”。对快手而言,可灵 AI 不仅是 “第二增长曲线”,更是抵御行业变革的 “护城河”:当 AI 视频生成改变内容生产方式,平台若只做 “内容集市”,而不具备 “自营生产” 或 “提供先进工具” 的能力,一旦用户偏好转向 AI 生成的新型视频(如个性化互动叙事),生态活力与用户粘性将面临严峻挑战 —— 这与网约车平台面临无人驾驶冲击的逻辑一致:若不能掌握核心技术,最终可能沦为 “流量入口”,价值被大幅挤压。


结语:AI 视频生成,开启互联网 2.0 的 “内容新大陆”

当大模型生成视频的技术逐渐成熟,AI 视频生成已不只是一个赛道的竞争,更是推动互联网向 2.0 时代演进的关键一步。在这个新时代,AI 将从 “工具” 升级为 “新内容世界的底层语法”,催生出人机共创的全新范式 —— 它不追求 “取代人类创作者”,而是以技术为笔,绘制更具想象力的内容版图。
当前,快手可灵换帅、爱诗科技深耕工具、字节阿里布局生态,所有玩家的探索都只是 “初稿”。赛道的终局尚未到来,资本、技术、生态的博弈仍将持续,但可以确定的是:谁能在 “用户广度” 与 “技术深度” 上同时突破,谁能在 “工具能力” 与 “生态壁垒” 间找到平衡,谁就能在这场变革中,握住开启 “内容新大陆” 的钥匙。而此刻,探索者们的地图,仍有大面积留白,等待被新的技术与战略填满。

推荐AGI

苏公网安备 11011xxxxx号 苏ICP备2025192616号-1