《2026年人工智能指数报告》（第九版）精简编译

斯坦福大学人类中心人工智能研究所近期发布《2026年人工智能指数报告》（第九版），这份长达423页的报告系统性梳理了全球AI发展的全景图景。本次编译以报告原有九章架构为基础，深度提炼核心结论、关键数据与趋势洞察，剔除冗余表述，重构内容逻辑，清晰呈现AI领域的发展现状、核心矛盾与未来走向。
原文标题：Artificial Intelligence Index Report 2026；原文来源：美国斯坦福大学人类中心人工智能研究所；原文编译：数字经济发展评论。

引言：技术狂奔下的体系适配困境

当前，AI技术正以惊人速度迭代演进，但其发展已远超周边支撑体系的跟进能力——无论是治理框架、评估方法，还是教育体系、数据基础设施，都难以完全匹配技术扩张的步伐。这种“能力领先、准备不足”的落差，成为贯穿本年度报告的核心主线。
与往年相比，2026年报告新增多项关键内容：聚焦推理、安全性及现实任务执行领域的AI测试追踪，剖析测试结果解读难度提升的核心原因；更新生成式AI经济价值估算数据，补充其对劳动力市场影响的初步实证；构建AI主权分析框架，并联合施密特科学基金会新增“AI与科学”“AI与医学”独立章节，凸显两大领域中AI的深远影响力。
近十年来，AI指数始终为全球AI领域提供可靠的标准化数据，为政策制定者、科研人员、企业管理者及公众提供决策参考。本次报告坚持独立客观立场，不盲从技术乐观主义，也不夸大潜在风险，致力于挖掘AI发展表象之下的长期规律与深层问题。
报告联合主席寄语核心提炼：相较于一年前记录AI成为主流力量的节点，本年度数据重点展现了AI“普及之后”的真实图景。生成式AI仅用三年就实现53%的人口级普及率，远超个人电脑与互联网的普及速度；领先AI企业营收规模化速度刷新技术代际纪录，2025年全球AI企业投资翻倍增长。但与此同时，顶级模型之间的性能差距快速收窄，而AI评估工具的迭代速度却严重滞后，整个领域正陷入“能力扩张快于体系适应”的失衡状态。

核心要点总览：AI发展的矛盾与突破

本年度报告的核心要点可概括为“能力突破与体系滞后并存、全球格局分化与局部创新凸显”，具体关键洞察如下：
一是AI能力加速迭代且普及面持续扩大。2025年，工业界主导了90%以上的前沿AI模型，多个模型在博士级科学问题、多模态推理及竞赛数学领域达到或超越人类水平，核心编程基准SWE-bench Verified性能一年内从60%飙升至接近人类水平；企业AI采用率达88%，五分之四的大学生已将生成式AI用于学业。
二是全球AI格局呈现“美中领跑、多极追赶”态势。美中两国模型性能差距已实质性缩小，2025年初中国DeepSeek-R1曾短暂追平美国顶尖模型，截至2026年3月，美国Anthropic顶尖模型仅领先2.7%；美国在顶级模型数量、高影响力专利上保持优势，中国则在论文发表量、引用量、专利总数及工业机器人装机量上占据领先，韩国以AI人均专利量位居全球首位。
三是硬件供应链集中风险凸显。美国拥有5427个AI数据中心，数量是第二名的十倍以上，能耗亦居全球首位；但全球几乎所有顶级AI芯片均由中国台湾台积电代工，尽管台积电美国工厂已于2025年投产，供应链集中化带来的脆弱性仍未根本缓解。
四是AI性能呈现“锯齿状前沿”特征。顶尖模型既能在国际数学奥林匹克（IMO）中斩获金牌（Gemini Deep Think得35分），却在简单的模拟时钟识别任务中正确率仅50.1%；AI代理在OSWorld真实计算机任务中的成功率从12%跃升至66%，但在结构化基准测试中仍有近三分之一的失败率，能力不均衡问题突出。
五是负责任AI发展严重滞后于技术能力。2025年AI事故数量从2024年的233起增至362起，而前沿模型开发者对负责任AI基准的披露仍极为零散；提升AI安全性往往会损害其准确性，各维度之间的权衡机制尚未明确，安全基准失效问题日益突出。
六是投资与人才格局出现新变化。2025年美国私人AI投资达2859亿美元，是中国的23倍以上，但美国吸引全球AI人才的能力持续下滑，2017年以来人才流入量下降89%，仅过去一年就降幅达80%。
此外，报告还揭示了AI在环境足迹、科学研究、临床医疗、教育、政策治理及公众舆论等领域的核心矛盾：AI生产力提升与初级岗位下滑同步出现，环境足迹随能力提升持续扩大，小模型在部分科学领域超越大模型，临床AI普及但严格证据不足，教育体系滞后于AI普及速度，各国AI治理路径分歧凸显，专家与公众对AI的认知鸿沟巨大。

第一章研究与开发：资源集中化与格局分散化并存

2025年，全球AI研发资源持续扩容，但发展格局呈现鲜明的“集中与分散”双重特征：一方面，前沿AI系统越来越集中于少数头部组织，工业界占据了90%以上的知名AI模型，且最强大的模型透明度持续下降——OpenAI、Anthropic、谷歌等机构已全面停止披露训练代码、数据集规模、参数量及训练时长，技术壁垒进一步强化。
在研发实力分布上，美中两国形成双领跑格局：中国在AI论文发表量、引用量及专利授权总数上位居全球首位，2024年在全球被引前100篇AI论文中占比达41篇，较2021年的33篇大幅提升；美国则在高影响力专利、知名模型发布数量上保持优势，2025年发布50个知名模型，中国同期为30个。韩国以AI人均专利量领跑全球，成为多极格局中的重要力量。
算力与数据领域呈现“算力飙升、数据提质”的趋势：尽管前沿模型参数量三年来徘徊在1万亿左右且披露停止，但可独立估算的训练算力持续爆发式增长，2022年以来年均增长3.3倍，2025年达1710万H100当量，其中英伟达占总算力的60%以上，谷歌、亚马逊提供补充，华为份额虽小但稳步提升。数据方面，合成数据尚未取代真实预训练数据，OLMo 3.1 Think 32B参数量仅为Grok 4的1/90，却通过数据剪枝、去重及筛选，在多个基准测试中取得与大模型可比的结果，印证了数据质量与后训练技术的巨大潜力。

▲按选定地理区域划分的知名人工智能模型数量（2025年）

研发过程中的环境与人才问题日益突出：Grok 4的训练排放量达72816吨二氧化碳当量，AI数据中心装机容量升至29.6GW，相当于纽约州峰值电力需求，仅GPT-4o的年度推理用水量就可能超过1200万人的日常饮用需求；AI人才流动格局发生重大变化，美国虽仍拥有最多AI人才，但2017年以来全球AI人才赴美数量下降89%，过去一年降幅高达80%，新增人才吸引率跌至十年最低，同时全球AI人才性别差距深度固化，无任何国家接近性别平等。
开源领域成为AI研发的重要增长极，GitHub上AI相关项目已达560万，Hugging Face上传量自2023年以来翻三倍，美国项目仍吸引最多关注，累计GitHub星标达3000万，开源开发正推动AI研发格局向地理分散化发展。

第二章技术与性能：能力突破与基准危机并存

2025年，AI技术能力持续突破人类表现边界，但进步呈现明显的不均衡性，“锯齿状智能”特征愈发突出，同时AI基准测试面临双重危机，难以有效衡量技术真实水平。
AI能力的突破主要体现在三个方面：一是基准测试被快速“攻克”，前沿模型在Humanity's Last Exam（专为AI设计、侧重人类专家能力的基准）上，一年内得分提升30个百分点，原本计划难住AI数年的评估，仅数月就达到性能饱和；二是顶尖模型性能快速收敛，截至2026年3月，Anthropic、xAI、谷歌、OpenAI、阿里巴巴、DeepSeek等机构的模型均跻身ArenaElo评分顶层，竞争焦点从性能比拼转向成本控制、可靠性提升及垂直领域适配；三是AI在特定领域实现跨越式发展，视频生成模型开始能模拟物理规律（谷歌Veo3经18000个视频测试，可模拟浮力、解迷宫等），AI代理从单纯答题转向完成真实任务，OSWorld任务成功率从12%跃升至66.3%，距人类水平仅差6个百分点，自动驾驶实现大规模量产部署，Waymo在美国五城每周完成45万次行程，中国Apollo Go完成1100万次完全无人驾驶行程，同比增长175%。
与此同时，AI性能的不均衡性表现得极为突出：顶尖模型能在IMO中获得金牌，却在ClockBench模拟时钟识别任务中正确率仅50.1%，远低于人类的90.1%；在税务、抵押贷款、法律推理等专业领域，AI表现介于60%-90%之间，顶尖模型间差距最小仅3个百分点，但高可靠性仍难以保障；机器人在可控环境（RLBench仿真）中操控成功率达89.4%，但在真实家庭任务中成功率仅12%，实验室与现实环境的鸿沟巨大。
基准测试的危机进一步加剧了AI性能评估的难度：一方面，开放权重与封闭权重模型的性能差距重新扩大，从2024年8月的0.5%升至2026年3月的3.3%，Arena排行榜前10名中有6个为封闭权重模型；另一方面，基准测试的可靠性备受质疑，MMLU Math无效题目率为2%，GSM8K高达42%，且有研究表明，Arena排行榜名次可能更多反映模型对平台的适应能力，而非真实综合实力。值得注意的是，美中AI模型性能差距已实质性缩小，2025年初DeepSeek-R1曾追平美国顶尖模型，截至2026年3月，美国领先幅度仅2.7%，全年差距维持在个位数以内。

▲AI指数技术性能基准与人类表现对比

第三章负责任AI：进展滞后与风险凸显

负责任AI（RAI）是保障AI系统安全、公平、有益的核心支撑，涵盖安全性、公平性、透明度、隐私保护等多个维度。但2025年的数据显示，负责任AI的发展速度远落后于AI技术能力的提升，安全风险与治理短板日益突出。
最突出的问题是安全事故激增与基准滞后：AI Incident Database记录的AI事故数量从2024年的233起增至2025年的362起，创历史新高；几乎所有前沿模型开发者都会披露能力基准（如MMLU、SWE-bench）的测试结果，但负责任AI基准的报告极为稀疏，难以有效衡量AI系统的安全与公平性。同时，AI模型在对抗性攻击下的脆弱性凸显，尽管在AILuminate基准上多个模型获得“良好”安全评级，但面对越狱提示攻击时，所有被测模型的安全性能均大幅下滑。

▲2012年至2025年报告的人工智能事件数量

模型的可靠性与透明度问题持续恶化：在新的准确性基准测试中，26个顶尖模型的幻觉率介于22%-94%之间，当虚假陈述被呈现为用户信念时，GPT-4o的准确率从98.2%骤降至64.4%，DeepSeek R1从90%以上跌至14.4%，凸显模型难以区分“知识”与“信念”的核心短板；基础模型透明度指数从2024年的58降至2025年的40，训练数据、计算资源、部署后影响等关键信息的披露差距依然显著。
组织层面的负责任AI推进仍受多重制约：尽管AI专项治理岗位2025年增长17%，完全没有负责任AI政策的企业占比从24%降至11%，但知识缺口（59%）、预算限制（48%）、监管不确定性（41%）仍是主要障碍。在监管格局上，GDPR仍是最常被引用的监管依据，但占比从65%降至60%，ISO/IEC 42001、NIST AI风险管理框架等新标准逐步兴起，完全未受监管影响的组织占比从17%降至12%。
此外，AI的语言偏见与维度权衡问题凸显：AI在英语场景下表现最优，在阿拉伯语、斯洛文尼亚方言等非通用语言场景中，性能大幅下降，部分顶尖模型在斯洛文尼亚方言常识推理测试中的准确率较标准语言下降近一半；同时，负责任AI各维度之间存在相互掣肘，实证研究表明，旨在提升某一维度（如安全性）的训练技术，往往会损害另一维度（如准确性），相关权衡机制仍未明确。

第四章经济：投资爆发与影响不均

2025年成为全球AI投资的爆发之年，私人投资、企业营收实现跨越式增长，生成式AI成为核心增长引擎，但AI对经济的影响呈现明显的不均衡性，生产力提升与岗位调整同步发生，区域与领域差距显著。
投资领域呈现“全球翻倍、美国领跑”的格局：2025年全球企业AI投资翻逾一倍，其中私人投资增长127.5%，占总量的60%，生成式AI投资增长超200%，占据私人AI融资的近半壁江山；新获资助的AI企业增长71%，十亿美元级融资事件近乎翻倍。美国以2859亿美元的私人AI投资额遥遥领先，是中国（124亿美元）的23倍以上，其生成式AI投资超过中国与欧洲的总和；需注意的是，中国政府引导基金在2000-2023年间已向AI企业投入约1840亿美元，私人投资数字可能低估中国实际投入规模。

▲2013–2025年按投资活动划分的全球企业人工智能投资总额

企业与消费者层面均显现AI的价值红利：顶尖AI企业正以历史性速度实现营收规模化，但算力成本也同步创下纪录，谷歌2025年资本支出超过1500亿美元；消费者从生成式AI中获得的价值快速提升，预计2026年初美国消费者的生成式AI年度盈余达1720亿美元，较上年增长54%，每用户中位价值一年内翻三倍，且多数工具仍处于免费或近乎免费状态。企业AI采用率升至88%，生成式AI已在70%的组织中至少一项业务职能中应用，中国与欧洲的年同比增幅最大，但AI代理在各业务职能中的部署率仍处于个位数，应用仍处于早期阶段。
AI的普及速度创下历史纪录，且区域差异明显：生成式AI仅用三年就实现53%的人口级普及率，超过个人电脑与互联网的普及速度；普及率与人均GDP密切相关，但新加坡（61%）、阿联酋（54%）等国的普及率高于其收入水平预期，而在AI投资与模型开发上领跑的美国，普及率仅28.3%，排名全球第24位。
劳动力市场受到不均等冲击：AI生产力提升主要集中在结构化、可量化的工作中，客服领域提升14%-15%，软件开发领域提升26%，营销产出提升50%，但在需要深度推理的任务中提升有限，且过度依赖AI可能带来长期学习损失。与此同时，劳动力市场的调整同步发生，22-25岁软件开发者的就业人数自2024年起下滑近20%，而年长开发者人数仍在增长；三分之一的组织预计未来一年将削减用工，其中服务运营、供应链、软件工程是预计削减最多的职能，但大规模失业尚未在总体就业数据中显现。此外，中国工业机器人装机量已超过全球其余国家总和，2024年占比达54%，且差距持续扩大，台湾以33%的年增速成为工业机器人领域的新增长点。

第五章 AI与科学：从辅助到引领的转型之路

2025年，AI在科学领域的角色发生深刻变革，从单纯加速单一研究步骤，转向尝试替代整个科研工作流程，成为科学发现的重要助力。但同时，AI在科研领域的应用仍存在明显短板，大模型并非万能，端到端科研能力仍有较大提升空间。

▲2010–2025年自然科学领域人工智能相关出版物数量

小模型超越大模型的现象成为科研领域的重要突破：在分子生物学领域，参数量仅1.11亿的蛋白质语言模型MSAPairformer，在ProteinGym基准上超越此前最优方法；参数量2亿的基因组学模型GPN-Star，更是超越了近200倍大的模型，印证了“小而精”的模型在特定科研领域的优势，也打破了“模型越大性能越好”的固有认知。
AI在不同科学领域的表现呈现分化态势：在化学领域，前沿模型在ChemBench的2700余道化学题中，平均表现超越人类化学家，但在基础任务上仍有短板；而在天体物理学、地球观测等领域，AI表现不佳，前沿模型在ReplicationBench上复现天体物理学论文的得分低于20%，在UnivEarth地球观测问题上的准确率仅33%，代码执行失败率高达58%。
多个科学领域实现AI应用的里程碑突破：天文学领域发布首个基础模型AION-1（基于5个主要巡天项目的2亿多个天体训练而成）、首个可视化基准AstroVisBench，以及100TB训练数据集，推动天文学研究进入AI辅助的新阶段；气象领域，AI首次端到端运行完整天气预报流程，Aardvark Weather以单一ML系统替代传统数值预报流程，FourCastNet 3在4分钟内生成60天全球预报，速度较传统方法快8-60倍，多个AI天气模型进入业务化部署。
AI在端到端科研任务中的能力仍有较大差距：在PaperArena基准测试中，最优AI代理的准确率仅38.8%，而博士专家的基线为83.5%；在BixBench的真实生物信息学分析任务中，前沿模型的准确率约为17%，远未达到人类专家水平。尽管如此，AI在科研领域的创新仍在推进，2025年首篇完全由AI生成的论文被同行评审研讨会接受（Sakana的AI Scientist-v2独立完成，被ICLR研讨会接收），谷歌AI Co-Scientist在三个生物医学领域的发现也得到实验验证，但经实验证实的AI科研发现清单仍较为短暂。
科研领域的AI模型开发格局与通用AI不同，主要以学术和政府机构为主：地球科学数据集完全来自政府和学术来源，气象和气候领域的基础模型开发则由产业界主导，形成了“学术+政府”为主、产业补充的独特格局。此外，AI相关科学出版物数量快速增长，2025年达80150篇，同比增长26%，在自然科学研究总量中的占比达5.8%-8.8%，彰显AI在科学研究中的影响力持续提升。

第六章 AI与医学：落地加速但证据不足

2025年，AI在医学领域的应用从试点走向规模化落地，在临床诊疗、分子生物学研究等方面发挥重要作用，有效减轻了医疗从业者的负担，但严格的临床证据基础依然薄弱，伦理与治理短板尚未补齐。
分子生物学领域延续了“小模型胜过大模型”的趋势：参数量1.11亿的MSAPairformer在ProteinGym基准上超越此前领先方法，参数量2亿的GPN-Star超越400亿参数的模型，进一步证明模型性能并非完全依赖参数量，数据质量与模型设计更为关键。同时，虚拟细胞模型成为新的研究前沿，Evo 2（Arc Institute）、STATE、DeepMind的AlphaGenome相继发布，旨在无需湿实验即可预测细胞对药物和基因扰动的响应，但现有系统仍需大量实验验证才能投入实际应用。
生物学模型开发的瓶颈发生转移：随着共折叠模型已覆盖蛋白质数据库中的所有结构类型，2025年研究重心从模型架构转向数据优化，训练集从数十万条扩展至数千万条，重点推进AI预测结构的精炼数据集建设与多源实验数据融合，提升模型的准确性与实用性。
临床诊疗领域的AI应用实现规模化突破：自动生成临床笔记的AI工具被多个医疗系统广泛采用，医生书写病历的时间减少多达83%，职业倦怠程度显著降低，其中一家医院系统的投资回报率达112%，彰显AI在提升医疗效率、改善医护人员工作体验中的价值。多智能体AI系统在复杂病例诊断中表现突出，微软AI诊断协调器配合OpenAI o3，在医学文献中的挑战性病例测试中得分85.5%，远超未借助AI的医生（20%），多智能体框架较单智能体基线的诊断准确率提升7%-60%以上。
AI在医疗领域的普及还体现在健康信息传播上，谷歌搜索中健康相关结果的AI生成摘要占比达84%-92%，其中症状和常见健康问题触发AI摘要的概率达92%，成为用户获取健康信息的重要途径，深刻影响用户对健康问题的初步解读。
尽管应用加速，临床证据不足与伦理治理滞后仍是突出问题：2025年FDA授权258项AI医疗设备，绝大多数通过无需新临床试验的设备修改审批路径入市，仅2.4%的设备临床研究基于随机对照试验数据，难以充分验证其临床有效性与安全性；医学AI出版物中的伦理讨论在2025年翻逾一倍，但讨论范畴较为狭窄，主要集中在治理问题上，算法问责、生物安全、全球健康公平等关键议题仍严重不足。此外，医疗数字孪生研究热度快速攀升，一项涉及150名糖尿病患者的随机对照试验显示，71%的患者在一年内将血糖维持在健康水平，同时安全减少用药量，为AI在慢性病管理中的应用提供了初步实证。

▲2024年与2025年人工智能驱动的蛋白质研究出版物数量对比

第七章教育：AI普及与体系滞后的悖论

当前教育领域面临一个核心悖论：AI工具在学生群体中快速普及，成为学习辅助的重要手段，但学校的政策制定、课程体系调整却严重滞后，难以适应AI时代的教育需求；与此同时，正规教育之外的AI技能学习快速兴起，有效填补了制度层面的空白。

▲2024年美国按种族/民族划分的AI硬件相关从业者与所有高等教育毕业生对比

▲2024年美国按种族/民族划分的AI软件相关从业者与所有高等教育毕业生对比

高等教育领域呈现“CS降温、AI升温”的趋势：2025年，美国四年制大学计算机科学（CS）本科入学率下滑11%，但AI相关研究生项目持续增长，AI软件相关领域的硕士毕业生从2023年到2024年增长17%，表明尽管整体CS专业热度下降，但AI专业化的需求依然旺盛。在ICT专业毕业生培养上，美国保持全球领先，但土耳其、巴西、墨西哥等国家的ICT毕业生产出增速更快，全球人才培养格局正逐步多元化。
学生群体的AI使用率极高，但学校政策严重滞后：五分之四的美国高中生和大学生在学业中使用AI，主要用于研究、论文编辑和头脑风暴，极大提升了学习效率，但仅有半数中学制定了AI相关政策，仅6%的教师认为政策内容清晰，政策的缺失与模糊导致AI在校园中的应用缺乏规范，难以平衡学习辅助与学术诚信的关系。
AI教育的推进呈现区域差异：全球90%以上的国家已向中小学生开设计算机科学课程，但AI教育的推进速度较慢，仅有中国、阿联酋等少数国家明确要求从2025-26学年起开展AI教育，标志着国家层面开始推动AI教学的系统性落地。在AI博士培养方面，美加两国2022-2024年间新增AI博士数量增长22%，但所有增量均流入学术界，逆转了此前十年新增AI博士主要流向产业界的趋势，可能影响产业界的AI研发人才供给。
终身学习成为AI技能提升的重要途径：越来越多的人在正规教育之外习得AI技能，并将其写入简历，弥补了学校教育的不足。从全球范围来看，大多数国家的AI素养增速快于工程导向的AI技能，但阿联酋、智利和南非例外，这三个国家的AI工程技能自2022年以来增速更陡，凸显出不同国家对AI技能培养的差异化需求。

第八章政策与治理：分歧凸显与主权崛起

2025年，全球AI政策进入分化加剧的阶段，各国基于自身利益与发展需求，出台了差异化的AI治理框架，欧盟、美国、日本、韩国等主要经济体的治理路径分歧日益明显，AI主权成为各国政策的核心议题，发展中国家开始逐步参与全球AI治理。

▲拥有国家人工智能战略的国家

2025年全球主要AI政策事件梳理

2025年全球主要AI政策事件梳理：1月23日，美国发布行政令，撤销此前AI相关指令，确立以“增强主导地位、促进创新、消除监管障碍”为核心的新政策框架；2月1日，欧盟AI法案第一阶段正式生效，禁止预测性警务、情感识别等高风险AI用途，为后续更严格的监管规则奠定基础；2月11日，巴黎AI行动峰会上，美国、英国拒绝签署60国共同认可的包容性AI宣言，全球AI治理路径的分歧进一步凸显；3月14日，中国监管机构发布最终规定，要求对AI生成内容和合成媒体进行明确标注，并分阶段实施；4月3日，首届非洲全球AI峰会在基加利举办，聚焦非洲大陆如何把握AI发展机遇、防范劳动力市场冲击。
国家AI战略的扩张呈现“新兴经济体领跑”的特征：2024年，超过半数的新增国家AI战略来自新兴经济体，截至2025年，撒哈拉以南非洲、中亚、中东的更多国家正在积极制定AI战略，标志着全球AI治理的参与主体日益多元化。AI主权成为各国AI政策的核心原则，各国纷纷加大国家级AI超算集群投资，欧洲和中亚将此类集群从2018年的3个扩展至2025年的44个，而南亚、拉丁美洲、中东和北非地区仅分别达到2个、3个和8个，基础设施支撑能力的差距显著，导致AI主权的实现程度不均衡。
各地区对数据主权的处理方式差异巨大：2024年以前，东亚和太平洋地区采纳了77项数据本地化措施，位居全球首位，其次是撒哈拉以南非洲（71项）、欧洲与中亚（66项）；而北美仅记录到3项数据本地化措施，反映出不同地区对跨境数据流的差异化态度，也体现了各国AI治理理念的分歧。
美国与欧洲的AI治理呈现“松监管”与“严监管”的鲜明对比：美国公共AI投资规模有限，2013-2024年间仅投入约204亿美元用于AI相关合同和补助，而2025年美国私人AI投资就达2859亿美元，同时美国转向放松监管，旨在消除创新障碍；欧洲则坚持严格监管，2013-2024年间欧洲AI公共合同承诺金额约达37亿美元，其中英国贡献16亿美元、德国5.05亿美元、法国3.2亿美元，且近期支出加速，2024年英国、德国的承诺金额分别占其十年总量的28%和40%。此外，美国国会AI相关听证会的证人数量自2017年以来增长二十倍，从5人增至2025年的102人，产业界证人占比从13%升至37%，成为最大证人群体，而学术界证人占比降至15%，反映出产业界在AI政策制定中的影响力持续提升。

第九章公众舆论：乐观与焦虑并存，认知鸿沟显著

2025年，Ipsos AI Monitor开展的全球调查覆盖30个国家、23216名成年人，结果显示，全球公众对AI的态度呈现“乐观与焦虑并存”的特征，AI专家与公众的认知鸿沟巨大，各国民众对本国政府AI监管能力的信任度分化明显。

▲2022-2025年使用Al的产品和服务带来的益处多于弊端，按国家（占总量的百分比）划分

全球对AI的情绪呈现双重上升态势：认为AI产品和服务利大于弊的受访者比例从2024年的55%升至2025年的59%，表明公众对AI价值的认可度持续提升；但同期表示对AI感到紧张的比例也升至52%，反映出公众对AI潜在风险的担忧并未缓解，这种“既期待又担忧”的心态成为全球公众对AI的主流态度。
区域差异较为突出：东南亚国家仍是全球最乐观的AI受众，中国、马来西亚、泰国、印度尼西亚、新加坡等国，超过80%的受访者认为AI将在未来3-5年内深刻改变自己的生活，其中马来西亚的乐观情绪提升幅度最大；与之形成对比的是印度，其公众对AI的紧张情绪上升幅度在所有受访国中最大，2024-2025年间担忧比例上升14个百分点，而兴奋情绪仅上升2个百分点，焦虑感显著高于其他国家。
工作场所AI使用率呈现“新兴经济体高于发达国家”的特点：2025年，全球58%的员工报告在工作中半定期或定期使用AI，而印度、中国、尼日利亚、阿联酋、沙特阿拉伯等新兴经济体的这一比例超过80%，反映出新兴经济体在AI应用落地方面的积极性，也体现了AI在不同发展阶段国家的渗透差异。
AI专家与公众的认知鸿沟极为显著，除“AI会损害选举和人际关系”这一观点达成共识外，几乎在所有其他议题上均存在巨大分歧：在就业影响上，73%的专家认为AI对职业的影响是积极的，而公众的这一比例仅为23%，差距达50个百分点；在经济领域，专家持积极态度的比例为69%，公众仅为21%；在医疗领域，专家积极比例为84%，公众为44%，差距均超过40个百分点。此外，近三分之二的美国人（64%）预期AI将在未来20年减少就业岗位，仅5%预期会增加，而专家相对乐观（39%认为减少，19%认为增加），且专家预测AI普及速度更快——预计到2030年生成式AI将辅助80%的美国工时，而公众的预估仅为10%。
公众对AI伴侣的预期与专家存在差异：目前AI伴侣仍属小众，但专家预测，到2027年将有10%的美国成年人每天使用AI伴侣，到2040年这一比例将升至30%，而公众的预期更低，预测2040年这一比例仅为20%。
各国民众对本国政府AI监管能力的信任度分化巨大：美国是所有受访国中信任度最低的国家，仅31%的民众信任本国政府监管AI的能力，远低于全球平均值（54%）；东南亚国家的信任度最高，新加坡81%、印度尼西亚76%；在全球范围内，欧盟比美国或中国更受信任，皮尤研究中心2025年调查的25个国家中，中位53%的受访者表示信任欧盟监管AI的能力，信任美国的为37%，信任中国的为27%。此外，美国所有50个州中，担忧AI监管力度不足的声音均压过担忧过度监管的声音，41%的受访者认为联邦AI监管力度不够，27%认为力度过大，超过三分之一的人尚未表态。

结语：填平能力与准备度的鸿沟

《2026年人工智能指数报告》通过海量数据与深度分析，勾勒出当前AI发展的核心图景：AI技术能力正以前所未有的速度扩张，在科学、医疗、经济、教育等多个领域实现突破性应用，为人类社会带来巨大价值，但围绕AI构建的支撑体系——评估基准、治理框架、教育体系、安全保障等——却未能同步跟进，形成了“技术先行、制度滞后”的核心矛盾。
报告既揭示了AI发展中的突出问题：基准测试失效、安全事故激增、劳动力影响不均、治理分歧明显、公众认知碎片化，也记录了积极的发展趋势：开源运动推动AI参与全球化，AI在科学发现与临床医疗中的潜力逐步释放，消费者从AI工具中获得前所未有的价值。
未来数年，AI发展的核心命题将不再是“如何提升能力”，而是“如何填平能力与准备度之间的鸿沟”。如何优化AI评估体系、完善治理框架、规范技术应用、弥合专家与公众的认知差距，实现AI技术的可持续、负责任发展，将成为全球政策制定者、科研人员、企业及公众共同面临的重要课题。

本文来自微信公众号：数字经济发展评论，作者：数字经济发展评论

引言：技术狂奔下的体系适配困境

核心要点总览：AI发展的矛盾与突破

第一章 研究与开发：资源集中化与格局分散化并存

第二章 技术与性能：能力突破与基准危机并存

第三章 负责任AI：进展滞后与风险凸显

第四章 经济：投资爆发与影响不均