AI 大模型之「盾」:283 个全行业 LLM 基准测试,一文尽览核心
图|代表性 LLM 基准测试(按时间线)。
大模型技术如破阵之 “矛”,不断突破智能的边界;基准测试(benchmark)则如御敌之 “盾”,精准衡量技术的真实实力。唯有
大模型技术如破阵之 “矛”,不断突破智能的边界;基准测试(benchmark)则如御敌之 “盾”,精准衡量技术的真实实力。唯有
三大证据 “戳穿” CoT?思维链再遭质疑,真正泛化推理路还远
思维链(Chain of Thought, CoT)提示技术曾被视为大语言模型(LLM)推理能力的关键突破 —— 通过生成类人类的分步推理过程,LLM 在数学计算、逻辑分析等任务中的表现显著
新规落地:DeepSeek 等大模型集体亮明 "数字身份证",AI 造假能终结吗?
“作品含 AI 内容” 标识成为行业标配的消息传来,不知多少人悄悄松了一口气。这场 “松气” 的背后,是 9 月 1 日正式落地的《人工智能生成合成内容标识
AI 神经解码新突破:脑机接口让瘫痪患者控制精度提升 4 倍
每当提及 “脑机接口”(BCI),人们总会立刻联想到 “意念控制”—— 只需在脑海中产生想法,机器就能代为执行。这一概念充满未来感,听起来酷炫十足
大厂扎堆角逐边缘 AI,这片 “新沃土” 到底香在哪?
在人工智能的发展进程中,技术形态与产业重心始终随场景需求动态调整。早期,云端 AI 凭借强大的集中式算力与数据处理能力,成为行业发展的绝对主导,支撑了大规模模型训练、高分辨
AI 智能体竞速战:字节阿里加码布局 全球超九成企业加速部署
当生成式 AI 从 “对话工具” 迈向 “自主决策实体”,AI 智能体(Agent)正成为科技巨头竞逐的新战场。近期,阿里、腾讯、字节、美团等国内大厂密集推出 Agen
大模型公司的未来,藏在 OpenAI 的 “命门” 里
在大模型行业,有一条公认的底层逻辑:Scaling Law 决定了模型能力的上限,而算力成本控制则决定了商业化的下限。当行业从 “拼参数规模” 的野蛮生长阶段,进入 “
北极圈也 "卷"?中国车以出海破局,极端市场显实力
当 “出海” 从企业战略版图中的 “加分项” 蜕变为决定生存的 “生命线”,中国汽车产业正以史无前例的规模与速度,在全球市场书写新的竞争篇
破壁与新生:2025 上半年中国企业重塑全球商业版图
2025 年 8 月的盛夏,两则来自不同领域的消息,共同奏响了中国企业全球化的新旋律 ——8 月 16 日,长城汽车巴西工厂在卢拉总统见证下竣工投产,中国汽车工业的 “
千亿规模 “跃级”!滴滴在拉美抢食外卖 “蛋糕”
2018 年,滴滴以收购巴西本土共享出行企业 99 为起点,正式拉开国际化战略序幕。如今,这一战略的核心落点愈发清晰 —— 拉美市场。截至 2025 年第二季度,滴滴国际业务
