170,927 AI论文揭示的趋势巨变

我们分析了自2025年初至6月26日以来发布在arXiv上四大主要机器学习类别的170,927篇AI研究论文,目标是找出当前AI研究中真正正在发生的变化。

170,927 AI论文揭示的趋势巨变
AI模型价格对比 | AI工具导航 | ONNX模型库 | Vibe Coding教程 | PLC在线仿真器 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo

我们分析了自2025年初至6月26日以来发布在arXiv上四大主要机器学习类别的170,927篇AI研究论文——cs.CL(计算与语言)、cs.CV(计算机视觉)、cs.LG(机器学习)和cs.AI(人工智能),目标是找出当前AI研究中真正正在发生的变化。

这也是我们AI Research Pulse的第一期,这是AI Papers Academy追踪AI研究随时间演变的定期报告。

方法基于对每篇论文标题和摘要的关键词匹配,使用一套精选的主题、模型系列和机构。我们将窗口分为三个连续的半年期:2025年上半年、2025年下半年和2026年上半年。由于该领域整体增长了约25%,我们追踪的是论文份额而非绝对数量。

1、增长最快的主题

上图按论文份额增长率排名了哪些研究主题正在占据该领域不成比例的更大份额。每篇论文可以计入多个主题。

模式立即显现:许多顶级条目是十八个月前几乎不存在的独立研究领域的智能体相关领域。

有趣的是,推理与思维链按份额增长仅排名第9,但按原始数量排名第1,有11,636篇论文。它规模如此之大,即使是适度的份额增长也代表数千篇论文。同样,对齐与AI安全排名第10,在已经很大的8,121篇论文基础上仍增长了33%的份额。

虽然研究加速指数追踪的是增长最快的主题,以下是按数量主导AI研究的主题。

2、智能体基础设施爆发

聚焦智能体相关主题,上图展示了它们从2025年以来的增长(按百分比,而非数量)。智能体工作流的提及从4,585增长到10,496。这本身就很强劲,但其下的专用构建模块增长速度是其二到五倍。长期规划——让模型在许多步骤中追求目标而不丢失线索——从264跃升至1,611(+510%),是整个数据集中增长最快的主题。

智能体工作流领域正变得更加成熟,这些子领域的增长代表了其发展方向。该领域已经从"我们能构建智能体吗?"转向"我们如何让智能体规划、推理、使用工具并判断自己的输出?"

3、基础模型权力转移

开源AI的重心正在转移。阿里巴巴的Qwen生态系统正成为需要易用、强大基础模型的研究人员的默认起点,而这个位置在一年前Meta的Llama还无可争议地占据着。

阿里巴巴的Qwen几乎将其覆盖范围翻倍,从752增至1,489次提及+98%),而Llama仅增长**+14%**(1,085 → 1,232)。中国开发的开源模型系列首次成为西方AI研究中被引用最多的。Qwen不仅仅是追上了Llama,它令人信服地超越了它,现在每个半年期领先250多次提及。

下图展示了论文提及中模型系列增长的全貌。谷歌的双轨战略在两端都在获得牵引力:其小型开源模型Gemma获得了所有系列中最快的百分比增长+147%,而Gemini增长+95%。Anthropic的Claude是增长最快的闭源模型,增长+130%。

4、哪些领域显示增长放缓?

了解该领域正在停止什么与了解它正在开始什么同样有价值。在上图底部,我们可以看到增长为负或非常小的领域。

  • 合成数据不仅失去了份额(-24%),而且在绝对数量上也减少了(1,564 → 1,475),这可能是质量担忧和在模型输出上训练的模型偏离现实的风险的迹象。
  • 状态空间模型(Mamba)在原始数字持平的情况下失去了**20%**的份额(495 → 492)。然而,SSM的思路正在被吸收到混合架构中。
  • 扩散模型尽管增加到1,774篇,但仍失去了**15%**的份额,因为精力正从图像转向视频生成。

5、闭源前沿

上图展示了闭源模型领域主导地位的转变趋势。OpenAI的GPT系列仍保持最高的绝对数量,但实际上已经停滞不前。与此同时,竞争正在缩小差距,由Anthropic的Claude(+130%)和Google的Gemini(+95%)引领。数据指向一个明确的现实:单一模型垄断的时代已经正式过去。


原文链接:170,927 AI Papers Reveal the Biggest Research Shifts of the First Half of 2026

汇智网翻译整理,转载请标明出处