中美大模型26Q2展望：Scaling延续，Agent与多模态能力或成最大看点

券商研报精选 2026-05-01 13:18:00

10秒看完全文要点

看要点

2026Q1中美大模型迎来密集迭代，模型能力进展加速。Coding和Agent领域成为主战场，Anthropic持续斩获SOTA溢价，或为最大赢家；国产模型则依托性价比优势持续扩大Token份额，形成差异化竞争。展望26Q2,5~6月有望成为下一轮模型密集迭代窗口期，Long Horizon Agent和多模态料将成为新的Scaling方向，谷歌Veo 4、GPT-6、Minimax M3、Kimi K3等模型值得重点关注。我们建议聚焦三条主线：1）头部模型公司及相关云厂商：下游需求爆发带来Token指数级增长以及量价齐升机遇；2）模型和应用一体化的公司：在AI应用渗透加速的背景下，更易形成“模型研发-算力（核心股）投入-商业变现”的闭环；3）算力产业链标的：模型迭代支撑算力需求景气，海外算力叙事或重回乐观。

▍26Q1复盘：模型能力进展加速，Token定位与定价逻辑显著分化。

一方面，海外高端模型以能力优势享受SOTA溢价。Anthropic凭借在Coding的深度布局，或为本阶段最大赢家；Gemini 3.1、GPT 5.5则分别在多模态和综合能力上建立差异化优势。另一方面，国内模型则以高性价比实现错位竞争，GLM-5.1领跑开源模型，DeepSeek V4、Qwen 3.6 plus、Minimax M2.7、MiMo-V2、Kimi K2.6、Seed 2.0等多款产品已跻身全球第一梯队；此外HappyHorse等AI视频生成模型亦有突破。我们预计本轮技术迭代后，中美模型整体差距仍维持在6个月左右。

▍26Q2展望：Test Time Scaling方向延续，5~6月为下一轮技术迭代窗口。

技术层面，Long Horizon有望延续Test Time Scaling Law，进一步打开模型智能上限。GLM 5.1已可完成连续8小时长程任务，Minimax M2.7亦开启自我进化探索；据罗福莉在中关村论坛的分享，模型连续工作时长有望从当前1~2天演进至3~4天，最终迈向自主进化。多模态方向同步推进，Google、Minimax等加快布局，多模态数据的融入，叠加多模态理解对生成的协同效应有望系统性提升模型综合能力。时间节点上，5~6月为下一轮技术迭代窗口，其中5月20日谷歌I/O大会为关键观察点，Veo 4、GPT-6、Minimax M3、Kimi K3等模型值得重点跟踪。此外，Agent在办公等生产力场景的最新进展，亦是后续重要的观察维度。

▍国产模型：技术创新推动Agent能力突破，持续追赶海外前沿；多模态经过多次迭代后应用生态逐步成熟，用户渗透加速，商业化有望迎来爆发。

1）DeepSeek：开源模型长期引领者，V4通过多项技术创新实现Agent能力突破与成本优化。模型性能方面，首创mHC残差优化技术，能有效增强深层训练稳定性，提高长序推理表现，为更大规模模型奠定基础，V4参数量已达到1.6T，并支持1M上下文。推理成本方面，CSA+HCA等工程优化显著减少显存占用，实现“低成本、高性能”，限时优惠输出价格为6元/百万Token，为同级别模型价格最优；适配华为昇腾950PR等国产算力（核心股），有利于缓解算力制约、降低推理成本。

2）Kimi：引入Agent集群架构，K2.6成为全球开源SOTA。月之暗面以长文本技术突破起家，已发展为国产大模型竞争的关键力量。Kimi K2.5实现重要演进：架构层面，创新Agent集群架构，通过调度多个Agent进行团队协作，大幅提升复杂任务处理效率；交互层面，突破了文字表达局限，延伸至图像等视觉内容理解；应用层面，掌握常用办公软件，表现出准专业水平的任务交付能力。Kimi K2.6能力继续迭代升级，成为开源SOTA，token调用量迅速攀升至OpenRouter平台首位，反映出强劲的技术竞争力和用户认可度。

3）智谱：GLM-5.1领跑能力领先，Agent能力成为核心亮点。2026年2月11日和4月8日，智谱发布先后发布新一代旗舰模型GLM-5和GLM-5.1，聚焦Coding与Agent能力，在开源阵营中达到第一梯队，在核心工程能力上对齐甚至超越Claude Opus 4.6。GLM-5模型规模进一步扩张，总参数量提升至744B（激活参数40B），较上一代GLM-4.7的355B（激活参数32B）实现翻倍增长；预训练数据规模由23T提升至28.5T，在Scaling Law指引下带动性能持续跃升。后训练阶段，公司自研“Slime”异步强化学习框架，强化长链路任务处理能力，使模型在Agent场景中形成显著优势。

4）Minimax：性价比优势凸显，M2.7开启自我进化。2026年2月12日和3月18日，MiniMax先后发布了新一代模型MiniMax M2.5和M2.7。在编程能力、工具调用和搜索等方面比肩SOTA。M2.5和M2.7模型性价比优势凸显，输出价格为8.4元/百万Token，仅为Opus、Gemini 3 Pro和GPT5等模型的1/10~1/20。此外，M2.7积极探路“自进化”，模型和Harness有望相互成就，开启Agent“自进化”时代。

5）字节：Seed2.0模型全面升级多模态理解能力，LLM与Agent突破。2026年2月14日，字节跳动发布了基于Seed技术体系迭代的原生全栈多模态通用Agent模型Seed2.0，在视觉推理与感知能力的多项测评中达到SOTA。公司增强模型长尾知识，改善模型在长链路真实世界任务中的表现。模型产品矩阵定位清晰，包含三档通用Agent模型和一款专业Code模型，覆盖全场景需求，成本优势较显著。

6）阶跃星辰：Step 3.5 Flash 平衡速度和可靠性，Openclaw 首周调用量第一。Step 3.5 Flash模型采用 MoE 架构，总参数量为196B，每Token仅选择性激活11B参数，以极低参数达到较强大表现。结合三路多Token预测(MTP-3)技术，其生成吞吐量在日常使用中达100-300tok/s。团队还利用SWA混合架构实现256K长上下文以及低计算开销。结合其他（核心股）工程优化，模型部署成本较低，位列OpenClaw调用量首位。

7）国产多模态：模型迭代加速，商业化进程有望进入爆发期，同时技术探索逐步延伸至世界模型领域。据快手2025年业绩会，视频生成模型方面，可灵（KLing）凭借快速迭代和海外出圈加速用户渗透，驱动ARR强劲增长，2026年1月已超3亿美元；Seedance参考能力强化，核心聚焦多模态输入下的视频生成可控性；Pixverse在生成速度和角色一致性等关键性能上表现突出，C端用户规模破亿；Vidu商业化层面则聚焦B端合作，服务超过1万的企业/开发者用户。

▍海外模型：谷歌引领多模态领域，语言模型SOTA竞争激烈，英伟达链或存在更大弹性。

1）谷歌：Veo 4多模态有望再升级，世界模式Genie 3开放试用。谷歌在多模态内容生成领域持续保持技术领先，Nano Banana 2和Veo 3均取得优秀成绩。下一代模型Veo 4预计将在流畅性、一致性、细节还原度等方面实现显著强化，同时在多模态理解与视频生成时长方面有望取得突破，进一步巩固谷歌前沿地位，持续引领多模态领域。同时，谷歌于2026年1月30日向部分订阅用户开放了由世界模型Genie 3、Nano Banana Pro和Gemini共同驱动的网页应用Project Genie的试用，标志其世界模型技术由实验室（核心股）研发走向实际应用场景验证，有望推动谷歌世界模型技术更进一步。关注5月谷歌I/O大会。

2）Anthropic：ARR指数级增长，或成Agent核心受益者。Anthropic近期陆续发布了Agent Skills、Cowork、Claude in Excel、Claude in PowerPoint等产品，显著降低Agent日常使用门槛，并强化其在办公场景的应用渗透。随着Agent应用场景的拓展，Anthropic有望成为Agent商业化的核心玩家。基于其B端业绩的强劲表现和近期产品的高市场热度，2026年4月Anthropic ARR首次超越OpenAI，达到300亿美元。

3）OpenAI：模型密集迭代，GPT-5.5重返SOTA。OpenAI近期密集迭代GPT-5.3 Codex、GPT-5.4、GPT-5.5，模型维持顶尖水准。GPT-5.4是OpenAI发布的第一个具备原生计算机使用能力的通用模型，擅长通过使用编写代码来操作计算机，并能根据截图发出鼠标和键盘命令。GPT-5.5能力进一步升级，在编程基准测试Terminal-Bench 2.0中，取得82.7%的成绩。此外，模型支持1M Token上下文，支撑智能体完成长周期任务规划、执行与全流程验证。

4）Meta & xAI：模型重整旗鼓，进度略有延后。2026年4月8日，Meta Superintelligence Labs推出Muse Spark首款原生多模态推理模型，支持工具调用、视觉思维链和多智能体编排。预训练栈重构后，达到同等性能所需算力（核心股）比Llama 4 Maverick降低超过一个数量级；此外，图像和视频等视觉内容生成模型Mango也在同步开发中。xAI方面，截至26Q1，Grok-5系列模型尚未发布，预计发布时间略有延后。

▍风险因素：

AI应用落地速度不及预期的风险；云厂商资本支出不及预期的风险；宏观经济恢复进度不及预期的风险；企业核心技术、产品研发进展不及预期的风险；相关产业政策不及预期的风险。

▍投资策略：

随着中美大模型进入新一轮快速迭代期，Agent和多模态能力持续升级，AI商业化落地加速，AI投资价值也在不断显现。同时，在近期AI模型与应用密集催化的推动下，算力（核心股）需求有望保持上行，海外算力链有望重回相对乐观情形。结合当前模型迭代和产业演进节奏，建议重点关注三类投资机遇：1）模型格局尚未稳固，SOTA的争夺可能带来模型公司重估机遇和相关云厂商受益；2）模型商业化和AI应用渗透加速，模型训练和应用布局一体化的公司或能占据优势；3）算力需求上涨带来海外算力链投资机遇，北美算力叙事逐步回归乐观。

股票频道更多独家策划、专家专栏，免费查阅>>