中美大模型26Q2展望:Scaling延续,Agent与多模态能力或成最大看点

券商研报精选 2026-05-01 13:18:00
10秒看完全文要点
看要点

2026Q1中美大模型迎来密集迭代,模型能力进展加速。Coding和Agent领域成为主战场,Anthropic持续斩获SOTA溢价,或为最大赢家;国产模型则依托性价比优势持续扩大Token份额,形成差异化竞争。展望26Q2,5~6月有望成为下一轮模型密集迭代窗口期,Long Horizon Agent和多模态料将成为新的Scaling方向,谷歌Veo 4、GPT-6、Minimax M3、Kimi K3等模型值得重点关注。我们建议聚焦三条主线:1)头部模型公司及相关云厂商:下游需求爆发带来Token指数级增长以及量价齐升机遇;2)模型和应用一体化的公司:在AI应用渗透加速的背景下,更易形成“模型研发-算力(核心股投入-商业变现”的闭环;3)算力产业链标的:模型迭代支撑算力需求景气,海外算力叙事或重回乐观。

26Q1复盘:模型能力进展加速,Token定位与定价逻辑显著分化。

一方面,海外高端模型以能力优势享受SOTA溢价。Anthropic凭借在Coding的深度布局,或为本阶段最大赢家;Gemini 3.1、GPT 5.5则分别在多模态和综合能力上建立差异化优势。另一方面,国内模型则以高性价比实现错位竞争,GLM-5.1领跑开源模型,DeepSeek V4、Qwen 3.6 plus、Minimax M2.7、MiMo-V2、Kimi K2.6、Seed 2.0等多款产品已跻身全球第一梯队;此外HappyHorse等AI视频生成模型亦有突破。我们预计本轮技术迭代后,中美模型整体差距仍维持在6个月左右。

▍26Q2展望:Test Time Scaling方向延续,5~6月为下一轮技术迭代窗口。

技术层面,Long Horizon有望延续Test Time Scaling Law,进一步打开模型智能上限。GLM 5.1已可完成连续8小时长程任务,Minimax M2.7亦开启自我进化探索;据罗福莉在中关村论坛的分享,模型连续工作时长有望从当前1~2天演进至3~4天,最终迈向自主进化。多模态方向同步推进,Google、Minimax等加快布局,多模态数据的融入,叠加多模态理解对生成的协同效应有望系统性提升模型综合能力。时间节点上,5~6月为下一轮技术迭代窗口,其中5月20日谷歌I/O大会为关键观察点,Veo 4、GPT-6、Minimax M3、Kimi K3等模型值得重点跟踪。此外,Agent在办公等生产力场景的最新进展,亦是后续重要的观察维度。

▍国产模型:技术创新推动Agent能力突破,持续追赶海外前沿;多模态经过多次迭代后应用生态逐步成熟,用户渗透加速,商业化有望迎来爆发。

1)DeepSeek:开源模型长期引领者,V4通过多项技术创新实现Agent能力突破与成本优化。模型性能方面,首创mHC残差优化技术,能有效增强深层训练稳定性,提高长序推理表现,为更大规模模型奠定基础,V4参数量已达到1.6T,并支持1M上下文。推理成本方面,CSA+HCA等工程优化显著减少显存占用,实现“低成本、高性能”,限时优惠输出价格为6元/百万Token,为同级别模型价格最优;适配华为昇腾950PR等国产算力(核心股,有利于缓解算力制约、降低推理成本。

2)Kimi:引入Agent集群架构,K2.6成为全球开源SOTA。月之暗面以长文本技术突破起家,已发展为国产大模型竞争的关键力量。Kimi K2.5实现重要演进:架构层面,创新Agent集群架构,通过调度多个Agent进行团队协作,大幅提升复杂任务处理效率;交互层面,突破了文字表达局限,延伸至图像等视觉内容理解;应用层面,掌握常用办公软件,表现出准专业水平的任务交付能力。Kimi K2.6能力继续迭代升级,成为开源SOTA,token调用量迅速攀升至OpenRouter平台首位,反映出强劲的技术竞争力和用户认可度。

3)智谱:GLM-5.1领跑能力领先,Agent能力成为核心亮点。2026年2月11日和4月8日,智谱发布先后发布新一代旗舰模型GLM-5和GLM-5.1,聚焦Coding与Agent能力,在开源阵营中达到第一梯队,在核心工程能力上对齐甚至超越Claude Opus 4.6。GLM-5模型规模进一步扩张,总参数量提升至744B(激活参数40B),较上一代GLM-4.7的355B(激活参数32B)实现翻倍增长;预训练数据规模由23T提升至28.5T,在Scaling Law指引下带动性能持续跃升。后训练阶段,公司自研“Slime”异步强化学习框架,强化长链路任务处理能力,使模型在Agent场景中形成显著优势。

4)Minimax:性价比优势凸显,M2.7开启自我进化。2026年2月12日和3月18日,MiniMax先后发布了新一代模型MiniMax M2.5和M2.7。在编程能力、工具调用和搜索等方面比肩SOTA。M2.5和M2.7模型性价比优势凸显,输出价格为8.4元/百万Token,仅为Opus、Gemini 3 Pro和GPT5等模型的1/10~1/20。此外,M2.7积极探路“自进化”,模型和Harness有望相互成就,开启Agent“自进化”时代。

5)字节:Seed2.0模型全面升级多模态理解能力,LLM与Agent突破。2026年2月14日,字节跳动发布了基于Seed技术体系迭代的原生全栈多模态通用Agent模型Seed2.0,在视觉推理与感知能力的多项测评中达到SOTA。公司增强模型长尾知识,改善模型在长链路真实世界任务中的表现。模型产品矩阵定位清晰,包含三档通用Agent模型和一款专业Code模型,覆盖全场景需求,成本优势较显著。

6)阶跃星辰:Step 3.5 Flash 平衡速度和可靠性,Openclaw 首周调用量第一。Step 3.5 Flash模型采用 MoE 架构,总参数量为196B,每Token仅选择性激活11B参数,以极低参数达到较强大表现。结合三路多Token预测(MTP-3)技术,其生成吞吐量在日常使用中达100-300tok/s。团队还利用SWA混合架构实现256K长上下文以及低计算开销。结合其他(核心股工程优化,模型部署成本较低,位列OpenClaw调用量首位。

7)国产多模态:模型迭代加速,商业化进程有望进入爆发期,同时技术探索逐步延伸至世界模型领域。据快手2025年业绩会,视频生成模型方面,可灵(KLing)凭借快速迭代和海外出圈加速用户渗透,驱动ARR强劲增长,2026年1月已超3亿美元;Seedance参考能力强化,核心聚焦多模态输入下的视频生成可控性;Pixverse在生成速度和角色一致性等关键性能上表现突出,C端用户规模破亿;Vidu商业化层面则聚焦B端合作,服务超过1万的企业/开发者用户。

▍海外模型:谷歌引领多模态领域,语言模型SOTA竞争激烈,英伟达链或存在更大弹性。

1)谷歌:Veo 4多模态有望再升级,世界模式Genie 3开放试用。谷歌在多模态内容生成领域持续保持技术领先,Nano Banana 2和Veo 3均取得优秀成绩。下一代模型Veo 4预计将在流畅性、一致性、细节还原度等方面实现显著强化,同时在多模态理解与视频生成时长方面有望取得突破,进一步巩固谷歌前沿地位,持续引领多模态领域。同时,谷歌于2026年1月30日向部分订阅用户开放了由世界模型Genie 3、Nano Banana Pro和Gemini共同驱动的网页应用Project Genie的试用,标志其世界模型技术由实验室(核心股研发走向实际应用场景验证,有望推动谷歌世界模型技术更进一步。关注5月谷歌I/O大会。

2)Anthropic:ARR指数级增长,或成Agent核心受益者。Anthropic近期陆续发布了Agent Skills、Cowork、Claude in Excel、Claude in PowerPoint等产品,显著降低Agent日常使用门槛,并强化其在办公场景的应用渗透。随着Agent应用场景的拓展,Anthropic有望成为Agent商业化的核心玩家。基于其B端业绩的强劲表现和近期产品的高市场热度,2026年4月Anthropic ARR首次超越OpenAI,达到300亿美元。

3)OpenAI:模型密集迭代,GPT-5.5重返SOTA。OpenAI近期密集迭代GPT-5.3 Codex、GPT-5.4、GPT-5.5,模型维持顶尖水准。GPT-5.4是OpenAI发布的第一个具备原生计算机使用能力的通用模型,擅长通过使用编写代码来操作计算机,并能根据截图发出鼠标和键盘命令。GPT-5.5能力进一步升级,在编程基准测试Terminal-Bench 2.0中,取得82.7%的成绩。此外,模型支持1M Token上下文,支撑智能体完成长周期任务规划、执行与全流程验证。

4)Meta & xAI:模型重整旗鼓,进度略有延后。2026年4月8日,Meta Superintelligence Labs推出Muse Spark首款原生多模态推理模型,支持工具调用、视觉思维链和多智能体编排。预训练栈重构后,达到同等性能所需算力(核心股比Llama 4 Maverick降低超过一个数量级;此外,图像和视频等视觉内容生成模型Mango也在同步开发中。xAI方面,截至26Q1,Grok-5系列模型尚未发布,预计发布时间略有延后。

▍风险因素:

AI应用落地速度不及预期的风险;云厂商资本支出不及预期的风险;宏观经济恢复进度不及预期的风险;企业核心技术、产品研发进展不及预期的风险;相关产业政策不及预期的风险。

▍投资策略:

随着中美大模型进入新一轮快速迭代期,Agent和多模态能力持续升级,AI商业化落地加速,AI投资价值也在不断显现。同时,在近期AI模型与应用密集催化的推动下,算力(核心股需求有望保持上行,海外算力链有望重回相对乐观情形。结合当前模型迭代和产业演进节奏,建议重点关注三类投资机遇:1)模型格局尚未稳固,SOTA的争夺可能带来模型公司重估机遇和相关云厂商受益;2)模型商业化和AI应用渗透加速,模型训练和应用布局一体化的公司或能占据优势;3)算力需求上涨带来海外算力链投资机遇,北美算力叙事逐步回归乐观。

股票频道更多独家策划、专家专栏,免费查阅>>

金融界提醒:本文内容、数据与工具不构成任何投资建议,仅供参考,不具备任何指导作用。股市有风险,投资需谨慎!
全部评论
谈谈您的想法...
AI解读分析
打开App
推荐 要闻 7x24 理财 财 经 导航