模型:DeepSeek-R1开启国产大模型新叙事
2025年1月20日,DeepSeek正式发布DeepSeek-R1模型,并同步开源。该模型在后训练阶段大规模使用了强化学习技术,在数学、代码、自然语言推理等任务上,性能比肩OpenAI的o1正式版。API定价方面,DeepSeek-R1 API 服务定价约是OpenAI-o1对应定价的1.8%/3.6%和3.7%。DeepSeek-R1发布后,DAU快速上升,成为行业现象级产品。2025年2月8日,QuestMobile数据显示,DeepSeek在1月28日的DAU(日活跃用户数)首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。
技术路径上,传统大模型训练依赖监督微调(如人工标注数据),而DeepSeek R1-zero 是完全依赖强化学习(RL)训练的大语言模型,能够在无监督环境下通过自我反思和环境交互优化策略,提升了模型的推理性能,证明了模型仅通过 RL 就能够实现有效学习和泛化的能力。例如,当AIME 基准测试采用多数表决时,DeepSeek-R1-Zero 的性能从 71.0% 上升到 86.7%,超过了 OpenAI-o1-0912 的性能。
DeepSeek-R1发布之后,国内外模型性价比成为竞争焦点,模型平权逻辑加强。
(1)阿里:2025年4月29日发布通义千问3大模型,千问3在性能大幅提升的同时,部署成本大幅下降,显存占用仅为性能相近模型的三分之一。
(2)字节:2025年6月11日推出豆包大模型1.6,首创按“输入长度”区间定价模式,综合价格比DeepSeek-R1降低63%。
(3)MiniMax:2025年6月17日推出开源推理大模型M1,实现业内最长上下文长度,API定价为行业最低。从2025年各厂商新发布大模型情况来看,AI普惠化趋势成为共识,也为应用的落地与繁荣提供了先决条件。
算力:国内资本开支上行,国产算力景气度获得先验
2024年及2025Q1AI算力板块营收与归母净利润增速显著高于行业整体水平。
收入端:2024年计算机行业AI算力板块A股标的总营收达4494.21亿元,同比增长14.57%,近三年板块营收呈现明显修复状态;2025Q1单季总营收达1260.33亿元,同比增长41.87%,单季度实现较高增长。
利润端:近5年来,AI算力板块A股标的归母净利合计值基本呈现稳定增长态势。2024年AI算力归母净利合计值达96.04亿元,同比增长13.26%;2025Q1单季归母净利合计值达24.33亿元,同比增长43.05%,单季度利润端增速略高于营收端。
我国智能算力规模将呈现快速增长态势。据IDC预测,2025年中国智能算力规模将达到1,037.3EFLOPS,并在2028年达到 2,781.9EFLOPS,2023-2028年中国智能算力规模的五年年复合增长率为46.2%。模型推理效率提升带来的潜在算力需求仍然是智算基础设施扩张的主要驱动因素。
当前,外部科技封锁趋严,倒逼国内集中力量攻克“卡脖子”领域,我国科技自立自强具备紧迫性。高端芯片方面,国产AI芯片替代加速,华为、寒武纪、海光信息等国内算力厂商已取得突破性进展,为国产算力替代加速提供先决条件。2024全年、2025Q1,寒武纪营收分别增长65.56%/4230.22%;海光信息2025Q1合同负债高达32.37亿元(2024全年及2024Q1合同负债仅为9.03亿元和0.03亿元),国产算力下游高需求已在报表端初
我国智能算力规模将呈现快速增长态势。据IDC预测,2025年中国智能算力规模将达到1,037.3EFLOPS,并在2028年达到 2,781.9EFLOPS,2023-2028年中国智能算力规模的五年年复合增长率为46.2%。模型推理效率提升带来的潜在算力需求仍然是智算基础设施扩张的主要驱动因素。
当前,外部科技封锁趋严,倒逼国内集中力量攻克“卡脖子”领域,我国科技自立自强具备紧迫性。高端芯片方面,国产AI芯片替代加速,华为、寒武纪、海光信息等国内算力厂商已取得突破性进展,为国产算力替代加速提供先决条件。2024全年、2025Q1,寒武纪营收分别增长65.56%/4230.22%;海光信息2025Q1合同负债高达32.37亿元(2024全年及2024Q1合同负债仅为9.03亿元和0.03亿元),国产算力下游高需求已在报表端初
算力:算力租赁与云计算开启新增长
国内训推需求快速增长、智算算力资源紧张共同支撑了算力租赁和云计算的繁荣。
政策支持与企业对成本效益的追求成为算力租赁的主要拉动因素。近年来,各地方政府通过发放“算力券”等方式鼓励企业使用算力。深圳、上海、北京等地多地出台算力券政策,单个企业年度补贴最高达5000万元。据中研普华研究院预测,到2026年,国内算力租赁潜在收入市场规模有望达到2600亿元,年增速超20%。
今年以来算力租赁公司持续公告重大合同订单。我们认为,算力资源趋紧情况下,大厂资本开支或向算力租赁倾斜。
ChatGPT发布以来,生成式AI推动云市场大幅增长。据Synergy Research Group数据,2024 年全球云市场规模达到3300亿美元,较2023年增长600亿美元,较2022年增长1020亿美元。过去两年中,生成式 AI 推动了市场增长的一半。我们认为,驱动企业转向云端的主要原因包括对弹性扩展能力、灵活部署方式以及对AI等先进技术的支持需求不断增加。中国云计算市场起步较晚,但增长较快,据中国信通院预计,到2027年,我国云计算市场规模将超过2.1万亿元。与全球趋势相同,生成式AI带来的云计算技术革新、国产大模型及应用的规模化落地将推动我国云计算产业开启下一轮增长。
从过程交付转向结果交付,Agent加速落地
AI Agent或接力Chat bot,成为下一阶段主流AI产品形态。根据Lilian Weng在《LLM Powered Autonomous Agents》中对Agent的定义,Agent具备Memory(记忆存储),能够自主规划并调用工具执行任务。执行是下一阶段AI能力的重点,相较于当前主流的Chat bot这一产品形态来说,Agent能够直接交付结果,将大大延展AI在生产力工具范畴的能力边界。
从AI的最终形态来看,AI能够在识别、理解、推理的基础上参与决策并执行操作是发展AGI的必经之路。据Root analysis,预计全球AI Agent市场规模将从2024年的52.9亿美元增长到2035年的2,168亿美元。
软件行业正站在一个关键的转型节点上。AI正在深度构建软件业的商业模式,驱动IT服务从交付软件到交付结果。与此同时,客户的IT支出将从费用项转为生产力成本项。以AI Agent为代表的新兴技术正在催生一种全新的结果交付范式——将关注点从"如何构建"转向"交付什么价值",从"遵循流程"转向"实现目标"。
传统的过程交付模式,即按照预先定义的流程、里程碑和文档要求逐步完成软件开发并交付给客户的方式,日益暴露出其僵化、低效和与业务价值脱节的弊端。
结果交付是一种以业务成果和价值实现为核心的软件交付理念,强调交付物必须能够产生可衡量的业务影响,而非仅仅完成合同规定的技术任务。这种模式下,服务提供方的报酬和成功标准与实际产生的业务价值挂钩,而非投入的工作量或时间。在目标上,前者关注完成开发任务,后者关注解决业务问题;在成功标准上,前者是按时按预算交付,后者是达成预定的绩效指标。
Agent:当下“结果交付”的更好载体
从Chatbot到Agent,经历了约三个代际的AI产品形态演变。
第一代(Chatbot)
定位:聊天程序
任务完成度:用户输入问题,产品输出答复/解决方案,具体执行需要用户完成。
代表产品:Chatgpt
第二代(Composer)
定位:编程实习生
任务完成度:用户输入问题,产品生成解决问题的代码,并且自动填入代码编辑器的编译区,需用户审核、进一步编写和执行。
代表产品:Cursor,Copilot
第三代(Agent)
定位:个人秘书
任务完成度:用户输入问题,产品生成完整的的解决方案,可调用工具、数据库等自动执行任务,用户需选择执行方案或决定是否终止执行。
代表产品:Manus
在演变的过程中,用户与AI的交互更为深入,任务结果交付更为完整。在当下,Agent是“过程交付”转向“结果交付”的更好载体。展望未来,AI产品的演进将更多地强化“生产力”属性,而非纯粹的“工具”属性。对企业来说,劳动力运营支出正在被GPU资本支出取代。
MCP:AI应用的USB-C接口
MCP协议是由Anthropic于2024年11月推出的开放协议,可类比为“AI应用程序的USB-C接口”——正如USB-C通过统一物理接口连接各类外设,MCP为AI模型与多样化数据源及工具建立了通用交互标准。在MCP出现之前,AI应用依赖手动API布线、插件接口或代理框架等碎片化方式与外部工具交互,这种模式要求为每个服务开发专用集成,不仅导致系统复杂性激增,还严重限制了可扩展性。MCP出现后,开发者无需重复编写适配代码即可构建复杂工作流和Agents,有效解决了传统AI面临的“数据孤岛”和“工具碎片化”的难题,更通过开放协议催生了跨平台协作生态,使得开发者能聚焦业务逻辑而非底层适配,加速了AI应用的规模化落地。
大厂入局,MCP生态持续繁荣。(1)海外:OpenAl、谷歌、微软和亚马逊等海外大厂陆续宣布支持或集成MCP协议。(2)国内:阿里云百炼平台、腾讯云、百度千帆大模型平台等官宣支持MCP协议。
通用Agent、垂类Agent走向多智能体协同时代
通用Agent:通用Agent具备跨领域适应性,定位为“全能助手”。例如,由Monica团队推出的首个通用AI Agent——Manus,能够操作电脑,做出决策并执行任务。其核心能力包括:自主任务执行、网页浏览和研究、代码开发、数据分析、内容创作和任务回放。从任务执行过程来看,Agent拆解任务需先浏览网页、解析文档、音频及视频等多源数据,分步推理,每一步推理是下一步的开始。相比于Chatbot,AI Agent的推理复杂程度和推理时长都有所增加。
垂类Agent:垂类Agent专注特定场景或领域,强调专业知识,定位为“行业专家”。例如,飞猪于今年劳动节假期前夕推出多智能体驱动的旅行AI——“问一问”,能够思考用户需求,提供定制化的旅行规划和预订服务。用户可以通过自然语言交互提出需求,“问一问”在“路线定制师”、“酒店顾问”等多个智能体的协作下,为用户提供行程规划、交通规划、酒店推荐、生成行程图等服务,并可以一键直达出行和住宿预订界面。
多智能体协同:多智能体协同对复杂任务处理具有高度适应性,智能体之间通过共享“记忆”减少误解,提高任务处理效率。下一阶段,MAaaS(多智能体即服务)有望成为Agent服务的主流形态。
海外AI应用业绩持续兑现,多应用场景并行
2025Q1,部分美股AI应用公司业绩持续兑现,关注垂类AI应用落地情况。部分AI驱动业绩增长的美股公司如下:(1)AppLovin(AI+广告营销):25Q1实现营收15亿美元(同比+40%),实现净利润5.76亿美元(同比+144.5% );在AI广告推荐引擎AXON的推动下,广告收入成为公司增长的主要驱动力。(2)Duolingo(AI+教育):25Q1实现营收2.31亿美元(同比+38%),订阅业务收入达到1.91亿美元(同比+45%),由GPT-4赋能的Duolingo Max订阅层级订阅量增长。(3)Palantir(AI+数据分析):人工智能平台(AIP)实现AI在政府和企业数据中的应用,25Q1实现营收8.84亿美元(同比+39%)。(4)Tempus AI(AI+医疗):将多模态模型与垂类数据结合,实现营收2.56亿美元(同比+75%)。
国内方面,DeepSeek-R1迅速推高了AI应用的热度。截止2025年2月,国内AI原生APP月活用户规模接近翻倍,为AI应用的持续推广积累了潜在的用户基础。我们认为,随着AI应用从过程交付转向结果交付,AI应用作为效率工具的角色定位将更为突出,企业IT支出将从成本项定义转向为生产力付费,用户付费驱动力增强。
从竞争力角度看,数据+模型+算力将成为AI应用交付能力的主要考量要素,考虑到底层AI技术平权,计算效率的提升将成为整个AI应用产业的主要驱动力量之一,而垂类数据或将成为AI应用公司提高市场份额的先发优势和核心壁垒。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。