DeepSeek大幅提升本地模型能力，AI私有云浪潮有望开启 - 产业科技 - 行业新闻

DeepSeek大幅提升本地模型能力，AI私有云浪潮有望开启
思瀚产业研究院 2025-02-24

1、DeepSeek“鲇鱼效应”下企业端积极接入，央企开启“AI+”专项行动

2月8日，工信部发文力推最新AI技术普惠应用，三家基础电信企业均全面接入DeepSeek开源大模型，实现在多场景、多产品中应用，针对热门的DeepSeek-R1模型提供专属算力方案和配套环境，助力国产大模型性能释放。

2月19日，国务院国资委召开中央企业“AI+”专项行动深化部署会，强调国资央企要抓住人工智能产业发展的战略窗口期，强化科技创新，聚焦关键领域加快掌握“根技术”，坚定攻关大模型，积极参与开放生态建设，推动产生更多“从0到1”的原始创新，加速推进成果转化和产业化发展。

在DeepSeek引发的“鲶鱼效应”下，AI热潮持续升温。从云计算平台到芯片厂商，从软件企业到互联网巨头，再到运营商等各个领域，纷纷宣布接入DeepSeek。2月13日，腾讯元宝迎来更新，同时支持满血版DeepSeek大模型；2月15日，微信搜一搜在调用混元大模型丰富AI搜索的同时，正式灰度测试接入DeepSeek。用户可通过微信对话框顶部搜索入口进入“AI搜索”功能，免费使用DeepSeek-R1满血版模型。

已接入DeepSeek厂商统计（部分）

中国电信：中国电信天翼云全场景上架DeepSeek，为用户提供了更便捷、更高效的智能服务。

中国联通： 中国联通联通云已基于“星罗”平台实现国产及主流算力适配多规格DeepSeek-R1模型，兼顾私有化和公有化场景，实现多产品场景调用。

中国移动： 中国移动移动云宣布全面上线DeepSeek，实现全版本覆盖、全尺寸适配、全功能畅用。用户可选择任一智算资源池进行部署、蒸馏、智能体编排等操作。

华为云： 昇腾社区正式上线包括DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro等系列新模型，支持昇腾硬件平台上开箱即用，推理快速部署，带来更快、更高效、更便捷的AI开发和应用体验。

腾讯云 ：宣布DeepSeek-R1大模型一键部署至腾讯云HAI上，开发者仅需3分钟即可接入调用。

阿里云 ：宣布其PAlModelGallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型，用户可以在该平台上零代码实现从训练到部署再到推理的全过程。

火山引擎 ：宣布全面支持DeepSeek系列大模型，包括V3和R1等不同尺寸的模型。

百度智能云 ：千帆平台已正式上架DeepSeek-R1和DeepSeek-V3模型，并推出超低价格方案以及限时免费服务。

云轴科技ZStack：宣布其Allnfra平台ZStack智塔全面支持企业私有化部署DeepSeekV3/R1/JanusPro三种模型。

联想集团：与沐曦股份联合发布基于DeepSeek大模型的一体机解决方案，联想个人智能体“小天”已接入DeepSeek.

安恒信息 ：宣布旗下恒脑·安全垂域大模型集成DeepSeek，发布了首个“DeepSeek版”安全智能体。

奇安信：宣布其安全智能体已接入DeepSeek平台，通过DeepSeek的优化和蒸馏技术，大幅降低了运营成本，提升了模型在处理威胁检测和响应速度上的性能。

360：宣布在DeepSeek基于MIT开源协议的生态环境下，公司旗下的部分产品进行了DeepSeek的接入与本地化部署。

天融信 ：宣布天问大模型正式完成DeepSeek大模型的接入，赋能安全事件检测分析、威胁情报融合等多个场景。

万兴科技：宣布已完成推理大模型DeepSeek-R1的适配，并落地融合相关能力于万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等产品。

当虹科技：宣布其BlackEye多模态视听大模型完成DeepSeek深度融合，并完成视听传媒、工业与卫星、车载智能座舱等多行业垂类场景的数据调优训练。

2、DS通过架构创新等技术提升推理效率，大幅提升低成本本地模型能力

DeepSeek-V3采用混合专家架构（MoE），包含256个专家模块，每个词元仅激活37B参数，动态选择最相关的专家处理任务，既降低计算资源消耗，又保持了千亿级参数模型的性能。结合多头潜在注意力（MLA）技术，通过低秩压缩机制减少键值缓存需求，显存占用降低30%-50%，推理效率提升3倍。这种架构设计在数学、代码生成等任务中表现尤为突出。

DeepSeek-R1在后训练阶段大规模使用了RL（强化学习），在仅有极少标注数据的情况下，极大提升了模型推理能力，降低推理开销。模型表现方面，它在数学、代码、自然语言推理等任务上，性能平齐OpenAI o1正式版。

通过蒸馏DeepSeek-R1生成的800K样本，小规模模型（1.5B~70B）在推理任务中表现显著。同时，蒸馏小模型对硬件要求大幅降低，有望推动私有化部署加速落地。从硬件部署来看，70B的小模型不考虑并发情况下，本地仅需两张RTX4090。

3、私有化部署再添利好：GROK 3免费开放，成熟后立即开源前代模型

2月18日，埃隆·马斯克旗下的人工智能初创公司xAI发布最新版Grok 3聊天机器人。根据xAI官方公布的测试结果，Grok 3测试版的推理能力超过了现有的AI模型。在有关推理和测试时间的基准测试中，Grok 3取得了比DeepSeek-R1、OpenAI o1、OpenAI o3mini- high、Gemini-2 Flash Thinking更优的效果。

根据xAI的比较基准显示，Grok 3在科学、编码和数学方面的得分高于Gemini 2 Pro、Deepseek V3、ChatGPT 4o等。并且，在盲测方面，xAI的Grok-3（早期版本）在 lmArena 排行榜中以1402 分的历史最高成绩登顶，成为首个突破1400分的AI模型。这一成绩超越了Google、OpenAI、DeepSeek等业界主要竞品。

目前，Grok 3已开放免费使用（直至服务器崩溃），且在Grok 3成熟后将会把上一代Grok 2开源，利好私有化部署。

更多行业研究分析请参考思瀚产业研究院官网，同时思瀚产业研究院亦提供行研报告、可研报告（立项审批备案、银行贷款、投资决策、集团上会）、产业规划、园区规划、商业计划书（股权融资、招商合资、内部决策）、专项调研、建筑设计、境外投资报告等相关咨询服务方案。

免责声明：
1.本站部分文章为转载，其目的在于传播更多信息，我们不对其准确性、完整性、及时性、有效性和适用性等任何的陈述和保证。本文仅代表作者本人观点，并不代表本网赞同其观点和对其真实性负责。
2.思瀚研究院一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及文章内容、版权等问题，我们将及时沟通与处理。