1、DeepSeek“鲇鱼效应”下企业端积极接入,央企开启“AI+”专项行动
2月8日,工信部发文力推最新AI技术普惠应用,三家基础电信企业均全面接入DeepSeek开源大模型,实现在多场景、多产品中应用,针对热门的DeepSeek-R1模型提供专属算力方案和配套环境,助力国产大模型性能释放。
2月19日,国务院国资委召开中央企业“AI+”专项行动深化部署会,强调国资央企要抓住人工智能产业发展的战略窗口期,强化科技创新,聚焦关键领域加快掌握“根技术”,坚定攻关大模型,积极参与开放生态建设,推动产生更多“从0到1”的原始创新,加速推进成果转化和产业化发展。
在DeepSeek引发的“鲶鱼效应”下,AI热潮持续升温。从云计算平台到芯片厂商,从软件企业到互联网巨头,再到运营商等各个领域,纷纷宣布接入DeepSeek。2月13日,腾讯元宝迎来更新,同时支持满血版DeepSeek大模型;2月15日,微信搜一搜在调用混元大模型丰富AI搜索的同时,正式灰度测试接入DeepSeek。用户可通过微信对话框顶部搜索入口进入“AI搜索”功能,免费使用DeepSeek-R1满血版模型。
已接入DeepSeek厂商统计(部分)
中国电信:中国电信天翼云全场景上架DeepSeek,为用户提供了更便捷、更高效的智能服务。
中国联通: 中国联通联通云已基于“星罗”平台实现国产及主流算力适配多规格DeepSeek-R1模型,兼顾私有化和公有化场景,实现多产品场景调用。
中国移动: 中国移动移动云宣布全面上线DeepSeek,实现全版本覆盖、全尺寸适配、全功能畅用。用户可选择任一智算资源池进行部署、蒸馏、智能体编排等操作。
华为云: 昇腾社区正式上线包括DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro等系列新模型,支持昇腾硬件平台上开箱即用,推理快速部署,带来更快、更高效、更便捷的AI开发和应用体验。
腾讯云 :宣布DeepSeek-R1大模型一键部署至腾讯云HAI上,开发者仅需3分钟即可接入调用。
阿里云 :宣布其PAlModelGallery支持云上一键部署DeepSeek-V3和DeepSeek-R1模型,用户可以在该平台上零代码实现从训练到部署再到推理的全过程。
火山引擎 :宣布全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型。
百度智能云 :千帆平台已正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案以及限时免费服务。
云轴科技ZStack: 宣布其Allnfra平台ZStack智塔全面支持企业私有化部署DeepSeekV3/R1/JanusPro三种模型。
联想集团: 与沐曦股份联合发布基于DeepSeek大模型的一体机解决方案,联想个人智能体“小天”已接入DeepSeek.
安恒信息 :宣布旗下恒脑·安全垂域大模型集成DeepSeek,发布了首个“DeepSeek版”安全智能体。
奇安信: 宣布其安全智能体已接入DeepSeek平台,通过DeepSeek的优化和蒸馏技术,大幅降低了运营成本,提升了模型在处理威胁检测和响应速度上的性能。
360: 宣布在DeepSeek基于MIT开源协议的生态环境下,公司旗下的部分产品进行了DeepSeek的接入与本地化部署。
天融信 :宣布天问大模型正式完成DeepSeek大模型的接入,赋能安全事件检测分析、威胁情报融合等多个场景。
万兴科技: 宣布已完成推理大模型DeepSeek-R1的适配,并落地融合相关能力于万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等产品。
当虹科技:宣布其BlackEye多模态视听大模型完成DeepSeek深度融合,并完成视听传媒、工业与卫星、车载智能座舱等多行业垂类场景的数据调优训练。
2、DS通过架构创新等技术提升推理效率,大幅提升低成本本地模型能力
DeepSeek-V3采用混合专家架构(MoE),包含256个专家模块,每个词元仅激活37B参数,动态选择最相关的专家处理任务,既降低计算资源消耗,又保持了千亿级参数模型的性能。结合多头潜在注意力(MLA)技术,通过低秩压缩机制减少键值缓存需求,显存占用降低30%-50%,推理效率提升3倍。这种架构设计在数学、代码生成等任务中表现尤为突出。
DeepSeek-R1在后训练阶段大规模使用了RL(强化学习),在仅有极少标注数据的情况下,极大提升了模型推理能力,降低推理开销。模型表现方面,它在数学、代码、自然语言推理等任务上,性能平齐OpenAI o1正式版。
通过蒸馏DeepSeek-R1生成的800K样本,小规模模型(1.5B~70B)在推理任务中表现显著。同时,蒸馏小模型对硬件要求大幅降低,有望推动私有化部署加速落地。从硬件部署来看,70B的小模型不考虑并发情况下,本地仅需两张RTX4090。
3、私有化部署再添利好:GROK 3免费开放,成熟后立即开源前代模型
2月18日,埃隆·马斯克旗下的人工智能初创公司xAI发布最新版Grok 3聊天机器人。根据xAI官方公布的测试结果,Grok 3测试版的推理能力超过了现有的AI模型。在有关推理和测试时间的基准测试中,Grok 3取得了比DeepSeek-R1、OpenAI o1、OpenAI o3mini- high、Gemini-2 Flash Thinking更优的效果。
根据xAI的比较基准显示,Grok 3在科学、编码和数学方面的得分高于Gemini 2 Pro、Deepseek V3、ChatGPT 4o等。并且,在盲测方面,xAI的Grok-3(早期版本) 在 lmArena 排行榜中以1402 分的历史最高成绩登顶,成为首个突破1400分的AI模型。这一成绩超越了Google、OpenAI、DeepSeek等业界主要竞品。
目前,Grok 3已开放免费使用(直至服务器崩溃),且在Grok 3成熟后将会把上一代Grok 2开源,利好私有化部署。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。