根据 DeepSeek 官方公众号,2025 年 8 月 21 日深度求索正式发布DeepSeek-V3.1。DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度,而UE8M0 FP8 是 针 对 即 将 发 布 的 下 一 代 国 产 芯 片 设 计 。 UE8M0 FP8 是DeepSeek-V3.1 大模型采用的 8 位浮点数参数精度配置,V3.1-Think 在输出token 数减少 20%-50%的情况下,各项任务的平均表现与 R1-0528 持平。
软硬协同大趋势下国产 AI 生态有望持续完善,国内 AI 产业发展有望迎来拐点。
第一,软件端,国内大模型能力不断提升,部分国内头部大模型已经达到全球顶尖水平。根据 SuperCLUE 总排行榜(2025 年 7 月),国内的豆包、DeepSeek、通义千问等模型,已经位于全球模型的前列。因此,在软件端,国内大模型已经具有建设相关生态的重要基础。
第二,硬件端,目前国内已经有多家厂商支持 FP8。未来预计在国产 AI 算力发展的大趋势下,会有更多国产 AI 算力芯片支持 FP8,进而加速国内 AI 产业的发展。
第三,参考英伟达 CUDA 生态对于全球 AI 发展的重要性,国内 AI 产业也需要自主可控的软硬件底座,而软硬生态的协同则在其中扮演至关重要的角色。CUDA 是英伟达公司开发的一种并行计算平台和编程模型,它允许开发者使用C/C++、Fortran 等编程语言来利用 GPU 的并行计算能力,已经成为了一种广泛应用于科学计算、数据分析、机器学习等领域的计算平台。在 AI 的训练和推理环节中,CUDA 作为连接大模型与 AI 芯片的平台,发挥着重要作用。
国内对于 AI 生态的建设正在不断加速:
1)8 月 5 日,在昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为昇腾硬件使能 CANN 全面开源开放,Mind 系列应用使能套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用。
2)此次 DeepSeek-V3.1使用了 UE8M0 FP8 Scale 的参数精度并针对下一代国产芯片进行设计,是国内 AI产业发展的又一重要突破,头部大模型与国产芯片生态的融合,加速了国内 AI 生态的建设,进而有望加速国产大模型的训练和推理,为整个 AI 产业实现跨越式发展奠定了重要基础。
大国科技博弈下,国产 AI 算力发展大势所趋。
1)科技媒体《the Information》援引知情人士消息称,英伟达公司已指示包括韩国三星电子、美国安靠科技等关键零部件供应商暂停与 H20 芯片相关的生产。目前,这一消息已得到路透社、彭博社、CNBC 等知名媒体的转载。针对有关消息,英伟达在一份声明中表示:“我们不断管理我们的供应链以应对市场状况。”但拒绝进一步详细说明。
2)8 月 22 日外交部例行记者会。会上有外媒记者就 H20 相关情况进行提问,外交部发言人毛宁对此表示:相关问题建议向相关的主管部门了解,作为原则,我们一贯认为各方各国都应当共同维护全球产供链的稳定畅通。在大国科技博弈的大趋势下,国产 AI 算力发展大势所趋,国产 AI算力龙头业绩持续高增,也说明算力领域的国产化正在加速推进。