本项目建设目标是研发沐曦集成电路(上海)股份有限公司曦云 C 系列训推一体芯片的第二代和第三代产品,包括 C600 和 C700 两个子项目。其中,C600 是基于国产先进工艺开发的通用 GPU 芯片,拥有较高性能;C700 是基于国产先进工艺开发的下一代通用 GPU芯片,拥有更高的性能。
两款产品均依托于公司自主创新的核心 GPU IP 及MXMACA 软件栈,可提供混合精度算力支持,并搭载超高带宽显存,深度融合计算密度与互连系统优化技术,支持从单卡到超大规模集群的全场景加速需求,是针对 AI 训练、推理及通用计算的高效解决方案。
本项目计划通过购置研发所需设备及软件、投入研发人力资源、流片及测试验证等方式,进一步完善高性能 GPU 架构、高集成度高能效 SoC 设计、国产先进工艺物理设计、弹性可扩展互连系统构建等方面的关键核心技术,最终完成研发目标并且实现相关产品的规模化量产销售。本项目的实施主体为沐曦集成电路(上海)股份有限公司母公司。
“新型高性能通用 GPU 研发及产业化项目”包括公司第二代高性能通用GPU 芯片(代号 C600)和第三代高性能通用 GPU 芯片(代号 C700)两个研发子项目,基于国产先进工艺开发具备较高性能和更高性能的两款通用 GPU 计算芯片,应用于 AI 训练及推理、通用计算等场景,是公司曦云 C 系列训推一体芯片的后续主力产品。
“新一代人工智能推理 GPU 研发及产业化项目”系公司研发下一代基于先进封装技术的云端大模型推理芯片(代号 Nx),主要用于生成式AI 推理。前述募投项目的顺利实施,将帮助公司完成现有核心产品线的持续迭代升级,巩固行业领先地位,进一步扩大市场份额,是公司未来几年主营业务发展及收入增长的重要基础和核心驱动。
2、项目投资概算
(1)第二代高性能通用 GPU 芯片(C600)研发项目
本项目投资总额为 136,977.30 万元。
(2)第三代高性能通用 GPU 芯片(C700)研发项目
本项目投资总额为 204,015.07 万元。
3、项目实施进度安排
(1)第二代高性能通用 GPU 芯片(C600)研发项目
本项目为公司目前在研项目,于 2024 年 2 月立项,计划建设期为 3 年。
(2)第三代高性能通用 GPU 芯片(C700)研发项目
本项目为公司目前在研项目,于 2025 年 4 月立项,计划建设期为 3 年。
4、项目备案情况
本项目已完成备案,取得上海市张江科学城建设管理办公室出具的《上海市企业投资项目备案证明》,项目代码:2504-310115-04-01-368516。
5、项目涉及的环保、用地情况
本项目为研发项目,不会对环境产生污染,无需办理环评手续。本项目拟使用公司现有办公场所作为项目实施地点,不涉及新增建设用地。
6、项目可行性分析
(1)国家政策大力扶持人工智能和集成电路行业发展
近年来,我国政府高度重视人工智能和集成电路产业的发展,尤其是最核心的算力基础设施领域,相关扶持政策频繁出台,为 AI 芯片项目及其下游市场发展提供了全方位有力保障。例如,《“十四五”数字经济发展规划》中指出要瞄准集成电路等战略性前瞻性领域,完善集成电路等重点产业供应链体系;
《算力基础设施高质量发展行动计划》提出到 2025 年,国内算力规模超过 300 EFLOPS,其中智能算力占比达到 35%;《关于推动未来产业创新发展的实施意见》明确要求加快突破 GPU 芯片、集群低时延互连网络、异构资源管理等技术,建设超大规模智算中心,满足大模型迭代训练和应用推理需求。
国家通过建立多层次的项目、资金、政策、人才支持体系,推动国内 AI 芯片领域上下游全面发展,目标实现进口替代,具体措施包括但不限于:1)设立各类政府引导基金、产业投资基金、专项科研基金等,对芯片设计初创企业进行股权投资和孵化培育;2)出台相关政府补助和税收优惠政策,给予企业资金支持;3)大力推进“东数西算”工程和各地政府智算中心建设,以及设备软件的国产化采购工作;4)加强人工智能及集成电路专业人才队伍培养等。综上所述,国家产业政策支持是募投项目顺利实施的重要基础。
(2)公司拥有自主创新能力,掌握芯片设计关键核心技术
GPU 产品研发是一项非常复杂的系统工程,需要掌握物理芯片设计与系统软件开发的大量关键技术,同时对各类人工智能算法和应用场景有深入理解。公司核心创始团队为整建制 AMD 背景,具备顶尖 GPU 技术及稀缺的万卡大集群落地经验,深刻洞察全球行业发展趋势。
公司是国内少数几家全面掌握了先进制程 GPU 芯片及其基础系统软件研发、设计和量产全流程经验的企业,拥有自主研发形成自主知识产权的 GPU IP、指令集和架构,以及高度兼容主流 CUDA 生态的 MXMACA 软件栈。公司仅用 3 年时间即完成两款芯片一次性流片成功并量产,快速实现商业化落地。
在核心技术储备方面,公司自研形成了覆盖计算和渲染场景的核心 GPU IP,积累了超过 600 条(XCORE1.0 计算 GPU)、800 条(XCORE2.0 渲染 GPU)指令组成的 MXMACA 指令集,为新一代 GPU 芯片研发奠定了良好基础。
硬件设计层面,公司掌握了高性能 GPU 处理器架构设计技术、高性能 GPU 流处理器设计技术、高性能 GPU 多级缓存结构及内存管理设计技术、高性能 GPU 系统控制及虚拟化技术、MetaXLink 高速互连技术、芯粒架构与先进封装设计技术、高性能GPU动态功耗管理技术、高性能GPU验证方法学及智能验证技术等核心技术;
软件开发层面,公司掌握了 GPU 异构计算编程语言与开发环境、人工智能编译器与编译技术、GPU 高性能通信库设计与优化技术、GPU 高性能数学库设计与优化技术、GPU 核心驱动程序、GPU 软硬件协同优化技术等核心技术。综上所述,公司深厚的技术积淀为募投项目实施提供了技术保障。
(3)公司具备完善的研发管理体系和产学研合作资源
作为一家技术实力业内领先的 GPU 企业,公司高度重视研发管理工作和研发资源整合。在研发管理体系建设方面,公司建立了完善的《项目管理程序》《硬件开发流程》《软件开发流程》《系统开发验证程序》《软件项目管理规定》《软件缺陷管理规范》等制度,明确了项目开发的具体流程、主导部门、主要任务、交付标准、项目结项等内容。
相关研发制度的设立及贯彻执行,能够帮助公司有效管控研发活动全流程的各个环节,赋能公司在硬件、软件、系统等领域完成开发探索,是公司形成研发成果并实现快速落地的关键因素。在产学研合作资源方面,为保持竞争优势并持续推动创新,公司积极寻求外部合作,拓展研发领域,构建了以企业为主体、市场为导向、产学研相结合的技术创新体系。
公司已与中科院某所共建“通用类脑智能大模型北京市重点实验室”;与清华大学集成电路学院合作,开展面向特定场景的可重构架构设计研究;与浙江大学成立联合研究中心,打造本土化 GPU 供应链和完整应用生态;与香港科技大学成立高级人工智能计算器联合实验室,全面支撑 HKGAI 大模型的应用。多年的产学研合作为公司技术攻关、新产品开发提供了有力支持,并取得了一系列科研成果,有助于募投项目的顺利实施。
(4)市场需求及客户基础可以保障募投项目产能充分消化
随着 AI 大模型快速迭代,模型参数量和训练数据量呈现指数级增长,需要更强大的算力基础设施作为支撑,政府、运营商和科技企业持续加码智算中心资本投入,推动市场需求不断释放。根据亿欧智库数据,预计 2025 年国内 AI 芯片市场规模将达到 1,780 亿元,2021-2025 年均复合增长率超过 42%。
同时,以DeepSeek 为代表的算法技术突破大幅降低了 AI 模型开发及应用门槛,使得整体算力结构发生显著变革,未来算力需求将逐渐从“重预训练”向“全流程平衡”转变,资源配置更为灵活。根据 IDC 预测,到 2027 年全球生成式 AI 推理算力需求将占到 AI 总算力的 70%以上,成为 AI 产业链的核心增长点。
公司长期深耕人工智能和 GPU 领域,凭借突出的产品性能、稳定性及交付能力,已获得市场广泛认可,积累了丰富的客户资源,持续服务于国家人工智能公共算力平台、商业化智算中心、AI 大模型企业、电信运营商等多种类型客户,且拥有良好的客户口碑。报告期内公司已相继交付 9 大智算集群,横跨北京、上海、杭州、长沙、中国香港等地区,并逐步向更多区域延伸。
公司致力于打造“1+6+X”的商业生态布局,依托其通用 GPU 产品在不同任务场景下的较高适用性,目前已重点布局教科研、金融、交通、能源、医疗健康、大文娱等垂直行业应用场景,与相关行业终端客户建立了密切的合作关系。
综上所述,旺盛的下游市场需求以及良好的客户合作基础为募投项目产能消化提供了可靠保障。
此为摘取部分,完整版根据发改投资规【2023】304号国家发改委关于印发投资项目可行性研究报告编写大纲要求,可定制化编制政府立项审批备案、国资委备案、银行贷款、产业基金融资、内部董事会投资决策等用途可研报告。