1、项目基本情况
国家信息安全已成为国家重要战略,数据库的自主研发已经成为国内基础软件发展的新趋势,公司已研发了分布式交易型数据库 KunDB 和分析型数据库 ArgoDB,并且有良好的数据库技术积累。
分布式关系型数据库建设项目拟就前述产品进一步完善,通过本项目的建设,公司将大幅提升分布式关系型数据库的产品能力,提升数据库的事务处理能力和数据分析能力,打造面向交易与分析混合场景的数据库的研发,并完善基于云模式的数据库 PaaS 服务能力,维护公司行业内的领军地位,拓展新的业务模式,增强公司产品的竞争力,进一步提高公司的行业影响力。
2、项目必要性分析
(1)本项目符合国家产业政策及国家战略的需求
关系型数据库行业拥有有利的政策环境。工信部发布的《软件和信息技术服务业发展规划(2016-2020)》中提出要以创新发展和融合发展为主线,以“技术+模式+生态”为核心,持续深化产业变革,重点要加快共性基础技术突破,尤其面向重大行业领域应用中,应加大力度支持操作系统、数据库、中间件、办公软件等基础软件技术和产品研发和应用。2019 年中国人民银行印发的《金融科技(FinTech)发展规划(2019-2021)》
中明确指出要加强分布式数据库研发应用,做好分布式数据库金融应用的长期规划,加大研发与应用投入力度,探索产用联合新模式,发挥科技公司的技术与创新能力,共同研发新产品、发展新产业、凝聚新动能。国家对云计算等新兴技术的政策支持也将促进新一代数据库的发展,2020 年 4 月,发改委发布的《关于推进“上云用数赋智”行动培育新经济发展实施方案》鼓励在具备条件的行业领域和企业范围内,探索大数据、人工智能、云计算、数字孪生、5G、物联网和区块链等新一代数字技术应用和集成创新,为数字化转型提供技术支撑。
本项目致力于研发下一代分布式关系型交易数据库与分布式关系型分析型数据库,符合国家基础软件自主研发的战略要求。
(2)分布式关系型数据库是行业数字化创新的重要支撑技术,本项目的实施有利于满足数字化建设中对新一代分布式数据库的需求
在数据科技的时代,企业应用技术发展迅速,很多应用会面临瞬时高并发的访问、操作数据量大、交易和分析业务混合等特点,应用的发布和上线频率快,需要有很好的弹性和可扩展性等特点,因此对数据库也有更高的要求。Oracle、IBM DB2、SQLServer等传统关系数据库具有性能可扩展性不足、弹性管理能力不强、不能有效的云化部署、灾备成本过高等问题,此外还可能有较大的企业信息安全隐患。
从 2010 年之后,随着分布式技术和新型硬件的发展,分布式计算和内存计算技术在数据库技术领域得到充分应用。采用分布式计算技术,数据库系统的读写性能都可以得到线性的提升,并且数据的一致性和灾备能力可以得到极大的改善,而使用新一代内存计算技术可以提高单个数据库实例的性能。新一代基于分布式计算的 OLTP 数据库,凭借着技术架构的先进性,能够在性能和可扩展方面逐步超越传统集中式关系型数据库,在办公软件类、互联网的应用服务等领域场景已经实现替代传统集中式关系型数据库。
金融行业也在大规模的推动新型的数据业务的建设工作,包括:将交易核心系统从单体模式改造为分布式交易核心系统;建设新一代的数据仓库和数据湖;建设企业内部的数据交换共享平台;建设基于大数据的风险控制系统等。这些新型的业务应用系统都要求有强大的分布式关系型数据库做支撑。
产品研发生命周期管理流程图
因此,本项目顺应行业技术发展趋势,可以提升公司在行业内的竞争力,并有利于满足数字化建设中对新一代分布式数据库的需求。
(3)本项目的对相关产品技术进行升级,有利于进一步提升公司竞争力
随着更多数据类型和应用场景的出现,数据库需要支持多种 SQL 协议与计算引擎。多模态数据库可以实现在一个数据库里满足结构化数据、半结构化数据和非结构化数据(如表单数据、文档数据、JSON、XML、时空地理数据等)的统一存储和处理的需求,相较于采用不同数据架构的方案,能够让企业提升场景效率、获得统一分析管理能力、降低运维成本以及降低数据持有成本。
此外本项目计划将 ArgoDB 与 KunDB 打造适配全新的分布式交易与分析混合型场景的高性能数据库。有利于更好地匹配当前行业客户的需求,满足企业业务应用以及数据分析的需求,具有较强的市场和技术前瞻性。
随着云计算技术的大规模应用,传统各类软件产品都开始由独立部署模式向云服务模式转变。云技术能够更好的实现数据库功能的融合与整合,实现更强大的上线敏捷性,同时具备降低企业部署成本等优势,未来云数据库将进一步实现市场拓展,如何积极拥抱云技术并实现成熟应用将成为未来关系型数据库产品的关键成功因素。关系型数据库作为信息系统核心软件,也需要逐渐附加云化能力形成关系型云数据库,以服务的形式对外提供技术支撑。
本项目计划采用新一代容器云技术作为云化数据库的基础支撑,能够在公有云、私有云、混合云等多类场景下提供云数据库 PaaS 服务,能够服务更多中小型企业客户,加速中小型企业数字化进程,也充分契合了云数据库的发展趋势,保持在行业中的竞争优势。
3、项目可行性分析
(1)公司已具备较强的技术基础及研发力量
公司目前在分布式数据库领域有很强的技术积累。在分布式分析型数据库领域,公司 ArgoDB 在 2019 年通过了 TPC-DS 的国际基准测试;在分布式交易型数据库领域,公司 KunDB 通过了中国软件评测中心的分布式数据库产品质量测试,达到了企业级交易数据库的技术要求。
自成立以来,公司组建了一支专业知识深厚、行业经验丰富的研发团队,具有较强的研发能力。自 2013 年创立以来,公司核心技术人员及研发团队坚持“自主研发”、“领先一代”的技术战略,研发了多个国内一流的分布式数据库产品。通过本项目,公司将加大数据库方面的技术投入,打造出一流的数据库产品,助力我国数据库的国产化进程。
(2)本项目具备良好的市场前景
随着数字化转型和应用技术升级,应用的复杂性和场景的丰富性也急剧增加,很多 应用具有并发访问高、操作数据量大、涉及数据类型多、迭代速度快等特点,对数据库 有了更高的要求。而新一代分布式计算数据库凭借技术架构的先进性,在性能和可扩展 方面与传统数据库相比具有显著优势。因此,本项目的开展适应行业未来的发展趋势, 具有良好的市场应用前景。
(3)公司拥有完善的客户资源和生态合作伙伴积累
经过多年发展,公司已在金融、政府、能源、交通、制造业等多个行业积累了较为 广泛的用户群体,同时,公司与数百家生态合作伙伴建立良好的合作关系。凭借在客户 中的品牌影响力,ArgoDB 已经在金融、政府等领域有数十个落地案例,KunDB 目前也 在政企客户中有多个落地案例,且相关产品已有诸多成功替换 Teradata、Oracle、IBM DB2 等传统数据库的案例。因此,完善的客户群体和强大的生态建设也将为本项目的 实施带来保障。
4、项目投资概算
本项目总投资额为 70,940.62 万元,主要投资内容包括招聘人员、产品交付费用、购置场地等,具体投资构成如下:单位:万元
5、项目实施计划
(1)建设工期
本项目建设周期为 5 年。
(2)项目计划进度
项目进度表如下:
(3)主要实施内容
1)新一代数据库通用技术的研发
公司将研发适用不同数据库的新一代基础组件或功能,并且以组件、微服务或代码库的方式为 KunDB 和 ArgoDB 提供相应的技术能力,从而优化软件架构,降低工程成本,提高产品交付速度。通用技术的升级研发工作主要包括数据库内核基础组件和配套工具的开发:内核基础组件覆盖 SQL 编译器、分布式存储引擎、分布式计算引擎、分布式事务引擎和资源管理引擎;配套工具包括数据库的安全、监控、运维、审计、部署等工具。
2)分布式闪存数据库 ArgoDB 的研发
公司将在当前 ArgoDB 产品的基础上,结合新一代数据库通用技术,研发新一代本地执行的计算引擎,目标是支持更多海量数据的复杂分析场景,并在各类分析业务场景下性能达到行业先进水平。同时结合新硬件技术,满足更复杂的业务场景需求。在 SQL编译器方面,进一步增强对 Oracle、IBM DB2、Teradata、SQLServer、MySQL 等数据库的兼容,并打造性能一流的 SQL 优化技术。
3)分布式交易数据库 KunDB 的研发
公司将在当前 KunDB 产品的基础上,结合新一代数据库通用技术,加强 KunDBSQL 编译技术以兼容 MySQL 和 Oracle 两种 SQL 标准;研发新一代分布式事务引擎,使其具备极致的事务处理能力并支持线性扩展,并发事务处理能力达到行业先进水平;开发新的执行引擎以支持高并发的统计分析业务;进一步完善 TDC 上 KunDB 的弹性调度、灾备、监控、数据导入导出等云化能力的开发工作。
4)AETP 数据库技术的研发
公司结合交易型数据库 KunDB 和分析型数据库 ArgoDB,提出了 AETP 数据库(分析增强型交易库)的架构。公司将研发新的行列混合存储以同时支持交易和分析混合型业务;研发全局的事务控制器从而可以实现两个存储的数据一致性;研发新的全局优化器从而可以让业务选择在不同数据库上的最佳执行路径,从而打造差异化竞争优势。
在打造的 AETP 数据库技术的基础上,结合新型加速设备、新型闪存等技术,打造数据库一体机,能够通过专用的软硬件协同设计为用户提供极致的性能和性价比。
5)面向公有云的数据库 PaaS 服务
基于 KunDB 和 ArgoDB 的产品能力,结合 TDC 的云托管能力,进一步打造面向公有云场景的数据库云服务,研发相关的云上数据库的托管、调度、计费、弹性伸缩、安全防护等技术,未来可以为中小型企业客户提供公有云上的数据库服务。
6)研发相关场地
公司拟在上海市范围内购置房产用于本项目的研发和办公,不涉及单独购置土地使用权的情况。
7)研发相关设备
优秀的硬件环境建设是保障技术开发顺利进行的前提。为支撑技术创新的顺利实施,本项目将采购相关设备,其中包括:两路服务器 X86 版本、两路服务器 ARM 版本、网络交换机、VPN 及病毒扫描等安全设备、防攻击安全设备、GPU 加速卡、Infiniband交换机、Infiniband 网卡、NVMe 存储盘、笔记本电脑与显示器、信息系统建设。
同时,在技术创新和研发升级的过程中,需要相应的互联网数据中心 IDC(InternetData Center)的支持。本项目将租赁 IDC 机房,以保障稳定的带宽和数据流通。以上设备的配置可以确保技术开发活动的项目进度,有效帮助其软件程序适用于不同的操作系统平台或不同的硬件平台。完善的硬件环境建设将为本项目的顺利实施提供可靠的外部保障。
6、项目涉及的审批、核准或备案程序
本项目已取得上海市徐汇区发展和改革委员会《上海市企业投资项目备案证明》,备 案 号 为 “ 上 海 代 码 : 31010406939747220211D3101003 ; 国 家 代 码 :2103-310104-04-04-236324”;同时,本项目不同于常规生产性项目,不存在废气、废水、废渣等工业污染物。不属于根据《中华人民共和国环境影响评价法》和《建设项目环境影响评价分类管理名录》等相关法律法规需要进行环境影响评价的建设项目,因此,本项目无需进行项目环境影响评价,亦不需要取得环保主管部门对项目的审批文件。
此报告为公开正式可研报告摘取部分,个性化定制请咨询思瀚产业研究院。