1、项目基本情况
本项目依托公司在大数据及人工智能领域方面的积累,通过引进先进软硬件设备、扩充研发团队、增加研发投入,开展知识工程的研发和产业化应用,解决项目建设生命周期中的知识引接、知识建模、知识抽取、知识清洗、知识融合、知识构建等问题,同时满足基于知识工程的智能应用需求,最终形成闭环式的一站式、端到端知识平台,解决底层数据处理能力不足、业务模式单一等问题。项目实施有利于充分发挥公司现有的技术优势及产品优势,巩固公司在行业内的市场地位和扩大市场占有率,提高公司的盈利能力,为公司长期可持续发展打下坚实基础。
2、项目实施的必要性
(1)有利于顺应行业发展趋势,积极进行战略布局
随着大数据及 AI 领域的蓬勃发展,国内外各大厂商在知识工程底层技术、理论研究上取得了一定的成果,包括非结构化多模态数据组织与理解、大规模动态图谱学习、神经符号结合的知识更新与推理、基于大规模知识下游任务的预训练模型等方面。
公司在大数据及 AI 产业快速发展的背景下,面临着新一代知识工程在基础理论、体系架构、关键技术等方面的挑战,为了能在激烈的市场竞争中实现可持续发展,公司必须顺应行业发展趋势,提高研发能力,积极建设上层应用系统,实现战略布局。
公司在政策指引、技术研发、产业化推广等多方面因素的共同驱动下,依托行业知识与经验,利用丰富的技术积累和数据支持,逐渐实现在金融、医疗、能源、制造等众多领域的知识工程深度融合。
同时公司将在各行业的数字化转型过程中,依靠大语言模型智能分析,建设跨领域、跨产业的 AI 知识助理,同步构建多模态知识工程以拓展应用场景和领域,使知识工程在更大范围内与实体关联,最终形成完整的以“场景需求”为导向的知识工程解决方案,顺应多模态知识产业的发展趋势,进一步实现战略布局的目标。
(2)有利于丰富产品应用场景,满足下游市场的需求
近年来,随着知识工程产业快速发展,其关键技术和理论方面取得了一定进步,以知识工程为载体的典型应用也逐渐走进各个行业领域,对公司知识助理项目的应用性能和应用场景提出更高要求。
目前,很多行业受到信息化和数字化的影响,在发展过程中遇到知识阻碍,同时又对数据挖掘需求较大,基于以上情况,公司计划在当前的产品矩阵基础上,结合新的深度图算法技术,建设新一代支持多种推荐模式的知识推荐引擎。具体而言,公司将研发多种推荐类图算法组合方式,以应对各种复杂业务知识推荐场景,并确保在各种知识推荐业务场景下,各维度性能参数都达到行业先进水平,同时结合知识业务引擎、文档解析引擎、智能问答引擎和知识推荐引擎,满足更复杂的业务场景需求。
在知识获取和生成方面将进一步整合大语言模型的 NLU 能力和 AIGC 技术,打造一个统一、智能、高效的知识助理系统。该建设项目专注服务于政府、医疗、金融、教育、媒体等行业的细分客户群体,相较于基础数据的标准化平台,该项目可以提供更加针对性的定制化的产品。
例如在政府方面,此项目产品可以将分散在政府各个部门、生产生活各个领域的相互孤立的数据资源联通共享,实现多源数据集成交换,从而对政务数据和社会数据进行深度挖掘。在医疗领域,此项目可以聚合核心医学概念和全方位的医疗生态圈知识,从海量的临床案例中对经验和知识进行提炼整理、录入标注、体系构建,在解决优质医疗资源供给不足和医疗服务需求持续增加的矛盾中产生重要的作用。知识助理项目建设将致力于开发高效、灵活、可扩展和易于使用的知识推荐引擎,以满足不同用户和企业的需求。
(3)有利于提升公司产品运行效率,增强产品核心竞争力
公司目前已形成大数据与云基础平台、分布式关系型数据库、数据开发与智能分析工具的软件产品矩阵,可以支撑客户及合作伙伴开发数据应用系统和业务应用系统,助力客户实现数字化转型。但公司现有产品是以底层数据库逻辑建立而成,采取独立数据模块,独立运行并输出,无法提供一站式数据服务。为满足客户一体化需求,丰富产品系统设计,集成行业知识工程数据,保障行业数据质量,公司将利用已有数据积累,融合分布式、SQL 编译、多模型数据处理技术建设知识助理项目。
本次项目拟投入业内先进软硬件设备,引进业界精英人才,重点开展知识工程的研发和产业化应用,解决知识工程建设生命周期中的知识引接、建模、抽取、清洗、融合、以及智能应用需求,形成以上游数据处理、中游知识建模、下游智能应用服务为闭环的一站式、端到端知识工程构建平台。
它将提供智能应用业务组件,降低知识工程在行业领域落地的技术成本、时间成本、人力成本,提升产品的运行效率,为基于知识工程的智能应用建设提供支撑及赋能。同时此项目会开辟星环在行业知识工程建设的 PaaS 产品线,进一步提升产品的核心竞争能力,以促进公司持续、稳定的长期发展。
3、项目实施的可行性
(1)相关产业政策为项目顺利实施提供政策保障
近年来,国家高度重视人工智能产业,颁布了多项规范并支持行业发展的相 关政策,以鼓励人工智能产业不断创新,驱动行业快速发展。知识工程作为人工 智能的组成部分,其技术在相关政策支持下也在不断更新迭代。
2022 年 7 月,国务院科技部、工信部等联合印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,鼓励行业领军企业面向国 家重大战略需求和国计民生关键问题,围绕企业智能管理、关键技术研发、新产 品培育等开发人工智能技术应用场景机会,开展场景联合创新。
2022 年 8 月, 国务院颁布《关于支持建设新一代人工智能示范应用场景的通知》,提出要重点 突破跨媒体统一表征、关联理解与知识挖掘、知识图谱构建与学习、知识演化与 推理、智能描述与生成等技术,实现跨媒体知识表征、分析、挖掘、推理、演化 和利用,构建分析推理引擎。
(2)下游丰富的应用场景为项目顺利实施提供了广阔的市场空间
认知智能是机器智能化的关键,而知识工程系列技术则是认知智能的核心。知识工程可以显著加强机器的学习能力,推动人工智能的发展。目前知识工程较为常见的应用场景有金融行业的智能客服与智能检索、政务领域的咨询问答与分析预警、医疗行业的院内外医疗咨询、警务领域的侦查等。
从更长远的角度来看,知识工程还可进一步推动相关行业的数字化转型和智能化水平,为未来更多的应用场景落地提供基础能力支撑。下游丰富的运用场景为项目的顺利实施提供了较为广阔的市场空间。
公司在知识工程主要的应用行业金融、政府领域具备广泛的客户基础。在金融领域公司已经取得一定市场份额,国内多家银行、券商、基金等金融机构已采购公司产品及服务,且助力多个客户实现了分析场景中部分关键系统的国产替代。
在政府领域,公司产品已被多个部委或省市机关部门使用,助力构建数字化政府,提升治理效率。目前公司的知识工程产品也已在部分行业实现了运用,积累了一定的客户量。基于上述客户基础,未来公司的知识工程产品可实现较为快速的推广。
(3)丰富的技术积累和充足的人才储备为项目顺利实施提供保障
在技术积累方面,公司已研发出 Inceptor、Slipstream、StellarDB、Scope 等一系列核心子产品,构建了 TDH 的多模型技术架构;同时拥有 Sophon 的 AI 能力聚焦于机器学习模型全生命周期中的模型训练、模型管理、模型发布,搭建了多源异构算法框架,为打通数据之间的壁垒,提供统一的查询引擎,实现各类复杂的跨模型查询的知识助理项目建设,提供了充足的底层存储和算法能力支撑。
在人才方面,公司通过外部引进及内部培训,已经建立了一支专业知识扎实、研发经验丰富、综合能力优秀的研发团队,专业背景涉及大数据分析、人工智能等众多领域。其中,核心管理人员均在国内外知名上市公司拥有数年的研发管理经验,在政府、金融、机场等方面积累了丰富的行业知识,从而确保业务正确的发展方向,把握住市场机遇。
主要研发人员在 AI 技术自然语言处理、知识图谱及图算法挖掘、大数据技术及数据挖掘等方面拥有丰富的技术积累,先后取得《一种地址信息提取方法及装置》《短文本多标签分类》《一种分类模型的损失函数优化方法及装置》等多项专利。
4、项目投资概况
本项目投资金额共计19,113.55万元,主要建设内容包括知识助理TKS的研发、 统一图计算引擎TKS UGE的研发、文档解析引擎TKS DDE的研发、知识业务引 擎TKS KBE的研发、结合大语言模型的智能问答引擎TKS KBQA的研发、基于 深度图算法的知识推荐引擎TKS KRE的研发。
5、实施主体和项目选址
本项目实施主体为星环信息科技(上海)股份有限公司,项目实施地点位于上海市。项目将先行在公司租赁的办公场地实施,待本次募集资金投资建设的研发及运营中心投入使用后搬迁至该地实施。
6、项目实施进度
本项目计划建设期为 60 个月。
7、项目涉及报批事项
截止本报告发布日,本项目备案手续正在准备过程中。本项目不同于常规生产性项目,不存在废气、废水、废渣等工业污染物。不属于根据《中华人民共和国环境影响评价法》和《建设项目环境影响评价分类管理名录》等相关法律法规需要进行环境影响评价的建设项目,因此,本项目无需进行项目环境影响评价,亦不需要取得环保主管部门对项目的审批文件。