首 页
研究报告

医疗健康信息技术装备制造汽车及零部件文体教育现代服务业金融保险旅游酒店绿色环保能源电力化工新材料房地产建筑建材交通运输社消零售轻工业家电数码产品现代农业投资环境

产业规划

产业规划专题产业规划案例

可研报告

可研报告专题可研报告案例

商业计划书

商业计划书专题商业计划书案例

园区规划

园区规划专题园区规划案例

大健康

大健康专题大健康案例

行业新闻

产业新闻产业资讯产业投资产业数据产业科技产业政策

关于我们

公司简介发展历程品质保证公司新闻

当前位置:思瀚首页 >> 行业新闻 >>  产业新闻

数据分析大模型建设项目可行性研究报告-上海市编制可研报告单位
思瀚产业研究院 星环科技    2023-06-08

1、项目基本情况

本项目依托公司在大数据及人工智能领域方面的积累,通过引进先进软硬件设备、扩充研发团队、增加研发投入,以满足终端客户对数据处理及分析大模型产品日益多样化、多元化的需求。

通过本项目的实施,公司将持续加大在数字化基础设施及应用的创新研发,建设大数据分析大模型基础设施、大模型工具层以及大数据全流程管理的助手工具,以服务更多细分客户群体。项目实施有利于充分发挥公司现有的技术优势及产品优势,巩固公司在行业内的市场地位和扩大市场占有率,提高公司的盈利能力,为公司长期可持续发展打下坚实基础。

2、项目实施的必要性

(1)有利于顺应行业发展趋势,巩固公司领先优势

近年来,人工智能成为了国际热点,随着人工智能技术的不断发展突破,创新成果不断融入社会各个领域,深刻地改变着各行各业。人工智能领域的激烈竞争已经超越了学术、产业、经济层面,上升到国家战略,世界各国都在纷纷加码人工智能战略。大模型技术作为人工智能领域中最热门的细分领域,已成为重要的发展趋势之一。

大模型兼具“大规模”和“预训练”两种属性,可以大幅提高人工智能的泛化性、通用性和实用性,推动人工智能产业化再加速。公司作为大数据领域的领先企业之一,与人工智能大模型天然有着技术融合的趋势,需要加快相关业务的研发和部署,顺应行业发展趋势,以巩固公司的领先优势。

基于本次研发项目的实施,公司将聚焦 AI 大模型的核心技术开发,针对大数据大模型、分布式向量数据库、人工智能基础设施及基础软件系列技术开展研发工作,实现数据治理时间与成本的有效降低、交互形式等技术不断创新,并延续发挥在自然语言处理、知识图谱等技术方面积累的研发经验,为公司大模型领域业务的持续拓展奠定基础。

(2)有利于完善公司产品结构,积极落实公司战略目标

公司自成立以来,围绕“打造世界领先的大数据基础软件”这一战略目标,始终专注大数据及相关基础软件的研发,在大数据、数据库、云计算、智能数据分析等领域提供覆盖数据全生命周期的基础软件及服务。而大数据分析大模型能大幅缩减特定模型训练所需要的算力和数据量,缩短模型的开发周期,还能得到更好的模型训练效果,是数据全生命周期管理的重要一环,同时也是公司落实战略目标的必经之路。

本项目将依托公司在大数据领域全生命周期建立的研发基础和行业经验,建设“大数据分析大模型”相应工具链和平台,具体包括“大数据分析大模型基础设施”(属于基础技术底座,由各类大数据分析模型、人工智能基础软件设施、分布式向量数据库三大模块构成)、“大模型工具层”(提供大数据分析大模型相关的多模态数据、提示工程、模型训练和微调、模型服务编排构建等生成式大模型工具链和运维平台)、“大数据全流程管理的助手工具”(包含业务向导标准化助手引擎、高并发数据产品控件标准容器、大数据编码助手和主动数据管理助手,提供敏捷性的大数据分析助手工具)三层架构。

“大数据分析大模型基础设施”包含星环大数据分析大模型“求索”的研发。该模型是一款针对大数据行业全生命周期各种场景的大数据领域大模型,其可以衍生出众多的子领域子任务微调大模型。

按照规划,“求索”大模型将具备大数据行业需求理解、推理、各类(含多模型)结构化查询语言和 OpenCypher 代码生成、Python/R 等常用数据分析程序代码生成、Query 改写、意图识别、文本生成、嵌入向量生成、知识推理等能力;达到用户只要使用自然语言,就能借助“求索”大模型获取所需数据分析、展示和报告。

本项目所带来的语言理解力、数据推理能力都为数据应用场景提出了新的想象空间,对目前公司现有产品的基础功能进行了延伸、提高和创新,是对现有产品线的完善和补充。

(3)有利于解决下游痛点,满足客户需求

在计算机技术不断成熟、各类数据的不断积累、大数据时代到来的背景下,企业各类决策有了相应数据支撑,可在一定程度上提高经营决策的科学性。而在企业数字化转型发展过程中,熟练应用数据的人才是日常高效经营、各类项目顺利推进的关键保障,但大量业务乃至管理人员缺乏数据应用意识和所必须的技能,致使企业数据价值无法得到发挥。大数据分析工具作为公司数据全生命周期中的重要一环,与人工智能技术融合介入后,许多新功能得以实现,从而满足更多客户在不同场景下对于数据收集、应用等不同方面的需求。

本项目将充分发挥国产化自主研发的技术优势,聚焦大模型应用开发技术,基于自研的 MLOps 体系,研发智能化数据开发、治理、应用体系,推出可提供泛行业的各类规模用户使用的大数据分析大模型。项目产品业务洞察分析助手作为核心功能之一,将主要面向无专业数据处理经验的一般用户,达到开箱即用,可交互、可设计及发布共享的效果,通过对业务控件容器和助手引擎的调用以及基础大模型的训练,形成行业场景级别的业务专项分析助手,如财务洞察助手、人效洞察助手、产品营销助手等。

此外,主动式数据管理助手功能将面向数据采集、清洗、治理、整合、分析、共享、流通等各阶段流程,并实现自动化的辅助能力,提供向导型的操作编排和基于行业知识的内容推荐,辅助完成数据湖仓构建、数据治理、数据应用建设、数据资产运营等体系的自动化流程构建。

3、项目实施的可行性

(1)大数据、人工智能产业政策为项目顺利实施提供政策保障

近年来,国家高度重视大数据、人工智能等产业发展,颁布了多项规范并支持行业发展的相关政策,以鼓励相关产业不断创新,驱动行业快速发展。

2023 年 2 月,中共中央、国务院印发了《数字中国建设整体布局规划》,指出大数据产业要全面赋能经济社会发展,培育壮大数据核心产业,研究制定推动大数据产业高质量发展的措施,打造具有国际竞争力的数据产业集群,有效推动大数据技术和实体经济深度融合。

2022 年 7 月,科技部等六部门印发了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,鼓励在制造、农业、物流、金融、商务、家居等重点行业深入挖掘人工智能技术应用场景,促进智能经济高端高效发展;鼓励行业领军企业面向国家重大战略需求和国计民生关键问题,围绕企业智能管理、关键技术研发、新产品培育等开发人工智能技术应用场景机会,开展场景联合创新。

2022 年 1 月,国务院印发了《“十四五”数字经济发展规划》,提出瞄准量子信息、大数据、人工智能等战略性前瞻性领域,发挥我国社会主义制度优势、新型举国体制优势、超大规模市场优势,提高数字技术基础研发能力;高效布局人工智能基础设施,提升支撑“智能+”发展的行业赋能能力。政策鼓励和支持大数据在各行业、各领域的创新应用,推动大数据、人工智能产业快速、健康发展。

(2)广阔的市场前景为项目的顺利实施打下了良好基础

在数据资源的不断增加,各行业信息化、智能化发展不断深入的背景下,我国人工智能市场规模逐年扩大。中国人工智能软件及应用市场规模 2021 年至2023 年分别为 50.83、64.68、91.60 亿美元,三年实现了 76.73%的增长。未来,人工智能将面向应用场景多元化、解决方案综合化的方向发展,相关需求有望持续扩大,预计 2026 年整体市场规模将会达到 210.77 亿美元。

公司将依托当前上海现代化产业体系建设的高地优势以及公司在大数据领域全生命周期的研发基础和行业经验,建设数据分析大模型相应工具链和平台。项目产品将利用大语言模型等人工智能技术涌现出的“上下文理解”、“逻辑推理”等能力,使用自然语言和机器交互这种全新的人机交互方式,助力企业数字化、智能化转型。未来,在企业数字化转型的持续推进下,各行业对大模型的应用需求也将迎来增长。

本项目产品基于高性价比、覆盖领域广等优势,有利于在市场竞争中脱颖而出,将拉大市场中与同类产品的竞争优势,从而进一步提升公司产品在市场的占有率。

(3)扎实的技术积累与充足的人才储备与为项目顺利实施提供保障

自成立以来,公司始终将研发和创新能力作为构建核心竞争力的首位,坚持从项目实践中不断积累技术和经验,积极与国内知名高校和团队开展合作、吸引高质量人才加入,拥有多项行业领先的核心专利、技术。

在多年经营过程中,公司已在大数据、人工智能等领域积累分布式计算引擎、数据库索引技术、多模型数据优化器技术、高并发分布式事务处理技术在内的一系列技术,并形成了《训练样本优化方法、目标检测模型生成方法、设备及介质》《一种反事实样本生成方法及模型调整方法、设备和介质》《机器学习模型之间进行转换的方法》在内的多项专利。基于丰富的相关技术积累,公司可实现众多大数据模型的场景训练。此外,公司还积极与北京大学、南京大学、复旦大学、新加坡理工学院、英特尔等联合共建大数据实验室、技术创新实验室,积极利用外部资源,不断完善自身技术储备,努力开展大数据、人工智能相关研发工作,为巩固技术优势提供有力支持。

公司高度重视人才培养及储备,大力引进大数据产业高端技术人才,在业务成长过程中集聚了一批大数据分析行业较高水平的开发人员、服务专家、工程实施专家以及具有丰富行业经验的大数据行业咨询专家。研发核心人员在大数据、人工智能领域拥有丰富的研发、管理经验,相关人员曾发布“生成技术在人工智能平台中的应用探索”论文,参与并完成中国信息通信研究院《大模型应用运营体系》《数据模型管理平台技术要求》在内的数十项标准及白皮书。

4、项目投资概况

本项目投资金额共计 35,183.08 万元,主要建设内容包括大数据分析大模型基础设施研发、大模型工具层研发以及大数据全流程管理的助手工具研发等。

5、实施主体和项目选址

本项目实施主体为星环信息科技(上海)股份有限公司,项目实施地点位于上海市。项目将先行在公司租赁的办公场地实施,待本次募集资金投资建设的研发及运营中心投入使用后搬迁至该地实施。

6、项目实施进度

本项目计划建设期为 60 个月。

截止本报告发布日,本项目备案手续正在准备过程中。

本项目不同于常规生产性项目,不存在废气、废水、废渣等工业污染物,不属于根据《中华人民共和国环境影响评价法》和《建设项目环境影响评价分类管理名录》等相关法律法规需要进行环境影响评价的建设项目。因此,本项目无需进行项目环境影响评价,亦不需要取得环保主管部门对项目的审批文件。

免责声明:
1.本站部分文章为转载,其目的在于传播更多信息,我们不对其准确性、完整性、及时性、有效性和适用性等任何的陈述和保证。本文仅代表作者本人观点,并不代表本网赞同其观点和对其真实性负责。
2.思瀚研究院一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及文章内容、版权等问题,我们将及时沟通与处理。