首 页
研究报告

医疗健康信息技术装备制造汽车及零部件文体教育现代服务业金融保险旅游酒店绿色环保能源电力化工新材料房地产建筑建材交通运输社消零售轻工业家电数码产品现代农业投资环境

产业规划

产业规划专题产业规划案例

可研报告

可研报告专题可研报告案例

商业计划书

商业计划书专题商业计划书案例

园区规划

园区规划专题园区规划案例

大健康

大健康专题大健康案例

行业新闻

产业新闻产业资讯产业投资产业数据产业科技产业政策

关于我们

公司简介发展历程品质保证公司新闻

当前位置:思瀚首页 >> 可研报告 >>  可研报告案例 >>  通讯网络

服务于该引擎算法中心人才体系建设基地项目可行性研究报告
思瀚产业研究院 零点有数    2024-11-13

本项目建设目标为知识增强智能引擎以及服务于该引擎的算法中心人才体系建设和基地场地建设,旨在为各政府与商业领域提供知识图谱与垂类模型融合支持能力。项目包括产品研发及相关的底层基座、知识增强(内容增强、检索增强、逻辑增强及增强抽取)等多个部分,最终实现知识图谱与垂类模型在各类场景下的融合应用。

本项目基于行业发展的最新趋势,结合公司现有业务,在各垂直业务场景下,构建以知识图谱结合多维增强技术对垂类模型进行全面增强的知识增强引擎,是对公司数据分析与决策支持业务开展的新能力支撑。投资总额:7,080.70万元。建设期:2年。

第一节 项目的必要性

一、积累前沿技术,落实国家科技创新发展战略的重要举措

人工智能是战略性新兴产业的重要组成部分,对我国经济发展和提升国家战略安全具有重要意义。我国在“十四五”期间,针对人工智能的未来发展陆续出台了相关指导方案和激励政策,对人工智能的整体发展方向和技术发展重点做出重要规划,同时提出加强算法创新与应用、推动算力基础设施建设、完善数据基础支撑体系等关键建议,倡导未来不断夯实产业发展新基础。

北京、上海、成都多地亦陆续出台多项相关政策,同时在推动通用人工智能技术创新场景应用中明确提到要推动在政务服务、金融、城市治理等领域的示范应用。

知识增强智能引擎,是将知识图谱技术与新兴垂类模型技术有效链接的关键技术,将进一步促进知识图谱技术与垂类模型技术高效融合应用,推进政务与商业领域数据智能化的发展,并对原有各垂直业务行业工作流的进行优化,持续以自主可控的技术与平台为我国人工智能技术与产业发展提供支撑,是公司落实国家科技创新发展战略的重要举措。

二、构建公司核心竞争力,提升长期技术实力的重要手段

通用认知智能技术的快速发展,带来重大技术创新和产业变革,如改变信息分发和获取模式、革新内容生产模式、全自然交互完成任务、实现专家级虚拟助手、颠覆传统手工编程方式、成为科研工作加速器。虽然目前通用认知技术通用知识能力较强,但在解决垂直领域问题与实际应用方面仍显不足;只有在多样化的实际应用场景中提升模型的准确性与可解释性,赋能智能经济与智能社会的发展,才能找到模型的产业价值。

知识增强智能引擎项目的建设将通过各种增强技术实现内容增强(狭义上的“知识增强”)、逻辑增强、检索增强等多维提升改造,叠加知识抽取增强提高专业知识图谱的建构效率,从而提高垂直业务场景数字化知识体系的建构效率和垂类模型应用的准确性与可解释性,进一步提升公司在人工智能数据服务领域的智能化水平,构筑公司数据智能技术的核心竞争力,促进企业持续经营,提升技术能力。

三、支撑核心业务及新业务发展,迎合公司业务战略布局的需要

公司结合30年来积累的不同应用场景的业务模型,运用互联网、大数据等技术,为客户提供数据分析与决策支持服务,提高决策支持的精准性和高效性,助力实现客户快速响应、科学决策和高效行动。通用认知智能技术将持续快速发展,客户有大量垂类模型的使用需求;但目前各类垂类模型在解决实际问题表现与实际应用之间仍有距离。

知识增强智能引擎项目,通过前沿的多种增强算法技术实现内容增强(狭义上的“知识增强”)、逻辑增强、检索增强,在多样化的实际应用场景中提升模型的准确性与可解释性,提升垂类模型在应用场景应用的效果,扩展了公司原有解决方案的应用场景。

因此,公司对本项目的研发投入,将进一步提升公司业务开展过程中数据支撑决策的智能化水平,是公司现有战略规划产品及业务方向的重要支撑,其实施基于公司中长期的发展规划,符合公司整体的发展战略。

四、知识增强引擎赋能知识图谱,是未来垂直应用解决方案成功的关键

公司上市后开展知识智谱项目研发,通过抽象、泛化等技术实现类人脑的知识建模、推理与分析决策,相关成果成为公司若干垂直应用解决方案的底层支撑,并在公司关键业务领域和场景建设了若干知识智谱垂直应用算子。

知识增强引擎项目与知识智谱项目一脉相承:知识增强引擎通过增强抽取提高专业知识图谱的建构效率;通过知识、检索、逻辑多角度增强,提高更多新领域垂直业务场景知识图谱的建构效率和模型应用的准确性与可解释性,是未来垂直应用解决方案成功的关键。本项目的研发,将进一步提升公司在人工智能基础数据服务领域的智能化水平,构筑公司数据智能技术的核心竞争力,促进企业持续提升技术能力。

第二节 项目的可行性

一、项目建设符合政策要求和行业发展趋势

自2015年七月,国务院出台《关于积极推进“互联网+”行动的指导意见》首次将人工智能纳入重点任务之一开始,我国的人工智能便步入了新阶段。此后,人工智能行业相关政策密集出台,2017年7月,国务院发布《新一代人工智能发展规划》,战略确立了新一代人工智能发展三步走战略目标,将人工智能上升到国家战略层面,提出到2030年,人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。

“十三五”规划时期,根据《“十三五”国家科技创新规划》和《“十三五”国家战略性新兴产业发展规划》,发展人工智能,培育人工智能产业生态,推动人工智能技术向各行业全面融合渗透以及发展大数据驱动的类人智能技术方法,在基于大数据分析的类人智能方向取得重要突破这两方面成为这一阶段的主要任务;十四五规划时期,根据《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》和《“十四五”数字经济发展规划》,人工智能要继续进行研发突破和迭代应用,深化应用端多场景渗透。

2023年4月底的中共中央政治局会议提出,要重视通用人工智能(AGI)发展,营造创新生态,重视防范风险。

5月初召开的第二十届中央财经委员会第一次会议指出,要把握AI等新科技革命浪潮。随后全国各地相继根据各自的情况和条件推出人工智能扶持政策。7月13日国家网信办联合国家发展改革委、教育部、科技部等7部门公布《生成式人工智能服务管理暂行办法》,促进人工智能良性、健康、安全发展,为生成式人工智能的研究与发展留足空间,利好人工智能未来可持续发展。

《生成式人工智能服务管理暂行办法》已于8月15日正式施行,这也是我国首个针对生成式人工智能产业的规范性政策。《生成式人工智能服务管理暂行办法》的落地预示着我国人工智能商用浪潮即将开启,在政策与技术的共振下,我国AIGC(AI Genersted Content,AI生成内容)产业未来发展前景广阔。

二、公司深耕公共服务、商业服务领域,人工智能有广阔的应用发展空间

根据IDC数据预测,2021年中国人工智能软件及应用市场规模为51亿美元,预计2026年将会达到211亿美元。数据、算法、算力是AI发展的驱动力,其中数据是AI发展的基石。公司长期深耕公共服务、商业服务领域,建设了系列辅助决策的数据智能应用产品,得到市场的认可。

垂类模型问世后持续得到业内关注,但垂类模型在某些专业场景下的应用与市场的期待略有距离。而“知识增强智能引擎”项目将链接通用垂类模型与“知识智谱”项目成果,形成新的产品解决方案,实现在客户垂类业务下的软件产品级应用,拓展目标客户群体和应用场景,改变产品交互模式,满足公共服务、商业服务多个业务场景的实际需要,有广阔的应用前景。

三、公司拥有扎实的建设项目实施基础

公司自成立起,就一直关注于数据的应用与算法模型的探索;公司上市后,通过实施知识智谱项目,通过抽象、泛化等技术实现类人脑的知识建模、推理与分析决策。知识增强智能引擎项目,是最终实现公司研发的知识智谱、公司整合的知识图谱技术和垂类模型在垂直场景下的融合应用,公司前期项目的研发为本项目奠定了良好的技术基础。

同时,公司自成立以来通过多年业务经验积累,以知识库的形式储备了大量知识文本,并针对文本数据、统计数据积累了大量的基础技术与算法模型,对于政务和商业领域的数据分析基础处理与应用模块,拥有丰富的研发项目经验,可以为本项目研发提供强大的基于行业知识进行研发的基础。

在团队建设上,公司拥有一支在NLP(自然语言处理)、多源数据融合和多元算法技术等领域具备丰富经验的技术团队,是项目建设的重要技术团队保障。在业务经验积累、技术储备和人才团队搭建等方面的优势将为项目实施提供坚实的基础支撑。

第二节 行业市场规模

一、人工智能发展历程

自上世纪50年代人工智能概念提出以来,科学家们不断探索如何让计算机模拟人类的思维过程。从符号主义到机器学习,再到知识工程、专家系统、智能代理;21世纪以来,人工智能的研究重点转向深度学习领域。

2006年Geoffrey Hinton提出通过逐层无监督预训练的方式来缓解由于梯度消失而导致的深层网络难以训练的问题,为神经网络的有效学习提供了重要的优化途径。此后,深度学习在计算机视觉、语音、自然语言处理等众多领域取得了突破性的研究进展开启了新一轮深度学习的发展浪潮。

总结过去十多年的技术发展,基于深度学习的人工智能技术主要经历了如下的研究范式转变:从早期的“标注数据监督学习”的任务特定模型,到“无标注数据预训练+标注数据微调”的预训练模型,再到如今的“大规模无标注数据预训练+指令微调+人类对齐”的前沿技术,经历了从小数据到大数据,从小模型到大模型,从专用到通用的发展历程,人工智能技术正逐步进入大模型时代。

2022年底,由Open AI发布的语言大模型Chat GPT引发了社会的广泛关注。语言大模型通过在海量无标注数据上进行大规模预训练,能够学习到大量通用的语言知识与世界知识,并且通过指令微调、人类对齐等关键技术拥有面向多任务的通用求解能力。在原理上,语言大模型旨在构建面向文本序列的概率生成模型。随着模型参数规模和预训练数据规模的不断增加,模型能力与任务效果将会随之改善。

除了深度学习外,知识图谱作为人工智能的一个分支,也是起源于上世纪50年代。但真正繁荣要到2012年谷歌提出Google Knowledge Graph 才正式得名。谷歌通过知识图谱改善了搜索性能。伴随人工智能技术的发展,知识图谱涉及到的知识抽取、表示、融合、推理、问答等关键问题得到一定程度的解决和突破。知识图谱成为知识服务领域的一个新的热点得到关注。

二、人工智能行业市场规模

随着数字经济、元宇宙等概念的逐渐兴起,人工智能进入大规模落地应用的关键时期,但其开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题开始显露,阻碍了规模化落地。2021年中国人工智能软件及应用市场规模为51亿美元,预计2026年将会达到211亿美元,各行业的需求正大力推进AI的发展,将推动市场的持续增长。

第三节 行业发展情况

一、客户需求量及需求复杂度增加

1、数据量爆发式增长对数据价值挖掘提了挑战

随着数据量的高速增长,数据特征高维、模态格式多样的趋势也逐渐明显,对数据的AI建模也相应地更加复杂,涉及到研究对象的多变量维度,如时间、空间维度,计算复杂度会随之呈指数增加,数据标注难度也会增加。同时,海量的数据将不可避免带来更大的数据噪声问题、数据偏见风险,为模型如何有效利用好数据、学习其中的知识带来更大挑战。

2、应用场景多元化和复杂化,及带来广阔市场空间,也增加了模型生产的难度

随着AI技术的发展、产业应用的深入,应用场景变得更多元、更复杂,客户也越来越希望模型能够最大限度的具备人脑智慧发挥作用;按照现在主流的算法应用,这意味着技术厂商需要针对不同场景、不同任务生产大量的专业算法或模型。一方面这将会导致重复性工作量加大,另一方面也对开发人员的算法能力和业务理解有更高的要求。

随着智能化转型的需求增加,AI开发门槛和研发效率问题凸显,知识增强智能引擎的研发,将大大提升新领域数字化知识体系构建效率和预训练垂类模型在垂直场景的效果表现,满足多元化、复杂化业务场景的实际需要。

二、国家政策支持

从“十二五”到“十四五”规划,国家从宏观层面上对人工智能新技术、新产业给予巨大支持,顶层设计从方向性引导到强调落地应用与场景创新,进一步细化、深化。

地方政府积极响应国家战略,加快规划人工智能产业建设。2023年7月1日,《人工智能 知识图谱技术框架》(GB/T 42131-2022)正式开始实施,规定了知识图谱架构、输入要求、场景定义、性能指标、构建知识图谱所需的人工智能技术和数字基础设施等。这一标注你的实施,对推动企业进行知识驱动的数字化转型升级具有重要意义,为进一步加快知识要素的规划化获取、挖掘与应用奠定了基础。

国家重视人工智能产业的安全可信和伦理秩序,两会期间科技部部长十天两提ChatGPT,强调规范科技伦理,趋利避害。国家近日出台人工智能相关管理条例,如《生成式人工智能服务管理办法(征求意见稿)》,进一步促进AI技术的规范应用和产业整体的高质量发展。

三、科技进步赋能

知识图谱作为知识体系的数字化表达,在实现人工智能规模性应用中拥有巨大价值。初代知识图谱及事理知识图谱、知识智谱,其应用领域较为广泛,涉及金融、民生政务、医疗和商业等各个细分领域,提高了业务效率和服务水平。垂类模型的出现所带来的模型知识融合能力、内容生成能力等新能力,将重构人工智能生产范式,释放开发者生产力。

传统的软件开发模式是通过任务/业务数据集形成专属模型,小模型不断迭代,开发人员用明确的代码去表达程序执行的逻辑,而随着业务场景从通用场景发展到长尾、碎片场景,该模式则逐渐显现出开发成本高,精确度不佳等一系列挑战。垂类模型问世后,逐渐形成围绕垂类模型结合人工反馈强化学习为核心的软件开发新范式,通过模型微调的手段,可以基于超大规模基模型,融合专业知识,打造出领域垂类模型或者行业垂类模型,进而覆盖更多行业应用场景。

与此同时,通过提示工程,只需用示例向计算机表达预期目标,计算机将通过神经网络自行找出达到目标的方法。综上所述,随着客户需求量及需求复杂度增加、国家政策支持和科技进步赋能,未来我国基于知识增强智能引擎的人工智能领域将迎来巨大的发展机遇。

四、知识增强能力技术研发

1. 内容增强

内容增强(狭义上的“知识增强”)是将知识图谱作为“边信息”(Side Information*)辅助增强垂类模型,知识图谱可以提供很多长尾分布的事实数据,是预训练语料中几乎不存在的。同时,知识图谱及其对应的文本可以提供额外的预训练监督信号,提升模型对事实相关文本的理解能力,提升在知识密集型任务上的性能。

2.检索增强检索增强

(RAG)是一种结合了检索和生成的自然语言处理算法模型。它通过在垂类模型中引入检索算法的有效产出信息,提高了生成结果的质量和准确性。RAG中通过构建合理的数据库,与知识检索方案,构建词向量模型,计算词向量之间的相似度,再加以最长公共子序列匹配等方法。匹配合理信息,拼接合理模板,从而更好的引导垂类模型生成合理答案。在垂类模型应用落地中,利用知识库进行上下文检索增强(In-Context Retrieval-Augmented )来进一步提升LLM效果,解决知识记忆、幻觉消弭等问题。

3、逻辑增强

逻辑增强是指在模型的自然语言处理任务中,通过引入事理图谱和常规图谱的知识逻辑推理算法和推演技术来提高模型的逻辑能力和推理能力。例如将一个复杂问题按照逻辑拆分为多个简单问题,引导模型在回答问题时能更细致化的去解析问题从而得到答案,在提高了生成结果的质量和准确性的同时,还能得到解答问题的思考线路。或者追溯推理一个问题发生的可能的原因,并推断主因等。

逻辑增强技术拟集合两大高智能的功能,一是实现以常规知识图谱结合规则以及图算法等多元化推理技术,综合实现高性能逻辑推理,包括基于描述逻辑推理、基于产生式规则推理等算法,应用于路径查询、多跳查询等场景。

二是在此基础上,结合事理图谱技术,实现基于规则或事理的增强,适用于独立场景推理、大主题推演等场合。比如,基于主体特征,以及已发生的事项和外部数据,共同推演未来可能发生的事项,用于预警等场合;在特定条件下,生成相应的解决策略,回答复杂的业务问题。上述能力用于业务产品的开发,可形成推演系统等产品。

4.增强抽取

增强抽取(偏向于生成式的结构化抽取方案)方法结合了生成式和抽取式这两种方法的优势。它使用生成式模型来生成候选结构化数据,然后利用抽取式的规则和模式进行筛选和修正。这样可以在保持灵活性和泛化性的同时,提高准确性。另外,可以帮助补全知识图谱中缺失的知识要素。

第四节、项目投资效益情况

一、经济效益

本项目建设落地后,将有利于公司收入规模和盈利水平的持续提升。通过构建底层基座建设和知识增强能力技术,链接通用垂类模型与“知识智谱”项目成果,形成新的产品解决方案,实现在客户垂类业务下的软件产品级应用,拓展目标客户群体,改变产品交互模式。

另外,“知识增强智能引擎”项目中的部分增强引擎,也将对原有“知识智谱”项目起到支持作用,加速新领域知识图谱的抽取能力与构建能力。公司将通过本项目的实施,实现“知识智谱”项目成果在垂类模型中的便捷有效应用,能够帮助相关领域重塑工作流,打造数智化的工作模式,提高生产效率,节省人工成本以及工作人员的学习成本。

公司预计会面向政府(如政务12345热线、公安等)和商业领域(烟草、汽车等行业)实现知识增强智能引擎的应用落地,通过私有化部署形式,向政府/企业提供专有的服务能力,提升公司收入规模和盈利能力。

与此同时,知识增强智能引擎还将对公司原有数智化解决方案升级优化,给到客户更加自然友好的类体感交互模式、拓展新的数智化应用场景。一是基于客户需求与业务场景,大模型将通过强大的自然语言处理(NLP)的能力,大幅度提升信息检索的效率,从而降低信息获取的成本。二是大模型技术通过实时指导与辅助,降低复杂技能的学习成本,并提供实时反馈从而缩短新技能的学习周期,快速提升技能。

公司将基于以上知识增强智能引擎,探索发展应用端Agent智能体,融合大模型技术以及知识管理系统,利用其在数据分析、趋势预测与决策支持等方面的卓越的性能,帮助企业、政府机构管理业务流程,提升企业与机构的生产力与创新力,进一步促进公司业务的发展和收入的提升。

二、社会效益

知识图谱技术和垂类模型均是人工智能技术向更高层次发展的探索,也是人工智能技术向更广泛领域应用的尝试。本项目的落地可以为社会带来更多的便利和价值,比如在政务12345热线领域通过上述技术建设垂类模型可以提供智能咨询和办事问答,在商业企业方面可以提供客户意图识别优化销售支持和服务能力评估等,在决策领域也可以提供为企业和政府对大数据进行深入挖掘和分析,从而更好地了解真实问题,有针对性地制定措施和建议。本项目的建设可以通过服务政府/企业,提高服务效率与效果;进一步提升居民生活和企业发展的获得感,使得居民/企业在政务服务办理、生活消费等全方面更加便利。

第五节、项目综合评价

本项目符合国家高新技术产业发展战略,紧密围绕公司的主营业务,是公司依据未来发展规划做出的战略性安排,项目流程完善,整体抗风险能力较强。项目的定位准确,投资结构清晰。总体来看,本项目的实施将增强公司的综合竞争实力,有利于公司业务的发展以及行业地位的提升,经济效益和社会效益显著。因此,该项目是可行的。

完整版可行性研究报告依据国家部门及地方政府相关法律、法规、标准,本着客观、求实、科学、公正的原则,在现有能够掌握的资料和数据的基础上,主要就项目建设背景、需求分析及必要性、可行性、建设规模及内容、建设条件及方案、项目投资及资金来源、社会效益、经济效益以及项目建设的环境保护等方面逐一进行研究论证,以确定项目经济上的合理性、技术上的可行性,为项目投资主体和主管部门提供决策参考。

此报告为摘录公开部分。定制化编制政府立项审批备案、国资委备案、银行贷款、产业基金融资、内部董事会投资决策等用途可研报告可咨询思瀚产业研究院。

免责声明:
1.本站部分文章为转载,其目的在于传播更多信息,我们不对其准确性、完整性、及时性、有效性和适用性等任何的陈述和保证。本文仅代表作者本人观点,并不代表本网赞同其观点和对其真实性负责。
2.思瀚研究院一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及文章内容、版权等问题,我们将及时沟通与处理。