(一)项目背景
1、人工智能产业链安全愈发重要,核心算法模型自主可控关系国家安全
2017年,国务院印发的《新一代人工智能发展规划》中指出“人工智能是引领未来的战略性技术,世界主要发达国家把发展人工智能作为提升国家竞争力、维护国家安全的重大战略”。2023年1月,工业和信息化部与国家互联网信息办公室等十六部门联合印发《工业和信息化部等十六部门关于促进数据安全产业发展的指导意见》,提出“加快数据安全技术与人工智能、大数据、区块链等新兴技术的交叉融合创新,赋能提升数据安全态势感知、风险研判等能力水平。”
近年来,我国国家安全和国际竞争形势日益复杂,数据安全受到越来越多的重视,人工智能产业链安全愈发重要。算法模型作为人工智能系统的根本内核,直接影响着系统的智能化水平。
目前,全球主流核心算法模型大多被美国提出并掌握,国内许多研究机构和应用型企业所开发的人工智能系统也是基于国外的算法模型,算法理论层面的攻关突破有所欠缺。而对国外算法模型的依赖将导致隐私数据泄漏、用户价值数据被大量获取、高级算法被限制等问题,影响到国家安全。因此,国内人工智能技术型企业需在核心算法、技术框架、基本理论等方面加强自主研发攻关,实现关键环节的自主可控。
2、大模型已成为人工智能的核心技术路径,并将推动人工智能产业化进程
近年来,人工智能算法模型层出不穷。2017年,谷歌提出了Transformer架构后,BERT、GPT等预训练模型相继提出。2019年,基于预训练模型的算法在阅读理解等任务中逐渐超过人类水平,预训练模型理论的算法能力也不断在多个AI榜单中夺得冠军。2020年,OpenAI发布的NLP大模型GPT-3,实现了千亿级数据参数,大模型也成为了超大规模预训练模型的代名词。2022年,ChatGPT的出现更进一步确定了大模型作为人工智能主流技术路线的趋势。
大模型技术能够在大量未标记的人类语言材料上训练,大幅减少了数据标注的成本。更为重要的是,大模型具有很强的迁移能力,通过“预训练+下游任务迁移”的方式,可以快速在不同场景实现迁移部署。因此,大模型技术对于人工智能产业化进程有着重要的推动意义。
3、大模型技术将助力国家新一代人工智能开放创新平台建设
为深入贯彻落实《国务院关于印发新一代人工智能发展规划的通知》,科技部于2019年印发《国家新一代人工智能开放创新平台建设工作指引》,目的是为了充分发挥行业领军企业、研究机构的引领示范作用,整合产业资源,通过建设开放创新平台的方式,着力提升技术创新研发实力和基础软硬件开放共享服务能力。目前,科技部公布支持云从科技、百度、科大讯飞等企业分别在视听交互、自动驾驶、智能语音等领域建设新一代人工智能开放创新平台。
2023年3月,科技部有关负责人表示,将推进面向重大科学问题的人工智能模型和算法创新,发展一批针对典型科研领域的“人工智能驱动的科学研究”专用平台,加快推动国家新一代人工智能公共算力开放创新平台建设,支持高性能计算中心与智算中心异构融合发展,鼓励绿色能源和低碳化,推进软硬件计算技术升级,鼓励各类科研主体按照分类分级原则开放科学数据。
大模型通用性更强,将使算法能力更快速地在用户场景侧部署,进一步降低行业开发门槛,促进领军企业形成规模化效应以及中小企业和团队创新创业,降低独立研发成本,为国家新一代人工智能开放创新平台建设提供助力。
4、行业深度智能化对人工智能提出更高要求
随着行业智能化步伐持续推进,人工智能在各领域的应用日益深入。第一阶段单一模块化的特定场景初步应用和第二阶段面向业务链条的人工智能综合解决方案难以实现对行业的革命性提升,市场亟需智能化程度更高、交互体验感更好、专业能力更强的新技术和新模式。
大模型技术推动人工智能将进入产业发展新阶段,产业发展将会以用户体验的革命性提升为主要驱动因素。AI的工程化能力和智能系统的交互体验成为关键,大量细分场景痛点需要更加完整的智慧解决方案。客户场景中各业务流程对AI的需求将更加强烈,需要交互能力更强的智能体嵌入到全业务环节,加速对传统行业的价值创造。
(二)项目概况
1、项目基本情况
本项目计划投资 363,519.00 万元,建设地点位于广东省广州市,实施主体为云从科技集团股份有限公司。
本项目主要依托公司算法研发能力和大模型理论基础,用于行业大模型的理论研究与构建以及行业大模型下游场景的应用研发,力争形成围绕行业大模型的全链路大模型综合解决方案。具体建设内容分为 4 个子项目的研发,分别是标杆行业专用大模型的研究与构建、人机协同操作系统对多模态大模型的整合与综合实践、数字人应用产品的标杆打造和生态建设、人机协同操作系统和行业专用大模型在行业智能化升级领域的实践。
其中标杆行业专用大模型的研究与构建是本项目的研发核心,云从科技采用大模型下游任务迁移与行业专家知识相结合的范式,打造出能够成为人工智能行业标杆的行业大模型。标杆行业专用大模型子项目的成功建设将为云从科技业务场景提供算法底座。
人机协同操作系统对多模态大模型的整合与综合实践子项目是行业大模型实现技术平台化的关键步骤,将语言大模型和视觉大模型、语音大模型等技术相融合,充分验证和发挥大模型的能力,整合大模型、数据和应用,为行业和场景应用的研发提供平台支持。
数字人应用产品的标杆打造和生态建设、人机协同操作系统和行业专用大模型在行业智能化升级领域的实践 2 个子项目是基于整合大模型技术的人机协同操作系统,在消费级场景和行业应用场景打造大模型应用的标杆。
2、项目实施的必要性
(1)系统性提升公司认知技术水平,助力公司应用场景拓展
公司主要提供高效人机协同操作系统和行业解决方案,助推人工智能产业化进程和各行业智慧化转型升级。“行业精灵”大模型研发项目的建设将大幅提升公司在人机协同操作系统认知层面的能力,通过行业专家知识与大量多维度的数据训练,强化人工智能对真实世界的理解能力,让机器更能够理解用户真实想法,从而产生满足客户预期的应用效果。
同时,大模型技术的研发将有助于公司新产品的开发,进一步提升人机交互能力,增强客户与机器交互过程中的体验感,扩展 AI 应用新场景,进一步开拓市场,让客户借助人工智能实现更好的价值创造。
(2)大模型基础理论与行业实践相结合,巩固公司核心技术壁垒
公司已经构建并开放的人机协同操作系统通过抽取并优化整合多应用领域的共性功能需求和系统技术,实现了技术平台化,提高了客户智能化升级的快速匹配能力。“预训练大模型+下游任务迁移”的训练方式可以在不同场景实现快速部署,算法模型的通用性增强,能够有效降低用户场景开发成本,契合公司技术平台化的战略。
公司将基于大模型理论基础,结合行业经验积累优势,打造具有行业专家知识和高水平交互能力的行业大模型,并在人机协同操作系统上架设大模型能力接口,以兼容自主研发的大模型和其他大模型,满足各种场景下客户的不同需求和偏好,进一步提高公司人机协同操作系统的交互能力,推动实现更加智能化的应用,强化公司的核心技术壁垒。
(3)促进公司人工智能生态建设,提升公司市场地位
随着人工智能产业的发展,基于操作系统的应用生态会愈加繁荣,以人工智能平台为核心的智能化生态将成为趋势。公司以人机协同操作系统为抓手,旨在打造人工智能平台型企业,通过将算法能力向社会释放,运用平台化思维赋能更多行业企业实现智能化转型。大模型具有更强的智能化水平,通过将大模型算法嵌入在已构建的人工智能平台服务生态体系中,将更好地实现全链 AI技术整合与规模化高效 AI 生产力,有助于公司人工智能生态建设,促进大量的行业企业围绕公司核心算法平台形成较强的生态粘性,从而进一步提升公司的市场地位。
3、项目实施的可行性
(1)构建 AI 大模型新型基础设施,符合国家战略发展方向和产业政策
2018 年 12 月,中央经济工作会议提出“要发挥投资关键作用,加大制造业技术改造和设备更新,加快 5G 商用步伐,加强人工智能、工业互联网、物联网等新型基础设施建设”。2020 年中共中央政治局常务委员会会议强调要加大新型基础设施建设进度,国家发改委对新基建的范围做了进一步明确,北京、上海、山东、江苏等全国多个省(市、区)纷纷出台新基建相应政策,新基建已然成为国家战略层面的重要部署。
2021 年,《中华人民共和国国民经济和社会发展第十四个五年规划和 2035年远景目标纲要》提出“瞄准人工智能、量子信息、集成电路、生命健康、脑科学、生物育种、空天科技、深地深海等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目。聚焦高端芯片、操作系统、人工智能关键算法、传感器等关键领域,加快推进基础理论、基础算法、装备材料等研发突破与迭代应用”。
2022 年,国务院印发《“十四五”数字经济发展规划》提出“高效布局人工智能基础设施,提升支撑‘智能+’智发展的行业赋能能力;建立完善基于大数据、人工智能、区块链等新技术的统计监测和决策分析体系,提升数字经济治理的精准性、协调性和有效性;创新发展‘云生活’服务,深化人工智能、虚拟现实、8K 高清视频等技术的融合”。
同年,科技部等六部门印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,提出“以促进人工智能与实体经济深度融合为主线,以推动场景资源开放、提升场景创新能力为方向,强化主体培育、加大应用示范、创新体制机制、完善场景生态,加速人工智能技术攻关、产品开发和产业培育,探索人工智能发展新模式新路径,以人工智能高水平应用促进经济高质量发展”。
AI 新型基础设施作为新基建中的重要部分,主要在算力、算法和数据三个层面为社会提供支撑。大模型系在大量数据的训练基础上,习得普适性的特征和规则,因其较强的迁移能力和通用性,适合作为 AI 新基建中的底层算法逻辑。北京在《北京市“十四五”时期高精尖产业发展规划》中提出建设国家级人工智能前沿研究中心、超大规模人工智能模型训练平台;广州在《广州市人工智能产业链高质量发展三年行动计划》提到大模型及其上下游产业生态等。
本项目着眼于在算法层面构建行业大模型,为制造、金融、商业等领域提供智能算法能力,主要投向属于国家行业政策与资金重点支持发展的科技创新领域,属于国家大力支持发展的产业方向,具备政策导向的可行性。
(2)公司具备成熟的研发团队、先进的算法积累和丰富的实践经验
公司汇聚了众多优秀人才组成人工智能研发团队,核心研发人员拥有丰富的行业经验和扎实的技术功底,研发团队结构合理、技能全面,形成了技术人才壁垒,有力地支撑了公司的技术创新和产品研发。公司打造了可持续发展的“三大联合实验室及六大研发中心”的研发架构,研发人员分布于公司在广州、重庆、上海、苏州、成都、芜湖六地研发中心,为公司内部技术研发核心力量。同时,公司和国内多家知名科研机构建立联合实验室,持续不断的开展人工智能领域相关研发项目合作,旨在提升公司在人工智能基础核心技术的研究能力。
公司通过在人工智能核心算法领域的多年深耕,掌握了自主可控且不断创新的人工智能核心技术,实现了从智能感知到认知、决策的核心技术闭环。公司自主研发的人脸识别、跨镜追踪、活体检测、语音识别、自然语言处理等人工智能技术均处于业界领先水平。
公司及核心技术团队曾先后 9 次获得国内外智能感知领域桂冠,并于 2018年获得“吴文俊人工智能科技进步奖”。公司受邀参与了人工智能国家标准、公安部行业标准等 43 项国家和行业标准制定工作,并同时承担国家发改委“人工智能基础资源公共服务平台”和“高准确度人脸识别系统产业化及应用项目”、科技部“视听交互国家新一代人工智能开放创新平台”等国家级重大项目建设任务。截至2022 年12 月 31 日,公司拥有356 项专利(其中 155项为发明专利)、501 项软件著作权等人工智能领域知识产权。
公司从 2019 年开始就在自然语言处理、OCR、视觉语义理解、语音识别等多个领域实践“预训练大模型+下游任务迁移”的技术范式,产出多个百亿参数以内规模的模型,在金融行业的票据证照识别和服务合规性督查、智慧城市的道路状态监控、机场的航班节点保障等场景体现出巨大价值,充分发挥预训练模型的小样本学习能力,凭借少量训练样本可以在以小时计的时间周期内完成具体场景的任务迁移;同时也一直坚持大规模自监督数据与专家知识相结合的“人机协同”理念,通过专家知识和经验的引入不断提升模型能力;也积极探索 NLP 预训练大模型和视觉/语音预训练大模型的多模态融合。
同时,公司在多个行业领域丰富的项目实践经验,为公司积累了大量的行业专家知识以及众多场景下的实操层面数据资料。行业专家知识不仅能够作为智能系统的教练,进行训练引导,而且能够帮助开发者理解行业逻辑,形成适用性更强的算法模型。以金融行业为例,公司不仅深度参与人民银行总行的 AI技术规范与金融行业标准制定,而且与工商银行、建设银行、证通等大客户建立联合实验室,客户覆盖六大行,签约超过 100 家银行的总行平台,覆盖全国超 14.7 万个网点,积累有丰富的行业经验和深厚的行业理解。
公司在研发人才、算法模型技术、行业实践经验和专家知识等多方面的积累为本项目研发提供了技术保障,具备技术可行性。
(3)大模型促进行业深度智能化,助力人工智能市场进一步拓展
云从科技多年深耕垂直行业,广泛布局智慧金融、智慧治理、智慧出行、智慧商业、数字城市、泛 AI 等业务领域,深入洞悉用户所需,提供多种高效的解决方案为不同垂直领域的客户赋能,形成领先的场景化经验积累和优质的品牌形象。历经长期与各垂直领域重点客户的紧密合作,公司通过大量场景数据训练不断优化算法平台,培育出针对不同行业特有的数据分析和应用能力,积累了对行业的深度理解和核心服务能力,建立了较高的业务壁垒。
中国人工智能产业处于高速建设阶段,核心产业规模呈现爆发式增长。根据赛迪顾问预测,2022 年中国人工智能产业规模达到 2,045.7 亿元,同比增速为 13.0%,随着新兴技术不断创新并逐步落地,人工智能产业将迎来新一轮的增长点,预计到 2024 年产业规模有望达到 2,750.9 亿元。
同时,人工智能通过行业智慧解决方案的方式带动相关的产业保持较高市场增速,预计 2025 年 AI带动行业应用综合解决方案服务的市场规模将达到突破 3 万亿元。未来人工智能将向着多元化的场景应用和行业综合解决方案服务中的深度融合赋能发展。
本次项目的实施将多模态的行业专用大模型整合到人机协同操作系统,基于整合大模型的人机协同操作系统将可实现智能效果和人机交互体验的跨越式提升,并具备基于行业专家知识的快速迁移能力,将提升对于传统人工智能无法应对的行业场景深度痛点的解决能力,充分释放用户智能化进一步升级需求,促进多模态创意内容 AI 生成、AI 咨询、AI 助理、AI 数字人等各类产品迭代升级,助推全新数字经济发展技术基础和商业模式的进一步构建,带动人工智能应用场景和市场空间的持续扩张。
4、项目投资概况
本项目的预计投资总额为 363,519.00 万元。
5、项目实施进度
项目计划建设期为 36 个月。
6、项目备案、环评事项及进展情况
截至本报告出具日,项目备案手续正在办理中。
本项目不同于常规生产性项目,不存在废气、废水、废渣等工业污染物,不涉及土建工程、运输物料等,无重大污染。根据《中华人民共和国环境影响评价法》和《建设项目环境影响评价分类管理名录》的规定,本项目不属于环保法规规定的建设项目,不需要进行项目环境影响评价,亦不需要取得主管环保部门对上述项目的审批文件。
此报告为节选部分,个性化定制咨询思瀚产业研究院。