首 页
研究报告

医疗健康信息技术装备制造汽车及零部件文体教育现代服务业金融保险旅游酒店绿色环保能源电力化工新材料房地产建筑建材交通运输社消零售轻工业家电数码产品现代农业投资环境

产业规划

产业规划专题产业规划案例

可研报告

可研报告专题可研报告案例

商业计划书

商业计划书专题商业计划书案例

园区规划

园区规划专题园区规划案例

大健康

大健康专题大健康案例

行业新闻

产业新闻产业资讯产业投资产业数据产业科技产业政策

关于我们

公司简介发展历程品质保证公司新闻

当前位置:思瀚首页 >> 行业新闻 >>  产业数据

人工智能企业全球布局加速,多语种能力成为企业业务拓展核心支撑
思瀚产业研究院 海天瑞声    2023-08-04

1、行业发展概况

(1)在全球数字经济发展以及以 ChatGPT 为代表的大模型的驱动下,全球人工智能产业即将进入新一轮加速发展期

当前,新一轮科技革命和产业变革深入发展,数字化转型成为大势所趋,世界主要国家均高度重视发展数字经济,纷纷出台战略规划,重塑数字时代的国际竞争新格局。

人工智能作为数字经济发展的底层核心技术之一,正在发挥更加重要的作用。例如,随着数字经济发展的不断深入,数据体量以及复杂度均不断提升,为更好解决产业数字化中数据提取、处理、分析等工作,将会产生更多样化的人工智能需求,人工智能支出也将成为支持企业数字化转型支出的主力之一。

根据 IDC 报告,全球范围内,企业在人工智能市场的投资增速将显著高于数字化转型支出(DX)和 GDP 增速。

此外,以 ChatGPT 为代表的大模型在近期的现象级智能化表现引发行业强烈关注。作为全新的人工智能聊天机器人,推出仅仅两个多月,ChatGPT 全球用户已突破 1 亿,人工智能通过极具颠覆性的能力再次走入大众视野,并获得了产业界的广泛关注。可以预见,人工智能行业将在以 ChatGPT 为代表的大模型技术的推动下进入新一轮产业高速发展期。

未来,受益于数字经济政策和大模型技术的双重驱动,人工智能将具备更强的产业融合能力,并将深刻影响千行百业的运行规则,以及人们的生活方式,人工智能产业的发展将随之进入快车道。

根据国际数据公司(IDC)的数据,2021 年,全球人工智能市场规模为 885.7亿美元,预计 2025 年将达到 2,218.7 亿美元,年复合增长率达到 26.2%。

在市场需求拉动和国家政策的支持引导下,当前我国人工智能产业加速发展,已形成基础底层设施、中层技术以及上层应用的完备的产业链生态,一批创新活跃、特色鲜明的创新企业不断涌现,并联合推动中国人工智能产业实现规模增长。根据艾瑞咨询的数据显示,2022 年中国人工智能产业规模达 1,948 亿元,

预计 2027 年市场规模将达到 6,122 亿元,年复合增长率为 25.6%,主要与智算中心建设以及大模型训练等需求拉动的 AI 芯片市场、无接触服务需求拉动的智能机器人及对话式 AI 市场等快速增长相关,并有望在下游制造、交通、金融医疗等多领域不断渗透,实现大规模落地应用。

(2)训练数据作为 AI 算法发展和演进“燃料”的作用更加凸显

在 AI 产业链中,算法、算力和数据共同构成技术发展的三大核心要素。算法模型从技术理论到应用实践的落地过程依赖于大量的训练数据。训练数据越多、越完整、质量越高,模型推断的结论越可靠。过去十年人工智能产业是以算法为核心,通过深度学习算法的不断创新,推动人工智能产业的快速发展。但未来,随着算法发展趋于开源、算力能力大幅提升、及人工智能模型从技术理论应用到更多的垂直场景,想要更快更好提升人工智能能力,数据将发挥更重要的作用。

根据 Cognilytica 数据统计显示,2021 年全球 AI 训练数据市场需求约为 42亿美元,并预计到 2027 年这一需求将增长到 220 亿美元,2021-2027 年复合增长率达 32%。

中国作为全球人工智能产业增速最快的国家之一,相关数据需求也在快速增长。根据德勤数据,2022 年中国人工智能基础数据服务市场规模为 45 亿元,2027年规模将达到 130-160 亿元,年复合增长率为 23.6%-28.9%。

(3)数据要素市场蓬勃发展,数据行业迎来更为广阔的发展机遇

近年来,我国数字经济蓬勃发展,数据要素因具有基础性战略资源和关键性生产要素的双重属性,相关市场规模持续增长。

尤其在《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》出台后,我国系统性布局了数据基础制度体系的“四梁八柱”,加速了数据流通交易和数据要素市场发展,进一步推动了公共数据、企业数据、个人数据合规高效流通使用。为更好响应中央号召,北京、上海、广州、深圳、杭州等地数据政策陆续出台,逐步构建了多层次、多元化数据要素市场生态体系。

以北京为例,《关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》、《北京市促进通用人工智能创新发展的若干措施》和《关于推进北京市数据专区建设的指导意见》指出,北京市要加快建设“数据基础制度先行先试示范区”(以下简称“先行先试示范区”),“支持北京经济技术开发区等开展数据基础制度先行先试,打造政策高地、可信空间和数据工场”,探索打造数据训练基地,归集高质量基础训练数据集,推动数据要素高水平开放,提升本市人工智能数据标注库规模和质量,并建设针对重大领域、重点区域或特定场景建设专题数据区域,吸纳市场主体和数据、技术、资本等多元要素参与。

北京市陆续出台的多项文件旨在打破数据壁垒,推动数据融合利用,加快推动公共数据开放,促进数据要素流通,激发数字市场创新活力,释放和发展数字化生产力,打造多层级数据要素市场,成为具有竞争力和影响力的数字产业集群。按照“政府引导、市场运作、创新引领、安全可控”的原则,“先行先试示范区”有望成为国际领先的数据要素高效流通核心枢纽。

数据要素市场受政策推动,进入高速发展期,未来围绕数据的价值利用以及流通交易,将产生大量新增数据需求,为数据行业开拓了新的增长空间,提供了新的业务拓展机遇。未来,数据要素也将成为数据行业增长的重要推动力量。

2、行业发展趋势

(1)大模型技术的突破和跃升,将驱动新型数据需求持续增长

随着 ChatGPT 成为全球范围内的现象级应用,人工智能迎来了新的发展机遇,其背后的大模型技术也将进一步引导人工智能产业变革并带来相关数据需求的变化和增长。

首先,数据的质量以及数据清洗的工程化能力会显著拉开大模型预训练阶段的效果差距;同时,更多模型或将采用类强化学习模式来进行特定领域或特定方向上的优化迭代,以使得机器能够以更加接近于人类期望的方式提供答案输出。

对于大模型训练而言,不仅需要持续获取大规模、高质量、多模态、多场景、多垂向的数据,更须具备持续迭代的高质量数据清洗和标注策略,以不断提升包括预训练(Pre-training)、模型微调(Fine-tune)及奖励模型(Reward Model)等过程中所需数据(例如提示(Prompt)类数据)的质量,确保语言类和常识性知识之外的其他垂直领域的应用场景的能力提升,为大模型精确性、通用性及泛化能力的实现奠定坚实基础。

在以上背景下,一方面,大规模、高质量数据集重要性凸显,成为模型训练效果的核心支撑之一。另一方面,AI 发展所面对的数据前沿性及工程化技术的挑战也较为显著。长期看,只有 AI 数据处理技术的不断拓新与发展,才能及时适应甚至超前引领大模型技术和应用的发展。

(2)多模态数据受 AIGC 发展驱动,将呈现快速增长趋势

随着 AIGC 技术发展,AI 可在更多维度、更多场景辅助人类进行内容生产以及创作。例如,通过大模型等 AIGC 技术,人类仅需输入一段简单的文字指令,AI 即可按照人类描述生成一幅画、一段语音或一段视频,以此帮助人类完成内容创作。想要实现上述功能,AI 除了要具备理解人类文字指令的能力,还需要通过对齐两种独立模态关键特征的方式,建立文字与图、语音、视频等一一映射关系,这背后将依赖大量的多模态数据,AI 需要对多模态数据进行学习,以实现跨模态的创作能力。

此外,随着 AI 虚拟主播、虚拟学生、虚拟员工轮番上岗,数字人这个新兴概念逐渐走入大众视野,成为人工智能领域的热门技术赛道。想要让虚拟数字人实现与人类的自然交互,不仅需要发音标准自然、身体动作流畅,其表情、口型与声音也要实现细节的精准匹配,而多模态技术就是打破传统人工智能单一感官局限、让各类 AI 能力协同使用的重要技术。通过对高质量多模态训练数据集的持续学习,AI 可实现图像、视频、音频、语义文本等多维度能力的融合,使得虚拟人在行为上更接近人类。

未来,随着以 AIGC、虚拟人为代表的 AI 技术以及应用的不断发展,多模态数据需求将呈现加速增长趋势。

(3)人工智能企业全球化布局加速,多语种能力成为企业业务拓展核心支撑

2013 年,共建“一带一路”的倡议正式面世,十年来,随着国家“一带一路”战略的深入推进,国内一批具有较强创新能力和过硬技术实力的企业,纷纷踏出国门,积极拓展海外市场,通过不断扩大企业出海战略版图,获得高速发展机会。另一方面,境外头部企业也继续践行“全球化”战略,搭乘全球出海的快车。

随着境内、外企业的全球化扩张成为确定性趋势,多语种能力作为支撑企业顺利出海的核心要素之一,重要意义更加凸显。未来,多语种训练数据将对客户侧在语音助手、智能汽车、智能家居、智能客服、机器人、多语种 OCR 等各领域产品/应用的全球化推广起到积极作用。因此,随着各类客户群体扩张步伐加速,多语种需求也将快速增长,具有强大语言研究能力的数据服务企业将获得更多商业机会。

(4)人工智能技术加速向产业渗透融合,催生更多垂向领域数据需求

随着深度学习技术的不断突破,人工智能发展已经进入 2.0 时代,相关训练需求正逐渐从通用基础能力建设,向更为专业的垂向场景/行业拓展。一方面,以大模型为代表的 AI 基础技术不断取得重大突破,AI 模拟人类认知的能力飞速提升,因此从技术能力维度看,AI 已具备与垂直产业融合并规模化应用的前提条件;另一方面,受国家数字经济发展战略推动,产业数字化和智能化将进一步席卷各行各业,智能化技术与传统产业的融合将成为数字经济时代的新发展趋势,并创造出巨大的蓝海空间。

当前 AI 技术正在加速与各类产业融合,在汽车、金融、医疗、工业等传统行业的渗透率和应用场景不断提升,展现出可观的商业价值和巨大的发展潜力,而数据作为打通算法技术与行业需求的核心桥梁,作用更加凸显,可以说数据能力一定程度上决定了算法模型在对应产业的适用性以及实用性,成为加速 AI 产业化落地的关键要素。

免责声明:
1.本站部分文章为转载,其目的在于传播更多信息,我们不对其准确性、完整性、及时性、有效性和适用性等任何的陈述和保证。本文仅代表作者本人观点,并不代表本网赞同其观点和对其真实性负责。
2.思瀚研究院一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及文章内容、版权等问题,我们将及时沟通与处理。