人工智能浪潮带来变革和机遇
人工智能(“AI”)是计算机科学的一个分支,其所致力开发的机器能够完成通常需要人类智力完成的任务。这些任务包括学习、推理、解决问题、感知、语言理解和决策。在人工智能浪潮的推动下,各行各业都在经历前所未有的变革。
随著机器学习、计算机视觉和自然语言处理等人工智能核心技术的飞速进步,从制造业、服务业、城市治理到交通运输等多个领域正在经历数字化转型。人工智能与其他多个领域的融合正在催生新的技术和业务模式,带来了持续的溢出效应。人工智能不仅提高了生产效率和决策的准确性,还孕育出全新的商业模式和服务。
随著技术的日益成熟和应用的广泛推广,人工智能已经成为推动经济增长和创新的关键力量。在这方面,中国市场正成为全球人工智能创新的领军者。2023年全球人工智能支出(包括系统软硬件及服务)达1,540亿美元,而中国已经崛起为全球第二大人工智能市场,人工智能的支出在2023年达到148亿美元,佔全球人工智能支出的约10%。在政策鼓励和技术进步的双轮驱动下,人工智能正在步入规模化应用时代。
生成式人工智能从研发到商业化应用
根据其目的和模型类型,人工智能可大致分为决策型人工智能和生成式人工智能(“生成式人工智能”)。决策型人工智能学习如何从样本数据中区分各种类别,根据输入数据做出最佳决策或选择正确的类别。而生成式人工智能则学习现有数据和信息的模式和结构,从而为用户生成新的数据和信息。作为人工智能发展的核心方向,生成式人工智能正迅速推动人工智能技术的革新。
生成式人工智能具备从数十亿到数万亿的参数及数据集中学习并处理、理解和生成人类语言、图像和声音的能力。作为生成式人工智能的一种强大形式,大模型(“大模型”)具有理解複杂语言模式和生成连贯、上下文感知响应的能力,使其能够在所有场景中执行动态任务。随著技术创新,大模型不再局限于单一模态的数据处理,而是拓展至多模态的数据处理。
多模态大模型能够同时处理和理解多种类型的数据,如文本、图像和声音,为複杂的多模态任务提供了强大的支持,令大模型在多种应用场景中展现卓越表现。在需要跨模态信息交互和整合的任务中,多模态大模型能够有效地整合和利用不同类型的数据,为相关应用场景提供更全面、更精确的解决方案。
为了解决工业应用中更为具体和专门的问题,领域大模型会进行微调或专门训练,以在特定领域、产业或专业领域内运作。与一般用途的大模型不同,领域大模型均为量身定制,专注于较狭窄的知识范围和应用场景。这种定制使之能够提供更精确、可靠和高效的输出,以满足不同行业和特定领域的独特需求。
世界各国均在积极推动大模型的研发和应用,其中美国和中国发佈的大模型总数佔全球发佈量的80%。截至2023年12月,全球已发佈超500个大模型,中国已经发佈了约240个大模型。随著生成式人工智能技术的快速发展,预计2023年至2028年,中国生成式人工智能投资複合年增长率将达到86.2%。
生成式人工智能的技术进步和应用为人工智能技术的各个领域带来了显著的改进。2023年,生成式人工智能技术经历了长足发展,不仅极大地提升了人工智能技术在各个行业中的应用,也使人工智能与传统行业深度融合。随著生成式人工智能的不断进步,预计生成式人工智能将有更广阔的应用前景,能够更好地满足未来複杂和多变的应用需求。凭藉其强大的语意表示能力,大模型已成为自然语言处理领域的一项突破性技术。
然而,模型规模的指数式增长大大增加了计算複杂度,导致在部署过程中出现高能耗和延迟限制-这些是在边缘设备和实时场景中应用大模型的主要障碍。为应对这一挑战,模型蒸馏被提出,通过知识迁移实现大模型的轻量级适配。
作为模型蒸馏中的“教师模型”,基本模型通常是指通过自监督预训练构建的大容量参数空间。其隐式知识表示来源于对大规模语料库的深度语意建模。传统的监督学习依赖于“硬标籤”-即离散的标记类别-而蒸馏技术使用“软标籤”来传达更丰富的知识信号。软标籤被定义为基本模型输出的归一化概率分佈,其特点包括:(1)非目标类别的置信度权重;及(2)类间相似性关係的隐式编码。
通过最小化其输出与教师模型输出之间的KullbackLeibler散度,学生模型不仅学习样本的判别特徵,还捕获教师模型的广义决策边界,从而增强对噪声和对抗样本的鲁棒性。随著模型蒸馏的不断发展和完善,轻量级大模型在保持性能标准的同时越来越能够实现低资源部署,为广泛普及人工智能提供了一种新的技术范式。
大模型的商业化落地面临挑战
作为生成式人工智能的核心引擎,大模型的商业化落地主要面临以下挑战。
数据採集。大模型的训练需要大量具代表性和多样性的数据,但在现实中获取这样的高质量数据面临隐私、安全和数据稀缺的问题。
对特定领域适应性不足。儘管大模型在处理複杂任务方面表现出色,但其在特定领域的适应性还存在局限性。例如,当应用大模型来优化交通流量或预测公共设施的需求时,模型可能因为对城市规划和运作了解不足而无法准确预测。
算力资源需求大。大规模模型的训练和运行需大量计算和能源资源。高效利用算力并探索可持续能源方案是大模型商业化落地过程中面临的挑战。
通用人工智能(“AGI”)的发展主要遵循三个技术路径,即大模型、新模型和“模型+系统”路径。大模型具有较高的泛化能力和通用性,可以为多个行业提供解决方案,所以大模型路径著重于扩大模型规模和改进训练方法。
新模型路径则探索新的模型架构,在行业中尚处于探索阶段。“模型+系统”技术路径是除了互联网巨头和以模型研发为主营业务公司之外的特定领域的企业快速实现大模型和AGI商业化的最佳途径。该路径将已有系统与各类模型进行融合,通过指令调用使模型对系统进行赋能,充分发挥模型的通用知识、理解力、推理能力和多模态能力,通过系统更好地实现多模态融合。
与此同时,系统的实时响应和控制等能力也能弥补模型的缺陷,为特定领域提供更为智能、高效的解决方案。“模型+系统”路径相较于大模型和新模型路径无需花费大量的时间和财力不断提升大模型的参数量,能够快速地将已有大模型商业化。量或预测公共设施的需求时,模型可能因为对城市规划和运作了解不足而无法准确预测。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。