AI发展历史
AI作为当今数字世界的核心驱动力,正在以前所未有的衝击力重塑人类生活。AI的发展经历了技术逐渐成熟、能力边界不断扩展的五个阶段。
第一阶段:符号逻辑与规则系统(1950年代至1980年代)
AI的发展始于1950年代,对逻辑推理及符号系统进行了早期探索。研究人员建立了基于规则的专家系统,以模拟人类的思维过程。这一阶段的关键突破是证明正式推理可以被计算建模。然而,受制于当时的技术,这些系统只能处理高度结构化的问题,难以应对现实世界的模糊性及複杂性。因此,此期间内的AI产品主要以学术研究、仅限于规则类问题应用为主,仅有简单人机交互、医疗诊断辅助等应用实现小范围商业化。
第二阶段:统计模型与神经网络(1990年代至2011年)
到1990年代,神经网络及统计模型开始取代符号系统,推动了在处理图像、语音及自然语言等非结构化数据方面的重大进步。这为深度学习奠定了基础。这一阶段的核心创新是使机器能够直接从数据中学习模式。因此,亦产生了静态图像识别、基于模板的机器翻译和语音识别等单一任务系统,但其跨任务的迁移能力有限。然而,模型仍然严重依赖人工设计的特徵,不同的数据类型(如图像及文本)使用不同的方法进行处理。
第三阶段:深度学习(2012年至2017年)
2012年,AlexNet在ImageNet竞赛中的优异表现标志著深度学习成为主流应用,开启了现实世界AI应用的新时代。这一时期出现了算法创新浪潮,包括各种形式的深度卷积及递归网络,在图像分类及自然语言处理等特定任务中实现了人类水平的性能。TensorFlow及PyTorch等训练框架的引入,进一步加速了大规模并行训练的採用。此阶段的AI产品在人脸识别、安防监控等特定应用场景具备了较强的能力。儘管取得了这些进步,但AI仍难以整合及生成多种数据模态。
第四阶段:模型架构渐趋统一(2017年至2022年)
2017年引入的Transformer架构通过其自注意力机制彻底改变了自然语言处理,实现了跨文本、图像及其他数据类型的统一表示。这一突破推动GPT-3等大规模预训练模型的激增,为大模型时代奠定了基础,并通过CLIP等模型验证了多模态对比学习的可行性。图文对齐、语义搜索、上下文理解等应用随之兴起。然而,由于缺乏真正的推理能力,AI系统仍然难以在生成任务中实现逻辑一致性。
第五阶段:大模型通向AGI(2023年后)
随著大模型进入商业部署,AGI成为长期目标,2022年ChatGPT的发佈标志著一个转折点。这些模型代表了深度学习的新范式,显著增强了AI的感知、理解及决策能力。凭藉强大的迁移学习能力及在一般领域越来越像人类的性能,大模型现在可提供更先进的多模态理解及输出,例如GPT-4o及Gemini。同时,GPT-o1等推理模型的推出表明其在逻辑、数学及複杂多步推理领域的能力增强。其被广泛认为是通往AIAgent及最终AGI道路上的关键跳板。
AI的三大核心要素
算力、数据及算法是AI的三大核心要素,共同驱动其发展。
算力。随著相关技术的快速进步,AI芯片的计算性能不断提升,同时算力成本稳步下降,逐渐降低了开发及部署AI模型的壁垒。特别是在大模型时代,集中训练及分佈式推理至关重要,高效的计算架构及优化的系统设计正被证明更具适应性,因此成为未来算力的一个决定性趋势。
数据。数据为训练AI模型提供素材,使它们能够学习複杂的模式及关係,并对以前从未见过的输入提供准确的预测及见解。训练数据的规模、质量及多样性直接影响模型性能。倘训练数据包含过多的噪音,可能会在现实世界应用过程中导致幻觉及其他问题。
特别是对中国的AI公司来说,一个关键挑战在于英语数据在主流培训语料库中佔主导地位,而中文语料相对有限,凸显了开发高质量中文语料库的紧迫性。此外,很大一部分高价值数据以非结构化及多模态格式存在,例如金融研究报告、专利申请及学术论文往往包含複杂的图表、多格式表格及複杂的数学公式。从这些内容中提取价值需要能够准确识别及分析数据的先进文档解析技术。
算法。算法创新仍然是提高AI性能及优化效率的最有力槓杆,定义了AI能力的上限,在这一领域的突破往往可以带来模型智能水平的巨大飞跃。AI模型架构已从早期的基于规则的系统发展到多种神经网络结构,并最终形成了如今的Transformer、MOE(混合专家模型)及RLHF(基于人类反馈的强化学习)等。此外,高效的算法可以帮助解决算力及数据可用性方面的瓶颈,释放现有计算资源的更大潜力,并减少对海量数据集的依赖,从而提高模型能力。
AI技术商业化
AI技术从符号逻辑和基于规则的系统走向通用智能,其发展本质是感知到认知再到决策的能力提升。展望未来,随著多模态大模型与现实环境深度融合,AI产品及解决方案将日益成为C端及B端智能决策的关键工具。AI技术的商业化主要有纯软件以及软硬件结合两种模式。在AI软件中,AI产品与AI解决方案的不同之处在于,AI产品的特点是标准化交付,具有统一的产品接口、模型架构及数据接口,能够实现可扩展性、快速部署及对市场需求的快速响应,适用于广泛的用例,既涵盖C端,也涵盖B端。
根据其目标用户,AI产品可分为C端产品及B端产品。C端产品旨在提高学习、工作及娱乐等领域的效率及能力。B端产品是为企业及机构开发的,利用技术及数据驱动的方法,帮助它们更高效、更准确地解决问题,从而简化工作流程,提高生产力。根据灼识谘询,2024年全球AI产品市场规模达465亿美元,预计到2029年将进一步增长至2,280亿美元,複合年增长率为37.4%。
全球AI产品市场发展趋势
技术驱动创新。AI公司持续的研发投入正在显著增强AI产品的智能化,使其能够更好地理解用户意图,并在複杂、动态的环境中更可靠地运行。
从感知到理解,再到现在的决策,AI产品正在经历能力的范式转变。早期的AI产品专注于单一模式识别,如文字及图像识别。自然语言处理、多模态处理及知识图谱等技术的后期集成,使AI能够更深入地理解来自多个来源的资料,从而增强产品性能及功能。最近,大模型、强化学习及长文推理方面的突破,使AI产品能够在日益複杂的场景中执行複杂的推理并做出决策。
覆盖全方位需求的产品。用户偏好、使用模式及行为现在可以被AI产品高效处理及学习。随著AI长文本处理能力的增长,其能力边界正在从处理孤立的任务扩展到支持用户完成更複杂、更一体化的工作流程。
在C端方面,凭藉强大的隐私保护,AI产品可以利用完整的用户历史,更好地了解个人需求及偏好,在日常生活中作为跨越不同场景的长期智能助手。
在B端方面,AI产品不断从业务模式中学习,主动识别需求并动态优化工作流程,同时确保合规及数据安全。这支持从需求识别到解决方案设计、执行及性能评估的全闭环流程。
跨不同场景的应用。AI产品正被部署在越来越多的垂直及跨行业场景中。在C端方面,AI进入了个人效率、创意内容生成及社交娱乐等领域。在製造业,AI实现了端到端的质量控制及预测性维护。零售方面,支持需求预测及智能补货,优化库存,提升运营效率。
在医疗领域,基于图像识别及多模态诊断工具的AI模型,可以帮助临床医生更有效地定位病灶及个性化治疗方案。展望未来,随著用户需求的增长、行业特定知识库的成熟以及AI能力的不断进步,AI产品有望解锁更广泛的应用,为C端及B端都带来持久的价值。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告、产业规划、园区规划、商业计划书、专项调研、建筑设计、境外投资报告等相关咨询服务方案。