首 页
研究报告

医疗健康信息技术装备制造汽车及零部件文体教育现代服务业金融保险旅游酒店绿色环保能源电力化工新材料房地产建筑建材交通运输社消零售轻工业家电数码产品现代农业投资环境

产业规划

产业规划专题产业规划案例

可研报告

可研报告专题可研报告案例

商业计划书

商业计划书专题商业计划书案例

园区规划

园区规划专题园区规划案例

大健康

大健康专题大健康案例

行业新闻

产业新闻产业资讯产业投资产业数据产业科技产业政策

关于我们

公司简介发展历程品质保证公司新闻

当前位置:思瀚首页 >> 行业新闻 >>  产业科技

生成式人工智能主要发展特点
思瀚产业研究院    2025-10-25

一、 国产人工智能成果丰硕

我国生成式人工智能相关领域迅猛发展。

一是用户规模显著增长。截至2025 年 6 月,我国生成式人工智能用户规模达 5.15 亿人,较 2024 年 12 月增长 2.66 亿人;生成式人工智能普及率达 36.5%,较 2024 年 12 月提升 18.8个百分点。据不完全统计,截至 7 月,我国大模型应用的个人用户注册总数超过 31 亿,API 调用用户总数超过 1.59 亿。

二是产品数量持续增多。截至2025 年 8 月底,累计有 538 款生成式人工智能服务完成备案,263 款生成式人工智能应用或功能完成登记。其中,豆包、DeepSeek、元宝、Kimi 等产品不仅在千亿级参数规模、多模态能力等方面实现突破,还与智能搜索、内容创作、办公助手等应用场景深度融合,构建了覆盖多个领域的智能应用生态。

三是产品性能明显提升。斯坦福大学人工智能研究所发布的《2025 年人工智能指数报告》显示,中美顶级人工智能大模型在 MMLU4和HumanEval5等基准测试中的性能差距从 2023 年的 17.5%缩小至 0.3%;中国拥有的顶级人工智能模型数量达到 15 个,位居全球第二,数量是欧洲的 5倍。四是优质产品惠及海外。

随着我国人工智能相关领域的持续发展创新,一批优质的国产人工智能产品加速出海,扩大了我国人工智能产品在全球市场的影响力。其中,DeepSeek 成为我国人工智能产品出海的耀眼名片。1 月,“DeepSeek-R1”模型对外发布,在实现卓越性能的同时,成本却不到同类模型的十分之一,迅速引发全球关注。上线不足 20 天,DeepSeek 的全球日活跃用户就突破 3000 万,登顶全球 140 个国家及地区的应用市场,超过ChatGPT 成为全球用户增速最快的生成式人工智能应用。

二、 逻辑推理能力显著提升

随着技术日趋成熟,用户对生成式人工智能的要求不断提高,在各类实际应用场景中更加看重人工智能对复杂任务的处理效果,推动生成式人工智能的逻辑推理能力显著提升。生成式人工智能在发展初期聚焦于文本、图像等内容的生成能力,“幻觉”问题严重,也很难根据历史信息进行合理的推演。

随后,相关企业通过多种技术手段提升生成式人工智能产品的逻辑能力,并取得了明显进步。

一是提高模型参数规模。模型参数规模的扩大显著增强了模型对复杂逻辑关系的捕捉能力,尤其是在多轮对话、代码生成和复杂推理任务中表现突出。例如,OpenAI 的 GPT-3 系列模型参数规模为 1750 亿,其后续发布的 GPT-4 系列模型参数规模则估计达到 1.76 万亿,显著提升了模型在逻辑推理和归纳任务中的表现。

二是优化架构设计。架构优化也成为关键突破口,例如采用稀疏注意力机制(Sparse Attention)、混合专家模型(Mixture of experts)等方式,不仅降低了模型的计算资源消耗,还提升了模型对长序列数据的处理能力。此外,Mamba 等新型架构也有望为模型在自然语言处理、时间序列预测等领域提供新的发展方向。

三是提升数据质量。生成式人工智能的逻辑推理能力高度依赖训练数据的质量和多样性。企业通过构建大规模、高质量的标注数据集,提升了训练模型的逻辑能力。此外,越来越多的专业数据也投入到模型训练过程中,企业通过整合代码、法律、医学、教育等领域的专业知识数据,使模型能够在不同场景进行灵活应对,提升了其在专业领域的应答能力。

三、 多模态能力跨越式发展

生成式人工智能的多模态能力实现了跨越式发展,有效拓展了应用场景。

一是模型性能提升。随着生成式人工智能技术的快速进步,其在处理多模态数据时的理解、生成和跨模态协调能力也得到显著增强。例如,OpenAI 的GPT-4o 能接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出,且可在平均 320 毫秒内响应音频输入,接近人类在交谈中的响应时间。

二是应用场景拓展。生成式人工智能多模态能力的增强使得其可以在越来越多样、复杂的应用场景下发挥作用。在内容创作领域,OpenAI 的 Sora、谷歌的 Veo3 等模型可以根据用户的文本提示创建真实度极高的视频片段,给电影、电视剧领域的内容创作带来新的可能;谷歌的Genie2 能够根据用户输入的文本描述和图像生成交互式的三维场景,为游戏开发、虚拟现实等领域提供有力支持;快手的“可灵 2.0”、阿里云的“通义万相”等国产视频生成模型不仅在语义响应、动态质量、画面美学等方面的生成效果显著提升,还能理解用户提供的图片、视频等多模态参考信息,从而强化模型对作者创意的理解能力。

在无人驾驶领域,智能汽车企业利用生成式人工智能的多模态能力融合摄像头采集的视觉图像、雷达探测的距离与速度数据,提升车辆对障碍物、行人与交通标识等复杂场景的理解和应对能力,增强车辆行驶安全性。

三是交互体验优化。多模态技术让人工智能的交互更加自然和拟人。以 GPT-4o 为例,其可以检测用户的情绪,并以类似人类或机器人的语调与用户交谈,还能按照要求变化音色、语调、情感等,给用户提供充满人类情感的反馈。

四、 模型推理成本显著降低

模型推理成本的显著降低成为推动生成式人工智能技术商业化的重要因素。以 OpenAI 的 GPT 系列模型为例,其 GPT-3.5 水平的系统推理成本在2022 年 11 月至 2024 年 10 月期间下降超过 280 倍。模型推理成本的显著下降主要得益于以下三点:

一是技术优化。模型架构的持续优化降低了其在处理复杂任务时的计算资源消耗。例如,混合专家模型通过将模型分解为多个专家网络,每个网络专注于特定任务或数据子集,减少了不必要的计算,进而降低了成本。

二是硬件升级。专用于生成式人工智能模型训练的芯片通过架构创新实现性能跃升。例如,英伟达专用于模型推理和训练的服务器系统 GB300 NVL72 的计算能力是上一代 Hopper 系统的 65 倍;谷歌专为生成式人工智能设计的第七代 TPU Ironwood 的计算效率比其首款 TPU 高出近 30 倍。

三是市场竞争。生成式人工智能领域日益激烈的市场竞争成为相关企业积极探索降低推理成本的重要动力。为争夺市场份额,各大厂商纷纷降低模型调用价格。如百度在 2024 年 9 月宣布其文心旗舰大模型降价幅度超过 90%;阿里云在 2024 年 12 月宣布其通义千问视觉理解模型降价超过80%。随着模型调用价格的显著下降,企业为获得利润空间,不得不投入更多资源降低模型的推理成本。

五、 轻量模型赋能场景应用

生成式人工智能企业在不断提升主力模型性能的同时,也积极推出轻量模型,满足用户在不同应用场景下的需求。无论是阿里巴巴、百度等国内厂商,还是 OpenAI、谷歌等海外厂商,都积极发布轻量模型,为用户提供低成本、易部署的解决方案。轻量模型成为生成式人工智能重要发展趋势的主要原因在于以下三个方面:

一是运行成本方面。生成式人工智能企业推出的主力模型虽然拥有强大的产品性能,但计算成本往往也非常高昂。以 OpenAI的 GPT-o3 模型为例,在 2024 年底对外公布时,其高计算量模式下每个任务的预期成本高达数千美元,显然超出了绝大部分用户的承受能力。

二是用户体验方面。生成式人工智能输出高质量的结果不仅需要大量的计算成本,而且往往需要较长的时间,因此主力模型难以满足需要快速响应用户的需求。例如,在智能客服系统中,用户通常无法容忍长时间等待响应的情况,而千亿参数模型的单次推理往往耗时较长,难以满足智能客服场景下的应用需求。通过剪枝、量化、知识蒸馏等技术,轻量化模型可以将推理时间压缩至毫秒级别,从而实现对用户的快速响应。

三是部署需求方面。主力模型的参数规模往往较大,难以在手机、物联网设备等资源受限场景中实时运行。轻量模型通过参数压缩、算法优化与硬件适配等方式,实现了性能与效率的平衡,推动生成式人工智能从云端走向终端。以网易有道在 2025 年 6 月发布的“子曰 3 数学模型”为例,其解决数学的推理性能超过主流通用大模型,却只需要单块消费级 GPU 就能运行,使得普通教育机构也能以低成本部署专业级的数学人工智能应用。

更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。

免责声明:
1.本站部分文章为转载,其目的在于传播更多信息,我们不对其准确性、完整性、及时性、有效性和适用性等任何的陈述和保证。本文仅代表作者本人观点,并不代表本网赞同其观点和对其真实性负责。
2.思瀚研究院一贯高度重视知识产权保护并遵守中国各项知识产权法律。如涉及文章内容、版权等问题,我们将及时沟通与处理。