1、轻量级 LLM 降本提效提供基础,智能 AI 模组预期迅速发展
轻量级 LLM 调用成本降低。在 2023-2024 年间,研发人员提出的MMMU、GPQA 和SWE-bench等新的基准人工智能测试基准中,人工智能的测试表现大幅度提升。效率提升的同时,受单位推理成本降低、Token 消耗优化技术的推动下,大模型调用成本实现优化。随着小模型性能提升,达到 GPT-3.5 水平的推理成本在两年间下降280 倍,硬件成本以每年30%的速度递减,能效年提升率达 40%。
在 MMLU 基准测试中达到GPT-3.5 水平(MMLU准确率 64.8%)的 AI 模型调用成本,已从 2022 年 11 月的 20 美元/每百万token 降至2024年 10 月的 0.07 美元/每百万 token,18 个月内 AI 成本下降280 倍。2025 年4 月18日,豆包发布 1.5 深度思考多模态模型,其激活参数仅 20B,具备显著的训练和推理成本优势。另外,实施模型级联策略,即先使用较便宜的小型模型处理简单请求,只有在复杂查询时才调用更昂贵的强大模型,能够在应用层更好地节约调用成本。
在轻量级大模型能力的不断提升,调用成本下降的趋势下,端侧AI 底座得以高速发展,AI 技术通过深度学习和大数据分析,使得物联网终端能够实时收集和处理大量数据,进而为行业提供精准的决策支持。一方面,蜂窝网络通信技术持续迭代更新,蜂窝模组因此更迭制式标准,以目前应用及发展情况来看,2/3G 面临退网,NB-IoT、Cat.1、Cat.4成为主流,5G RedCap 模组正在得到应用的青睐,轻量化的模组与大模型得到结合的际遇。另一方面,用户对端侧 AI 的需求上涨,促使蜂窝模组从简单的具备通信功能向具有基本边缘数据处理功能演进,所以各公司都纷纷开辟了智能模组产品线。
AI 与物联网的结合使得下游行业能够提供更加个性化的服务和体验,无线通信融合端侧AI 应用,AI 大模型与边缘计算的结合正在持续扩展应用领域,物联网设备搭载轻量化大模型的趋势将加速演进。终端硬件性能跃迁为端侧 AI 部署提供基础,边缘计算需求的增长促进 AI 算力下沉至终端设备已成为趋势,通过专用AI 芯片和分布式计算框架,企业能够实现云端训练与边缘推理的无缝衔接。同时,针对物联网设备对轻量化AI模型的需求,模型压缩技术可将千亿级参数的大模型精简为百兆级版本,并保持较高的任务精度。
AI 计算能力从云端下沉至手机、PC、汽车等终端设备,相较于云部署AI集群,端侧 AI 通过本地化处理实现低延迟、高隐私保护和个性化服务。根据Counterpoint数据,到 2030 年 AI 嵌入式蜂窝模组预计将占所有物联网模组出货量的25%,复合年增长率为 35%。AI 蜂窝模组的出货量将在 2023-2027 年之间达到73%的复合增长率,截至2030年,智能模组、AI 模组预计将占所有蜂窝物联网模组出货量的15%、10%,7 年分别达60%、28%。
高算力智能模组的需求日益增长,边缘计算技术已成为推动行业进步与创新的核心驱动力。凭借低时延、高带宽等显著优势,边缘计算技术与物联网、5G、大数据和人工智能等技术的深度融合,为传统行业提供了创新的信息技术服务和强大的计算能力。据Market Growth 预测,边缘计算市场规模将从 2024 年的 185.6 亿美元增长至2033年的2166.0 亿美元,年复合增长率高达 31.1%。得益于快速部署的人工智能加速处理器,硬件在边缘计算预测初期成为最重要的投资领域。IDC 预计,整体服务细分市场(包括预配置服务和专业服务)的份额将超越硬件,五年复合年增长率将超过18%。
2、智能终端赋能众多领域,嵌入 AI 加速智慧升级
相对传统蜂窝通信模组,智能模组内置主控芯片和内存,可以运行Android、Linux等操作系统,拥有强大的实时数据处理能力和丰富的接口。智能模组作为集计算与通信功能于一体的边缘侧产品,已成为边缘计算需求新的载体,并已经应用于车联网、消费电子等多个领域。汽车物联网作为 5G 物联网应用的典范,依托于 5G 技术所提供的高带宽和低延迟特性,为包括先进自动驾驶系统在内的多样化车联网服务提供支持。
5G 物联网的精确定位功能,使其与无法满足现代汽车应用严格要求的 4G 网络明显区分开来。随着智能汽车产业的迅速发展以及联网车辆在道路上数量的持续增加,汽车技术需求经历了显著的转变,而 5G 物联网技术则成为这一转型过程中的关键推动力量。在车载模组市场,智能网联汽车渗透率快速提升,车载模组作为车联网、自动驾驶、OTA升级的核心硬件,单车搭载量显著增加。
2024 年全球智能网联汽车出货量将达到约7620万辆,2020-2024 年 CAGR 为 14.5%。智能模组与端侧 AI 使车载座舱延展出更多可能,能够调用更多功能使个性化交互得到智能体赋能加持,本地部署的端侧AI 可支持语音、图像、情绪识别融合,实现“零延迟”的座舱服务。
据中国信通院数据统计,2024年1-9月乘用车新车车联网前装标配 1312.50 万辆,同比增长14.09%,标配搭载率84.59%,其中前装标配 5G 车联网交付上险 215.51 万辆(含选装),同比增长88.45%;V2X交付上险 29.37 万辆,同比增长 37,31%。智能网联汽车感知设备类型增多、装配率上升,丰富了网联汽车数据,提升车辆网联渗透率,增加智能驾舱等相关模组使用。
AI 应用的进步、智能传感器精度的提升及低功耗硬件的发展,使得可穿戴设备能够处理大量数据并可进行深度学习和云边协同的智能分析。在可穿戴设备领域,AI 应用已扩散至智能手表、智能手环、AR/XR 眼镜、耳机等设备。智能手表与智能手环,凭借其集成的健康监测、消息提醒、导航、无接触支付等功能,在健康预警、运动指导及个性化服务领域实现了显著的进展,并在可穿戴设备市场中占据了主导地位。
通信技术的持续发展为可穿戴设备的未来提供了更多可能性。2025 年 8 月,高通公司宣布推出第二代骁龙W5+和第二代骁龙 W5 可穿戴平台,作为全球首批支持 NB-NTN 卫星通信的可穿戴平台,它们在连接性、能效、产品形态以及定位追踪方面为可穿戴技术带来了全面的提升。同样在 2025 年,得益于人工智能技术的推动,智能可穿戴设备市场亦呈现出新的增长趋势,特别是在智能眼镜领域,国内外制造商纷纷推出了新一代AI 眼镜。根据ABI Research的预测,智能眼镜市场预计将经历显著的增长,从 2024 年的330 万台增长至2026年的近 1300 万台。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告(立项审批备案、银行贷款、投资决策、集团上会)、产业规划、园区规划、商业计划书(股权融资、招商合资、内部决策)、专项调研、建筑设计、境外投资报告等相关咨询服务方案。