国产大模型能力接近甚至部分超越 GPT-4 Turbo。4 月 23 日,商汤科技发布全新大模型日日新 5.0(SenseChat V5),采用混合专家架构(MoE),参数量高达 6000亿,支持 200K 的上下文,具备更强的知识、数学、推理及代码能力,综合性能全面对标 GPT-4 Turbo。
根据 SuperCLUE 团队综合性测试,商汤 SenseChat V5 以总分80.03 的成绩超越 GPT-4 Turbo 的 79.13 分,刷新了国内大模型最好成绩。
在 LMSYSOrg(Large Model Systems Organization 大模型系统组织)发布的 Chatbot Arena总榜单中,零一万物排名第七,以机构排序,零一万物排名仅次于 OpenAI、Google和 Anthropic。而根据权威基准 OpenCompass 的测评结果,通义千问 2.5 得分追平GPT-4 Turbo,也是该基准首次录得国产大模型取得如此佳绩。
大模型应用加速落地。随着大模型能力的持续提升,国内大模型商业化也在持续落地。阿里、百度等在发布的今年一季度财报中均提到了生成式 AI 对收入增长带来的正面影响。阿里云聚焦“AI 驱动,公共云优先”的战略,AI 相关收入实现三位数增长。
百度智能云收入为 47 亿元,同比增长 12%,其中生成式 AI 带来的收入占比 6.9%,约为 3.24 亿元。创业公司零一万物也在加速商业化,目前海外已经上线 4 款消费端产品,其中生产力产品线今年预期营收过亿元,ROI(投资回报率)达到 1,海外生产力应用用户规模接近千万。