1、随着企业数据基础完善,大数据分析带来的价值将进一步提升
近年来,伴随各国家和地区大数据产业政策鼓励以及数字经济的深入发展,全球范围内大数据市场呈快速发展态势,数字化技术已经渗透到社会各行各业,小到超市使用的数字化支付手段、物流快递等基于地理信息的数字化追踪,大到智能制造企业基于数字孪生技术的元件设计、生产、组装,任何一家企业在生产经营过程中都会发生数据的生成、处理、分析、辅助决策。
近年来,Hadoop、MPP 等大数据处理技术发展迅猛,出现了大量以大数据平台及软件产品为核心的大数据企业,但主要是解决了底层的存储或者计算的问题,大数据分析企业通过大数据算法模型将企业数据、业务、大数据技术进行有机融合,是各行业释放数据要素潜能、发挥数据价值、实现数据赋能业务和各行业企业机构数字化转型的关键点。
未来伴随下游各行业数据基础设施进一步提高,以及企业管理者对数字化认知的不断提升,都将为大数据分析工作提供良好的数据基础,大数据分析带来的业务价值将进一步突显,同时预计未来企业会逐步将相关建设重点转向大数据分析环节,尤其是已经基本完成数字化基础建设行业,如:电力、金融等行业。
2、决策指导性分析、可解释机器学习、多模态数据融合将成为行业技术演进方向
当前大数据分析市场中,描述性、诊断性、预测性分析应用较多,决策指导性分析应用等更深层次分析应用偏少,且在与人类生命、财产、发展和安全紧密关联的领域依然发展不足。未来随着大数据分析技术应用领域的拓展、技术的提升、数据共享开放机制的完善,以及产业生态的成熟,具有更大潜在价值的决策指导性应用将是发展重点。为实现决策指导性分析,需要把业务对象尽可能全面的信息纳入分析。同一对象不同维度的信息往往包含在不同模态的数据中(如文本、音频、图像、视频等)。
整合这些互补信息是进一步提高模型分析能力,实现决策指导性应用的重要途径之一。多模态数据融合对不同模态的数据中包含的信息进行提取、编码和整合,实现异质信息的互补,从而提升算法模型的效果。多模态数据融合未来将成为大数据分析挖掘应用的重要发展方向。
决策指导性分析模型应用到国民经济各重要领域,需要评估算法模型的决策对现实业务的影响,具备可解释性将成为对大数据算法模型的重要要求。算法模型的可解释性指的是算法模型内部的工作机理以及输出结果的具体原因可以用人类能够理解的方式进行说明或呈现。
当前被广泛使用的机器学习、深度学习算法,当中很大的一部分(如各种神经网络算法)为“黑盒”算法,其内部机制无法直接用人类语言逻辑进行描述。在大部分复杂应用场景中,可解释算法的效果与这类“黑盒”算法相比有一定的差距。如何通过技术手段使得“黑盒”算法模型具备必要的可解释性,如何研发与目前广泛使用的“黑盒”算法模型具有同等效果的可解释算法模型,将是大数据分析挖掘未来重点的研究领域之一。