(1)所属行业在新技术方面的发展情况
根据工信部发布的《“十四五”大数据产业发展规划》:“数据是新时代重要的生产要素,是国家基础性战略资源;大数据是数据的集合,以容量大、类型多、速度快、精度准、价值高为主要特征,是推动经济转型发展的新动力,是提升政府治理能力的新途径,是重塑国家竞争优势的新机遇;大数据产业是以数据生成、采集、存储、加工、分析、服务为主的战略性新兴产业,是激活数据要素潜能的关键支撑,是加快经济社会发展质量变革、效率变革、动力变革的重要引擎”。
受到大数据技术的不断成熟、各地数字经济和智慧城市建设项目的开展、物联网终端的大规模落地等因素驱动,中国的数据量呈爆炸增长,带动大数据服务市场持续快速增长。
在 AI 赋能的大数据阶段,知识图谱与 NLP 技术是大数据行业的关键技术。知识图谱(Knowledge Graph)把所有不同种类的信息连接在一起而得到的一个关系网络,本质上是一种揭示实体之间关系的语义网络,提供了从“关系”的角度去分析问题的能力。
知识图谱与 NLP 技术具有紧密联系,NLP 帮助知识图谱从非结构文本数据中抽取信息,实现文本理解、实体提取、关联分析以及数据标签化;另一方面,知识图谱提供的实体之间的关系网络信息,也可以帮助 NLP 模型在语义处理中得知此实体的额外语义信息,更精确的进行语义处理。NLP 与知识图谱相辅相成,两者结合的使用可以将大数据应用在多个行业的具体场景。
(2)行业概况
商业大数据服务属于新兴的大数据服务的一种。商业大数据围绕企业的各类原始数据(包括但不限于:基本信息、股权、司法涉诉、信用、董监高、产业链、舆情等)。
根据 IDC 数据,中国企业级数据量将从 2015 年占中国数据圈的 49%增长到 2025 年的69%。伴随着企业数量增加、信息技术发展、大数据、AI 应用场景丰富,商业类数据仍将保持高速增长。
商业大数据服务将原始数据采集、清洗之后变为结构化信息,信息在挖掘后变为知识,知识再通过建模分析变为可用的数据资产,挖掘数据背后蕴藏的价值,赋能各行各业,提供风险预警、信用评级、供应链管理等附加价值。
根据灼识咨询,2017 年,中国商业大数据服务市场规模为 131.1 亿元,2022 年增长至 406.2 亿元。随着相关利好政策的推动、企业及政府对数据资产管理需求的提升、应用场景的丰富成熟,预计 2022-2027 年,该市场复合年均增长率将会保持约 20.7%的水平,2027 年市场规模达到 1,040.9 亿元。
按照下游客户类型及交付形式,中国商业大数据服务可分为 C 端 APP、B 端基础数据服务(如 API、数据包、数据同步服务)、B 端标准化服务(如数据终端、分析决策工具、SaaS 软件等)和 B 端场景化解决方案四种形态。
(3)行业发展驱动因素及发展趋势
1)大数据相关政策利好行业发展
2020 年 4 月,我国发改委首次将数据中心明确为新基建建设的方向之一,强调了大数据建设的重要性与战略意义。2020 年 4 月,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》正式公布,将“数据”列入五大生产要素范围中,并提出从推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护三方面加快培育数据要素市场。
2021 年 3 月,我国十四五纲要提出“加快推动数字产业化,发展第三方大数据服务产业”的目标,其点出大数据是数字经济重点产业,并提出了“推动大数据采集、清洗、存储、挖掘、分析、可视化算法等技术创新,培育数据采集、标注、存储、传输、管理、应用等全生命周期产业体系”的要求。
2021 年 11月,工信部发布《“十四五”大数据产业发展规划》,提出大数据产业“产业保持高速增长、价值体系初步形成、产业链稳定高效、产业生态良性发展”的四个发展目标,并强调“数据采集、标注、存储、传输、管理、应用、安全等全生命周期产业体系统筹发展,与创新链、价值链深度融合,新模式新业态不断涌现,形成一批技术领先、应用广泛的大数据产品和服务。”
2023 年 2 月,中共中央、国务院印发的《数字中国建设整体布局规划》提出“到 2025 年,数字基础设施高效联通,数据资源规模和质量加快提升,数据要素价值有效释放,数字经济发展质量效益大幅增强,政务数字化智能化水平明显提升,数字文化建设跃上新台阶,数字社会精准化普惠化便捷化取得显著成效”,强调“释放商业数据价值潜能”。
2)企业及政府对数据资产管理需求不断提升
数据资产管理包括重要的三个方向包括:数据资产分析、数据资产治理、数据资产应用,目的是实现提升数据质量、实现数据互联互通、提高数据获取效率、持续释放数据价值。数据治理是数据资产管理的重要组成部分。传统模式下 IT 系统中存在大量过程数据、历史数据、临时数据、未使用数据,这类数据占用数据库大量空间;同时企业各个部门数据标准未统一,导致大量数据重复记录,数据冗余。
数据治理则能够实现数据的梳理,以提升数据质量与标准化程度,提高数据到数据资产的转化率,是企业及政府实现数字化转型的重要举措。
因此各行业都在积极实践数据资产管理,以数据治理为目的,通过引入大数据平台,实现数据汇聚、清洗、挖掘、分析等工作,实现数据的真正价值,在完善内部数据应用的同时,对外提供数据产品服务。
3)商业大数据的应用场景不断丰富成熟
目前,大数据在电信、金融等领域的落地较为集中,逐渐向政务、工业、公检法等领域广泛渗透,应用向生产、物流、供应链等核心业务延伸,电力、铁路、石化等实体经济领域龙头企业不断完善自身大数据建设与治理能力,应用行业“脱虚向实”趋势明显。
例如,在政务大数据领域,2022 年,国务院办公厅发布的《全国一体化政务大数据体系建设指南》明确了关于加强数字政府建设、加快推进全国一体化政务大数据体系建设的决策部署;在交通旅游大数据领域,2019 年,交通运输部发布《推进综合交通运输大数据发展行动纲要(2020—2025 年)》;
在能源大数据领域,2022 年,国家能源局发布《能源领域深化“放管服”改革优化营商环境实施意见》,提出“加强能源监管领域数据汇集,提升能源监管智能化水平”;在工业大数据领域,2020 年工信部发布《关于工业大数据发展的指导意见》。各行各业逐步意识到大数据应用对业务发展的促进作用,下游应用场景的快速增长推动着大数据行业的发展。
4)第三方企业征信机构在社会信用体系建设发挥愈加重要的作用
企业征信是按一定规则合法采集企业信息,加工整理为企业信用报告,为经济活动中的各类信息需求者提供信息服务的活动。在市场经济成熟国家,社会信用体系建设同时依靠政府与第三方专业的企业征信服务机构的共同协作。
我国第三方企业征信服务业起步较晚,我国企业征信市场参与者以政府为主,征信数据对企业的覆盖度欠缺,信息整合度低。这为第三方征信机构提供了市场发展机遇。第三方征信机构可利用大数据挖掘与知识图谱技术,突破原有征信数据的局限,带来更
丰富、深入的分析维度,补充、完善了征信系统企业的覆盖率与信息的维度,进而不断扩展征信服务的应用场景。
近几年我国政府愈加重视第三方征信在社会信用体系建设的重要作用,发布多项支持政策:2018 年 2 月国家发改委办公厅发出《关于充分发挥信用服务机构作用加快推进社会信用体系建设的通知》(发改办财金[2018]190 号);2021 年 3 月发布的十四五纲要中明确将建立健全信用法律法规和标准体系纳入国家规划。
另一方面,政府数据的公开化、透明化趋势也为第三方征信服务企业提供了更完善的数据来源。2015 年,国务院发布《促进大数据发展行动纲要》,明确提出“推动政府数据开放共享”整体要求,将“形成公共数据资源合理适度开放共享的法规制度和政策体系”作为中长期目标;2023年 2 月,中共中央、国务院印发的《数字中国建设整体布局规划》提出“推动公共数据汇聚利用,建设公共卫生、科技、教育等重要领域国家数据资源库”,强调“释放商业数据价值潜能”。
(4)行业进入壁垒
1)技术与人才壁垒
商业大数据服务行业是知识、资源、技术密集型行业。在技术方面,商业大数据服务行业有较高的技术要求,包括数据清洗处理、数据资源整合、数据挖掘、知识图谱构建等方面,这些核心技术能力均需要花费大量的时间、资金在各细分领域内逐一攻克。
此外,商业大数据服务行业的技术更新频率非常快,市场需求也在不断变化,促使商业大数据企业根据下游客户的不同需求,开发标准化程度不同、形态不同的产品,提高对数据清洗、数据挖掘的智能化水平,提高知识图谱的构建与计算能力,才能够在激烈的市场竞争中立于不败之地。
大数据技术在实际应用场景上的商业化落地,需要长时间的技术积累与持续的研发投入,也需要大量的优秀研发人员进行底层算法与应用模型的研究,新进入此领域的科技公司的技术追赶难度较大,同时也难以在短期内培养出尖端的研发人才团队。
2)数据资源壁垒
对于大数据企业,数据覆盖广度与数据质量也是竞争的关键要素之一,更丰富的数据能够为客户提供更多的参考维度,帮助客户在更多场景做出决策;实时更新的数据也能够保障客户所取得数据信息紧跟市场变化,从而提高决策的可靠性。
另外,大数据企业还需要针对下游客户所在行业积累垂直行业的数据,构建针对行业场景的知识图谱。行业知识图谱由于需考虑行业中各级别、各类业务,需具备较高深度与完备性,需要更为丰富的相关专业实体与关系量,而行业数据需要较长时期的积累或利用一定资金进行外采。对于新进者来说,在短时间内难以积累多维度数据,难以构建完备的行业知识图谱,存在较高数据资源壁垒。
3)客户资源壁垒
对于 C 端 APP 细分市场,先行进入市场的商业大数据查询 APP,利用先发优势,已积累大量用户,形成了品牌效应与用户粘性,这对本行业的新进企业形成了较高的用户壁垒。对于 B 端服务细分市场,商业大数据头部企业通过多元化的 B 端产品线布局,在多个下游行业树立了多家标杆企业客户,其落地案例通常会形成较大行业影响,影响此行业内众多企业的供应商选择。
另外,大型企业客户对于服务往往有较高的场景化个性化的要求,对供应商选择较为谨慎,此类大数据解决方案的落地将融合进客户内部系统流程,迁移成本较高,形成长期稳定的合作关系。因此本行业对于缺乏稳定客户基础的新进者来说,存在较高客户资源壁垒。
4)销售能力壁垒
由于不同行业客户对于大数据服务的需求与应用场景不同,商业大数据服务提供商对于各行业场景的深度理解、研发出可在行业场景中落地的应用产品是本行业企业能否在本行业立足的关键因素之一。如为银行机构客户提供用于贷款用户资质审查、信贷准入等决策支持的大数据服务,为制造业客户支持供应商审核风控的大数据服务。
因此,一家成功的商业大数据企业不仅需要尖端研发人才,也同时需要可链接行业客户需求和内部研发团队的销售团队,销售团队对客户所在行业的真实业务场景、业务逻辑、产业链上下游等有充分的理解,以客户的痛点、需求为核心,充分调动公司内部如研发、实施、售后服务等各类资源,以实现行业解决方案的落地。而行业的深度理解需要依靠大量案例的经验积累,这对本行业的新进企业形成了较高的销售能力壁垒。
更多行业研究分析请参考思瀚产业研究院官网,同时思瀚产业研究院亦提供行研报告、可研报告、产业规划、园区规划、商业计划书、专项调研、建筑设计、境外投资报告等相关咨询服务方案。