bigdataresearch的个人博客分享 http://blog.sciencenet.cn/u/bigdataresearch

博文

[转载]中国大数据产业产值测算方法研究

已有 1346 次阅读 2022-7-22 17:16 |系统分类:论文交流|文章来源:转载

中国大数据产业产值测算方法研究


杨玫, 李玮, 乔思渊, 刘巍

国家工业信息安全发展研究中心


 摘要大数据产业发展当前仍然面临产业边界不够清晰、企业界定不够明确、产值测算方法不够统一等产业发展问题和痛点,在遵循现阶段我国大数据产业发展客观实际的基础上,将大数据产业链划分为数据资源层、基础硬件层、通用软件层、行业应用层、安全保障层5个层级,并对大数据企业概念进行界定。通过获取相关层级各细分领域骨干企业市场营收占比、细分领域骨干企业大数据营收占主营业务收入比均值,折算细分领域大数据产业产值。最终运用加总法测算出2016—2021年我国大数据产业产值为44 908亿元,并预判“十四五”时期,我国大数据产业年均复合增长率约为25%,即到2025年我国大数据产业营收预计突破3万亿元。

关键词大数据产业;产值测算;加总法


论文引用格式:

杨玫, 李玮, 乔思渊, 等. 中国大数据产业产值测算方法研究[J]. 大数据, 2022, 8(3): 151-160.

YANG M, LI W, QIAO S Y, et al. Research on calculation method of China’s big data industry output value[J]. Big Data Research, 2022, 8(3): 151-160.


0 引言


大数据作为数字经济和实体经济发展的重要驱动,具有高渗透性和高融合性特点。随着大数据技术突破、服务升级,大数据产业边界及业务范畴不断扩展。大数据产业是以数据生产、采集、存储、加工、分析、服务为主的相关经济活动,包括数据资源建设,大数据软硬件产品的开发、销售和租赁活动,以及相关信息技术服务等产业供给侧范畴。沿着计算技术体系发展所追求的技术和产品通用性主线,大数据产业初步形成了以开源框架和软件为基础,以硬件设施为支撑,包括数据采集工具与汇聚平台、大规模数据并行处理软件系统、数据分析方案与工具、面向特定领域的大数据应用系统等多个相互支撑的技术产品门类的产业生态。

“十四五”时期是我国工业经济向数字经济大踏步迈进的关键时期,大数据产业将步入集成创新、快速发展、深度应用、结构优化的新阶段。在此阶段和背景下,大数据产业发展仍然面临产业边界不够清晰、企业界定不够明确、产值测算方法不够统一等产业发展问题,致使产业主管部门不能科学地掌握和判断产业发展态势,不能有效围绕产业链、价值链部署创新链,不能根据产业实际固根基、扬优势、补短板、强弱项。国家工业信息安全发展研究中心基于相关行业统计标准和经验,在研究积累的近5 000个大数据案例库、项目库和企业库调研工作基础上,围绕大数据产业链范畴、大数据企业认定标准、大数据企业分层分类标准以及大数据产业产值测算方法等方面,建立了一套完备的大数据产业产值测算体系。该方法可为国家掌控大数据产业发展态势、为地方精准把握产业发展实际提供数据参考。

1 大数据产业链相关概念界定

1.1 大数据产业链层级划分


产业链是各个产业部门之间基于一定的技术经济关联,并依据特定的逻辑关系和时空布局关系客观形成的链条式关联关系形态,是一个包含价值链、企业链、供需链和空间链的概念。根据对大数据企业基本情况的调研,基于现阶段我国大数据产业发展的客观现实,以大数据产业供需链、企业上下游关联性为基础,从价值链角度将大数据产业链划分为数据资源层、基础硬件层、通用软件层、行业应用层、安全保障层5个层级,如图1所示。

image.png

图1   大数据产业链各维度相互关系

● 数据资源层:促进数据要素资源价值释放。涵盖数据采集、加工、交易和服务等从数据产生到价值变现的过程,即利用数据智能化软件进行数据采集,通过加工处理,最终形成简洁、规范、清晰的数据集,通过技术、制度、模式创新消除数据壁垒,促进数据开放共享、交易服务及价值实现。

● 基础硬件层:提供数据基础设施及相关服务。涵盖数据采集、存储、计算等基础硬件,以及基于硬件的咨询、规划、定制、优化、运维和系统集成服务。此类经济活动以提升大数据基础硬件的集约化建设水平为核心,旨在构建覆盖服务器及存储设备、一体机、数据采集设备等的大数据硬件生态。

● 通用软件层:围绕大数据关键技术构建软件生态。涵盖在Hadoop、Spark、Flink等主流开源框架以及国内自研技术生态架构的基础上,由包含基础平台、数据存储、数据管理,以及分析挖掘、可视化、商业智能(business intelligence,BI)和机器学习等数据应用在内的通用平台和工具构成的大数据软件生态体系。

● 行业应用层:面向行业应用主体提供产品及服务。涵盖利用大数据技术在各行业、各领域进行融合应用,为互联网、工业、金融、政务、医疗等领域提供相关产品、服务和应用解决方案,加速大数据与数字经济、实体经济深度融合发展的相关经济活动。

● 安全保障层:支撑安全运行并提供相关支撑服务。一方面,涵盖研发大数据安全技术产品,提供大数据安全相关服务,以及利用大数据完善安全管理机制等内容;另一方面,提供包括大数据咨询、标准、测试、培训等在内的相关产业支撑服务。

1.2 大数据企业概念界定


在对国内近5 000家大数据企业的企业资质、业务收入、创新能力、产品服务、经营环境等情况进行深度调研的基础上,结合《软件和信息技术服务业统计报表制度》中的软件企业认定门槛,以及当前地方大数据产业主管部门对大数据企业认定的主流统计标准,本文认为大数据企业需同时满足以下要求:①在我国境内注册(港澳台地区除外),大数据业务收入超过300万元的独立法人单位;②从事以数据生产、采集、存储、加工、分析、服务为主的相关经济活动的企业,符合测算体系的大数据产业范畴;③具备与大数据业务相关的基础设备条件和专门经营场所。

根据上述对大数据产业链的划分及我国大数据产业发展的实际特征,可将大数据企业分为数据资源层、基础硬件层、通用软件层、行业应用层、安全保障层5层32类,每一层级细分类别,企业可根据其主营业务构成,选择所属产业链环节,具体分类情况见表1。

image.png

2 大数据产业产值测算方法分析

2.1 测算方法

通过对产值测算常用方法进行对比,分析各方法的适用范畴和计算特点。国外的产值测量方法主要分为3类:支出法、收入法、生产法。支出法是从最终的角度反映产值最终去向的方法,主要包括总消费、总投资、净出口三部分内容。计算式为增加值=总消费+总投资+出口-进口。以日本为例,其在计算季度GDP时,分别计算季度各产业总消费、季度各产业总投资、季度各产业进出口,并求和。收入法从收入的角度,把产业生产过程中得到的各种收入相加。计算式为:增加值=劳动者报酬+营业盈余+固定资产折旧+生产税净额。以德国服务业为例,其产业产值采用收入法计算,按行业分别计算雇员报酬、生产税净额、营业盈余总额(包含固定资产消耗),最后相加得到增加值。生产法从生产入手,将产业生产过程中创造的货物及服务价值相加,并除去生产过程中投入的中间货物和服务价值。计算式为:增加值=最终货物价值+最终服务价值-中间货物价值-中间服务价值。以意大利制造业为例,其分别计算出制造业各方面的总产出及各方面的中间消耗,最后相减得到增加值。

国内产值计算方法可以归纳为3类。一是直接核算法,主要包括收入法和生产法。收入法[7]将企业作为一个整体,按企业的生产活动最终成果来计算,不同环节之间不进行重复计算,只计算最终的产品产值;生产法从产品和服务形成的角度入手,剔除生产环节中间投入的价值,从而得到新增产值,计算式为:增加值=总产值-中间投入+本期应缴增值税。二是间接核算法,常用方法为分配法,即从大数据产品生产过程中制造的原始收入初次分配的角度,对大数据生产活动最终成果进行核算的一种方法,计算式为:增加值=工资+福利费+折旧费+劳动、待业保险费+产品销售税金及附加+应缴增值税+营业盈余。三是比例推算法,即通过测算目标行业增加值在相关行业增加值中的占比来测算该行业增加值,适用于某些与主体行业易剥离的部分行业规模测算,计算式为:增加值=相关行业增加值×新兴行业渗透系数。

总体来看,上述方法基于产业增加值的概念进行产业规模测算,但是由于大数据产业具有泛在赋能、融合深入等特点,使用增加值方式进行核算时可操作性较低。为了更好地反映大数据在经济社会发展中的地位和作用,了解大数据与其他产业发展的联系既能反映大数据的发展现状,也能反映大数据的增长情况,本文拟采用加总法与比例推算法相结合的形式,部分层级测算通过行业渗透系数折算的方式进行,最终结果计算采取企业营收加总的形式,无须通过剔除不同企业之间的中间收入来计算大数据产品和服务的所有产值。

2.2 测算思路

基于全样本数据难以获取的现实基础,在产值测算的数据资源层、基础硬件层、通用软件层、行业应用层、安全保障层分别通过获取相关层级各细分领域骨干企业市场营收占比、细分领域骨干企业大数据营收占主营业务收入比均值,折算细分领域大数据产业产值。

(1)确定追踪企业名单。建立各层企业追踪体系,通过对企业定期调研,获取产业最新的收入变化,为建立数学模型提供基础,并在跟踪过程中对数学模型进行修正完善。

(2)建立测算数学模型。在对大数据产业链各环节进行充分调研、掌握地区大数据产业发展现状的基础上,按照数据资源层、基础硬件层、通用软件层、行业应用层、安全保障层,分层级建立数据模型。

(3)产值总体结果估算。根据调研的企业数据,将相关数据带入数学模型中,将各层级产业进行加总,得到最终大数据产业产值。

大数据产业的产值=∑(数据资源层收入+基础硬件层收入+通用软件层收入+行业应用层收入+安全保障层收入)。

2.3 测算过程

2.3.1 确定跟踪企业名单

(1)数据资源层主要包括数据采集、数据加工、数据交易、数据服务,数据加工包括数据清洗、数据标注,数据服务包括数据应用程序接口(application programming interface,API)服务和数据流通服务等,见表2。

image.png

(2)基础硬件层主要包括数据采集设备、生物识别设备、智能终端、服务器及存储设备、一体机和硬件解决方案,涵盖数据采集、存储、计算等基础硬件,以及基于硬件的咨询、规划、定制、优化、运维和系统集成服务,见表3。

image.png

(3)通用软件层包括基础平台、数据存储、数据管理以及数据应用等通用平台和工具。具体而言,基础平台包括集群管理、文件系统、编程模型等;数据存储包括SQL、NoSQL、NewSQL、数据仓、数据库运维企业等;数据管理包括从事信息检索、ETL(数据抽取、转换、加载工具)、数据建模和数据质量管理等业务的企业;数据应用包括从事数据挖掘、分析、可视化、BI和机器学习等数据分析和展示的软件和工具开发的服务商,见表4。

image.png

(4)行业应用层包括为各个行业提供与实际应用紧密相关的终端应用软件和整体解决方案(即大数据技术、产品、服务、解决方案)的供给侧企业,见表5。

image.png

(5)安全保障层是产业发展的支撑,主要包括大数据安全、咨询、标准、测试、培训等,见表6。

image.png

2.3.2 建立测算数学模型

测算数学模型基于各层级包含的主要环节以及骨干企业的市场营收占比进行折算,以数据资源层为例:数据资源层产值=∑(数据采集+数据加工+数据交易+数据服务)/30%,系数30%基于对该领域骨干企业营收数据调研,结合行业渗透率水平得出。2016—2021年数据资源层产值见表7。

image.png

目前,大量传统企业开始对大数据产业进行布局,因此数据资源层企业均呈现企业收入增长较快的态势,中共中央、国务院在《关于构建更加完善的要素市场化配置体制机制的意见》中首次将数据作为要素参与分配,数据要素的作用逐步凸显。根据该层当前所追踪企业年增幅(大部分保持在30%以上),结合该细分领域产业发展特征,运用指数平滑方法,预计未来5年内数据资源层产值复合增长率约为26%。2022—2025年数据资源层产值预测见表8。

image.png

2.3.3 产值总体结果估算

根据上述大数据产业链划分的5个层级,得出大数据产业的产值=∑(数据资源层产值+基础硬件层产值+通用软件层产值+行业应用层产值+安全保障层产值)。其中,行业应用层的测算是基于《国民经济行业分类》,结合我国大数据产业融合应用现状,挑选大数据融合应用涉及的有关行业进行的测算。根据测算,2019年大数据产业产值为7 866亿元,2020年中国大数据产业产值达到10 195亿元,2021年中国大数据产业产值达到13 052亿元,据国际数据公司(International Data Corporation, IDC)预计,在2022—2024年中国大数据相关技术与服务市场复合增长率为19.0%。“十三五”时期是我国大数据产业萌芽壮大期,在此期间关键技术攻关、数据平台建设、基础设施布局等巨大的市场需求驱动产业发展呈爆发式增长态势,实现了年均复合增长率30%左右的目标。预计到2025年,大数据产业产值将突破3万亿元,达到31 689亿元。2016—2025年大数据产业产值及预测见表9。

image.png

3 结束语

本文参考软件和信息技术服务业统计范围标准,并结合大数据产业发展实际,将大数据业务收入超过300万元的独立法人单位作为大数据产业统计认定门槛。根据产业链各环节之间的技术经济关联性、特定的逻辑关系和时空布局关系,基于现阶段我国大数据产业发展的客观现实,将大数据产业链划分为数据资源层、基础硬件层、通用软件层、行业应用层、安全保障层5个层级,首次界定了大数据相关概念边界,填补了大数据统计监测标准的空白。基于全样本数据难以获取的实际情况,在产值测算的数据资源层、基础硬件层、通用软件层、安全保障层分别通过获取相关层级各细分领域骨干企业市场营收占比、细分领域骨干企业大数据营收占主营业务收入比均值,折算细分领域大数据产业产值,计算过程根据产业链分层特点进行。在对“十四五”时期大数据产业发展进行预测的过程中,参考了IDC等机构的预测结果,综合考虑国内大数据产业发展态势、国际发展形势和疫情影响等因素,科学研判“十四五”时期大数据产业发展态势。希望该方法及相关理论能为实现全国协同一致的测算标准,统筹推进全国大数据产业发展和应用,更有效地支撑产业发展提供决策参考。


作者简介


杨玫(1989-),女,博士,国家工业信息安全发展研究中心高级工程师,主要研究方向为大数据、软件产业宏观政策、技术发展及融合应用。


李玮(1993-),男,国家工业信息安全发展研究中心工程师,主要研究方向为大数据产业宏观政策、技术发展、数据治理。


乔思渊(1993-),男,国家工业信息安全发展研究中心工程师,主要研究方向为大数据产业宏观政策、技术发展、数据治理。


刘巍(1981-),女,国家工业信息安全发展研究中心人工智能所副所长,主要研究方向为大数据、软件产业宏观政策、技术发展及融合应用。


联系我们:

Tel:010-81055448

       010-81055490

       010-81055534

E-mail:bdr@bjxintong.com.cn 

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/



大数据期刊

《大数据(Big Data Research,BDR)》双月刊是由中华人民共和国工业和信息化部主管,人民邮电出版社主办,中国计算机学会大数据专家委员会学术指导,北京信通传媒有限责任公司出版的期刊,已成功入选中国科技核心期刊、中国计算机学会会刊、中国计算机学会推荐中文科技期刊,以及信息通信领域高质量科技期刊分级目录、计算领域高质量科技期刊分级目录,并多次被评为国家哲学社会科学文献中心学术期刊数据库“综合性人文社会科学”学科最受欢迎期刊。




https://m.sciencenet.cn/blog-3472670-1348387.html

上一篇:[转载]元宇宙数字经济:现状、特征与发展建议
下一篇:[转载]漫威电影中的深度学习

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-21 20:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部