摘要:作为数据基础制度的重要内容,数据分类分级制度对扩大数据要素的供给、流通和治理具有重要作用。我们分析数据要素价值的实现路径和数据要素化及市场化过程,以及数据分类分级制度赋能数据要素市场化的作用机制,梳理我国数据分类分级制度的实践进展及现实困境,探讨数据要素分类分级制度赋能数据要素市场化的推进策略。研究表明,数据分类分级制度有助于扩大数据要素供给、促进数据要素市场化流通和完善数据要素权益保障。我国数据分类分级制度实践经历了从服务信息采集和管理到健全数据安全治理体系,再到赋能数据要素市场化的过程,仍然存在缺少系统性顶层规划、适用范围有限、一致性有待提高、对数据价值增值和市场流通支撑不足等现实困境。需要遵循“统一规划+行业主导”的建设思路;明确国家层面和行业部门的建设模式;以全面性和一致性为建设方向;注重数据要素市场化及数据价值增值过程,注重数据价值评估和市场化流通治理。 关键词:数据要素;数据基础制度;数据分类分级;数据价值;数据要素市场化 基金:中国社会科学院高端智库基础项目“产业发展新态势的理论分析方法及经济分析智能化能力建设”(21ZKJC001);中国社会科学院登峰战略优势学科(产业经济学)资助;中国石油天然气集团软科学研究课题“能源央企加快形成新质生产力研究”(中油研20230215)。 |
数字技术、数字经济是世界科技革命和产业变革的先机,是新一轮国际竞争的重点领域。作为数字经济发展过程中的核心生产要素和关键战略性资源,数据要素对数字技术发展和产业数字化转型具有重要作用。随着数字产业化和产业数字化进程加快,尤其是当前以GPT和BERT等大语言模型(LLM)为代表的通用人工智能(AGI)快速发展,数据在对人工智能技术和社会经济发展中的重要性及战略性进一步提高。可以说,如何高效利用并发挥数据的最大价值和潜能,成为推动中国式现代化的重要保障。现实来看,数据规模方面,国际数据集团(IDC)发布的Global DataSphere 2023预测,中国数据量规模将从2022年的23.88泽字节增长到2027年的76.6泽字节,年均复合增长率达到26.3%,成为世界上数据量最大的国家。数据和经济发展方面,《中国数字经济发展研究报告(2023)》显示,2022年中国数字经济规模达到50.2万亿元,数字经济占GDP比重达到41.5%,产业数字化和数字产业化规模分别达到41万亿元和9.2万亿元。
在数据规模持续扩大,数据要素市场化格局初步形成的背景下,完善数据分类分级制度,对于推进数据基础制度建设,规范数据安全治理,提高数据采集、加工、融合创新效率,促进数据更大范围流通和更深层次开发利用,具有重要意义。2022年12月,中共中央、国务院《关于构建数据基础制度更好发挥数据要素作用的意见》对我国的数据基础制度构建和数据要素作用发挥做出战略部署,并在多处提及数据分类分级。2023年12月,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,提出健全标准体系,加强数据采集、管理等标准建设,协同推进行业标准制定的重点行动任务。由于数据分类分级工作本身具备高度多维性、综合性和复杂性,系统性的数据分类分级制度是高效完成大规模、多样化和复杂数据的分类分级工作并促进数据要素市场化的前置条件,然而当前关于数据分类分级的理论研究和实践工作主要集中在数据管理和数据安全领域,对数据要素市场化和数据价值实现的关注较少。因此,本文分析数据分类分级制度赋能数据要素市场化的作用机制、实践进展和现实困境,并提出数据分类分级制度的推进策略。
一、“数据—数据要素—数据要素化”的概念及内涵
(一)“数据—数据要素化—数据要素”的概念
从数据的概念看,《辞海》将其定义为“描述事物的数字、字符、图形、声音等的表现形式”,《剑桥词典》定义为“收集供检查、考虑和用于帮助决策的信息,特别是事实或数字”。从使用过程看,数据是构成信息和知识的基本元素,通过特定的程序和方法对数据进行解码和分析便能得到数据所承载的信息,而随着数据规模的增大和分析工具的进步,所能够获得的信息也变得更加丰富和具有前瞻性。随着数字技术与实体经济深度融合,将数据作为要素资源投入社会经济活动,可以优化企业决策,重构生产关系和生产函数,实现社会再生产的重塑和精准化管理,促进创新和技术进步,提高全要素生产率。基于此,本文认为数据是对客观事物、活动和关系等信息抽象化概括并以数字化形式表示和储存的内容,其核心是以数字化形式所承载的信息。数据要素是社会经济在生产、分配、流通、消费和社会服务管理等各环节所需要的数据资源,通过改变生产、生活和社会治理方式,重构各类生产要素以优化生产经营活动,推动社会经济更好更快发展的基本元素。数据要素化则是使数据成为数据要素的过程。数据、数据要素和数据要素化三者的关系如图1所示。
图1数据、数据要素和数据要素化关系韦恩图
(二)数据要素价值的实现路径
数据要素通过优化知识、决策和管理,重构传统生产要素,扩大原有经济活动的价值空间。数据要素价值实现的路径包含传统生产和数据要素赋能生产两种方式(见图2)。传统生产方式中,投入土地、资本、人力资源和技术生产产品并获得市场价值。数据要素赋能生产过程中,首先,通过数字化系统分析并采集传统生产过程信息和其他能够促进、优化生产的信息;其次,将信息进行处理和加工使其成为数据要素,然后借助智能算法和算力支持,将数据要素和生产过程相结合,从而得到新信息、新知识和新模式;再次,应用得到的新信息、新知识和新模式对传统生产要素进行重构并优化生产过程;最后,通过数据要素赋能,提高了产品质量和生产效率,降低了生产成本,并创造了新的价值。从价值生成视角看,在既定的生产投入约束集合中,通过数据要素赋能生产得到的产品价值和传统生产方式得到的产品价值之间的差值,即为数据要素赋能生产的价值增加值。可以说,数据要素使传统生产方式在既定投入约束下生产可能性集合的边界和范围得到了扩大。
图2数据要素价值实现路径
(三)数据要素化及市场化过程
虽然数据要素能够赋能社会经济生产,但需要注意的是,经过处理的有效信息转化为能够投入经济生产活动的数据要素,是数据要素参与社会经济生产并发挥其价值的前置条件。换言之,并非所有数据都是或者都能够成为数据要素。那么,数据如何成为数据要素,以及如何提高数据要素化的效率,是数据要素在更大程度上赋能社会经济发展需要解决的前置性问题。基于此,本文对从信息到数据再到数据要素的数据要素化过程进行理论解构(见图3)。数据的要素化过程,包括:第一步,将存在于客观世界中的事物、现象和关系等内容进行抽象和归纳,得到具有代表性和高度概括性的信息。第二步,信息的数字化采集,即按照既定标准和规范,将信息以数据的形式转化和存储。第三步,数据的加工,即将数据按照特定目的和使用需求进行加工和整理,补全数据缺失内容并降低数据冗余,提高数据的可用性。第四步,数据要素的应用,一方面,经过加工的数据可以被特定需求者直接使用;另一方面,作为能够产生经济价值的要素投入品,数据要素可以成为商品在市场上进行交易。加工后的数据流入数据要素市场,其中部分数据在流通交易之后被购买方直接使用,也有部分数据被购买后同其他数据进行融合创新,而后被直接使用或再次流入数据要素市场。需要注意的是,数据要素的使用可能产生新的信息,而这些新的信息又能再次要素化为新的数据要素。同时,数据要素使用和数据要素市场能够为数据加工、采集环节提供使用与需求的反馈,优化并提高数据要素化效率。
图3数据要素化及市场化过程
随着数字经济的发展和产业数智化程度加深,数据的来源、类型、结构和格式等方面的多样性不断提高,应用场景也变得更加丰富多样,给数据采集、管理和数据要素化带来了挑战。加之数据的交易、流通和融合创新需求增加,使得扩大供给、促进流通和优化治理,成为数据采集、加工、融合创新和数据要素市场建设等环节的关键问题。在数据规模持续扩大和数据要素市场化背景下,数据的科学分类分级不仅是数据高效采集、加工、融合创新和流通的前置条件,也是提高数据要素化效率,激励数据要素供给、规范数据要素流通和维护数据安全的必要手段。作为数据要素基础制度的重要组成部分,数据分类分级制度建设能够赋能数据要素市场化和数据要素价值实现。
二、数据分类分级制度的内涵及赋能数据要素市场化的作用机制
(一)数据分类分级的内涵
分类分级是以识别和比较为基础,按照事物的共同特征或差异点,将事物在类别和等级维度进行区分和细分的过程,有助于认识、区分和组织事物,使大量事务和问题的处理能够系统化、条理化和标准化。从分类分级思想的理论发展和实践看,原始社会时期的部落划分,封建社会时期的郡县制和三省六部制,近现代以自然科学和人文社会科学为基础的科学和认知体系,以及社会和国民经济活动中有关产业部门的划分,均是分类分级思想的实践应用。现实中,分类分级制度通常以统计和管理为目的而建立,或根据某一组织内部特定的需求和目的而建立。数据的分类分级是分类分级思想在数据应用和管理领域的具体实践。
数据分类分级本质上是基于数据内在属性、特征和人为目的,对数据进行标签化和符号化区分的过程。具体而言,数据分类是根据数据的属性和特征,按照一定的原则和方法对具有相似性或存在共性的数据进行归类,并建立起层次性分类体系的过程。数据分类有助于明确数据的本质、属性和权属及相关关系,以便更好地管理和使用数据。数据分级是根据一定的目的,按照既定原则和方法对数据在权限、范围和影响程度等方面进行差异化定级。数据分级有助于明确数据的使用方式、价值和权限等内容。通过对数据分类分级,数据的属性、特征被识别且显性化、符号化表示,有助于提高数据管理和应用效率。理论研究和实践中,数据分类分级实际上包括两个方面的内容,一是数据分类分级体系、制度和标准的建设,二是基于数据分类分级标准对具体数据进行归类和等级划分的工作。前者涉及数据制度和规范的建设,后者则是基于前者内容而进行的实际应用和操作。
(二)数据分类分级赋能数据要素市场化的作用机制
数据分类分级对数据要素的赋能机制主要回答两个问题:如何赋能?所赋何能?从作用机制看,数据分类分级制度通过提高数据要素化效率、完善数据要素市场建设和优化数据要素治理体系,赋能数据要素的供给、流通和权益保障。
1.提高数据要素化效率,扩大数据要素供给规模。数据分类分级制度能够在数据规范和协同、数据搜寻匹配与创新和数据供给策略优化三个方面提高数据要素化效率,扩大数据要素的供给规模。第一,数据分类分级制度能够为数据要素化过程提供明确的规范和指引,提高数据要素供应链各环节的协同性。通过分类分级,数据被赋予了诸如来源、状态、所属行业、应用场景、地域等维度的分类特征标签,以及数据规模、质量、时效性、稀缺性等维度的等级特征标签。可以说,数据分类分级制度为数据的采集、加工和管理,提供了基于类别维度和等级维度理解数据的通用规范和框架,使数据要素化过程中不同环节、不同主体之间具备了一致的描述、定义和理解数据的语言与方法,提升了数据要素化过程中各环节和各主体之间的协同性和一致性,进而提高数据要素化效率。此外,按照通用的数据分类分级标准和规范,数据要素供给方可以根据分类分级的结果,将相同类型和等级的数据进行批量化处理和集中管理,减少数据冗余和数据要素化过程中的工作重复,降低时间和人力成本的同时提高了数据要素化效率。第二,数据分类分级制度能够提高数据的搜寻、匹配效率,降低数据融合创新环节的信息成本,并且有助于数据要素融合创新机会识别,促进不同环节、不同主体和不同数据源参与数据融合创新。一方面,数据要素化过程中的数据采集、开发和加工者,通过数据类型、等级的标签和说明信息,能够快速了解数据的结构和特征,降低了不同主体在数据协同创新和合作开发中的沟通和数据转译成本。同时,按照分类分级标签或结果搜寻特定类型或等级的数据,提高了数据的搜寻效率,进而提高数据要素化效率。另一方面,数据分类分级可以明确数据的规模、质量、适用性、稀缺性和潜在用途等价值特征,有助于识别、挖掘数据之间可能存在的相互补充或促进关系,便于数据要素化过程中各主体识别、发掘具有创新潜力的数据资源,进而激发不同主体之间的数据要素协同合作和融合创新动机,提高了数据要素化效率。第三,数据分类分级为市场主体按照不同类别和不同等级,分门别类地统计数据要素供需情况提供了条件。数据供给方可以了解不同类型、不同特征和不同价值属性数据要素的市场需求状况,然后通过市场需求分析及时调整数据采集、加工策略,以更为精准的数据要素供给匹配市场需求。
2.完善数据要素市场建设,促进数据要素有序流通。数据分类分级制度能够在降低信息不对称、推进数据交易标准化、促进市场化定价和数据要素供需匹配四个方面完善数据要素市场建设,促进数据要素更大范围有序流通。第一,数据分类分级为不同类型和不同等级的数据提供对应的标签和说明,提高了反映数据要素特征和价值属性内容的信息量。市场主体可以快速、清晰地了解数据要素的类别、等级及其对应的特征和属性,降低了数据要素市场的信息不对称。数据分类分级使蕴含数据特征和价值属性的信息,从不同维度以类别和等级的形式显性化表达。随着分类分级的细化,不同维度类别和等级的数据标签和说明增多,分类分级结果所能表达的诸如数据含义、价值、用途和限制等方面的信息不断丰富。例如,对于数据要素市场价值的评估,数据规模决定了数据所蕴含的信息量和价值潜能,数据质量和适用范围决定了数据的影响力和市场认可度,数据稀缺性从供需层面反映数据的获得困难程度,数据敏感性决定了数据的使用限制和适用范围。市场主体可以通过数据的类别和等级,快速、清晰地了解数据要素背后所蕴含的特征和价值信息,降低了数据要素市场的信息不对称和交易不确定性,促进了数据要素的市场化流通。第二,使用统一的数据分类分级标准和语言,有助于推进数据要素商品化和标准化,规范数据要素交易过程,降低市场交易风险。标准化的数据要素商品能够降低各方因对数据内容表达含糊、理解歧义,以及特征指向不明确而产生的交易风险。数据分类分级结果为标准化交易合约中的交易规则、概念说明、条款设置、特征描述,以及数据要素内容与权利的细化和分割提供了支撑。此外,由于数据产品的多样性和复杂性,数据要素交易的谈判和协商需要付出时间和经济成本。通过统一的数据分类分级框架和标准化合约达成数据交易,能够简化交易流程,降低交易成本,提高数据要素流通效率。第三,不同类别和等级的数据具有不同的市场需求和使用价值,数据分类分级有助于市场交易主体准确识别和评估数据要素价值,提高数据要素的市场化定价效率。一方面,数据分类分级使数据要素的价值特征更加明确和显性化,有助于交易主体准确识别和评估数据要素的价值,推动数据要素市场化定价。另一方面,数据分类分级结果及其价值特征可以与其他数据评估指标或模型相结合,从而提高数据价值评估的准确性。例如,通过综合考虑数据要素来源、敏感性、稀缺性、质量、时效性等特征,结合数据要素市场的供需状况、同类数据要素情况、第三方评估指标和供应商的既往服务评价等因素,建立综合性数据要素价值评估模型,能够提高数据要素价值评估的全面性和准确性。第四,数据分类分级制度有助于市场主体根据数据要素的类别和等级匹配数据要素的供需双方,降低市场交易成本,提高数据要素流通效率。数据分类分级帮助市场交易主体快速准确判断交易标的的类别、属性和适用范围等特征信息,基于数据分类分级结果,市场需求方能够快速寻找到所需数据及其供给者,供给方也能更好地了解市场需求以提供相匹配的数据产品。此外,数据要素供需匹配效率的提高有助于降低数据要素交易成本,吸引更多的市场主体参与数据要素交易和流通,进而带来数据要素需求和供给的同向增大,促进数据要素更大范围的流通。
3.优化数据治理体系,完善数据要素权益保障。数据分类分级制度能够在数据权属类型及权责边界以及精细化治理两个方面优化数据治理体系,完善数据要素权益保障。第一,数据分类分级制度有助于明确数据的权属类型,界定数据相关主体的权责边界。数据要素通常涉及数据采集、加工、使用和交易流通等多个环节,而不同环节又可能存在多个数据权利主体。数据的非排他性和可复制性特点使得单一权利主体可以拥有多个数据,而同一数据又可能涉及多个权利主体,因此明确数据权属,界定数据权责是实现数据要素权益保障的基本条件。数据分类分级在类别和等级维度界定数据相关主体的权力和责任,使得后续依据相应的法律规定和管理制度,保护数据要素主体的权益成为可能。一方面,数据分类分级可以明确不同类型和等级数据的适用范围和使用权限,通过加密、访问控制和身份验证等技术手段建立差异化的访问和控制策略,确保只有经过授权的人员可以访问和使用对应类别和等级的数据,降低数据滥用的风险。另一方面,数据要素作为无形资产或知识产权,其权利主体存在多样性和复杂性。数据分类分级有助于按照数据类别和等级细化,并明确数据要素交易与使用过程中相关合约、协议主体的权责和收益分配方式,进而保障数据供给主体的收益。第二,数据分类分级制度有助于实现数据要素的精细化治理,降低治理成本的同时提高治理效率。首先,根据分类分级结果采取差异化的安全审计和风险管理措施,能够及时发现数据要素市场化与使用过程中的异常活动和安全隐患。其次,对相同类型和等级的数据进行集中管理或批量化处理能够减少数据治理的重复工作,从而降低数据治理成本。此外,随着数据要素的应用场景动态变化,其所承载信息的敏感性和内容质量等特征也会发生变化,因此需要调整使用权限和适用范围。利用数据的分类分级结果,有助于从类别和等级维度匹配数据的不同适用场景和使用模式,提升数据要素所承载内容的权责配置更新效率。
三、数据分类分级制度的实践进展及赋能数据要素市场化的现实困境
无论是早期人口统计、地理绘注,抑或天文观察和记录等,“对数分类”的工作自古有之。自第三次工业革命以来,特别是随着20世纪80年代以来个人计算机的逐渐普及,信息化、数字化同个人工作、生活以及社会生产的融合加速,数据规模开始爆发式增长。小规模、非标准化数据分类分级方式不再能适应日益增长的数据发展需要,而对规范化、标准化和系统性的数据分类分级制度的需求日益增强。为应对不断扩大的数据规模及其使用和管理的需求,我国政府出台了一系列政策支持数据分类分级制度的建设。基于政策演进视角,本文梳理我国数据分类分级制度的实践进展,为精准把脉数据分类分级制度建设难题并对症施策提供基础。
(一)我国数据分类分级制度的实践进展
使用北大法宝·法律法规数据库,以“数据分类、数据分级、数据分类分级和数据分级分类”为关键词,对中央层面已经公布的法律、行政法规、国务院规范性文件、部门规章和部门规范性文件,以及地方层面已经公布的省级地方性法规、自治条例和单行条例、地方政府规章和地方规范性文件全文内容检索分析。如图4所示,截至2023年12月31日,包含以上关键词的政策性文件中,中央层面共有1部法律、15部国务院规范性文件、2部部门规章和26部部门规范性文件;地方层面共有22部地方性法规,25部地方政府规章和214份地方规范性文件。仅从数量来看,地方层面的数据分类分级制度性文件数量远高于中央层面,中央层面的法律法规中以部门规范性文件和国务院规范性文件居多,法律和部门规章较少;地方层面的地方性规范性文件较多,地方性法规和部门规章较少。此外,无论是中央或是地方,涉及数据分类分级的文件数量近年来开始呈爆发式增长趋势。接下来,对上述政策内容及出台背景作进一步分析。
图4数据分类分级制度政策数量和结构
1.以服务信息采集和管理为向度,旨在提高数据供给效率。数字化和智能化技术发展对数据的利用方式、范围和程度造成了重大影响,数据相关制度也受到技术范式的影响,表现为一方面因技术范式形成的需求促逼制度建构,另一方面技术范式又可以作为一种制度背景塑造制度的更新。作为事实和内容的逻辑归纳,数据通常承载着意象的客观表达和信息的科学表示。早期的数据获取主要依赖于观察、统计、实验和计算等方法,内容主要为信息资料的统计和记录,数据规模相对较小,结构和关系较为单一。进入21世纪,信息化技术进步和计算机应用普及,使用计算机设备以数字化形式采集和存储信息成为数据生成的重要方式,数据规模快速增长,数据表现形式的多样性和复杂性提高。然而,因缺乏相关的数据采集和管理标准,整合和利用不同来源和不同格式的数据变得复杂和困难,降低了数据的利用效率。因此,“十二五”之前,数据分类分级制度建设以服务信息采集和管理为向度,旨在提高数据供给效率。从政策演进视角看,2002年,我国编制的第一个国家信息化规划《国民经济和社会发展第十个五年计划信息化重点专项计划》提出了社会信息化建设的发展方针和目标;同年,《国家信息化领导小组关于我国电子政务建设指导意见》提出促进电子政务建设,带动其他领域信息化的要求。此后,其他行业部门为推进本领域的信息化建设,基于提高行业内数据供给效率的目标,在行业信息化采集和数据管理等环节的制度建设方面陆续提出了数据分类分级的要求。例如,2003年《关于做好房地产市场预警预报信息系统有关工作的函》提出房地产市场预警预报信息系统的基础工作是数据分类采集,《2004—2010年国家科技基础条件平台建设纲要》在科学数据共享平台建设部分提出要形成国家科学数据分级分类共享服务体系。
2.以健全数据安全治理体系为向度,旨在保障数据相关主体权益。随着我国互联网和数字化产业快速发展,数据规模持续增大。特别是2014年“大数据”一词被首次列入政府工作报告,2015年《关于积极推进“互联网+”行动的指导意见》《中国制造2025》,以及“十三五”规划等一系列促进信息经济和数据信息产业发展的行动计划出台,以大数据和人工智能为代表的新一代信息技术与传统产业的融合进程加快,产业数字化程度持续提高,数字产业化初具规模。然而,数据规模持续增大的同时,个人隐私泄露、信息违规采集、数据霸权、数据侵权等涉及数据安全的问题也日益增多,甚至对行业发展和国家安全构成了潜在威胁,导致对数据的监管需求也同步增大。从政策演进视角看,2015年,《促进大数据发展行动纲要》强调落实信息安全等级保护,建立健全大数据安全保障体系。2016年,我国第一部全面规范网络空间安全管理的基础性法律《中华人民共和国网络安全法》出台,提出国家实行网络安全等级保护制度,采取数据分类、重要数据备份和加密等措施,为各行业和地区通过数据分类分级高效管理数据和提高数据安全治理能力提供了指导。此后,诸多行业部门或地方政府陆续出台本行业、本地区的数据分类分级制度文件,以规范数据使用和安全治理。行业层面,例如,2016年,国土资源部出台《关于促进国土资源大数据应用发展的实施意见》,提出建立完善国土资源数据分级分类管理办法,建立健全国土资源数据管理制度。2017年,《国务院关于深化“互联网+先进制造业”发展工业互联网的指导意见》强调通过健全工业数据分级分类管理制度,建立数据安全保护体系。2018年,国务院办公厅发布《科学数据管理办法》,提出科学数据要遵循分级管理,保障安全可控。2019年,国家互联网信息办公室发布《数据安全管理办法(征求意见稿)》,提出采用数据分类、备份、加密等措施加强对个人信息和重要数据保护。2020年,工业和信息化部办公厅印发《工业数据分类分级指南(试行)》,提出基于数据安全维度将数据分为三个等级,在分类分级基础上给出数据管理指导意见。此外,也有诸如《上海市公共数据和一网通办管理办法》《贵州省大数据安全保障条例》《浙江省公共数据开放与安全管理暂行办法》等地方性政策文件,涉及建立数据分类分级制度以完善数据采集、使用和安全管理等方面的内容。
3.以赋能数据要素市场化为向度,旨在促进数据要素价值实现。数字经济开辟了继农业经济、工业经济之后的经济新形态。党的十九届四中全会首次将数据增列为生产要素,数据在社会经济发展过程中的重要性进一步提高。数据开始从信息化过程的单一产物向具有经济价值并参与社会生产和价值分配的要素化产物转变,因此如何提高数据要素化效率,促进数据更广范围和更大规模的市场化流通,更好地发挥数据要素价值以赋能社会经济高质量发展,成为“十四五”以来数据分类分级制度建设的主要关注点。从政策演进视角看,2021年,《中华人民共和国数据安全法》出台,提出国家建立数据分类分级保护制度,在立法层面强调数据安全的同时关注数据的开发和利用。此后,诸多围绕数据开发利用和价值实现内容的政策陆续出台。同年,工业和信息化部印发《“十四五”大数据产业发展规划》,国务院印发《“十四五”数字经济发展规划》和《要素市场化配置综合改革试点总体方案》,提出通过数据分类分级充分发挥数据要素作用,以及在保护个人隐私和确保数据安全的前提下,分类分级、分步有序推动部分领域数据流通应用。2022年,国务院《关于数字经济发展情况的报告》提到完善公共数据、企业数据、个人数据分类分级确权授权使用,统筹推进全国数据要素市场体系。随后,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》进一步强调数据分类分级作为数据基础制度的重要内容,对推动完善数据要素产权制度构建、促进数据要素规范有序流通和优化数据要素治理体系具有重要作用。2023年,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,从12个不同类别的数据要素应用场景提出数据要素赋能社会经济发展的重点行动,并在提升数据供给水平、优化数据流通环境和加强数据安全保障三个方面涉及数据分类分级制度支撑数据要素价值实现的相关内容。此外,如《山东省大数据发展促进条例》《上海市数据条例》等地方政策文件,以及《交通运输政务数据共享管理办法》《农业农村数据分类分级指南》等行业部门政策文件陆续出台,关注数据分类分级制度与数据要素市场化和数据要素价值实现方面的内容。
(二)数据分类分级赋能数据要素的现实困境
随着数据分类分级制度赋能数据要素市场化并促进数据要素价值实现的作用增大,诸多行业和地区开始以赋能数据要素市场化为向度建立健全本行业和本地区的数据分类分级制度,但是进一步分析当前已出台的数据分类分级制度建设内容,可以发现仍然面临缺少系统性顶层规划、适用范围有限、一致性不足、对数据价值增值和市场流通支撑不足等一系列现实挑战。
1.缺少数据分类分级制度的顶层规划。从实践进展看,尽管当前社会经济、数字经济和大数据产业发展规划以及相关政策多次提及加强数据分类分级制度建设,但在国家层面,数据分类分级制度建设仍然缺乏系统性的规划。例如,《关于构建数据基础制度更好发挥数据要素作用的意见》分别从数据确权授权、数据市场化流通和数据要素权益保护三个方面阐述了数据分类分级的意义和要求,《“十四五”大数据产业发展规划》提出打造分类科学、分级准确、管理有序的数据治理体系。以上虽然已经确认了数据分类分级对于数字经济发展和数据治理的作用和必要性,但对于数据分类分级制度建设的基本要求、基本原则、建设路径,以及国家层面、行业和地区主管部门的职责等方面,尚未给出更为明确的规划和设计。缺少国家层面的顶层规划,各行业和地区的数据分类分级制度建设仍处于“摸着石头过河”的自主探索状态。一方面,部分行业和地区的数据分类分级制度建设进展缓慢,或已有建设方案中仅提出了数据分类分级的方向性要求,并未就相关规范和标准作进一步明确;另一方面,如图4所示,地方层面的数据分类分级法律法规、制度性文件数量显著高于中央层面,制度和政策体系整体的效力层次较低。在缺少顶层规划的情况下容易引发中央和地方之间对于规范性制度统一和有效治理之间的矛盾,表现为这种“自下而上”和分散式的制度建设模式,易使数据分类分级制度在规范、标准、程序和方法等多个方面存在不一致和不协调的问题。长此以往,不同区域、行业间,甚至同一行业内可能存在多套数据分类分级的标准、方法、程序、说明、格式和目录。
2.数据分类分级制度的适用范围有限。数字技术发展使数据的范畴、内容和信息承载方式较以往发生了较大变化,但是当前的数据分类分级制度对于新型数据在应用场景、结构和特征等方面涵盖的全面性不足,致使其适用范围受限。一是当前的数据分类分级制度主要适用于工业、金融、医疗、卫生和教育等传统行业的基础性数据,以及以政务数据为主的公共数据。然而,对于新兴行业或新场景数据,例如物联网数据、数字孪生数据、自动驾驶数据的采集和管理、医疗健康大数据和文化元宇宙数据,以及企业和个人的数字痕迹等数据,目前缺乏全面的数据类别和等级目录、分类分级标准和方法,难以适应日益增长的大数据和数字产业化需求。二是新兴产业和新技术领域的数据通常包含多种类型和格式,如结构化数据、非结构化数据、文本、图像、音频和视频等。当前的数据分类分级标准和方法主要针对结构化和数字型数据,对于具有多样性结构和复杂特征的数据的适应性不足。特别是,面对新兴技术场景下产生的高维、复合型数据,既有的数据分类分级标准和方法可能无法全面识别该类数据的内容和特征,或虽然能够识别,但因为数据的维度和特征超出了既定框架下的分类分级范畴,导致无法搜寻和匹配对应的数据类别和等级,进而无法有效完成数据分类和分级工作。
3.区域和行业间数据分类分级制度的一致性有待提高。数据分类分级规范和标准的一致性有助于提高数据要素市场化效率,促进数据更大范围的流通和更深层次的融合创新,但是当前数据分类分级规范和标准在分类分级过程和结果方面的一致性仍然有待提高。首先,不同地区对数据分类和分级在定义、解释说明和标准认定等方面存在差异。例如,由于不同地区的产业结构和数字化基础不同,加之受到区域发展水平和社会文化差异的影响,不同地区在数据的类别判定条件、等级认定标准以及不同类别和等级的符号化表示方面存在不一致性。如图5所示,数据分类分级过程中,对于相同的数据,主体A按照数据分类分级标准A将其确定为A类Ⅰ级,而主体B按照标准B将其确定为B类Ⅱ级,则出现了相同数据的不同分类分级结果问题。对于不同的数据,主体A按照标准A将其确定为X类Y级,而主体B按照标准B也将其确定为X类Y级,则出现了不同数据的相同分类分级结果问题。究其原因,一方面,以数据敏感性等级的判定为例,标准A和标准B对于该数据敏感性的定义和判定相同,仅因为符号表征存在差异,即地区A的数据Ⅰ级敏感性等同于地区B的Ⅱ级敏感性水平;另一方面,因地区A和地区B数据分类分级标准对于敏感性的定义和判定条件存在差异,导致分级结果的差异。
图5数据分类分级制度一致性问题的影响
其次,如果数据分类分级制度缺乏明确的判定标准和方法,实践中的“自由裁量”导致即使使用同一套标准,但分类分级结果仍然不一致。随着数据要素化链条增长,参与主体增多,缺乏统一的数据分类分级框架,使得数据要素市场化过程中数据在价值增值链条的不同环节、不同主体之间需要不断对数据进行类别和级别的转换,多次的数据转换和匹配工作增加了数据应用的复杂性和经济成本,阻碍了数据的集成、加工和融合创新。
4.数据价值实现和价值增值过程的支撑不足。数据要素价值实现和数据要素权益配置对数据要素供给、加工和融合创新具有重要作用。然而,当前数据分类分级制度难以对数据要素化过程中数据价值增值的不同环节进行细化区分,进而难以计量数据在不同环节的价值增加值。从数据要素市场化过程看,数据的价值增值涉及数据采集、整理、清洗、加工、融合创新和应用等多个环节。不同环节对数据的质量、可信度、可用性和适用性等价值属性的影响不同,故对数据的价值增值贡献不同。但是,现有的数据分类分级制度和标准主要关注诸如数据来源、行业特征和敏感性等数据管理和存储方面的内容,较少考虑数据要素市场化过程中的数据价值增值,不仅缺乏对数据价值增值不同环节进行细化区分的分类方式,也缺少以等级判定的方式反映和评估诸如数据准确性提高、规模扩大、信息增强等价值增值变化的内容。这一方面不利于数据动态变化和价值增值的测度,另一方面难以根据数据在各个价值增值环节的贡献来分配数据要素的价值和收益。
5.数据要素市场化流通的支撑不足。市场化定价和流通治理是促进数据要素在更大范围和更深层次利用的重要途径,但是当前的数据分类分级制度对数据要素市场化流通的支撑不足。一方面,数据要素的价值特征和属性是数据要素价值评估的重要元素,也是影响数据要素市场化流通的重要因素。当前数据分类分级框架和标准中缺乏诸如数据稀缺性、数据可信度、数据质量、数据规模、数据的适用性、数据竞争力等有助于数据要素价值评估的要素,增加了市场主体分析数据要素作用和评估数据要素价值的难度,或将延长交易周期、降低交易达成的可能性,影响数据要素的流通效率。另一方面,由于数据来源的多样性和数据所承载信息的敏感性,数据要素交易的合规性治理重要且必要。例如,某些数据要素应该在受限制的范围内和特定主体之间进行流通,而一些特殊主体可能仅限于交易特定类型和等级的数据要素。然而,当前的数据分类分级制度和标准缺少与数据要素市场流通合规性治理相关的内容,容易出现数据要素交易乱象,影响数据要素的流通效率。
四、数据分类分级制度赋能数据要素市场化的推进策略
立足我国数据分类分级制度建设现况及发展需要,本文从建设思路、建设模式、建设方向和建设重点四个方面(见图6),提出以系统性长效制度建设,促进数据要素市场化和数据要素价值实现的数据分类分级制度推进策略。
图6数据分类分级制度推进策略
(一)“统一规划+行业主导”的建设思路
明确数据分类分级制度建设“统一规划+行业主导”的“1+N”建设思路,其中,“1”为国家层面的建设主体,“N”为不同的行业部门主体。根据前文对数据分类分级制度的实践进展分析,当前我国存在两种数据分类分级制度建设思路:一是国家统一规划,以行业部门主导推进;二是国家统一规划,以地方政府主导推进。从不同建设思路的作用和适用性看,以地方政府部门为主导推进的数据分类分级制度虽然更加符合本区域内数字化基础、数据要素相关产业和数字经济发展的现实状况和客观需求。但是,这种建设思路存在以下两个方面的问题。其一,因不同区域数字化基础、产业结构和经济发展水平不同,可能存在不同区域数据分类分级制度建设的主导部门对于数据类别和等级,在概念理解、标准设定、方法选择等方面存在差异。结果上,不同区域对于同一行业、产业的数据在分类分级标准和指南等方面不一致,同一数据在不同区域被划分为不同的类别或不同级别,影响数据要素的跨区域流通。其二,基于区域发展考量,部分区域数据分类分级制度建设主导部门可能为支持本区域优势产业发展,在数据分类分级标准制定等方面出现一定的倾向性和选择性,影响数据分类分级制度的客观性和统一性。
当前的建设实践中既存在以行业部门主导推进的情况,也存在以地方政府部门主导推进的情况。这种“双轨制”建设思路在数据规模较小、数据结构和内容较为单一、数据市场需求较低的情况下,能够有效促进数据分类分级制度的初期建设和实践探索。但是,随着数据规模和数据需求增大,数据内容与结构进一步复杂化,加之全国统一大市场背景下数据要素市场不断完善,以地方政府主导推进的数据分类分级制度建设思路作用于数据要素更大范围流通和更深层次利用的能力减弱。基于行业部门主导的数据分类分级制度有助于建立行业内全国统一的数据分类分级标准和指南,避免不同区域因理解差异、标准设定不一致而导致的数据分类分级混乱,有助于确保数据的准确性和可比性,为数据的跨区域流通和利用奠定坚实基础。而国家统一规划,能够确保各行业、各地区的数据分类分级制度在全国统一的原则和框架下进行,增强行业间、区域间数据分类分级制度的协调性和一致性。因此,“统一规划+行业主导”的数据分类分级制度建设思路更加有助于赋能数据要素市场化及数据要素价值实现。
(二)明确国家层面和行业层面的建设模式
1.国家层面出台数据分类分级制度建设的顶层规划。国家层面加强数据分类和分级制度的顶层规划和机制设计,以行政法规和规范性文件等形式出台数据分类分级制度建设规划或指导意见,明确数据分类分级的指导思想、基本原则、发展目标,为进一步建设全面、一致的数据分类分级制度提供基础支撑。权责方面,国家层面基于数字经济和数据产业发展规划,在综合研判、分析不同行业、产业数据内容特征的基础上,统筹考量数据安全治理、数据价值实现、数据要素市场化流通、数据权利及收益分配等内容,制定涵盖传统行业和新兴行业的数据分类分级基本框架。针对数据分类分级制度面临的现实约束和潜在困难,明确解决问题的基本原则。此外,数据分类分级制度建设初期,可以选择部分行业作为试点,探索并逐步完善具有全面性和统一性,综合多行业、多领域的数据分类分级制度。
2.行业主管部门负责本行业数据分类分级规划和标准建设。加强行业层面的数据分类分级规划和标准建设,行业主管部门负责本行业的数据分类分级制度建设,联合行业协会和第三方机构制定本行业的数据分类分级标准和指南等内容。一是行业主管部门充分了解本行业数字化进程、产业数字化发展现状和面临形势,特别是人工智能等新技术对行业产业的影响,分析本行业数据的应用场景、数据特征、数据结构及格式、数据管理、数据安全等内容,在此基础上制定本行业的数据分类分级发展规划。二是行业主管部门联合行业协会或第三方标准制定机构,制定具有全面性、一致性的行业数据分类分级标准。明确本行业数据的分类分级方法、原则、程序和依据,以及各个类别、等级的含义和适用范围。三是提供数据分类分级指南。通过详尽的操作程序、解释说明和应用案例,帮助标准使用者准确理解不同类别和不同级别数据的特征和分类分级方法等实践内容。四是加强标准与实践的衔接,确保数据分类分级标准契合现实需求且能及时更新。标准制定部门应与实际应用领域的专家和从业者紧密合作,充分考虑实际需求和技术发展,建立动态的、可持续更新的数据分类分级制度,与不断发展的行业、应用场景和技术保持同步。
(三)以全面性和一致性为建设方向
1.提高数据分类分级制度的全面性。从数据内容及适用场景的全面性和数据结构及特征覆盖的全面性两个维度进行科学系统设计,以实现数据分类分级制度的全面性建设。第一,提高数据分类分级制度对数据内容及其适用场景覆盖和识别的全面性。一是全面分析不同行业和产业数据的内容特征、适用场景及范围,并对相关内容、场景和特征给出明确的定义和分类分级判定条件,确保各类数据可以在既定的数据分类分级框架下被识别,并被合理地分类分级。特别地,需要重点关注新兴产业和智能产业场景下数据内容及场景的涵盖和识别。二是对数据内容及应用场景进一步细化,形成全面涵盖大、中、小及细分类别,包含多层级与细分等级的数据分类分级框架,确保数据能够得到明确和详细的分类分级。三是建立数据内容和应用场景分类分级的反馈机制,定期评估并更新完善分类分级标准和指南,以适应数据内容及场景的发展和变化。第二,提高数据分类分级制度对数据结构及特征覆盖和识别的全面性。一是全面识别数据的数字化结构与特征。除传统数据外,重点关注新兴产业和智能化场景下诸如数组、栈、队列、链表、哈希表、堆等数据结构,以及文本、图像和视频等能够转换为以上数据结构的内容。二是全面分析不同数据结构特征并完善对应的分类分级标准。根据不同数据结构及其应用场景,结合数据结构特征蕴含的信息和内容完善数据分类分级标准,使其能够适用于各类结构的数据。
2.增强行业数据分类分级制度的一致性建设。制定统一的数据分类分级标准和指南,确保行业内不同区域、不同主体能够遵循一致的分类分级规范,增强数据分类分级结果的一致性。一是统一分类分级标准和术语。为确保数据分类和分级制度的一致性,需要对数据分类的定义、等级的划分、标签的使用等方面进行规范,制定统一的标准、术语和对应说明,避免不同主体对数据分类和分级的理解差异。二是统一分类分级流程和指南。数据分类分级实践中,统一的流程和指南能够保障分类分级结果的一致性。制定明确统一的分类分级目录和指标,以及不同类别和等级数据的标准化操作流程、方法选择和适用性指南、操作人员选择及要求、特殊问题应对指南和处理原则等。三是加强国际对接与合作统一。促进数据更大范围地流通,需要将我国的数据分类分级标准同国际标准对接。制定数据分类和分级标准过程中,参考国际上已有的标准和实践案例,同国际组织和相关国家展开合作,共同推动数据分类分级的国际一致性建设。四是推动数据交易和管理平台一致性建设。建设统一的数据交易和管理平台,通过具有标准化、统一性的数据采集、交易、管理规范和标准化合约,促进行业数据分类分级标准和规范的推广应用,提高数据质量的同时推动整个数据要素市场生态系统的一致性建设。
(四)明确数据要素市场化背景下的建设重点
1.注重数据要素市场化及数据价值增值过程。识别不同行业或不同类别数据要素市场化的核心环节,基于数据价值增值链条健全分类分级标准。数据在价值链不同环节具有不同的价值量,数据分类分级制度要能够涵盖并识别数据价值增值链条中的主要环节。一是识别不同行业数据要素市场化的主要环节和价值增值路径。例如,按照“数据获取→存储→处理→分析→应用→服务”等价值链环节,将数据分为原始数据、清洗后的数据、分析结果和应用数据等多种类别。二是针对数据要素市场化过程不同环节的特点,分析并建立诸如准确性、规模性、信息度等有助于反映数据价值链价值贡献和增加值测度的数据分级指标。
2.注重数据价值评估和市场化流通治理。第一,注重有助于数据要素价值评估的数据分类分级内容建设。识别数据要素的价值特征,结合数据要素市场化过程和价值实现场景,从数据的规模、准确性、完整性、适应性、稀缺性等方面,健全能够反映和评估数据要素价值的分类分级标准。例如,根据数据数量、容量或覆盖范围进行规模性分类分级,有小规模数据、中等规模数据和大规模数据;根据数据的准确性、完整性、一致性和可信度等方面因素,将数据按照质量等级进行分类分级,如高质量数据、中等质量数据和低质量数据;根据数据的适用领域、目标用户或者使用场景将数据进行分类分级,如通用数据、特定行业数据和特定用户数据;根据数据的复杂程度和结构进行分类分级,如简单数据、中等复杂数据和高度复杂数据;根据数据的稀缺程度将数据进行分类分级,如一般数据、有限供应数据和稀缺数据。第二,注重有助于数据要素市场流通治理的数据分类分级内容建设。一是健全数据要素市场化过程中的参与主体类型、等级及认定标准。例如,明确个人、企业、事业单位、行政部门、社会组织等不同主体的类别和级别的认定标准。二是基于数据要素市场化流通和数据要素治理视角,进一步明确不同主体、不同类型和等级的数据要素参与市场化流通的条件和要求。例如,市场参与主体方面,明确不同类型市场主体能够交易数据的类型、范围和限制条件;数据要素交易方面,明确不同类型、不同等级数据要素的可交易对象,数据要素使用限制和适用范围等内容。
注释从略,请参阅期刊纸质版原文。
何辉|首都经济贸易大学财政税务学院副院长,教授、博士生导师。
薛钦源|通讯作者,首都经济贸易大学财政税务学院讲师。
史丹,何辉,薛钦源.数据分类分级制度与数据要素市场化:作用机制、现实困境和推进策略[J].福建论坛(人文社会科学版),2024,(04):58-76.