如何唤醒“沉睡”的公共数据?开发利用顶层设计出台

发布时间:2024-12-29 23:12:16 来源: sp20241229

  公共数据资源开发利用顶层设计出台

  如何唤醒“沉睡”的公共数据

  “这是中央层面首次对公共数据资源开发利用进行系统部署。”

  ——————————

  整理材料、开展调研、上报数据……“十一”假期刚过,各地政府的数据管理机构、数据服务企业就马不停蹄地忙碌起来。

  “今天上午,省里面就到了我们这边的数据要素产业园,现在都还在那边调研。”10月11日傍晚,四川省某地级市政务和大数据局副局长在电话中对中青报·中青网记者说。来不及细聊,他就忙着接待,挂断了电话。也在这两天,每日互动股份有限公司(以下简称“每日互动”)董事长方毅奔波于各种会议,调研、采访一个接着一个,时间被安排得“密不透风”。究其原因,都与一份公共数据资源开发利用领域的顶层设计文件有关。

  10月9日,中办、国办正式对外发布了《关于加快公共数据资源开发利用的意见》(以下简称《意见》),提出到2025年,公共数据资源开发利用制度规则初步建立;到2030年,公共数据资源开发利用制度规则更加成熟,资源开发利用体系全面建成。

  “这是中央层面首次对公共数据资源开发利用进行系统部署。”国家数据局局长刘烈宏在日前举行的国新办新闻发布会上说。而就在《意见》发布后的第三天,两项配套政策的征求意见稿也按期与公众见面,公共数据资源开发利用的政策规则体系逐渐明晰,如何唤醒“沉睡”的公共数据则备受关注。

  明确共享、开放和授权运营三种方式

  作为继土地、劳动力、资本、技术之后的第五大生产要素,数据越来越受到市场的重视。

  2022年12月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》发布,业内称为“数据二十条”,以此来凸显其重要性。在总述“探索数据产权结构性分置制度”时,“数据二十条”明确要“建立公共数据、企业数据、个人数据的分类分级确权授权制度”。

  这里提到的公共数据,就是各级党政机关、企事业单位依法履职,或提供公共服务过程中产生的数据资源,小到城市空气质量、小区用水用电,大到GDP、CPI等,《意见》也延续了这一概念。聚焦数据智能服务赛道10余年,每日互动推出的数据服务产品,大部分是基于自主持有数据和相关平台企业数据开发而来,“从政府等单位获取公共数据的情况并不多”。但长期与数据打交道的方毅,深谙各类数据价值。

  “在业内,公共数据被认为是极具价值的数据资源。”方毅对记者说,公共数据规模体量大,数据的客观性、准确性更高,企业类、平台类数据往往是实时采集的,更加鲜活。“未来如果能把公共数据的开放性、权威性、准确性,与互联网平台数据的鲜活性相结合,可以更好地发挥数据要素的价值。”

  其实,早在2015年,“公共数据”的表述就首次出现在国务院发布的《促进大数据发展行动纲要》中。多年来,面向支撑数字政府建设,公共数据发挥了显著作用,但刘烈宏坦言,公共数据在资源供给、应用创新、权益分配等方面,“不敢”“不愿”“不会”的问题比较突出,要素价值没有得到充分释放。他也明确指出:“公共数据资源开发利用不足,主要矛盾在供给侧。”

  今年5月发布的《全国数据资源调查报告(2023年)》显示,2023年,我国公共数据开放量同比增长超16%,18.6%的平台企业和51%的中央企业在数据开发利用过程中应用到政府开放数据。但在2023年我国生产的数据量中,只有2.9%被保存,而在存储数据中,一年未使用的数据约占四成,大量数据价值被低估,亟待挖掘复用。

  对此,《意见》首先瞄准公共数据资源供给,明确了共享、开放、授权运营3种公共数据资源供给方式。国家数据局副局长陈荣辉表示,作出上述规定,主要是考虑要按“需”施策、因“数”施策,既满足不同的开发利用需要,也提出有针对性的管理要求,“目的就是希望能够系统性地解决公共数据资源‘供得出’的问题”。

  其中,“共享”面向各级政务部门,主要解决跨层级、跨地区、跨系统、跨部门、跨业务的数据共享交换问题;“开放”主要面向企业和社会公众,强调要在维护国家数据安全、保护个人信息和商业秘密的前提下,利用互联网依法依规有序开放数据或者数据集。

  陈荣辉透露,截至今年7月,我国已有243个省级和城市的地方政府上线了数据开放平台,开放的有效数据集超过37万个,“最近8年来增长了44倍”。《意见》提出,要健全公共数据开放政策体系,优先开放与民生紧密相关、社会需求迫切的数据。“这些措施,必将持续提升公共数据开放的‘质’和‘效’。”他说。

  而对于潜在价值高,具有一定敏感性的数据,则需要依托更加专业的力量,付出一定的治理和开发成本,形成数据产品和服务供社会各方调用。在此背景下,授权运营应运而生。

  “公共数据资源开发利用是数据要素化配置的切入点,也是社会数据资源开发利用的牛鼻子。”清华大学计算社会科学与国家治理实验室执行主任孟庆国预计,《意见》将激活现有占全社会70%-80%的公共数据资源,“将对企业数据资源开发利用、个人数据资源开发利用等都产生极大的示范带动作用”。

  强化规范公共数据授权运营

  “公共数据授权运营将是扩大公共数据资源供给最主要和有效的方式。”孟庆国对记者说,相较于“共享”和“开放”,“授权运营”在平衡公共数据的公益性与收益性问题、平衡公共数据信息保护与数据价值释放问题方面,存在着较大优势。

  他提到,公共数据来源于政府部门、公共企事业单位的公共管理和公共服务履职,如果无条件无偿使用,开发利用动力就会不足,也难以持续。通过授权运营,允许运营机构在政府指导和授权下,进行有偿服务,将极大程度激活公共数据市场活力。“此外,授权给专业的机构运营公共数据,按照‘管运适度分离’的原则,让社会资本有序参与,也能最大释放公共数据要素价值。”

  此前,“数据二十条”曾提到要“推进实施公共数据确权授权机制”。此次新发布的《意见》则提出,要“鼓励探索公共数据授权运营”,探索将授权运营纳入“三重一大”决策范围,强调要明确授权条件、运营模式、运营期限、退出机制和安全管理责任等。在国家数据局数据资源司司长张望看来,这是建立数据产权分置运行机制的重大举措,也是建立公共数据、企业数据、个人数据分类分级确权授权机制的一个重要的突破口,就是在落实“数据二十条”精神。

  记者查询公开信息后发现,截至目前,全国各地至少公布了50份公共数据授权运营专门政策文件,大多数出现在“数据二十条”出台之后,其中又以2023年发布的文件居多。“因此,2023年也被业内称为我国的‘公共数据授权年’。”方毅认为,从各地的相关动作,足以看出社会各界对公共数据资源授权运营的期待。

  其实,从去年国家数据局挂牌成立到现在,近一年的时间,方毅作为企业方代表之一,一直与国家数据局保持着良好的沟通,相关政策文件在前期酝酿和讨论过程中,其公司也参与其中。“《意见》的主基调是强调数据‘开放’和‘运用’,从大的逻辑上可以理解为,在保障数据安全的同时,鼓励供需双方共同努力让数据润泽到产业发展中。”他说。

  值得注意的是,《意见》不光将“公共数据授权运营”作为一种新型公共数据资源开发利用形式写入,还将“加强资源管理,规范公共数据授权运营”单独作为一节写出,并着重强调了要“建立健全价格形成机制维护公共利益”,关注到公共数据资源到底“值多少钱”这个关键问题。

  实际上,数据定价,一直是数据要素市场化配置的难点和焦点。中央财经大学数字经济融合创新发展中心主任陈端介绍,目前,公共数据的定价主要有专家评估、数据收集或管理机构定价、市场公允价值定价等方式,尚未形成统一的公共数据价值评估标准。“核心是不同主体对定价权的争夺,背后则是定价模式的差异”。

  对此,《意见》提出要发挥好价格政策的杠杆调节作用,加快建立符合公共数据要素特性的价格形成机制,还明确提出了“无偿使用”和“有偿使用”两种方式。“无偿使用”用于公共治理、公益事业的数据产品和技术服务,实行有条件的无偿使用;“有偿使用”用于产业发展、行业发展的经营性技术和产品开发,确实需要收费的,也不能漫天要价,要实行政府指导价,目的就是要降低全社会的用数成本。

  “两种收益方式,保障了公共数据的公共属性,最大程度激发了公共数据开发运营的市场活力。”孟庆国说。陈荣辉表示,建立健全价格形成机制,本质是要在坚持维护公共利益的前提下,正确处理公益性和市场化开发利用的关系,实现经济和社会综合效益的最大化。记者在采访中了解到,目前,国家数据局正会同国家发展改革委,研究制定相关价格政策文件,将于近期出台。

  安全合规地使用数据

  对于公共数据资源开发利用,“如何保证数据被安全合规地使用”是民众最关心的问题。

  近日,审计署发布了《中央部门单位2023年预算执行等情况审计结果》,其中提到,4个部门所属7家运维单位未经审批自定数据内容、服务形式和收费标准,依托13个系统数据对外收费2.48亿元。这是公共数据被违规利用的典型案例。有业内人士指出,政务和公共数据开放能释放经济价值,但也要在数据安全要求范围内。政务数据、公共数据等所包含的有价值信息多,需要高程度的保护,例如限制或禁止对外流通,以及更为严格的授权获取或使用程序等。

  除了数据被违规利用,陈端提到,在公共数据资源开发利用过程中,公共数据泄露风险也值得关注。她说,数据具有易复制性和可携带性特点,公共数据价值密度高,涉及大量个人敏感信息,如泄露将对个人隐私造成严重影响,动摇公众对公共数据开放的信任度,也会给相关方带来经济损失。其中,国防、军事等领域的敏感信息安全风险尤为突出,需要有更为完善的数据安全防范机制。

  “在‘数据二十条’中,坚持‘原始数据不出域、数据可用不可见’的原则,主要是为了防止数据泄露。”孟庆国分析说。《意见》也延续了“数据二十条”的上述原则,对公共数据安全作出相应规定,并特别重申“依法依规予以保密的公共数据不予开放,严格管控未依法依规公开的原始公共数据直接进入市场”。

  在制度方面,《意见》要求建立健全分类分级、风险评估、监测预警、应急处置等工作体系,开展公共数据利用的安全风险评估和应用业务规范性审查。在技术方面,鼓励开发数据模型、数据核验、评价指数等多形式数据产品。此外,《意见》还强调要提升数据汇聚关联风险识别和管控水平。

  “数据资源开发利用程度越深,数据安全和个人信息保护就越要强化。”张望介绍,对于其中涉及个人信息的公共数据,将严格落实《中华人民共和国个人信息保护法》,进行脱敏和匿名化处理。同时,有关部门还将支持数据加密、可信流通、安全治理等技术创新和应用,更好地解决数据利用中的安全问题。

  关于公共数据开发利用中的数据安全合规问题,方毅认为要围绕具体场景来讨论。他以交通场景为例说,如果某辆车的数据被泄露,就有可能侵犯了隐私,但如果是根据车辆分析得到的整体路况数据就不涉及隐私,且路况分析数据反映出的城市交通情况将有助于交管部门很好地提升交通治理水平。

  “所以,结合具体场景来谈数据的安全合规非常重要。”方毅认为,这一方面要通过机制来保障“分场景”论证,同时也需要用装置来保障“封场景”使用,从而做到数据可用而不可见,“让数据非必要不流转,但数据价值畅通流转”。

  中青报·中青网记者 贾骥业 来源:中国青年报 【编辑:张燕玲】