众所周知,数据是人类社会发展的忠实记录者,它的采集、处理与应用在人类社会发展过程中一直扮演着重要角色。随着互联网平台的快速普及,各类信息技术应用几乎随处可见,海量数据随着这一进程不断产生,蕴含着巨大的经济、科研、社会价值。
面对海量数据,缺乏监管是万万不行的。推动数据采集标准化,已成为推动数据良性利用、数据价值充分释放的一大要务。对此,国家有关部门也在积极行动。近日,中共中央、国务院发布关于构建更加完善的要素市场化配置体制机制的意见。意见包括加快发展技术要素市场、加快培育数据要素市场、加快要素价格市场化改革、健全要素市场运行机制等内容。
意见提出,提升社会数据资源价值。培育数字经济新产业、新业态和新模式,支持构建农业、工业、交通、教育、安防、城市管理、公共资源交易等领域规范化数据开发利用的场景。发挥行业协会商会作用,推动人工智能、可穿戴设备、车联网、物联网等领域数据采集标准化。
在人工智能系统应用过程中,数据在其中扮演了重要角色,数据安全成为企业发展不得不考虑的问题。通常来讲,如果在训练数据中加入精心构造的异常数据,破坏原有的训练数据的概率分布,则会导致模型在某些条件下产生分类或聚类错误。例如垃圾邮件系统、自适应生物识别系统等,都存在此类风险。而对数据采集的方式和渠道进行规范,则能够有效降低数据异常、数据滥用所带来的一系列危害,从而为企业实现数字化、智能化转型创造有利条件。
2019年3月,中国保险行业协会在京发布四项车险相关标准,涉及机动车保险车联网数据采集、以及车险理赔。其中,《机动车保险车联网数据采集规范》规范了机动车保险经营管理过程中车联网数据采集、交换、共享、分析等活动中所涉及的主要术语及车联网基础数据采集的定义、范围、类型、频率、精度等方面的内容。
不得不说,《机动车保险车联网数据采集规范》对汽车领域车联网数据采集设置了一道防火墙,为车辆集成、汽车共享等相关信息数据的利用设立了相应的依据。综合采集各种信息数据,将其运用于公共事务管理和现代化城市建设进程之中,正成为大城市实现功能转变、服务升级的重要特征,“城市大脑”就是一大典型应用。
“城市大脑”最早发源于杭州,是探索大城市治理数字化提供杭州方案。由杭州市和阿里巴巴合力,来自全市70余个部门和企业的数据汇入了城市大脑,日均新增数据达到了8000万条以上,包括警务、交通、文旅、卫健等11大系统、48个应用场景,力促杭州成为“全国数字治理第一城”,全力提升城市治理现代化水平。与此同时,与数据资源相配套的“杭州健康码”“亲清在线”等数字平台的上线,也为杭州公共事务决策科学化、治理高效化、服务精准化的实现提供着重要的技术支撑。
综合来看,数据采集的标准化、规范化,不仅需要依靠扎实的技术手段作后盾,更需要设备、平台和系统的配合运用。充分调动多种因素,把技术、制度的作用放大,将有助于各类企事业单位管理者明确数据采集、应用、分享的界限所在,从而在合规范围内使用各类数据。数据量巨大、安全性考虑不足、对原有系统的采集难度大等问题,仍然有待业内人士探讨和重视。而数据采集标准化大业的完成,也需要社会各界的合力推动。