前几天,美国安全行业盛会RSA2018在旧金山开幕。它的创新沙盒环节一直是“网络安全风向标”,这些创新企业、创新技术也是国内同行的关注焦点。
BigID是美国的一家隐私数据保护公司,他们在此次创新沙盒环节中得了第一名。
我们对这家公司一直有所关注,他们的产品主要有5个功能点:
1.数据最小化:在数据库中快速发现那些需要保护的数据对象。
2.授权管理:证明个人数据收集得到了用户的许可。
3.泄漏报警:如果数据被非法访问或使用,系统会有预警提示。
4.数据主体权利:是否被搜集数据,用户有最终决定权。
5.数据驻留,评估跨部门调用以后,这些数据在其他系统中被泄露的风险。
简单来说,BigID主要是应对GDPR、PI、PII等欧美合规要求(中国与欧美在安全合规上的要求并不完全相同)。它通过使用数据沙盒技术,根据业务需求提取敏感数据进行脱敏,形成敏数据脱敏库。然后根据事先定义的需求结合原始数据进行关联分析,在数据不离开原始环境的前提下形成一个闭环数据分析沙箱,由此来给出客户建议。
在某种程度上,观数科技和这家公司的技术DNA有某些相似之处。
我们是参考了《个人信息安全规范》以及最新研制的《大数据安全标准》,开发了针对大数据环境的数据安全使用共享平台,融合观数大数据访问控制技术、敏感数据发现技术、数据脱敏技术、关联分析引擎、数据审计技术形成一套闭环的数据使用,共享的安全沙箱,为数据的安全使用提供技术保障,达到“事前可防、事中可控、事后可查”的安全效果。
以某南方省份的运营商为例:他们的Hadoop大数据平台已初具规模,Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,十分适合数据仓库的统计分析。
在数据流转过程中,Hive存储了大量敏感数据,包括姓名、身份证号、电话号码等。按照去年6月份颁布的《网络安全法》,运营商是这些数据保护的第一责任人。
要解决Hive的数据泄露风险,首先面临的两个问题是:1.客户不知道这些敏感数据存储在哪些表中;2.发现这些敏感数据后,我们如何保证这些数据在流转过程中不被泄露。
基于这种现状,观数科技提出了“三步走”的解决方案:
1.先发现敏感数据。通过大数据敏感数据发现系统BIGDsi,内置发现规则发现敏感数据,对其敏感数据标记分级分类。在此之前,运营商都是通过各部门协同,手动对数据进行分类分级。我们的系统可以做到自动化或者半自动化,大大提高分类分级效率。
2.敏感数据脱敏。数据在流动中产生价值,我们如何解决在开发测试、数据共享和交换过程中的泄露风险呢?观数科技根据客户的业务需求,结合可用计算资源情况,灵活选择替代、混洗、数值变换、加密、遮挡、空值插入/删除等脱敏方法,避免高敏感的原始数据泄露。
3.大数据审计。观数科技大数据应用审计系统BIGAudit能够实时监控、记录 Hadoop 大数据集群组件活动,并对其访问和操作行为进行细粒度审计的合规性管理系统。通过分析用户访问大数据组件行,帮助用户生成行为审计报告、溯源安全事件,同时加强内外部网络行为记录,提高大数据资产的安全。
这三步战略,可以初步满足现阶段国内大数据安全的合规性需求,解决了客户的一块儿心病。
但作为一家专业的大数据安全解决方案提供商,我们明白,仅做到这些还是远远不够的,大数据平台依然面临很多风险。在很多业务场景下,因为缺乏精细化的大数据安全标准,我们并不知道安全产品应该实现到什么尺度。
中国在数据安全领域的技术能力,并不逊于美国,但我们在安全意识和安全标准方面确实还需要相当长时间的培育。这也是为什么我们一直强调要推动国内大数据安全标准完善的原因。
观数科技很敬畏这个市场,我们希望在分布式框架下的大数据安全领域,做的更深一些,为用户提供切实有效的安全产品。请大家多多关注,我们一直在努力。