随着互联网、大数据等新兴技术的飞速普及应用,数据集中存储已成为趋势,越来越多的应用采用连接数据中心或者数据共享层的方式来开展业务,这使得采用“先脱敏-后分发”方式的静态数据脱敏产品往往无法满足用户“兼顾实时性和安全性”的需求,潮数科技的动态数据脱敏应运而生。
动态脱敏与静态脱敏的区别
动态脱敏和静态脱敏最大的区别在于动态脱敏适用于不脱离生产环境,对敏感数据的查询和调用结果进行实时脱敏,即“边脱敏,边使用”;静态脱敏则是适用于将数据抽取出生产环境脱敏,将脱敏后的数据分发至测试、开发、培训、数据分析等场景,即“数据的搬移并仿真替换”。
动态脱敏的三个阶段
动态脱敏分为三个阶段:首先,需要识别出数据库中的敏感字段信息;其次,采取替换、过滤、加密、遮蔽或者删除等技术手段将敏感属性脱敏,脱敏所使用的技术手段与去标识化和匿名化用到的技术本质上没有不同;最后,需要对脱敏处理后的数据集进行评价,以确保其符合脱敏要求。
动态脱敏的处理流程
动态脱敏的处理流程分为:敏感数据发现、敏感数据梳理、脱敏策略指定、脱敏任务执行。其基本技术原理为:通过准确的解析sql语句匹配脱敏条件,在匹配成功后改写查询sql或者拦截防护返回脱敏后的数据到应用端,从而实现敏感数据的脱敏,实际上存储于生产库的数据未发生任何变化。
其中敏感数据发现是基于其内置的可配置的敏感数据字典,包括:个人信息规则(中文姓名、身份证号、手机号码、中文地址、email地址、银行卡号、港澳通行证、台胞证、军官证、证券账号、回乡证……)、组织机构信息规则(组织机构代码证、纳税人识别号、工商注册号、企业名称、座机号码、组织机构代码号、经营单位、法人代表……)、其他敏感信息(金额数字、日期、产品代码、ip地址、mac地址、url访问链接、车牌号、车架号……)。
动态脱敏的部署方式
动态脱敏采用物理旁路和逻辑串联方式。应用或者运维人员对数据库的访问必须都经过动态脱敏系统,根据系统的规则对数据访问结果进行脱敏。
动态脱敏的产品优势
动态脱敏产品优势明显,包括:一、丰富的脱敏算法:系统内置敏感数据字典、数据脱敏算法和脱敏规则,用户可根据实际需求自行配置脱敏策略,脱敏控制粒度可达到字段级别;二、支持多种数据源:与数据库产品、版本相耦合,支持多种数据库和文件格式,用户只需进行简单配置即可;三、精细化权限控制:访问控制主体可细化到用户和字段,多用户访问的情况下针对不同用户可设置不同的数据脱敏策略;四、高并发、高可用:分布式部署,可在线动态扩容,有效支持高并发访问;五、高性能:对数据检索性能基本无影响,一般情况下性能下降不超过5%;六、快速集成:数据脱敏操作对应用系统透明化,不改变原有应用系统和数据库结构。
动态脱敏的行业应用
动态脱敏行业应用广泛,主要应用在运维、银行、证券、政务等行业。
数据库是存放数据、经常是那些高敏感度数据的宝库,因此它也是合规检查程序的重点区域。数据库中存在着大量的结构化数据,存在着大量的敏感数据,这些数据存在着很高的价值,尤其是一些客户信息的基础数据,而就泄露而言,数据库信息泄露是重灾区,而数据库运维又成为数据库信息泄露的一大推手。
证券行业是国家金融监管的重要对象,股票、期货、基金等的运作直接关系大大小小投资者的切身利益。与投资者相关的个人身份信息、交易记录、财务状况等敏感数据本身就具有很高的价值,也因此成为黑客、内鬼等不法分子觊觎的“肥羊”;而证券投资咨询公司、证券资信评级机构等掌握的重要数据,更关乎整个证券交易市场乃至国民经济和社会的健康、稳定运行,其数据安全防护不容有失。
在政务行业,当前智慧政务建设正广泛开展,与此同时,政务协同平台因承载大量的政务敏感数据和关键业务应用,其安全性也备受关注。随着云计算与大数据技术在政务环境普及应用,政务数据共享与开放程度加深,数据深度分析与挖掘能够提升数据的使用价值,为公众提供便捷与高质量服务,但重要信息和敏感信息的泄露将导致整个政务部门形象造成不可挽回的影响。