什么是数据脱敏
数据脱敏,又称为数据混淆、数据漂白和数据变形,是采用特定的脱敏规则或者算法对原始数据(字符或其他数据)进行修改或隐藏的过程。对数据字段使用数据脱敏的主要目的是为了保护个人可识别隐私信息的数据、敏感个人数据或商业敏感数据。
数据脱敏的技术原则
有效性:经过数据脱敏的操作后,攻击者失去了获取敏感信息的渠道,提升了窃取敏感信息的难度,从而保证了敏感数据的安全性。
真实性:尽可能地真实体现数据的特征(数据结构特征和数据统计特征)。也就是说,在数据中保留尽可能多的有意义的信息,并保留数据之间的原始数据格式、类型、依赖关系和特征。
高效性:一般通过自动化手段完成需要多次执行的环节,提高效率。
稳定性:在原始数据不变的条件下,脱敏操作执行的次数对最终结果是没有影响。
数据脱敏类型
一般的脱敏规则根据脱敏后的数据能否恢复,可以分为可恢复脱敏规则和不可恢复脱敏规则。可恢复数据脱敏规则是指可以将脱敏数据以某种方式,恢复为原始敏感数据。不可恢复的数据脱敏规则意味着无论使用哪种方法,脱敏数据都无法恢复为原始敏感数据。
数据脱敏根据环境的不同,分为静态数据脱敏(Static Data Masking,SDM)与动态数据脱敏(Dynamic Data Masking,DDM)。SDM 主要用于在不公开敏感信息的情况下为应用程序的开发和测试提供高质量(即逼真的)数据,它使开发人员和测试团队能够更有效地在开发周期的早期识别缺陷,从而降低成本并提高整体质量。DDM 主要用于为数据库或者应用程序提供基于角色的(对象级)安全保障。
数据脱敏的常用方法
泛化:泛化是指使用通用值替换生产数据,以便保留生产数据的局部特征,因此泛化后的数据是不可逆的。泛化方法包括数字和日期偏移取整、规整(根据大小将数据规整为多个预定义的档位)、区间(将数据用区间表示,不显示真实的数据)等。
抑制:是指隐藏生产数据信息的一部分,以实现数据值的转换,这是一种隐藏技术,一般通过使用掩码实现。
扰乱:是指将噪声添加到生产数据中,对数据进行扰动,从而导致生产数据失真和更改。生产数据经过扰动后,其分布特性保持不变。扰乱方法包括重排、替换、均质化、散列等。
更多互联网行业数据安全相关知识,敬请关注本站行业知识栏目。
推荐阅读
《2020BCS-北京网络安全大会:数据安全法规及标准建设.pdf》
《赛迪智库:数据安全治理白皮书(35页).pdf》
来源:互联网 / 发布时间:2023-12-01 08:31:52