数据水印保护数据安全
在当今网络信息发展迅速的时代,大数据包含有巨大的价值,是非常重要的资源。在利用这些数据资源的过程中,数据共享和数据交换需求也在不断增多,如业务部门数据交换、组织结构间的数据交换、数据外包泄漏等。数据一旦流入低安全域,复杂的环境使得数据安全难以控制,这也导致了数据泄漏事件频发。一旦发生了数据丢失泄漏,如果不采取有效的安全控制和版权保护,将会造成无法想象的后果。因此,预防固然重要,但是泄漏发生后的溯源同样重要。数据水印可以在数据泄漏发生后可溯源到操作数据用户身份、作业及泄露范围和渠道,从而提高数据共享和交换中数据的安全性。
数据水印深入推进
数字化转型的深入推进,企业内部大量数据在频繁交互,同时企业间有大量的数据共享、交换的需求。然而,数据流通给数据安全带来巨大的挑战,其中潜在的数据泄露风险是首要面临的安全问题。本文介绍的数据库水印技术,在数据泄露前在结构化数据(关系表)载体中隐藏水印标记信息;在数据泄露后可提取水印,可作为泄露主体(包括针对企业员工、组织机构)溯源追责的有效技术手段,可积极促进数据的流动与共享。另一方面,数据库水印技术在一定程度上可以起到心理威慑作用,强化数据接收机构的安全保护意识与责任。
数据水印的特点
数据水印的定义
数据水印是指从原始环境向目标环境进行敏感数据交换时,通过一定的方法向数据中植入水印标记,从而使数据具有可识别分发者、分发对象、分发时间、分发目的等因素,同时保留目标环境业务所需的数据特性或内容的数据处理过程。
数据水印通过对原数据添加伪行、伪列、对原始敏感数据脱敏并植入标记等方式进行水印处理,保证分发数据正常使用,水印数据具有高可用性、高透明无感、高隐蔽性,不易被外部发现。
数据水印性质
(1) 鲁棒性:数据库遭到有意或无意处理后水印的提取情况。如:增加、删除或篡改操作。评价指标:误码率(BER)。
(2) 保真性:含水印数据库与原始数据库的数据差别。评价指标:平均误差(MAE)。
(3) 水印容量:可嵌入的有效载荷。评价指标:嵌入率(ER)。
(4) 计算代价:水印算法的计算代价。评价指标:算法的时间复杂度(O)。
(5) 安全性:根据Kerckhoff法则,水印算法是公开的,其安全性依赖于水印密钥,攻击者在知晓嵌入和提取算法的情况下也无法检测或去除水印。
(6) 可用性:嵌入水印后数据库不影响数据挖掘和统计分析等应用。
版权所有©2024 天助网