Advertisement

数字水印综述

阅读量:

目录

    • 数字水印技术的历史沿革
  • 水分解析过程
  • 数据恢复环节
  • 性能表现的影响因素
    • 嵌入算法的效能评估

    • 检测模块的运算效率

    • 数据重构过程中的运算效率

    • 水信息隐藏效率

    • 数据承载能力评估
      小结与分析部分

      • 2.1关系数据可逆水印参生的问题以及解决办法

        • 2.1.1 小结
      • 3 总结

      • 4 数据溯源

      • 参考论文

      • 水印算法

      • 名词解释:

1.1 数字水印技术发展历史

水印技术:Watermark technology / Digital Watermark

1954年, 世界上首个模仿"数字水印"技术方案诞生。当时, 美国Muzac公司的Emil Hembrooke申请了一项名为"标识码可无感知地嵌入音乐以证明版权的方法"的专利。该专利首次描述了一种将标识码不可感知地嵌入音乐中以验证版权的方法, 这是目前所知最早的电子水印技术之一.
1993年Cox团队提出了基于扩频通信原理的水印方案, 该方案相对于空域算法具有较好的鲁棒性, 已成为数字水印技术中的一个经典方案. 但该方法存在显著缺陷, 其中最关键的一点就是需要依赖原始图像来提取水印信息
Chen于1998年提出了一类盲式水印方案. 该方法采用量化器实现信息嵌入, 在容量和鲁棒性方面表现优异, 已成为数字水印领域的重要方法之一. 音频水印技术研究最早见于1996年,Bender团队提出了LSB编码、回声编码、扩频编码等四种算法. 文本水印研究始于1994年,Bell实验室Maxemchuk率先提出在数字文档中嵌入标记的方法, 用于保护电子出版物版权. 视频水mark研究同样源于1994年,Matsui团队提出了一种类似于图像watermark的视频watermark算法
英国剑桥大学于1996年举办了第一届信息隐藏国际学术研讨会
在1998年的国际图象处理会议上, 开辟了两个专门讨论数字watermark的内容
1998年第3届信息隐藏国际学术研讨会上,"数字watermark"主题成为会议焦点
2001年, 西安举办了全国第三届信息隐藏学术研讨会, 深度探讨了数字watermark技术的发展方向及其具体应用
2002年,Country Security Agency宣布发布《国家保障数字空间安全策略》文件
2003年2月,American政府发布《国家网络空间安全战略》文件
2006年7月,"第八届国际信息隐藏会议"召开期间, 国际学术界陆续发表了大量关于数字watermark的研究文章
2000年Jan矩形数字化watermark学术研讨会举行
以下是主要watermark产品: Digimarc,JK-PGS,SysCop,Suresign等公司提供的watermark嵌入软件
与此相对应的是Stirmark和Unzign等攻击性watermark工具

在这里插入图片描述

上图是关系数据库的水印模型

纂改提示水印是一种脆弱水印,用来标识宿主信号的完整性和真实性
时域数字水印:直接在数据上叠加水印信息,对采样点的幅值作出改变
频域数字水印:在DCT变换域上隐藏水印。
变换域具有很好的稳定性。
水印生成 :将一些有意义的图像,声音或者文字处理转变
水印嵌入 :水印嵌入的前提是不影响数据使用,位置由MAC决定
水印攻击 :常见的水印攻击有元组添加、删除、修改攻击
1)元组添加攻击:添加一定比例的元组,不会破坏水印但是会干扰水印的检测结果
2)元组删除攻击
破坏水印,降低水印的鲁棒性
3)元组修改攻击
修改含有水印的元组合,进而破坏水印
水印检测
数据恢复 :只有关系数据库可逆水印方案才能实现数据恢复,传统的水印方案不可以恢复。

水印是否具有可逆性 关系数据数字水印、关系数据可逆水印
水印的鲁棒性 鲁棒性水印、脆弱性水印
水印的用途 内容认证水印、版权认证水印、盗版溯源水印
水印特征 隐蔽性、鲁棒性、安全性、盲检性

1、基于标记算法的关系数据数字水印技术

Agrawal和Kiernan提出的关系数据库的数字水印
2、基于秘密排序和数据分区的关系数据数字水印技术
2004 年,R.Sion 提出了另一个比较经典的关系数据数字水印方案[8]。该方案的
基本思想是首先利用带密钥的哈希函数将所有的元组排序,然后在此顺序的基础上,
将所有元组划分为若干个大小相等的数据分区,最后通过修改各数据分区的数据分
布特性在数据分区中嵌入 0 或 1。
但是,该方案所采用的数据分区方法在应对元组删除攻击和元组添加攻击时鲁棒性较差
3、基于差值扩展的关系数据可逆水印技术
2004年被Alattar提出,取相邻像素点的值计算差值,改变差值嵌入水印,水印检测之后,重构像素值,实现数据恢复。
4、基于遗传算法的关系数据可逆技术
一大优点是可降低水印嵌入对水印的影响,利用遗传算法算出对数据影响最小的水印串,缺点就是效率低

1.2水印检测

为了避免他人修改并删除自己的版权信息后重新添加 watermark,并保护自身 watermark 的安全起见,在实际应用中建议采用将数据划分为多个独立区域的方式进行 watermark 分布部署。具体操作时可以通过对每个区域分别添加独特的 watermark 标记来实现这一目标。在实际应用中建议进行多轮独立的检测流程,在每次测试中仅识别一个区域内的特定 watermark 标记。这种设计既能有效防止他人恶意篡改和删除 watermarks 并干扰后续操作 又能在一定程度上提高 watermark 的可靠性和安全性 从而达到版权保护的目的?

加粗样式

我们如何确定数据分区的数量?
水印的最高检测次数与版权的最大声明次数相等。划分的数据区域数量越多,则每个区域内的水印容量随之减小相应的抗干扰能力就越低;反之则越高。因此,在设置系统参数时需要综合考虑系统的抗干扰能力以及版权保护要求。

1.3数据恢复阶段

该数字水印技术具有对数据进行有效恢复的能力。去除嵌入的水印信息。主要应用于那些对数据完整性要求极高的领域如医学、军事、遥感等。同时将本论文中涉及的数据恢复算法的相关代码进行了公开分享。

在这里插入图片描述

1.4 性能影响

1.4.1水印嵌入算法性能

主要决定水印嵌入位置的选择、确定属性值配对的方式以及运算过程,并完成数据库的数据存储和读取过程

1.4.2水印检测计算性能

水印检测位置的选取,水印检测操作,读数据库数据

1.4.3数据恢复算法的计算性能

除了数据的读写时间,数据恢复数据的悬着以及数据恢复操作

1.4.4 水印隐藏率

已知在进行信息嵌入时需要考虑多个因素包括数据分区的选择以及所使用的数据元组和相关属性。这些因素共同决定了最终能够嵌入的信息量即所谓的"隐藏率"。在之前的章节中我们已经了解到信息被干扰的能力主要体现在其抗干扰性能上而这种性能通常通过"检测准确率"这一指标来进行评估。
在信息被干扰的过程中我们需要评估系统能够恢复原始信息的能力这可以通过"检测准确率"这一指标来进行量化分析。
研究发现随着"隐藏率"值的增加系统的抗干扰能力反而会下降这表明两者之间存在显著的负相关性。

1.4.5 水印容量性能

当水被注入容器的比例低于1/5时,在后续持续提高这一注入比率的过程中(即伴随注入比率的增长),视频质量对各个性能指标的影响呈现出较为稳定的增长态势。一旦该比率超过1/5,在随后继续提升这一注入比率的过程中(即伴随进一步提高这一注入比率),各个性能指标的表现变得更加波动剧烈。

1.4.6 小结

本章针对水印验证次数有限的问题进行了深入研究,并构建了一种支持多轮验证的关系数据可逆水印方案。在该方案中,我们开发了完整的水印管理流程:包括高效的嵌入算法、精确的检测算法以及可靠的恢复算法等关键组件。通过优化关键参数设置来控制水印检测灵敏度,在确保数据完整性的同时实现了对嵌入水印的多次检出功能。此外,在方案设计中充分考虑了系统的抗干扰能力,在实际应用中能够有效去除失效标记码并恢复原始数据内容。为了全面评估该方案的实际性能表现,在实验阶段与现有主流方法进行了系统对比分析:包括基于关系重建的水印方案(RRW)、基于行为建模的方法(BRM)以及基于双重冗余机制的设计(BRRW)。实验结果表明:采用本方案所嵌入的水印不仅具有优异的抗攻击特性,在多个典型应用场景下均满足了实际需求要求

2.1关系数据可逆水印参生的问题以及解决办法

在之前介绍的关系可逆水印系统中,在用户获取并恢复了该系统中的原始关系之后,在将其出售给第三方时,并不会影响到原始系统的控制权。那么为何会出现这种情况呢?因为在这个恢复过程中,在删除了所有的元信息后就不再能够实现对原始系统的控制。因此,在实际操作中我们遇到了一个问题:是否可以在不删除所有元信息的情况下实现一种不影响原有系统控制的水印嵌入方式?

在这里插入图片描述

方案主要由五个关键部分组成:(1)预处理阶段;(2)分层编码阶段;(3)特征提取与保护层构建阶段;(4)码本生成与管理优化阶段;(5)增强防御能力强化阶段。

在这里插入图片描述

它们在确定元组的数据分区、选择水位点进行水印编码以及辅助数据提取方面存在一致性。通过从当前元组中识别出已嵌入的标记位WD_z后ward计算原始信息bit_y并执行更新操作。最终输出调整后的数据库关系Dw' ,完成等级提升过程。值得注意的是所使用的分层密钥sk'仅覆盖当前子区域所需的信息编码部分

2.1.1 小结

现有关系数据的可逆水印方案能够彻底去除数据中的所有水印以实现完整的数据恢复功能。然而,在这种情况下其版权信息将无法得到有效保护。为此本章提出了一个分级可逆的关系数据库水印方案旨在通过引入多级的数据质量等级指标来反映不同层次的数据有效性水平并构建了一个完整的嵌入式watermarking体系框架该体系包含四个核心算法即基于分区的嵌入式watermarking方法层次式检测机制以及动态提升优化策略等实现了对任意质量等级的数据都能够进行相应的watermark增强处理同时对于任意的质量等级关系型数据库也都可以通过其中内置的watermark验证机制有效地确认原始数据的所有版权信息这一方法经过大量实验分析证明其提出的各项算法均具有较高的执行效率较高的抗干扰能力并且能够很好地满足大多数实际应用需求

3 总结

本文对现有数字水印方案进行了系统性研究与分析,并揭示了以下问题:(1)一次水印嵌入仅能实现一次版权认证;(2)数据所有者在进行数据恢复时缺乏有效控制。针对上述问题提出了解决方案如下:(1)通过将数据划分为多个区域,在每个区域中分别嵌入水印,并通过多次检测实现多层版权认证;对于失效的水印则采用差值扩展的方法以达到数据恢复的目的;(2)提出了分级可逆数字水印技术,在依据数据的可利用程度来提升水印质量的基础上实现了更高层次的安全性与可靠度。通过性能测试验证表明以上两种方案均具备良好的可行性和抗干扰能力;展望未来在面对不同分布特性的数据集时需要进一步探索如何实现自适应式的嵌入技术以满足多样化需求;这方面的深入研究将涉及深度学习相关技术的应用与发展

4 数据溯源

该文章深入阐述了数据溯源模型的具体构建过程与实现原理,并详细探讨了其在实际应用中的表现特点。文中对比分析了各种方法的优劣特点,并提出了一种基于改进算法的数据回溯机制方案。此外,在现有技术框架基础上进一步优化了算法性能指标,在保证准确率的前提下显著提升了运行效率。

数据追踪技术如今已广泛应用于WEB安全领域、通信安全领域、文档安全领域以及数据库安全性较高的场景中,并获得了相应的应用实例

参考论文

[1]侯瑞涛. 结构化数据数字水印技术研究[D].青岛大学,2019. 此处可下载全文 图像篡改的主要方法主要包括截屏复制、亮度提升、加入噪音干扰、重新采样处理以及双重压缩处理等方法。

小波变换被公认为一种用于图像分层分解的关键数学工具。作为一种高效处理非平稳信号的方法论框架,在多分辨分析(MRA)中得到了广泛应用。其构造基于有限持续时间和变化频率的小波函数,在时频分析方面也表现出与傅里叶变换不同的特性[14]。多分辨分析(MRA)框架下将信号分解为低频子带和高频子带;粗粒度的信息由低频子带捕获;而详细捕捉边缘细节的部分则由高频子带提供;由于人眼在感知边缘变化方面具有一定的鲁棒性,则可以利用高频子带进行水印编码过程

离散余弦变换是一种线性可逆变换{\displaystyle F:R^{n}\rightarrow R{n}}F:Rn \rightarrow R^n其中R代表实数集这一概念也可以通过另一种方式来表达即一个由{\displaystyle n\times n}n \times n矩阵所表示的操作符这种矩阵操作在实际应用中具有重要的意义此外离散余弦变换衍生出多种不同的形式每种形式都基于以下基本原理将一组包含{\displaystyle n}n个实数值数据点经过特定算法处理后转化为另一组同样数量的新数据点这一过程在信号处理图像压缩等领域有着广泛的应用

水印算法

数字水印技术主要采用变换域算法进行实现

运行python test.py
所有代码由python实现,可封装成dll、so、web服务。

名词解释:

blind embedding: 该种方式不依赖于载体作品
blind extraction: 无需原始图像即可进行水印提取
无法用肉眼察觉的隐形水印: 这是一种无法用肉眼察觉的隐形水印
PSNR指标用于评估加了水印后的图像质量;数值越高越好;达到35以上时肉眼几乎察觉不出来。

信息的两种关键特性消失:
原始图像中的数据均为整数,在应用奇异值分解(SVD)或离散小波变换(DWT)处理后会生成浮点数值,在转换过程中会引入精度损失。将图像以JPEG格式压缩编码后解码回内存时会引入重建误差。统一缩放到512×512像素可能会带来失真问题;部分图像在压缩解压过程中可能会出现较大的失真程度。
文件元数据中的大小字段缺失:
无法进行无痕水印技术的应用。

能保存的信息太少,判断不准确,而且意义也不大

尺寸必须大于64×64像素【存储的信息量不足,在实际应用中准确性不足,并且意义也不大

意义也不大

该视觉系统(HVS)具备以下显著特征:
在包含显著灰度梯度或纹理特征的区域中表现出较强抗变异性。
主导图像模式会强烈遮蔽与之方向一致且具有相近空间频率的小幅度变化。
当背景亮度升高时其对比敏感度逐渐减弱从而难以辨识较亮区域中的细微灰度变化。
该系统可被系统性地分类为运动敏感特性、纹理敏感特性以及亮度相关敏感特性。
截取图片后通常会产生明显的黑白失真效果此时由于图片信息量较低难以实现隐埋式的秘密信息嵌入。

对于灰度图像而言,在其结构中每一个像素点都占据8个二进制位数;而在RGB颜色空间下,则将三个颜色通道各自定义为8-bit数据类型,并总计占用24-bit的空间资源。每一位二进制数值仅有两种可能的状态:0或1;这也正是导致每个颜色通道最大取值范围被设定为255的原因所在。在此体系下,默认情况下不同比特位置所代表的价值存在显著差异:其中低位的信息量相对较少。因此将水印编码嵌入到最低有效比特层能够有效地保护版权信息而不显著影响图象质量。

攻击手段通过修改关键位数据对数字图像进行数学转换。
该方法具有结构简洁、容量充分的优点。

实现对任意类型的离散余弦序列转换。输入数组x:一个可变长的输入数组。类型:{1,2,3}(可选),指定使用的离散余弦变换类型(参见注释)。默认值为2。转换长度n:整数(可选)。当n小于x沿着轴的长度时,则会截断输入;当n大于该长度时,则会进行零填充处理,默认情况下设置为n等于x沿着轴的长度。计算dct的轴:整数(可选)。默认情况下选择最后一个轴(即axis=-1)。归一化标准:无或'正交'(可选),指定归一化方式(参见注释)。默认值为无。是否覆盖输入数组x:布尔值(可选),若设置为True则将销毁原数组x;默认值为False返回y:实数类型的转换后数组。转换后的输出数组y请参见

全部评论 (0)

还没有任何评论哟~