IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于多示例学习图卷积网络的隐写者检测

已有 404 次阅读 2024-5-20 11:14 |系统分类:博客资讯

引用本文

 

钟圣华, 张智. 基于多示例学习图卷积网络的隐写者检测. 自动化学报, 2024, 50(4): 771789 doi: 10.16383/j.aas.c220775

Zhong Sheng-Hua, Zhang Zhi. Steganographer detection via multiple-instance learning graph convolutional networks. Acta Automatica Sinica, 2024, 50(4): 771789 doi: 10.16383/j.aas.c220775

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c220775

 

关键词

 

图像隐写者检测,图卷积网络,多示例学习,示例包表征 

 

摘要

 

隐写者检测通过设计模型检测在批量图像中嵌入秘密信息进行隐蔽通信的隐写者, 对解决非法使用隐写术的问题具有重要意义. 本文提出一种基于多示例学习图卷积网络 (Multiple-instance learning graph convolutional network, MILGCN) 的隐写者检测算法, 将隐写者检测形式化为多示例学习(Multiple-instance learning, MIL) 任务. 本文中设计的共性增强图卷积网络(Graph convolutional network, GCN) 和注意力图读出模块能够自适应地突出示例包中正示例的模式特征, 构建有区分度的示例包表征并进行隐写者检测. 实验表明, 本文设计的模型能够对抗多种批量隐写术和与之对应的策略.

 

文章导读

 

图像隐写者检测技术是一项通过对用户传播的图像进行综合分析、侦测, 来发现那些试图将隐秘信息隐藏在图片中进行隐秘通信的隐写者的信息安全技术. 在真实的社交网络中, 隐写者检测十分困难. 一方面, 基于图像的隐写算法可以帮助隐写者在不改变图像外观的前提下, 将隐秘信息嵌入图像中. 另一方面, 隐写者使用隐写术和有效载荷[1]等相关参数往往是无法预知的, 这进一步增加了隐写者检测的难度. 与试图捕获载密图像和载体图像之间的差异的隐写分析方法不同, 隐写者检测更关注隐写者与非隐写者之间的差异.

 

现有的隐写者检测方法中, 为了模拟真实场景中隐写者数量远远少于正常用户的情况, 常常假设在测试的过程中, 用户中只有一个隐写者存在, 采用异常检测或排序的方法将预测的隐写者概率最高的用户作为隐写者进行输出.

 

因此, 通用的隐写者检测方法通常由两部分组成: 特征提取和基于特征的聚类或离群值检测. Ker[1]首次将隐写者检测转换为聚类问题进行研究, 从每张图像中提取PEV-274特征[2], 并使用最大平均差异计算每对用户之间的距离, 再通过层次聚类算法来区分隐写者与非隐写者. 此后, Ker[3-4]进一步改进之前的工作, 用局部离群值因子方法代替层次聚类算法, 计算用户的异常程度并进行排序, 异常值最高的用户被检测为隐写者. 2016, Li[5]提出使用高阶联合特征作为图像的隐写分析特征, 并集成多个层次聚类器来检测隐写者. 2017, Zheng[6]首次提出一种基于深度学习方法的隐写者检测框架, 使用深度残差网络来提取图像特征, 最后使用聚合性层次聚类算法识别隐写者. 2018, Zheng[7]进一步改进特征提取模型, 并提出一种用于隐写者检测任务的多分类深度神经网络, 与传统方法和其他深度学习方法相比, 该模型在标准数据集上实现了最好的性能. 尽管这些方法的特征提取部分有所不同, 但是在用户表征、用户之间相似性的度量和可疑用户的检测等步骤没有本质差异. 在这些方法中, 每名用户的表征由其所分享的所有图像的特征分布拼接而成, 在此基础上, 计算用户的特征分布之间的相似度, 找出与其他用户差异较大的用户, 进而确定隐写者. 2020年以来, Zhang[8-9]将用户分享的图像及其相关关系建模成图, 提出相似性累积图卷积单元, 能够增强相似特征分布, 从而发现载密图像构成的子图, 对其进行加权, 以获得更有效的用户表征, 这也是迄今为止唯一使用图神经网络模型进行隐写者检测的方法.

 

本文将隐写者检测形式化成多示例学习(Multiple-instance learning, MIL)任务, 并提出基于多示例学习图卷积网络的隐写者检测算法(Steganographer detection algorithm based on multiple-instance learning graph convolutional network, MILGCN). 该算法通过共性增强图卷积网络(Graph convolutional network, GCN) 有效增加正示例的共性特征, 通过注意力示例包表征模块自适应地构建更具有区分力的示例包表征, 并设计多示例学习损失约束. 与现有算法相比, 提升了空域和频域、已知和未知隐写术等多种隐写策略情况下的隐写者检测准确率. 相比于Zhang[8-9]的工作, 本文提出一种新的基于图的用户表征模型, 能够针对不同嵌入策略做到对分享的图像数量鲁棒. 相比于文献[8-9]中基于规则构建的图重建和边池化方法, 本文提出自适应的图构建和归一化方法, 并通过损失进行约束, 自适应地攻击不同隐写策略; 相比于文献[8-9]中将节点视为同等重要的展平读出和平均读出, 本文进一步设计新的图读出方式, 能够载密图像构建具有区分力的图表征.

 

本文内容安排如下: 1节回顾图神经网络的相关工作; 2节给出基于多示例学习的通用隐写者检测方法的详细介绍; 3节给出一系列实验, 以验证提出方法的有效性; 4节对全文工作进行总结, 并给出进一步的研究思路.

 1  基于多示例学习图卷积网络的隐写者检测框架

 2  隐写者检测框架中两个模块((a) 共性增强图卷积模块; (b) 注意力读出模块)

 3  当测试阶段隐写者使用不同隐写术、分享的载密图像数量占总图像数量的10%100%, 不同的基于图的隐写者检测方法检测准确率

 

近年来, 隐写者在分散秘密信息嵌入图像的策略选择上越来越多样. 因此, 本文扩展基于图的隐写者检测方法, 进一步探究应对不同嵌入策略的通用隐写者检测方案. 本文提出一种基于多示例学习图卷积网络的隐写者检测算法, 将隐写者检测形式化为多示例学习任务. 在多示例学习任务的形式化下, 用户分享的图像对应于示例, 用户对应于示例包. 在此基础上, 本文设计多示例学习图卷积网络, 在正示例占比较低或特征分布与负示例相近的情况下, 能够识别和区分正示例的模式特征. 其中, 本文设计的共性增强图卷积能够自适应地突出示例包中正示例的模式特征, 而注意力图读出模块能够自适应地构建示例包表征, 并根据具有区分力的表征对用户进行正确检测. 实验表明, 本文设计的模型能够对抗多种批量隐写术和隐写策略. 在未来工作中, 将研究当载密图像数量占比很小情况下有效的隐写者检测方法.

 

作者简介

 

钟圣华

深圳大学计算机与软件学院副教授. 主要研究方向为多媒体内容分析, 情感脑机接口. 本文通信作者. E-mail: csshzhong@szu.edu.cn

 

张智

深圳大学计算机与软件学院研究助理, 香港理工大学电子计算学系博士研究生. 主要研究方向为隐写者检测, 脑电信号分析. E-mail: zhi271.zhang@connect.polyu.hk



https://blog.sciencenet.cn/blog-3291369-1434815.html

上一篇:自适应特征融合的多模态实体对齐研究
下一篇:基于多目标PSO混合优化的虚拟样本生成
收藏 IP: 150.242.79.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-3 19:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部