Journal of Computer Applications ISSN 1001.9081 2013..04..01 计算机应用,2013,33(4):1074—1076,1107 文章编号:1001—9081(2013)04—1074—03 C0DEN JYIIDU http://www.joca.en doi:10.3724/SP.J.1087.2013.01074 基于双边转移概率矩阵的JPEG图像隐写检测 赵艳丽 ,王兴 (1.南阳师范学院计算机与信息技术学院,河南南阳473061;2.南阳师范学院软件学院,河南南阳473061) ( 通信作者电子邮箱nysyzyl@126.com) 摘要:针对当前基于JPEG图像的典型隐写算法,基于离散余弦变换(DCT)域分块内及分块间相邻系数之间的 相关性进行分析,通过将相邻三个系数的中间位置的系数作为条件,统计两边系数的条件分布概率矩阵,将提取的所 得矩阵作为隐写检测敏感特征,提出了一种基于DCT系数双边转移概率分布的JPEG图像隐写检测算法。实验结果 表明,在不同嵌入率下,该算法的检测性能均优于已有检测算法。 关键词:隐写;JPEG图像;系数相关性;双边转移概率;隐写检测 中图分类号:TP309 文献标志码:A Steganalysis of JPEG images based on bilateral transition probability matrix ZHAO Yanli ,WANG Xing (1.College of Computer and Information Technology,Nanyang Normal University,Nanyang Henan 473061,China; 2.School of Software,Nanyang Normal University,Nanyang Henan 473061,Chia)n Abstract:For the typical steganographic algorithms in JPEG images,this paper firstly analyzed the correlation between neighboring coeficifents of intra.and inter—block in Discrete Cosiine Transfo珊(DCT)domain,and then extracted the conditional distribution probability matix of rthe bilateral coeficifents as the sensitive steganalytic features by taking the middle coeficientf of three neighboring coeficifents as the condition.At last,this paper proposed a JPEG image steganalytic algorithm on a basis of bilateral transition probability distribution of DCT coefficients.The experimental results show that,for different embedding ratios,the algorithm proposed in this paper outperforms the existing algorithms. 、 Key words:steganography;JPEG image;coeficifents correlation;bilateral transition probability;steganalysis 0 引言 隐写及隐写检测是信息安全领域的一个重要研究方向。 目前,由于数字图像的广泛应用,基于数字图像空域像素及频 域系数的隐写及隐写检测研究最为广泛。在隐写方面,基于 空域的典型隐写方法如最不重要比特位(Least Signiifcant Bit, LSB)替换隐写、LSB匹配隐写、高不可检测(Highly Undetectable steGanOgraphy,HUGO)隐写…等;基于频域的典 型隐写方法有Jsteg、F5[2 J、Outguess 、基于模型(Model— 地描述隐写对数据相关性的破坏。目前,还未有相关文献基 于DCT系数的这种高阶统计特征设计针对JPEG图像的隐写 检测算法。 本文受文献[10]基于相邻像素差值矩阵高阶Markov特 征的隐写检测算法的启发,提取JPEG图像相邻三个DCT系 数的联合分布矩阵作为隐写检测特征,提出了一种针对JPEG 图像的隐写检测算法,进一步提高了隐写检测的性能。 1 相关工作 现有隐写检测算法中,基于相邻数据相关性所提取的特 征均具有较好的检测性能,该节将主要以文献[6,8]为例分 别给出共生矩阵和Markov转移概率矩阵特征的具体提取算 法。 Based,MB) -5 3等。在隐写检测方面,尽管已经存在很多检 测方法,然而,对一些较为高级的隐写算法,尤其是频域隐写 算法在信息嵌入率较低的情况下,现有检测算法的性能仍有 待进一步提高。本文以基于JPEG图像频域中的隐写为研究 对象,研究设计具有较高检测精度的隐写检测算法。 针对JPEG图像的隐写检测方面,绝大多检测算法均将 相邻离散余弦变换(Discrete Cosine Transformation,DCT)系数 令图像DCT系数矩阵c的尺寸为HXW,其第i行第 列 个分块中(m,n)位置的系数为c ,其中:1≤i≤ 8,1 ≤ /8,1≤m,n≤8。根据文献[6]中描述,以水平方向相邻系 数为例,可得分块内及分块问相邻系数共生矩阵特征absNJ。 和absNJ2 计算如式(1)和(2): 1f/8 WI8 8 8—1 的联合分布统计特征,如共生矩阵和Markov转移概率矩阵等 作为敏感特征,如:文献[6—7]等基于共生矩阵特征进行隐 写检测,文献[8—9]等基于将Markov转移概率矩阵作为特 征或特征的一部分进行隐写检测,等等。众所周知,隐写将会 破坏自然图像相邻数据如DCT系数的相关性,而上述两类特 征能够较好地捕捉这种相关性,因此,该类算法具有较高的检 测精度。然而,现有针对JPEG图像的隐写检测中仅使用了 相邻两个系数的联合分布特性进行隐写检测,从而未能更好 收稿日期:2012.10.30;修回日期:2012-11+30。 absNJ ( )=∑∑∑∑6(1 c洳 l= , l=1 J=1 m=I n 1 I c枷( )1=y)/(56×(H/8)×(W/8)) 8 W/8—1 8 =(1) 8 ∑∑∑∑占( i:l =1 =1 n=l c (『+1) I=y)/64×(H/8)×(w/8) (2) 基金项目:河南省重点攻关项目(082102210067,112102210408)。 作者简介:赵艳丽(1978一),女,河南南阳人,讲师,硕士,主要研究方向:图像处理、多媒体;王兴(1974一),男,河南南阳人,副教授,主要 研究方向:计算机网络、数据库。 第4期 赵艳丽等:基于双边转移概率矩阵的JPEG图像隐写检测 1075 其中:6(“, )=1当且仅当u= , 和Y表示待统计的数值。 根据上式,当设定阈值 时,0≤o,b≤T。垂直方向相邻系数 的共生矩阵特征可参照式(1)和(2)统计得到。然后,对分块 = 内和分块间特征,取水平和垂直方向的平均值,即可得到最终 用于隐写检测的特征。 程:分类模型的训练和可疑图像的检测,其简要步骤分别如 下: 分类模型训练 1)分别使用常见的JPEG图像隐写算 鹏∑㈦M 法,如F5、Outguess、MB1和MB2等,构建足够数量的载体和 载密图像库;2)对载体和载密图像库中的每一幅图像,分别 统计分块内及分块间多个方向的特征向量;3)对特征进行预 处理,将其转换为适合分类器的特征形式;4)对分类算法设 置合适的参数,使用处理好的特征训练分类模型。 啪∑ ∑ kov转移 相邻系数的差值,然后提取系数差值矩阵的一阶Mar∑ 概率矩阵作为特征。如对分块内水平方向相邻系数,根据式 文献[8]在提取Markov转移概率矩阵特征时,首先计算 C (3)计算水平方向相邻系数: c =c咖 一c枷( +1) = (3) 然后,可得Markov转移概率 ( ,Y)统计如下:C Mh( ,Y) ¨ =Y)/ ∑∑∑∑6(i=1 J=l m=1 n=1 c n= ) (4) 其中各符号含义与式(1)~(2)中相同。文献[8]分别对水 平、垂直及对角方向提取上述特征以后,将其与分块效应、系 数直方图等特征进行联合,给出了针对JPEG图像的隐写检 测算法。 下一章将对本文在考虑相邻三个系数的联合分布特性 时,基于双边转移概率的隐写检测特征的提取方法进行介绍。 2 基于双边转移概率的隐写检测 2.1双边转移概率矩阵提取 现有基于DCT系数相关性的JPEG图像隐写检测算法大 都对相邻两个数据进行统计,然而,对于自然图像而言,其相 邻多个数据如像素或系数之间仍存在较强的相关性,通过对 统计体现这种相关性的高阶统计特征能够更好地描述数据的 统计特性,对隐写造成的数据相关性的破坏和更改能够更好 地捕捉,从而能够实现更高精度的检测。文献[10]针对空域 隐写,将统计相邻像素差值矩阵的高阶Markov转移概率矩阵 作为统计特征,提出了一种隐写检测算法,其检测精度优于已 有的算法,尤其在对LSB匹配隐写的检测方面,在目前仍然 表现出较优的性能。受该文的启发,本文以JPEG图像DCT 系数作为统计特征的提取源数据,将该基于高阶统计特性的 特征统计方法应用到JPEG图像的隐写检测中。 本文在进行高阶特征统计时,考虑到距离为1的相邻系 数相比距离为2的相邻系数具有更强的相关性,因此,本文并 未完全按照文献[10]中方法提取高阶Markov转移概率特征, 而是将相邻三个系数中的中间系数作为条件,统计其两边的 两个系数取值的概率分布矩阵作为特征。仍以水平方向块内 统计特征的提取为例,其计算表达式如下: ///8 W/8 8 8—3 (x,y,z)=∑∑∑∑占l 1 J 1 m 1 n 1 (cn =X, ̄Cijm(n+1)=Y, H/8 W/8 8 8—3 C ̄/m(n+2)=y)/∑∑∑∑6(l 1 J=1 m 1 n 1 c咖( )=y) (5) 其中 即为统计得到的双边转移概率矩阵,其余参数含义 与式(1)一(4)相同。分别对分块内及分块间水平、垂直和对 角方向统计其概率矩阵,并分别对分块内及分块间三个方向 计算平均值,然后将矩阵转换为一维向量,即得到本文的隐写 检测特征。 2.2隐写检测算法 根据所提取得到的特征向量,在进行分类器训练和检测 时,基于双边转移概率分布的隐写检测算法主要分为两个过 可疑图像检测1)读取待检测图像,提取基于双边转移 概率的分布矩阵,并处理得到特征向量;2)对特征进行预处 理,将其转换为适合分类器的特征形式;3)使用训练好的分 类模型进行分类,得到待检测图像的判别结果。 根据上述分类模型的训练和图像分类检测的过程,下面 将对本文提出的检测算法的性能进行实验验证。 3 实验及结果分析 本文图像库所使用的载体图像来自于BOSS 11 J中的5000 幅PGM格式的灰度自然图像,图像尺寸均为512×512大小, 内容包括人物、动物、自然风景、建筑等多种形式。对所得到 的图像,首先将其转换为质量因子为75的JPG格式的灰度图 像;然后,采用F5、Outugess、MB1、MB2等5种隐写算法,分别 构建4种信息嵌入率(嵌入信息量占最大嵌入容量的比例) 为5%、10%、20%和40%的隐秘图像。综上,可得到包括载 体和隐秘图像共计5000×(4×4+1)=85000幅图像在内的 实验图像库。 然后,在对检测算法的性能进行测试时,将所构造的图像 库分为两部分,随机选取载体及与其相对应的各组载密图像 中的3000幅作为训练图像库,用来训练分类模型,各组剩余 的2000幅图像用来进行性能分析。所使用的分类器为 libSVM,这是当前隐写检测研究中被广泛采用的分类算法。 为了能够较为客观地反映检测算法的性能,按照上述分类器 训练及测试方法重复实验1O次,对每次实验,将载体及其对 应的隐秘图像的正确分类比率的平均值作为检测结果,最后, 将10次结果的平均值作为最终的检测精度。 在当前JPEG图像隐写检测算法中,文献[8]基于多类特 征综合和图像校准的检测算法是目前性能表现较好的,因此, 本文所提出算法的检测性能将与该算法进行比较。同时,文 献[6]中基于相邻DCT系数的共生矩阵特征进行检测,为了 证明本文所提取的基于三个相邻系数的联合分布特征更为敏 感,该算法也将用于性能比较。采用上述检测算法性能测试 的过程,可得到文献[6]和[8]算法与本文算法的性能对比结 果如表1所示(其中fMerg表示文献[8]算法,fabsNJ表示文 献[6]算法,Proposed表示本文算法)。 从表1可以看出,相对于文献[6]的隐写检测算法,本文 算法的检测率表现更优,尤其在信息嵌入率较低时,本文算法 的优势表现更为明显。相对于文献[8]的检测算法,尽管其 提取直方图、分块效应、Markov转移概率矩阵等多类特征进 行隐写检测,本文仅提取双边转移概率矩阵的性能即优于该 文的算法,从而进一步验证了所提取特征的敏感性。因此,本 文将所提取的特征替换文献[8]中的Markov转移概率矩阵特 征,得到组合特征fCombine,其检测结果如表1中所示,可以 看出,组合之后的特征进一步提高了隐写检测正确率(对每 种算法的每个嵌入率的隐秘图像检测的最高正确率已用下划 线标出)。 1076 计算机应用 第33卷 此外,为了更好地反映隐写检测算法的性能,本文描绘了反 Operation Characteristic)曲线,该比较方法也是当前隐写检测算 法性能比较时经常使用的方法。从表1中结果可以看出,在较高 嵌入率隋况下,几个算法的正确检测率都很高,尤其在嵌入率为 开,因此,本文仅对5%和10%的嵌入率情况下的检测结果描绘 映不同虚警率条件下载密图像正确检测率的ROC(Receiver 40%时,各检测算法几乎能够完美将隐秘图像与载体图像区分 其ROC曲线,分别如图1—2所示。 匝黼;痒 l 0 0 0 O O 0 O O O l O O 0 0 O O O 0 O 将蘑 器 燕 器茸 匦稍 l 斟嚣 器 O O 0 0 O 虚警率 虚警率 (a)F5 (b)Outguess l O O O O醉蓐 器 O O匝稍 O O O 1 O O 0 O O斟窝 器 O O O圈黼2 O 摩 虚警率 虚警率 (c)MB1 (d)MB2 图1本文算法与文献[6,8]算法对嵌入率为5%的隐秘图像的检测结果的ROC 虚警率 虚警率 (a)F5 (b1 Outguess 1 鋈 翼 虚警率 虚警率 (c)MB1 (d)MB2 图2本文算法与文献[6,8]算法对嵌入率为10%隐秘图像的检测结果的ROC 从图1~2对比结果可以看出,相对于已有检测算法,在 率矩阵作为敏感特征,提出了一种新的JPEG图像隐写检测 不同的虚警率条件下,本文检测算法的性能均表现更优。当 算法。尽管本文仅提取了一类特征,然而,相对于当前检测性 将本文所提取特征与已有特征进行组合后,检测精度能够进 能较好的、基于多类特征综合的隐写检测算法,本文算法能够 一步得到提升。上述实验验证了本文所提出的基于双边转移 概率分布的JPEG图像隐写检测算法具有良好的检测效果, 表现出较优的性能,从而验证了本文所提取的特征对JPEG 能够提高已有检测算法的检测正确率。 图像隐写更为敏感。此外,在针对JPEG图像隐写检测方面, 对较低嵌入率的隐秘图像仍然存在较高的漏检率,因此,继续 4 结语 对该类隐写进行分析,提取更为敏感的特征,从而设计具有高 本文针对目前较为常见的JPEG图像隐写算法,如F5、 检测率的隐写检测算法仍是一个值得研究的方向。 Outguess、MB1和MB2等,通过提取DCT系数的双边转移概 (下转第1107页) 第4期 曾友伟等:基于灰色关联度改进的Contourlet变换图像去噪算法 1l07 (上接第1076页) 表1 对F5、0utguess、MB1和MB2隐写的分类检测正确率% [31 PROVOS N.Defending against statistical steganalysis[C]//Pro— eeedings of the lOth USENIX Security Symposium.Berkley:USE— NIX Association.2001:323—335. [4] SALLE P.Model—based steganography[C】//Proceedings of Inter- national Workshop on Digital Watermarking,LNCS 2939.Berlin: Springer,2004:154—167. 【5】 SALE P.Model—basedmethodsfor steganography and steganalysis【J】. International Journal of Image Graphics,20O5,5(1):167—190. [6] LIN Q,SUNG A,QIAO M.Neighboring joint density—based JPEG steganalysis[J 1.ACM Transactions on Intelligent Systems and Technology,2011,2(2):article no.16. 【7】 XUAN G,SHI Y,HUANG C.Steganalysis using high—dimensional features derived from matrix and class・-wise non prinei-- pal components analysis(CNPCA)【C]//Proceedings of Interna— tional Workshop on Digitla Watermarking,LNCS 4283.Berlin: Springer.2006:49—6O. 【8】 PEVNY T.FRIDRICH J.Merging Markov and DCT features for muhi・class JPEG steganalysis[C]//Proceedings of the SPIE Elec— tmnic Imaging,Security,Steganography,and Watermarking of Multimedia Contents IX,2007,SPIE 6505.【S.1.】:SPIE,2007: 参考文献: 650503一l一13. 【1】PEVNY T,FILLER T,BAS P.Using high—dimensional image rood- 【9] HUANG F,HUANG J.Calibration based universal JPEG steganaly. els to perform highly undetectable steganography[C]//Proceedings sis【J].Science in China Series F:Information Sciences,2009,52 of International Workshop on Information Hiding,LNCS 6387.Ber- (2):260—268. lin:Springer,2010:161—177. 【10】 PEVNY T,BAS P,FRIDRICH J.Steganalysis by subtraetive pixel [2] WESTFELD A.F5一A steganographie algorithm—Hjsh capacity adjacency matrix[J].IEEE Transactions on Information Forensics despite better steganalysis【C】//Proceedings of the 4th Internation— and Security,2010,5(2):215—224. al Workshop on Infor ̄nation Hiding,LNCS 2137.Berlin:Springer, Agent Technology Center.BOSS[EB/OL】.[201 1—10—12】.ht— 2001:289—302. tp://www.agents.ez/boss/BOSSFinal/.