文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2015.12.025
中文引用格式: 戴冬,衛(wèi)娟,王磊. SVD分解和離散小波域特征值量化的安全數(shù)字語音水印算法[J].電子技術(shù)應(yīng)用,2015,41(12):94-97,101.
英文引用格式: Dai Dong,Wei Juan,Wang Lei. Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain[J].Application of Electronic Technique,2015,41(12):94-97,101.
0 引言
近年來,社會(huì)上很多企業(yè)、組織和用戶通過互聯(lián)網(wǎng)對(duì)數(shù)字媒體進(jìn)行傳播,數(shù)字媒體的版權(quán)保護(hù)等安全問題已成為社會(huì)關(guān)注的焦點(diǎn)。而數(shù)字水印是保護(hù)和監(jiān)控?cái)?shù)字媒體的最好方法之一[1]。數(shù)字水印的思想是將水印信息直接嵌入到載體,同時(shí)不影響原載體的性能和使用價(jià)值[2],在版權(quán)保護(hù)、商標(biāo)隱藏和通信安全等方面應(yīng)用十分廣泛[3]。如何在水印信息載入到載體后,保證載入后的宿主擁有盡可能多的原屬性、擴(kuò)大載入容量以及對(duì)外界攻擊的魯棒性是現(xiàn)代水印技術(shù)主要目標(biāo)[4]。
數(shù)字水印以圖像水印和音頻水印最為常見,本文討論音頻水印。音頻水印可以分為變換域聽覺屏蔽[5,6]、相位調(diào)制[7,8]和參數(shù)化建模[9,10]等主要類別。
文獻(xiàn)[7-8]利用一幀儲(chǔ)存所有的水印數(shù)據(jù)。在對(duì)數(shù)譜域的倒譜系數(shù)中嵌入水印信息,僅對(duì)不可聽性具有一定魯棒性。
參數(shù)化建模利用極點(diǎn)濾波器(如自回歸模型)對(duì)語音信號(hào)進(jìn)行建模及嵌入水印,有線性預(yù)測(cè)編碼(Linear Predictive Coding,LPC)[9]或線譜對(duì)系數(shù)(Line Spectrum Pair,LSP)間接修改或量化參數(shù)[10]等算法。然而,該類算法容易受到在語音壓縮期間或其后分流語音期間進(jìn)行壓縮攻擊。
雖然利用離散小波變換和奇異值分解技術(shù)嵌入水印[11]并不是一個(gè)新的想法,但本文相比于其他文獻(xiàn)有其獨(dú)特之處,主要?jiǎng)?chuàng)新點(diǎn)如下:(1)本文的水印是嵌入在離散小波變換的近似系數(shù)中,而不是離散小波變換的細(xì)節(jié)系數(shù)。研究表明,將水印嵌入近似系數(shù)魯棒性更強(qiáng);(2)本文主要討論的語音水印是一種盲算法,即這種算法在水印提取或水印檢測(cè)過程中不需要原始信號(hào),增大了容量,提高了隱蔽性;(3)本文音頻水印的量化指數(shù)調(diào)制(Quantization Index Modulation,QIM)選擇簡(jiǎn)單,所需運(yùn)行時(shí)間更少。
1 分解技術(shù)
圖1顯示了單層離散小波變換(Discrete Wavelet Transformation,DWT)的一般過程,分別利用低通濾波器和高通濾波器將信號(hào)分解為近似系數(shù)(低頻部分)和細(xì)節(jié)系數(shù)(高頻部分),然后將其結(jié)果發(fā)給另一組低通濾波器和高通濾波器,作進(jìn)一步分解。
奇異值分解作用于對(duì)角矩陣,以最優(yōu)方式將信號(hào)分解為基本態(tài)。N×N的矩陣A奇異值分解如式(1)和式(2)。矩陣S的對(duì)角線元素是矩陣A的奇異值,按照σ(i)>σ(i+1)降序排列。矩陣U和矩陣V的縱列分別是A的左奇異向量和右奇異向量。
通常, 矩陣S各元素的細(xì)微變化不會(huì)改變觀眾對(duì)信號(hào)質(zhì)量變化的感知,這個(gè)特點(diǎn)主要用于音頻水印。因此,水印信息可以被簡(jiǎn)單添加到對(duì)角矩陣S的奇異值中,同時(shí)不會(huì)嚴(yán)重影響信號(hào)的感知性或可聽性[11]。
2 提出的數(shù)字語音水印算法
2.1 嵌入過程
(1)將原始語音信號(hào)分成幀;
(2)對(duì)每幀進(jìn)行第一級(jí)離散小波變換,計(jì)算近似系數(shù)和細(xì)節(jié)系數(shù);
(3)通過近似系數(shù)使用二維矩陣公式;
(4)對(duì)矩陣進(jìn)行奇異值分解,找到右特性向量V、奇異值S和左特性向量U;
(5)基于式(3)的每個(gè)特征值利用奇或偶調(diào)制函數(shù)嵌入水印,奇或偶調(diào)制函數(shù)能夠保存原始信號(hào)的直方圖,同時(shí)還能確保信號(hào)統(tǒng)計(jì)數(shù)據(jù)的改動(dòng)較小,因?yàn)樾薷陌l(fā)生在小范圍內(nèi),宿主信號(hào)失真較少;
(6)運(yùn)用逆奇異值分解計(jì)算修正矩陣;
(7)將修正矩陣轉(zhuǎn)換為修正近似系數(shù);
(8)細(xì)節(jié)系數(shù)和近似系數(shù)進(jìn)行逆小波變換,獲得修正框架;
(9)以修正框架為基礎(chǔ)重構(gòu)信號(hào),得到有水印的語音信號(hào)。
2.2 提取過程
(1)利用同步位尋找水印的初始位置;
(2)將有水印的語音信號(hào)分成幀;
(3)對(duì)每幀進(jìn)行第一級(jí)離散小波變換,計(jì)算近似系數(shù)和細(xì)節(jié)系數(shù);
(4)通過近似系數(shù)使用二維矩陣公式;
(5)對(duì)矩陣進(jìn)行奇異值分解,找到右特征向量V、奇異值S和左特征向量U;
(6)對(duì)每個(gè)特征值應(yīng)用逆奇或逆偶調(diào)制函數(shù),提取水印,如式(4)所示:
3 實(shí)驗(yàn)結(jié)果與討論
3.1 本文算法的實(shí)驗(yàn)結(jié)果
本文采用模擬方法研究提出的數(shù)字語音水印的魯棒性、隱蔽性和容量,仿真實(shí)驗(yàn)在Intel i5雙核處理器、內(nèi)存為4.0G、2.93 GHz主頻、Windows7操作系統(tǒng)的筆記本電腦上進(jìn)行,使用的平臺(tái)為MATLAB2011b,實(shí)驗(yàn)材料為兩組語音數(shù)據(jù)。第一組采用交錯(cuò)正交幅度調(diào)制(SQAM)的6個(gè)信號(hào),指數(shù)49~54,抽樣頻率44.1 kHz,平均時(shí)長(zhǎng)大約22 s,分辨率16 bit。第二組采用ATCOSIM語音語料庫的20個(gè)語音數(shù)據(jù)[12],抽樣頻率32 kHz,分辨率12 bit,平均時(shí)長(zhǎng)3.8 s。圖2所示的二值水印標(biāo)志的尺寸為22×31,用于本文實(shí)驗(yàn)。
表1顯示了本文所提出盲數(shù)字語音水印的多種因素。分別運(yùn)用式(5)的誤碼率(BER)、位秒(BPS)、式(6)的信噪比(SNR)來測(cè)量本文算法的魯棒性、容量和隱蔽性:
式中,w是原始信號(hào),
是水印信號(hào),
是OX(XOR)運(yùn)算子,N是信號(hào)長(zhǎng)度。
表1給出了增加容量對(duì)隱蔽性的影響。嵌入原始數(shù)據(jù)的水印越多,失真就越大,進(jìn)而影響語音的隱蔽性。
表2 給出了不同量化步長(zhǎng)的誤碼率和信噪比。可以看出,量化步長(zhǎng)越少,有水印信號(hào)的隱蔽性越強(qiáng)。
表3給出了在不同攻擊之下的誤碼率??梢钥闯觯瑤V波器降低了一半的誤碼率,因?yàn)楹芏嗨”磺度氲皖l區(qū)域。當(dāng)加性高斯白噪聲的信噪比增加時(shí),誤碼率隨之降低。
3.2 與其他算法的比較
本文的對(duì)比算法與文獻(xiàn)[5]和文獻(xiàn)[11]算法作比較,選擇的原因如下:在信號(hào)嵌入水印方面應(yīng)用類似離散小波變換和奇異值分解的技術(shù)可以以相同的方式改變水印強(qiáng)度因子(Δ和α),且這些技術(shù)都流行且簡(jiǎn)單。設(shè)置Δ=0.2,α=0.2。
表4從誤碼率和信噪比方面,對(duì)各算法的不同量化步長(zhǎng)進(jìn)行比較??梢钥闯?,本文的平均誤碼率高于文獻(xiàn)[11]和文獻(xiàn)[5]的平均誤碼率,表現(xiàn)出了更強(qiáng)的魯棒性。另外,本文算法的信噪比也高于文獻(xiàn)[5]和文獻(xiàn)[11],即本文算法的隱蔽性更強(qiáng)。
表5給出了本文算法與文獻(xiàn)[5]和文獻(xiàn)[11]在誤碼率方面的魯棒性表現(xiàn),測(cè)試了5種不同情況,包括無攻擊、添加高斯白噪聲使信號(hào)SNR為35 dB、低通濾波使截止頻率為22 kHz、隨機(jī)設(shè)置嵌入水印和信號(hào)重采樣然后恢復(fù)。當(dāng)處于這些不同攻擊下,本文算法的魯棒性更強(qiáng),這是因?yàn)樗∈乔度胝Z音近似系數(shù)部分,該部分的能量多于語音細(xì)節(jié)系數(shù)部分的能量。
圖3是各算法在不同攻擊下提取出來的水印標(biāo)志,為了進(jìn)行公平有效的比較,所有條件完全相同。可以看出,與文獻(xiàn)[5]和文獻(xiàn)[11]的算法相比,運(yùn)用本文算法所提取出來的水印最為清晰,這也印證了表4和表5的數(shù)據(jù)結(jié)論。
表6為各算法嵌入和提取水印的運(yùn)行時(shí)間,可以看出本文算法明顯快于其他兩種算法,這是由于本文在量化特征值方面只修改了較小范圍的統(tǒng)計(jì)數(shù)據(jù),而且嵌入的系數(shù)部分是離散小波域的近似系數(shù)部分。而文獻(xiàn)[5]和文獻(xiàn)[11]均需要原始信號(hào),水印嵌入在細(xì)節(jié)系數(shù)部分。
3.3 信噪比、誤碼率與幀長(zhǎng)、量化步長(zhǎng)的關(guān)系
實(shí)驗(yàn)中幀長(zhǎng)和量化步長(zhǎng)的設(shè)置直接關(guān)系實(shí)驗(yàn)結(jié)果,故這節(jié)討論信噪比、誤碼率與幀長(zhǎng)、量化步長(zhǎng)關(guān)系。
圖4給出了信噪比和幀長(zhǎng)之間的關(guān)系,從圖中可以看出,幀尺寸增大時(shí),信噪比也會(huì)隨之增加,其原因在于水印嵌入時(shí),水印的語音信號(hào)失真較少。此外,選擇較少的量化步長(zhǎng)會(huì)提高語音信號(hào)的質(zhì)量。
圖5給出了信噪比和量化步長(zhǎng)之間的關(guān)系,很明顯,增加量化步長(zhǎng)會(huì)減少信噪比,信噪比的減少會(huì)降低語音信號(hào)的質(zhì)量。而在量化步長(zhǎng)非常小時(shí),誤碼率并非都是零,較小的量化步長(zhǎng)不適用于較大的幀尺寸,因?yàn)檫@樣的量化步長(zhǎng)無法改變特征值,會(huì)在水印提取過程中產(chǎn)生錯(cuò)誤。
圖6給出了處于不同攻擊下誤碼率與量化步長(zhǎng)之間的關(guān)系。從圖中可以看出,量化步長(zhǎng)增加時(shí),誤碼率會(huì)降低。因此,選擇較高的量化步長(zhǎng)會(huì)提高魯棒性,但也會(huì)降低質(zhì)量。圖6還表明,選擇較高的量化步長(zhǎng)并不會(huì)提高使用低通濾波器的魯棒性。使用低通濾波器時(shí),小波的許多能量將會(huì)喪失,這會(huì)直接影響水印載體的特征值。
4 結(jié)論與展望
本文提出了一種盲數(shù)字語音水印技術(shù),在離散小波變換域進(jìn)行特征值量化。實(shí)驗(yàn)表明,當(dāng)量化步長(zhǎng)和所選幀長(zhǎng)較高時(shí),該算法能夠抵御多種攻擊,魯棒性很強(qiáng),否則,水印就會(huì)減弱。而且,將水印嵌入細(xì)節(jié)系數(shù)中能夠提高隱蔽性,但也會(huì)降低魯棒性。未來工作主要研究自適應(yīng)量化步長(zhǎng)和同步技術(shù),進(jìn)一步改善水印提取過程。
參考文獻(xiàn)
[1] PHADIKAR A.Multibit quantization index modulation:A high-rate robust data-hiding method[J].Journal of King Saud University Computer and Information Sciences,2013,25(2):163-171.
[2] 王新宇,詹永照.構(gòu)造頂點(diǎn)分布特征的三維模型數(shù)字水印算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2014,26(2):272-279.
[3] 尹浩,林闖,邱鋒,等.數(shù)字水印技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2005,42(7):1093-1099.
[4] 秦樹東.音頻數(shù)字水印算法的研究[D].南京:南京郵電大學(xué),2014.
[5] 王飛.基于SVD和預(yù)測(cè)錯(cuò)誤擴(kuò)展的數(shù)字音頻水印算法研究[D].長(zhǎng)沙:湖南大學(xué),2014.
[6] 謝斌,肖玲玲,吳君欽.一種抗剪切的DWT域多重音頻數(shù)字水印算法[J].電子技術(shù)應(yīng)用,2010,36(4):138-140.
[7] GOPALAN K.A unified audio and image steganography by spectrum modification[C].Industrial Technology.ICIT 2009.IEEE International Conference on.IEEE,2009:1-5.
[8] 侯劍,付永生,郭愷.基于相位調(diào)制的立體聲音頻數(shù)字水印[J].電子技術(shù)應(yīng)用,2006,32(6):49-51.
[9] 高裴裴,朱耀庭,張世濤,等.基于數(shù)字水印載體的圖像語音判讀方法研究[J].激光與紅外,2012,42(10):1187-1190.
[10] Nematollahi Mohammad Ali,Al-Haddad S A R.An overview of digital speech watermarking[J].Int.J.Speech Technol.2013,17(8):1-18.
[11] LEI B,SOON I Y,LI Z.A robust audio watermarking scheme based on lifting wavelet transform and singular value decomposition[M].Berlin:Digital Forensics and Watermarking,2012:1985-2001.
[12] HOFBAUER K,PETRIK S,HERING H.The ATCOSIM corpus of non-prompted clean air traffic control speech[J].Sixth International Conference on Language Resources & Evaluation Lrec,2008,24(1):2147-2152.