《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > SVD分解和離散小波域特征值量化的安全數(shù)字語音水印算法
SVD分解和離散小波域特征值量化的安全數(shù)字語音水印算法
2015年電子技術(shù)應(yīng)用第12期
戴 冬1,衛(wèi) 娟1,王 磊2
1.河南機(jī)電高等??茖W(xué)校 計(jì)算機(jī)科學(xué)與技術(shù)系,河南 新鄉(xiāng)453003; 2.西南財(cái)經(jīng)大學(xué) 經(jīng)濟(jì)信息工程學(xué)院,四川 成都610074
摘要: 針對(duì)傳統(tǒng)數(shù)字語言水印算法魯棒性較差、復(fù)雜度較高等問題,提出一種基于SVD分解和離散小波域特征值量化的安全水印算法。該算法以離散小波變換的特征值量化為基礎(chǔ),利用離散小波變換將每幀數(shù)字語音轉(zhuǎn)化到小波域,再利用SVD奇異值分解計(jì)算近似系數(shù)特征值,而不是細(xì)節(jié)系數(shù)部分;最后,使用量化后的特征值嵌入水印比特位信息。實(shí)驗(yàn)結(jié)果表明,當(dāng)量化步長(zhǎng)和所選幀長(zhǎng)較高時(shí),該算法能有效抵御過濾攻擊、加性高斯白噪聲攻擊、重采樣攻擊和剪切攻擊,其中高斯白噪聲攻擊和剪切攻擊的誤碼率幾乎為0。相比其他優(yōu)秀算法,該算法具有更好的魯棒性。
中圖分類號(hào): TP391
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2015.12.025

中文引用格式: 戴冬,衛(wèi)娟,王磊. SVD分解和離散小波域特征值量化的安全數(shù)字語音水印算法[J].電子技術(shù)應(yīng)用,2015,41(12):94-97,101.
英文引用格式: Dai Dong,Wei Juan,Wang Lei. Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain[J].Application of Electronic Technique,2015,41(12):94-97,101.
Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain
Dai Dong1,Wei Juan1,Wang Lei2
1.Department of Computer Science & Technology,Henan Mechanical and Electrical Engineering College,Xinxiang 453003,China; 2.College of Economic Information Engineering,Southwestern University of Finance and Economics,Chengdu 610074,China
Abstract: As the low robustness and high complexity problem of traditional digital speech watermarking algorithm, a digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain is proposed. Eigenvalues quantization in discrete wavelet domain is the base of the proposed algorithm, firstly, discrete wavelet transform is used to transform every frame of the digital voice into wavelet domain; Then, SVD singular value decomposition is used to calculate the eigenvalues of approximate coefficient, rather than part of the detail coefficients; Finally, the watermark bits were embedded by quantization of the eigenvalue. The experimental results show that when quantization step size and the length of the selected frame are high, the algorithm can effectively resist filter attacks, additive white Gaussian noise attack, resampling and cropping attack, where the bit error rates of Gaussian white noise attacks and cut attacks are almost zero. Compared to other outstanding algorithms, the proposed algorithm has better robustness.
Key words : digital speech watermarking;approximate coefficient;discrete wavelet;eigenvalues quantization;SVD singular value decomposition

  

0 引言

    近年來,社會(huì)上很多企業(yè)、組織和用戶通過互聯(lián)網(wǎng)對(duì)數(shù)字媒體進(jìn)行傳播,數(shù)字媒體的版權(quán)保護(hù)等安全問題已成為社會(huì)關(guān)注的焦點(diǎn)。而數(shù)字水印是保護(hù)和監(jiān)控?cái)?shù)字媒體的最好方法之一[1]。數(shù)字水印的思想是將水印信息直接嵌入到載體,同時(shí)不影響原載體的性能和使用價(jià)值[2],在版權(quán)保護(hù)、商標(biāo)隱藏和通信安全等方面應(yīng)用十分廣泛[3]。如何在水印信息載入到載體后,保證載入后的宿主擁有盡可能多的原屬性、擴(kuò)大載入容量以及對(duì)外界攻擊的魯棒性是現(xiàn)代水印技術(shù)主要目標(biāo)[4]

    數(shù)字水印以圖像水印和音頻水印最為常見,本文討論音頻水印。音頻水印可以分為變換域聽覺屏蔽[5,6]、相位調(diào)制[7,8]和參數(shù)化建模[9,10]等主要類別。

    文獻(xiàn)[7-8]利用一幀儲(chǔ)存所有的水印數(shù)據(jù)。在對(duì)數(shù)譜域的倒譜系數(shù)中嵌入水印信息,僅對(duì)不可聽性具有一定魯棒性。

    參數(shù)化建模利用極點(diǎn)濾波器(如自回歸模型)對(duì)語音信號(hào)進(jìn)行建模及嵌入水印,有線性預(yù)測(cè)編碼(Linear Predictive Coding,LPC)[9]或線譜對(duì)系數(shù)(Line Spectrum Pair,LSP)間接修改或量化參數(shù)[10]等算法。然而,該類算法容易受到在語音壓縮期間或其后分流語音期間進(jìn)行壓縮攻擊。

    雖然利用離散小波變換和奇異值分解技術(shù)嵌入水印[11]并不是一個(gè)新的想法,但本文相比于其他文獻(xiàn)有其獨(dú)特之處,主要?jiǎng)?chuàng)新點(diǎn)如下:(1)本文的水印是嵌入在離散小波變換的近似系數(shù)中,而不是離散小波變換的細(xì)節(jié)系數(shù)。研究表明,將水印嵌入近似系數(shù)魯棒性更強(qiáng);(2)本文主要討論的語音水印是一種盲算法,即這種算法在水印提取或水印檢測(cè)過程中不需要原始信號(hào),增大了容量,提高了隱蔽性;(3)本文音頻水印的量化指數(shù)調(diào)制(Quantization Index Modulation,QIM)選擇簡(jiǎn)單,所需運(yùn)行時(shí)間更少。

1 分解技術(shù)

    圖1顯示了單層離散小波變換(Discrete Wavelet Transformation,DWT)的一般過程,分別利用低通濾波器和高通濾波器將信號(hào)分解為近似系數(shù)(低頻部分)和細(xì)節(jié)系數(shù)(高頻部分),然后將其結(jié)果發(fā)給另一組低通濾波器和高通濾波器,作進(jìn)一步分解。

wl1-t1.gif

    奇異值分解作用于對(duì)角矩陣,以最優(yōu)方式將信號(hào)分解為基本態(tài)。N×N的矩陣A奇異值分解如式(1)和式(2)。矩陣S的對(duì)角線元素是矩陣A的奇異值,按照σ(i)>σ(i+1)降序排列。矩陣U和矩陣V的縱列分別是A的左奇異向量和右奇異向量。

    wl1-gs1-2.gif

    通常, 矩陣S各元素的細(xì)微變化不會(huì)改變觀眾對(duì)信號(hào)質(zhì)量變化的感知,這個(gè)特點(diǎn)主要用于音頻水印。因此,水印信息可以被簡(jiǎn)單添加到對(duì)角矩陣S的奇異值中,同時(shí)不會(huì)嚴(yán)重影響信號(hào)的感知性或可聽性[11]。

2 提出的數(shù)字語音水印算法

2.1 嵌入過程

    (1)將原始語音信號(hào)分成幀;

    (2)對(duì)每幀進(jìn)行第一級(jí)離散小波變換,計(jì)算近似系數(shù)和細(xì)節(jié)系數(shù);

    (3)通過近似系數(shù)使用二維矩陣公式;

    (4)對(duì)矩陣進(jìn)行奇異值分解,找到右特性向量V、奇異值S和左特性向量U;

    (5)基于式(3)的每個(gè)特征值利用奇或偶調(diào)制函數(shù)嵌入水印,奇或偶調(diào)制函數(shù)能夠保存原始信號(hào)的直方圖,同時(shí)還能確保信號(hào)統(tǒng)計(jì)數(shù)據(jù)的改動(dòng)較小,因?yàn)樾薷陌l(fā)生在小范圍內(nèi),宿主信號(hào)失真較少;

wl1-gs3.gif

    (6)運(yùn)用逆奇異值分解計(jì)算修正矩陣;

    (7)將修正矩陣轉(zhuǎn)換為修正近似系數(shù);

    (8)細(xì)節(jié)系數(shù)和近似系數(shù)進(jìn)行逆小波變換,獲得修正框架;

    (9)以修正框架為基礎(chǔ)重構(gòu)信號(hào),得到有水印的語音信號(hào)。

2.2 提取過程

    (1)利用同步位尋找水印的初始位置;

    (2)將有水印的語音信號(hào)分成幀;

    (3)對(duì)每幀進(jìn)行第一級(jí)離散小波變換,計(jì)算近似系數(shù)和細(xì)節(jié)系數(shù);

    (4)通過近似系數(shù)使用二維矩陣公式;

    (5)對(duì)矩陣進(jìn)行奇異值分解,找到右特征向量V、奇異值S和左特征向量U;

    (6)對(duì)每個(gè)特征值應(yīng)用逆奇或逆偶調(diào)制函數(shù),提取水印,如式(4)所示:

wl1-gs4.gif

3 實(shí)驗(yàn)結(jié)果與討論

3.1 本文算法的實(shí)驗(yàn)結(jié)果

    本文采用模擬方法研究提出的數(shù)字語音水印的魯棒性、隱蔽性和容量,仿真實(shí)驗(yàn)在Intel i5雙核處理器、內(nèi)存為4.0G、2.93 GHz主頻、Windows7操作系統(tǒng)的筆記本電腦上進(jìn)行,使用的平臺(tái)為MATLAB2011b,實(shí)驗(yàn)材料為兩組語音數(shù)據(jù)。wl1-t2.gif第一組采用交錯(cuò)正交幅度調(diào)制(SQAM)的6個(gè)信號(hào),指數(shù)49~54,抽樣頻率44.1 kHz,平均時(shí)長(zhǎng)大約22 s,分辨率16 bit。第二組采用ATCOSIM語音語料庫的20個(gè)語音數(shù)據(jù)[12],抽樣頻率32 kHz,分辨率12 bit,平均時(shí)長(zhǎng)3.8 s。圖2所示的二值水印標(biāo)志的尺寸為22×31,用于本文實(shí)驗(yàn)。

    表1顯示了本文所提出盲數(shù)字語音水印的多種因素。分別運(yùn)用式(5)的誤碼率(BER)、位秒(BPS)、式(6)的信噪比(SNR)來測(cè)量本文算法的魯棒性、容量和隱蔽性:

wl1-gs5-6.gif

wl1-b1.gif式中,w是原始信號(hào),wl1-b1-s1.gif是水印信號(hào),wl1-b1-s2.gif是OX(XOR)運(yùn)算子,N是信號(hào)長(zhǎng)度。

    表1給出了增加容量對(duì)隱蔽性的影響。嵌入原始數(shù)據(jù)的水印越多,失真就越大,進(jìn)而影響語音的隱蔽性。

    表2 給出了不同量化步長(zhǎng)的誤碼率和信噪比。可以看出,量化步長(zhǎng)越少,有水印信號(hào)的隱蔽性越強(qiáng)。

wl1-b2.gif

    表3給出了在不同攻擊之下的誤碼率??梢钥闯觯瑤V波器降低了一半的誤碼率,因?yàn)楹芏嗨”磺度氲皖l區(qū)域。當(dāng)加性高斯白噪聲的信噪比增加時(shí),誤碼率隨之降低。

wl1-b3.gif

3.2 與其他算法的比較

    本文的對(duì)比算法與文獻(xiàn)[5]和文獻(xiàn)[11]算法作比較,選擇的原因如下:在信號(hào)嵌入水印方面應(yīng)用類似離散小波變換和奇異值分解的技術(shù)可以以相同的方式改變水印強(qiáng)度因子(Δ和α),且這些技術(shù)都流行且簡(jiǎn)單。設(shè)置Δ=0.2,α=0.2。

    表4從誤碼率和信噪比方面,對(duì)各算法的不同量化步長(zhǎng)進(jìn)行比較??梢钥闯?,本文的平均誤碼率高于文獻(xiàn)[11]和文獻(xiàn)[5]的平均誤碼率,表現(xiàn)出了更強(qiáng)的魯棒性。另外,本文算法的信噪比也高于文獻(xiàn)[5]和文獻(xiàn)[11],即本文算法的隱蔽性更強(qiáng)。

wl1-b4.gif

    表5給出了本文算法與文獻(xiàn)[5]和文獻(xiàn)[11]在誤碼率方面的魯棒性表現(xiàn),測(cè)試了5種不同情況,包括無攻擊、添加高斯白噪聲使信號(hào)SNR為35 dB、低通濾波使截止頻率為22 kHz、隨機(jī)設(shè)置嵌入水印和信號(hào)重采樣然后恢復(fù)。當(dāng)處于這些不同攻擊下,本文算法的魯棒性更強(qiáng),這是因?yàn)樗∈乔度胝Z音近似系數(shù)部分,該部分的能量多于語音細(xì)節(jié)系數(shù)部分的能量。

wl1-b5.gif

    圖3是各算法在不同攻擊下提取出來的水印標(biāo)志,為了進(jìn)行公平有效的比較,所有條件完全相同。可以看出,與文獻(xiàn)[5]和文獻(xiàn)[11]的算法相比,運(yùn)用本文算法所提取出來的水印最為清晰,這也印證了表4和表5的數(shù)據(jù)結(jié)論。

wl1-t3.gif

    表6為各算法嵌入和提取水印的運(yùn)行時(shí)間,可以看出本文算法明顯快于其他兩種算法,這是由于本文在量化特征值方面只修改了較小范圍的統(tǒng)計(jì)數(shù)據(jù),而且嵌入的系數(shù)部分是離散小波域的近似系數(shù)部分。而文獻(xiàn)[5]和文獻(xiàn)[11]均需要原始信號(hào),水印嵌入在細(xì)節(jié)系數(shù)部分。

wl1-b6.gif

3.3 信噪比、誤碼率與幀長(zhǎng)、量化步長(zhǎng)的關(guān)系

    實(shí)驗(yàn)中幀長(zhǎng)和量化步長(zhǎng)的設(shè)置直接關(guān)系實(shí)驗(yàn)結(jié)果,故這節(jié)討論信噪比、誤碼率與幀長(zhǎng)、量化步長(zhǎng)關(guān)系。

    圖4給出了信噪比和幀長(zhǎng)之間的關(guān)系,從圖中可以看出,幀尺寸增大時(shí),信噪比也會(huì)隨之增加,其原因在于水印嵌入時(shí),水印的語音信號(hào)失真較少。此外,選擇較少的量化步長(zhǎng)會(huì)提高語音信號(hào)的質(zhì)量。

wl1-t4.gif

    圖5給出了信噪比和量化步長(zhǎng)之間的關(guān)系,很明顯,增加量化步長(zhǎng)會(huì)減少信噪比,信噪比的減少會(huì)降低語音信號(hào)的質(zhì)量。而在量化步長(zhǎng)非常小時(shí),誤碼率并非都是零,較小的量化步長(zhǎng)不適用于較大的幀尺寸,因?yàn)檫@樣的量化步長(zhǎng)無法改變特征值,會(huì)在水印提取過程中產(chǎn)生錯(cuò)誤。

wl1-t5.gif

    圖6給出了處于不同攻擊下誤碼率與量化步長(zhǎng)之間的關(guān)系。從圖中可以看出,量化步長(zhǎng)增加時(shí),誤碼率會(huì)降低。因此,選擇較高的量化步長(zhǎng)會(huì)提高魯棒性,但也會(huì)降低質(zhì)量。圖6還表明,選擇較高的量化步長(zhǎng)并不會(huì)提高使用低通濾波器的魯棒性。使用低通濾波器時(shí),小波的許多能量將會(huì)喪失,這會(huì)直接影響水印載體的特征值。

wl1-t6.gif

4 結(jié)論與展望

    本文提出了一種盲數(shù)字語音水印技術(shù),在離散小波變換域進(jìn)行特征值量化。實(shí)驗(yàn)表明,當(dāng)量化步長(zhǎng)和所選幀長(zhǎng)較高時(shí),該算法能夠抵御多種攻擊,魯棒性很強(qiáng),否則,水印就會(huì)減弱。而且,將水印嵌入細(xì)節(jié)系數(shù)中能夠提高隱蔽性,但也會(huì)降低魯棒性。未來工作主要研究自適應(yīng)量化步長(zhǎng)和同步技術(shù),進(jìn)一步改善水印提取過程。

參考文獻(xiàn)

[1] PHADIKAR A.Multibit quantization index modulation:A high-rate robust data-hiding method[J].Journal of King Saud University Computer and Information Sciences,2013,25(2):163-171.

[2] 王新宇,詹永照.構(gòu)造頂點(diǎn)分布特征的三維模型數(shù)字水印算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2014,26(2):272-279.

[3] 尹浩,林闖,邱鋒,等.數(shù)字水印技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2005,42(7):1093-1099.

[4] 秦樹東.音頻數(shù)字水印算法的研究[D].南京:南京郵電大學(xué),2014.

[5] 王飛.基于SVD和預(yù)測(cè)錯(cuò)誤擴(kuò)展的數(shù)字音頻水印算法研究[D].長(zhǎng)沙:湖南大學(xué),2014.

[6] 謝斌,肖玲玲,吳君欽.一種抗剪切的DWT域多重音頻數(shù)字水印算法[J].電子技術(shù)應(yīng)用,2010,36(4):138-140.

[7] GOPALAN K.A unified audio and image steganography by spectrum modification[C].Industrial Technology.ICIT 2009.IEEE International Conference on.IEEE,2009:1-5.

[8] 侯劍,付永生,郭愷.基于相位調(diào)制的立體聲音頻數(shù)字水印[J].電子技術(shù)應(yīng)用,2006,32(6):49-51.

[9] 高裴裴,朱耀庭,張世濤,等.基于數(shù)字水印載體的圖像語音判讀方法研究[J].激光與紅外,2012,42(10):1187-1190.

[10] Nematollahi Mohammad Ali,Al-Haddad S A R.An overview of digital speech watermarking[J].Int.J.Speech Technol.2013,17(8):1-18.

[11] LEI B,SOON I Y,LI Z.A robust audio watermarking scheme based on lifting wavelet transform and singular value decomposition[M].Berlin:Digital Forensics and Watermarking,2012:1985-2001.

[12] HOFBAUER K,PETRIK S,HERING H.The ATCOSIM corpus of non-prompted clean air traffic control speech[J].Sixth International Conference on Language Resources & Evaluation Lrec,2008,24(1):2147-2152.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。