摘要:提高移動(dòng)通信話務(wù)量的預(yù)測(cè)精度對(duì)提高網(wǎng)絡(luò)性能、增進(jìn)用戶體驗(yàn)具有重要意義。由于多種因素會(huì)影響到移動(dòng)通信話務(wù)量的準(zhǔn)確預(yù)測(cè),故選擇多因素灰色話務(wù)量預(yù)測(cè)模型來(lái)預(yù)測(cè)話務(wù)量。先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,用關(guān)聯(lián)分析法找到影響話務(wù)量預(yù)測(cè)的主要因素。但此模型對(duì)波動(dòng)較大的數(shù)據(jù)預(yù)測(cè)精度較低,用支持向量機(jī)的模型來(lái)改善預(yù)測(cè)結(jié)果,選取擁有較強(qiáng)的斂散性和全局尋優(yōu)能力的復(fù)高斯小波核函數(shù)優(yōu)化向量機(jī)。從仿真結(jié)果可以看出該模型有更好的收斂作用和較為理想的預(yù)測(cè)效果。
關(guān)鍵詞:復(fù)高斯小波核函數(shù);支持向量機(jī);多因素;話務(wù)量預(yù)測(cè)
0引言
話務(wù)量預(yù)測(cè),是指以歷史話務(wù)量數(shù)據(jù)為基礎(chǔ),從一定的規(guī)律性與特點(diǎn)出發(fā),通過(guò)統(tǒng)計(jì)調(diào)查,運(yùn)用科學(xué)有效的建模方法對(duì)未來(lái)某一時(shí)段的話務(wù)量進(jìn)行預(yù)測(cè)。通過(guò)對(duì)預(yù)測(cè)結(jié)果的分析,可以清楚地知道哪些網(wǎng)絡(luò)需要擴(kuò)容,哪些網(wǎng)絡(luò)需要優(yōu)化壓縮。通常情況下預(yù)測(cè)話務(wù)量所采用的方法有線性自回歸移動(dòng)平均模型(ARIMA)[1]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[2]、支持向量機(jī)(SVM)[3]等。其中線性自回歸移動(dòng)平均模型[4]要求訓(xùn)練數(shù)據(jù)的時(shí)間序列應(yīng)具有正態(tài)分布、全局平穩(wěn)等特征,但在實(shí)際應(yīng)用中,話務(wù)量的時(shí)間序列往往是不規(guī)則、非平穩(wěn)且非線性的。人工神經(jīng)網(wǎng)絡(luò)[5]相比線性自回歸移動(dòng)平均模型有較好的非線性預(yù)測(cè)能力,但要求訓(xùn)練樣本數(shù)據(jù)量較大,且易于陷入局部極值,會(huì)導(dǎo)致最終的預(yù)測(cè)效果不穩(wěn)定。普通的預(yù)測(cè)模型大多數(shù)是根據(jù)過(guò)去的話務(wù)量去預(yù)測(cè)未來(lái)的話務(wù)量,但并沒(méi)有將相關(guān)因素考慮在內(nèi),如果沒(méi)有考慮影響因子,預(yù)測(cè)結(jié)果就會(huì)有一定的失真。為了能夠準(zhǔn)確地預(yù)測(cè)未來(lái)話務(wù)量的變化趨勢(shì),本文從多因素的角度,提出了一種改進(jìn)的復(fù)高斯小波核函數(shù)優(yōu)化支持向量機(jī)的多因素灰色預(yù)測(cè)模型[6]。根據(jù)收集到的話務(wù)量數(shù)據(jù)和影響因素,用灰色關(guān)聯(lián)分析法計(jì)算出對(duì)話務(wù)量影響較大的因素有系統(tǒng)接通率、忙時(shí)用戶數(shù)、開(kāi)機(jī)用戶數(shù)、小區(qū)切換次數(shù)。使用MATLAB進(jìn)行仿真,將預(yù)測(cè)結(jié)果與粒子群優(yōu)化支持向量機(jī)的多因素灰色模型、多因素灰色模型、真實(shí)值比較,本文算法的預(yù)測(cè)結(jié)果與真實(shí)值更接近。
1本文改進(jìn)的多因素灰色模型相關(guān)原理及算法
1.1數(shù)據(jù)的選擇及預(yù)處理
分析往年的話務(wù)量數(shù)據(jù)可以發(fā)現(xiàn),話務(wù)量會(huì)隨著時(shí)間和季節(jié)的改變而明顯發(fā)生變化,比如白天的話務(wù)量比夜晚高,節(jié)假日的話務(wù)量明顯高于平時(shí)。假如將話務(wù)量看做一個(gè)時(shí)間序列,那它具有季節(jié)性和周期性。
由于收集到的話務(wù)量數(shù)據(jù)有限,本文將側(cè)重于傳統(tǒng)節(jié)假日忙時(shí)話務(wù)量的預(yù)測(cè)。收集了安慶移動(dòng)2011年~2015年每年五一之前20天的話務(wù)量數(shù)據(jù)以及影響因素的資料。在此基礎(chǔ)上,對(duì)其在五一的忙時(shí)數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),預(yù)測(cè)忙時(shí)話務(wù)量數(shù)據(jù)。首先將實(shí)際數(shù)據(jù)進(jìn)行歸一化,將歸一化后的數(shù)據(jù)通過(guò)灰色關(guān)聯(lián)分析后得出結(jié)果數(shù)據(jù),再用提出的改進(jìn)模型進(jìn)行預(yù)測(cè)。
1.2灰色關(guān)聯(lián)分析
由于話務(wù)量受多種因素的影響,本文采用灰色關(guān)聯(lián)分析法[7]來(lái)判斷話務(wù)量與多種影響因素間的相關(guān)度大小,選擇與話務(wù)量相關(guān)性較大的因素。
灰色關(guān)聯(lián)分析的主要原理是根據(jù)序列曲線幾何形狀的相似程度來(lái)判別其聯(lián)系是否緊密。通過(guò)計(jì)算數(shù)據(jù)間相關(guān)度的大小來(lái)判別話務(wù)量與各因素相關(guān)性的大小。
(1)設(shè)系統(tǒng)特征序列X1,相關(guān)因素序列Xk:
?。?)對(duì)各數(shù)據(jù)序列進(jìn)行處理:
Yk=Xk/xk(1)=(yk(1),yk(2),...yk(m))
k=1,2,...,m(2)
?。?)計(jì)算相關(guān)系數(shù):
?。?)根據(jù)各數(shù)據(jù)序列關(guān)聯(lián)系數(shù)的大小,計(jì)算關(guān)聯(lián)度的值:
對(duì)話務(wù)量影響較大的因素與話務(wù)量間的關(guān)聯(lián)度結(jié)果如表1所示。
1.3多因素灰色模型
多因素灰色模型MGM(1,n)[8]是利用n元一階常微分方程組來(lái)描述n元相關(guān)聯(lián)變量的狀態(tài),并進(jìn)行未知狀態(tài)預(yù)測(cè)。核心思想是先進(jìn)行數(shù)據(jù)預(yù)處理,使得新生成的數(shù)列具有單調(diào)性,再對(duì)新生成的序列構(gòu)建n個(gè)一元微分方程組,優(yōu)化目標(biāo)函數(shù),找到相對(duì)誤差最小的模型參數(shù),最終可以實(shí)現(xiàn)預(yù)測(cè)未來(lái)的話務(wù)量。算法步驟如下:
假設(shè)某個(gè)系統(tǒng)經(jīng)過(guò)灰色關(guān)聯(lián)分析后有n個(gè)影響因子,每個(gè)影響因子有m個(gè)數(shù)據(jù):
(1)輸入原始序列,進(jìn)行累加:
x1={x1i(j)}(5)
其中{x1i(j)}=∑kj=1x0i(j),i=1,2,...,n,j=1,2,...,m
?。?)多變量灰色模型MGM(1,n)對(duì)累加后的數(shù)據(jù)建立n元一階微分方程組,簡(jiǎn)寫(xiě)為:
其中X(1)=(x(1)1(j),x(1)2(j),...,x(1)n(j))
令D=(A,B)T=[ai1ai2…ainbi]T,i=(1,2,…,n),若LTL可逆,則可得D的辨識(shí)值:
D′=(A′,B′)T=(LTL)-1LTY,i=1,2,...,n(8)
計(jì)算模型參數(shù)的估計(jì)值,由式(8)得到A、B的辨識(shí)值A(chǔ)′、B′:
(3)計(jì)算模型的擬合值或預(yù)測(cè)值。由式(6)可得到預(yù)測(cè)值:
x′(1)i(j)=eλ(j-1)(x(1)i(1)+A′-1B)-A′-1B′(10)
最終的預(yù)測(cè)值為:
x′(0)i(1)=x′(1)i(1)
x′(0)i(j)=x′(1)i(j)-x′(1)i(j-1), j=2,3,…(11)
通過(guò)以上多因素灰色模型的計(jì)算公式,可計(jì)算出時(shí)間序列的模擬值。但對(duì)于波動(dòng)較大的時(shí)間序列,計(jì)算出的模擬值誤差較大。把安慶移動(dòng)2011年~2015年每年“五一”之前20天的話務(wù)量數(shù)據(jù)及表1中相關(guān)因素的數(shù)據(jù)作為MGM(1,4)模型的輸入變量進(jìn)行預(yù)測(cè),可得到2015年“五一”話務(wù)量的預(yù)測(cè)趨勢(shì),預(yù)測(cè)結(jié)果如圖1。
圖1基于多因素灰色模型2015年5月1日的話務(wù)量預(yù)測(cè)值
1.4基于復(fù)高斯小波核函數(shù)優(yōu)化的向量機(jī)
支持向量機(jī)預(yù)測(cè)模型[9]的預(yù)測(cè)精度,主要受到兩個(gè)參數(shù)的影響:懲罰因子和核函數(shù)。由于復(fù)高斯小波核函數(shù)[10]擁有較強(qiáng)的斂散性和全局尋優(yōu)能力,為了進(jìn)一步提高預(yù)測(cè)精度,提出了基于復(fù)高斯小波核函數(shù)的支持向量機(jī)預(yù)測(cè)模型對(duì)殘差序列進(jìn)行預(yù)測(cè)[11]。殘差序列是由原始的真實(shí)序列與上一步多變量灰色模型得到的模擬值對(duì)應(yīng)相減得到。
設(shè)有樣本集{(xi,yi),i=1,2,...,n},其中xi∈Rd為輸入樣本,yi為輸出,不敏感損失函數(shù)ε的定義是:
回歸函數(shù)的表達(dá)式為:
f(x)=[ω·φ(x)]+b(13)
其中φ(x)是從低維到高維的映射函數(shù),ω表示權(quán)值參數(shù),b表示偏差參數(shù)。
回歸函數(shù)的優(yōu)化目標(biāo)函數(shù)為:
minω,b,ξ12ω2 +C∑ni = 1(ξi + ξ*i )(14)
目標(biāo)函數(shù)的約束條件為:
st|yi -(ω·φ(x))-b|≤ε + ξ*i
其中,ξi ≥0,ξ*i ≥0,i = 1,2,...,n。
構(gòu)造拉格朗日函數(shù),將帶約束條件的目標(biāo)函數(shù)轉(zhuǎn)變?yōu)闊o(wú)條件下的目標(biāo)規(guī)劃問(wèn)題。
L(ω,b,ξ,ξ*)=12ω2+C∑ni=1(ξi+ξ*i)-
∑ni=1αi[ε+ξi-(yi-(ω·φ(x))-b)]-
∑ni=1α*i[ε+ξ*i-(yi-(ω·φ(x))-b)]-
∑ni=1(βiξi+βiξ*i)′(15)
對(duì)上式中的參數(shù)分別求導(dǎo),并令偏導(dǎo)為零:
maxα,α*,β,β*-12∑ni=1∑nj=1[(αi-α*i)(αj-α*j)K(xi-xj)]-
上式中,α,α*中至少有一個(gè)為零,α≠0對(duì)應(yīng)的樣本點(diǎn)xi被定義為支持向量,根據(jù)支持向量進(jìn)行求解,便可得到支持向量機(jī)的預(yù)測(cè)函數(shù)表達(dá)式:
K(xi, x)為支持向量機(jī)預(yù)測(cè)函數(shù)表達(dá)式中的核函數(shù), 采用的是復(fù)高斯小波核函數(shù)[12]。
使用安慶移動(dòng)2011~2014四年的“五一”前20天的數(shù)據(jù)以及2015年“五一”數(shù)據(jù)的殘差序列作為已知數(shù)據(jù)來(lái)訓(xùn)練預(yù)測(cè)模型,仿真結(jié)果如圖2所示。
1.5本文算法主要思想
?。?)用灰色關(guān)聯(lián)分析法計(jì)算出特征序列與各相關(guān)因素序列之間相關(guān)度的大小,根據(jù)相關(guān)度的大小,找出影響話務(wù)量較大的因素。
?。?)將對(duì)話務(wù)量影響較大的因素作為MGM(1,n)模型的輸入,實(shí)現(xiàn)對(duì)話務(wù)量基本規(guī)律的預(yù)測(cè),并得到預(yù)測(cè)的殘差序列。
?。?)利用復(fù)高斯小波核函數(shù)優(yōu)化的支持向量機(jī)模型建立殘差序列預(yù)測(cè)模型,從而實(shí)現(xiàn)對(duì)殘差序列的預(yù)測(cè)。
(4)將MGM(1,n)的預(yù)測(cè)結(jié)果與殘差序列預(yù)測(cè)結(jié)果疊加,實(shí)現(xiàn)對(duì)話務(wù)量的預(yù)測(cè)。
2仿真實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證本文所提算法的預(yù)測(cè)結(jié)果,選取了粒子群[13]優(yōu)化的支持向量機(jī)的多因素灰色模型、多因素灰色模型作為比較模型。其中粒子群算法的基本參數(shù)為:粒子群種群規(guī)模m=100,最大迭代次數(shù)為1 000,學(xué)習(xí)因子c1=c2=2,慣性權(quán)重ω=09,松弛因子ε=054,粒子的初始化速度為0,最小適應(yīng)值ξ=001,通過(guò)粒子群優(yōu)化算法確定C=0616 0,g=10983 6。對(duì)2015年“五一”的忙時(shí)話務(wù)量進(jìn)行預(yù)測(cè),仿真結(jié)果如圖3所示?! ?/p>
通過(guò)對(duì)話務(wù)量的仿真分析,證明了該模型相較傳統(tǒng)的多因素灰色模型預(yù)測(cè)精度高,對(duì)波動(dòng)較大的數(shù)據(jù)預(yù)測(cè)比較準(zhǔn)確。采用相對(duì)誤差的方法對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析,計(jì)算結(jié)果如表2所示。
3結(jié)論
本文選擇預(yù)測(cè)精度較高的預(yù)測(cè)模型對(duì)話務(wù)量進(jìn)行預(yù)測(cè),話務(wù)量的預(yù)測(cè)精度越高,對(duì)移動(dòng)網(wǎng)絡(luò)通信的指導(dǎo)意義就越大,越能及時(shí)應(yīng)對(duì)網(wǎng)絡(luò)可能出現(xiàn)的擁塞情況。在研究了國(guó)內(nèi)外預(yù)測(cè)領(lǐng)域的最新進(jìn)展后,針對(duì)話務(wù)量的預(yù)測(cè),本文提出了基于復(fù)高斯小波核函數(shù)改進(jìn)支持向量機(jī)的多因素灰色預(yù)測(cè)模型。在進(jìn)行預(yù)測(cè)之前,搜集了大量話務(wù)量的歷史數(shù)據(jù)和相關(guān)因素?cái)?shù)據(jù),對(duì)2015年“五一”的忙時(shí)話務(wù)量進(jìn)行了預(yù)測(cè)。
由于話務(wù)量受多種因素的影響,選擇多因素灰色話務(wù)量預(yù)測(cè)模型。此模型適合由多種因素影響的話務(wù)量的預(yù)測(cè),而且算法比較簡(jiǎn)單。但是當(dāng)數(shù)據(jù)波動(dòng)較大時(shí),多因素灰色預(yù)測(cè)模型預(yù)測(cè)精確度較低,針對(duì)這種情況,本文提出用支持向量機(jī)的模型來(lái)修正灰色模型的預(yù)測(cè)結(jié)果。
核函數(shù)與支持向量機(jī)的預(yù)測(cè)精度相關(guān),通過(guò)改進(jìn)核函數(shù),可提高預(yù)測(cè)精度。復(fù)高斯小波核函數(shù)擁有較強(qiáng)的斂散性和全局尋優(yōu)的能力,通過(guò)實(shí)驗(yàn)仿真,得出改進(jìn)的模型相比多因素灰色模型、粒子群優(yōu)化支持向量機(jī)補(bǔ)償?shù)亩嘁蛩鼗疑P陀懈玫氖諗啃Ч洼^為理想的預(yù)測(cè)結(jié)果。
參考文獻(xiàn)
[1] 彭宇,雷苗,郭嘉,等.基于先驗(yàn)知識(shí)的移動(dòng)通信話務(wù)量預(yù)測(cè)[J].電子學(xué)報(bào),2011,39(1):190-194.
[2] 張一農(nóng),劉伯龍,王文婷.基于神經(jīng)網(wǎng)絡(luò)的客服中心話務(wù)量預(yù)測(cè)模型[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2011,29(2):97-101.
[3] Chen Dianbo, Xu Fucang, Wu Min. Traffic based on clustering and support vector machine forcasting model [J]. Journal of Control Engineering, 2009, 16(2):195-198.
?。?] 張偉, 張新波. 移動(dòng)GSM網(wǎng)話務(wù)量的ARIMA模型的建立及其預(yù)測(cè)[J].數(shù)學(xué)理論與應(yīng)用,2008(2):70-74.
?。?] 吳永明,吳晟. 改進(jìn)的遺傳算法在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化中的應(yīng)用[J]. 微型機(jī)與應(yīng)用,2011,30(3):79-81,85.
[6] Pai Pingfeng,LIN C. A hybrid ARIMA and support vector machines model in stock price forecasting[J].Omega,2005,33(6):497-505.
?。?] 李鵬,劉思峰.基于灰色關(guān)聯(lián)分析和D—S證據(jù)理論的區(qū)間直覺(jué)模糊決策方法[J].自動(dòng)化學(xué)報(bào), 2011, 37(8): 993-998.
[8] LUO Y. Nonequidistant MGM(1,n) based on vector continued factions theory and its application[J]. Information Technology Journal, 2014,13(6) ,1186-1191.
?。?] 陳電波,徐福倉(cāng),吳敏. 基于聚類和支持向量機(jī)向量機(jī)的話務(wù)量預(yù)測(cè)模型[J]. 控制工程, 2009, 16( 2) : 195-199.
?。?0] 陳中杰,蔡勇,蔣剛.基于復(fù)高斯小波核函數(shù)的支持向量機(jī)的研究[J].計(jì)算機(jī)應(yīng)用研究,2012, 29(9):3263-3265.
?。?1] 侯偉真,潘美芹. 高斯核支持向量機(jī)最優(yōu)模型參數(shù)選擇搜索算法[C]. 中國(guó)運(yùn)籌學(xué)會(huì)第八屆學(xué)術(shù)交流會(huì)論文集. 2006:716-722.
[12] 林繼鵬, 劉君華. 基于小波的支持向量機(jī)算法研究[J]. 西安交通大學(xué)學(xué)報(bào), 2005,39(8):816-819.
?。?3] WANG F S, CHEN L H. Particle swarm optimization(PSO)[J]. Encyclopedia of Systems Biology, 2013,12(8):1649-1650.