《神經(jīng)網(wǎng)絡(luò)的IaaS云資源需求預(yù)測》由會員分享,可在線閱讀,更多相關(guān)《神經(jīng)網(wǎng)絡(luò)的IaaS云資源需求預(yù)測(3頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、神經(jīng)網(wǎng)絡(luò)的IaaS云資源需求預(yù)測
神經(jīng)網(wǎng)絡(luò)的IaaS云資源需求預(yù)測
2016/02/02
摘要
為保證基礎(chǔ)設(shè)施即服務(wù)(IaaS)模式云環(huán)境中資源的有效分配與高效調(diào)度,提出了一種基于集成模型-優(yōu)化神經(jīng)網(wǎng)絡(luò)的資源需求預(yù)測方法(EMONN).分析了用戶偏好以及資源配置需求,根據(jù)需求變化采用閾值法確定波動期與平緩期,通過基本預(yù)測器集成模型實(shí)現(xiàn)不同時期、不同需求的預(yù)處理.預(yù)處理結(jié)果經(jīng)過加權(quán),與歷史數(shù)據(jù)共同作為神經(jīng)網(wǎng)絡(luò)(NN)的訓(xùn)練數(shù)據(jù),保證預(yù)測結(jié)果精度.為改善神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率
2、與穩(wěn)定性,采用自適應(yīng)學(xué)習(xí)率以及動量方法對神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化.采用統(tǒng)計指標(biāo)對系統(tǒng)有效性進(jìn)行驗(yàn)證,結(jié)果表明所提方法可以精確有效實(shí)現(xiàn)用戶需求預(yù)測.
關(guān)鍵詞
基礎(chǔ)設(shè)施即服務(wù)(IaaS);資源需求預(yù)測;集成模型;神經(jīng)網(wǎng)絡(luò);自適應(yīng)學(xué)習(xí)率;統(tǒng)計驗(yàn)證
在IaaS模式云計算[1]中,高效精確地為用戶分配資源是效益最大化的重要保證.云中心根據(jù)請求以虛擬機(jī)(VM)形式為其分配資源,為保證服務(wù)質(zhì)量,有必要根據(jù)虛擬機(jī)運(yùn)行狀態(tài)實(shí)現(xiàn)資源動態(tài)調(diào)整.然而,準(zhǔn)備和初始化實(shí)例需要一定時間,使得資源無法根據(jù)用戶需求動態(tài)調(diào)度,導(dǎo)致無法有效地為用戶提供彈性的資源管理[2],降低了云計算的服務(wù)質(zhì)量,因而需求預(yù)測為資源動態(tài)管
3、理與供給提供了重要參考[3].對資源需求和工作負(fù)載的預(yù)測已有許多研究工作,為了優(yōu)化資源管理和任務(wù)調(diào)度,部分學(xué)者采用常規(guī)預(yù)測方法,例如基于移動平均線的長期趨勢預(yù)測算法[4]、基于FUSD的指數(shù)加權(quán)移動平均算法[5]等實(shí)現(xiàn)云計算環(huán)境下的負(fù)載預(yù)測,有學(xué)者將模糊系統(tǒng)引入虛擬機(jī)負(fù)載和資源預(yù)測中[6-7],提升了系統(tǒng)魯棒性,但是預(yù)測精度不夠高.針對云環(huán)境工作負(fù)載的非線性特性,有學(xué)者引入神經(jīng)網(wǎng)絡(luò)并結(jié)合典型預(yù)測方法[8-10].上述預(yù)測方法難以對不斷變化的情況進(jìn)行自適應(yīng)預(yù)測,其精確性和實(shí)時性有待提升.本研究提出一種基于集成模型-優(yōu)化神經(jīng)網(wǎng)絡(luò)的預(yù)測方法,采用基本預(yù)測器集成模型對需求情況進(jìn)行預(yù)處理,并分別從以下三
4、個方面對神經(jīng)網(wǎng)絡(luò)進(jìn)行了優(yōu)化:利用集成模型的輸出數(shù)據(jù)優(yōu)化訓(xùn)練數(shù)據(jù)結(jié)構(gòu);通過優(yōu)化神經(jīng)網(wǎng)絡(luò)傳遞函數(shù)改善網(wǎng)絡(luò)權(quán)重更新過程;通過自適應(yīng)學(xué)習(xí)率優(yōu)化學(xué)習(xí)過程.
1預(yù)測系統(tǒng)結(jié)構(gòu)與資源需求情況
1.1預(yù)測系統(tǒng)云計算資源預(yù)測系統(tǒng)結(jié)構(gòu)如圖1所示,圖中VM為虛擬機(jī).資源需求預(yù)測之前,首先分析歷史數(shù)據(jù)庫中的用戶請求,包括數(shù)據(jù)結(jié)構(gòu)、內(nèi)容和數(shù)量,得到用戶偏好性選擇、需求描述等.為了實(shí)現(xiàn)精確有效的預(yù)測,對不同的資源需求情況進(jìn)行分析,包括長期需求、短期需求和需求抖動情況,并給出了區(qū)分不同情況的方法準(zhǔn)則.對資源需求采用基本預(yù)測器集成模型進(jìn)行預(yù)處理,對集成模型預(yù)測結(jié)果進(jìn)行加權(quán)后,輸入至神經(jīng)網(wǎng)絡(luò)預(yù)測器中.神經(jīng)網(wǎng)絡(luò)同時采用
5、歷史數(shù)據(jù)序列和集成模型預(yù)測結(jié)果作為訓(xùn)練數(shù)據(jù),以提升結(jié)果的精確性.引入自適應(yīng)學(xué)習(xí)率以及動量法改善神經(jīng)網(wǎng)絡(luò)的收斂速度和穩(wěn)定性.預(yù)測輸出值用來指導(dǎo)IaaS云計算數(shù)據(jù)中心的資源分配.采用不同統(tǒng)計指標(biāo)對預(yù)測效果進(jìn)行評估,并將結(jié)果反饋至歷史數(shù)據(jù)庫中,為后續(xù)資源預(yù)測調(diào)度提供參考.
1.2需求平緩期基于平緩期的特點(diǎn),采用二次移動平均法(SMA)[11]進(jìn)行資源需求的預(yù)測,提高預(yù)測精度.圖2所示為長度為L的滑動窗模型。
1.3需求波動期指數(shù)移動平均法(EMA)[12]是一種短期預(yù)測的有效方法,由于其響應(yīng)的快速性,因此適用于非周期性的快速變化時間序列預(yù)測.EMA對當(dāng)前測量值給予較大權(quán)重,而對于較早時刻
6、的測量值給予較小權(quán)重,可以對短期資源需求以及需求抖動作出快速反應(yīng).
1.4波動期和平緩期確定進(jìn)行需求預(yù)測時,須明確當(dāng)前需求所處時期,定義波動閾值(hu)和平緩閾值(ha)界定平緩期與波動期.
2集成模型-優(yōu)化神經(jīng)網(wǎng)絡(luò)資源需求預(yù)測
2.1總體結(jié)構(gòu)通過集成預(yù)測模型可以對不同的需求情況進(jìn)行預(yù)處理,而神經(jīng)網(wǎng)絡(luò)良好的非線性逼近能力和自組織特性可以提升預(yù)測結(jié)果的精度.將集成模型結(jié)果輸入至神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)二者有效結(jié)合,是提升系統(tǒng)預(yù)測性能的有效方法.集成模型-優(yōu)化神經(jīng)網(wǎng)絡(luò)資源需求預(yù)測方法核心是采用兩層結(jié)構(gòu),如圖3所示.第一層為基本預(yù)測器集成模型,第一層的輸出值與歷史數(shù)據(jù)共同作為第二層神經(jīng)網(wǎng)絡(luò)訓(xùn)
7、練值,以優(yōu)化預(yù)測結(jié)果.
2.2基本預(yù)測器集成模型在預(yù)測器基礎(chǔ)上,集成模型引入自動回歸模型(AR)和移動平均法(MA).設(shè)在時刻t預(yù)測器i的預(yù)測值為x(i)t,其對應(yīng)權(quán)重為w(i)t,通過對上述預(yù)測結(jié)果進(jìn)行加權(quán),則集成模型輸出值。
3實(shí)驗(yàn)與結(jié)果分析
3.1統(tǒng)計指標(biāo)為了評估預(yù)測系統(tǒng)的性能,采用系列指標(biāo)[13]包括平均絕對誤差(MAE)和均方誤差(MSE),誤差區(qū)間數(shù)量統(tǒng)計值(PRED(x))對系統(tǒng)進(jìn)行分析.MAE是測量預(yù)測值和真實(shí)值之間誤差均值的指標(biāo)。
3.2預(yù)測效果對比與分析基于集成模型-優(yōu)化神經(jīng)網(wǎng)絡(luò)的資源需求預(yù)測方法EMONN的預(yù)測結(jié)果如圖4所示,圖中Q為訪問流量.由圖
8、可見預(yù)測值與實(shí)際值符合較好,誤差較小.根據(jù)指標(biāo)(11)~(13),對多種預(yù)測方法進(jìn)行對比實(shí)驗(yàn),結(jié)果如表1所示.可知:對于平均歸一化誤差值和最大誤差,EMONN均達(dá)到最小,EMA和SMA的預(yù)測結(jié)果與EMONN較接近,而僅采用神經(jīng)網(wǎng)絡(luò)時,預(yù)測效果較差;EMONN在誤差能量方面低于其他方法,約為AR模型的1/4;EMONN方法處于5%的誤差點(diǎn)數(shù)最多,預(yù)測誤差較小,預(yù)測性能優(yōu)于其他預(yù)測方法.
3.3預(yù)測方法學(xué)習(xí)過程優(yōu)化僅采用神經(jīng)網(wǎng)絡(luò)時預(yù)測性能不理想,原因主要是學(xué)習(xí)率不夠優(yōu)化,本節(jié)討論自適應(yīng)學(xué)習(xí)率對神經(jīng)網(wǎng)絡(luò)的影響.圖5為不同學(xué)習(xí)策略下的神經(jīng)網(wǎng)絡(luò)性能對比,m為迭代次數(shù).不采用自適應(yīng)學(xué)習(xí)率的神經(jīng)網(wǎng)絡(luò)經(jīng)
9、過2000個學(xué)習(xí)周期,均方誤差(Pa)接近8.6610-3,采用自適應(yīng)學(xué)習(xí)率后,經(jīng)過相同訓(xùn)練周期后,誤差為3.110-3,二者比率達(dá)到2.8.因此,采用自適應(yīng)學(xué)習(xí)率后,神經(jīng)網(wǎng)絡(luò)的收斂速度有大幅提升,預(yù)測結(jié)果更加精確.
3.4集成模型對預(yù)測效果的影響圖6所示為將集成模型預(yù)處理結(jié)果引入訓(xùn)練數(shù)據(jù)進(jìn)行優(yōu)化后的學(xué)習(xí)過程曲線.與圖5相比,學(xué)習(xí)速度得到進(jìn)一步提升,經(jīng)過1600個訓(xùn)練周期即達(dá)到訓(xùn)練目標(biāo)值0.001,遠(yuǎn)小于僅采用歷史數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的預(yù)測方法,網(wǎng)絡(luò)收斂速度得到有效提升,而且其訓(xùn)練誤差值達(dá)到了0.001,性能得到進(jìn)一步提升.采用不同訓(xùn)練數(shù)據(jù)結(jié)構(gòu)的性能對比如表2所示.引入集成模型后,預(yù)測性能得
10、到有效提升,盡管絕對誤差僅僅降低了0.0031,但是提升了13.9%;優(yōu)化前后的eMSE值分別為0.0012和0.0010,PPRED(5)值分別為302∶320,預(yù)測誤差較表1有進(jìn)一步降低.
4結(jié)論
為了提升云計算資源供給效率和精確性,提出了一種基于集成模型-優(yōu)化神經(jīng)網(wǎng)絡(luò)的資源需求預(yù)測方法(EMONN).在分析了用戶資源需求特點(diǎn)的基礎(chǔ)上引入基本預(yù)測器集成模型對上述不同情況進(jìn)行處理,并將預(yù)測結(jié)果發(fā)送至神經(jīng)網(wǎng)絡(luò)作為訓(xùn)練數(shù)據(jù).采用自適應(yīng)學(xué)習(xí)率和帶有動量的權(quán)重對學(xué)習(xí)過程進(jìn)行優(yōu)化.通過統(tǒng)計指標(biāo)對預(yù)測方法進(jìn)行有效性驗(yàn)證.結(jié)果表明EMONN可以有效精確地實(shí)現(xiàn)用戶資源需求的預(yù)測,對于云中心資源調(diào)度提供了有效的參考,但是對于多人次多種資源預(yù)測,若采用順序處理,則會降低預(yù)測的實(shí)時性,下一步工作重點(diǎn)在于采用多線程實(shí)現(xiàn)多人次多資源同時的預(yù)測.