新建風(fēng)電場短期風(fēng)電預(yù)測方法
時間:2022-09-30 10:00:29
導(dǎo)語:新建風(fēng)電場短期風(fēng)電預(yù)測方法一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
長久以來,人類社會以化石燃料作為主要能源?;茉撮L期地開采使用,也帶來了資源枯竭、大氣污染和氣候變暖等一系列問題。風(fēng)能作為傳統(tǒng)化石能源的一種替代能源,具有分布地域廣、儲量豐富和可再生等特點,在滿足人們對能源需求的同時,也能實現(xiàn)人類社會的可持續(xù)性發(fā)展。但風(fēng)力發(fā)電具有和傳統(tǒng)發(fā)電方式不同的特點,例如風(fēng)能具有季節(jié)性、間接性、隨機(jī)波動等,這都決定了風(fēng)力發(fā)電相關(guān)技術(shù)更加復(fù)雜。其中對風(fēng)電功率的預(yù)測,直接影響到風(fēng)電并網(wǎng)安全性和電力市場競爭力。風(fēng)電功率的準(zhǔn)確預(yù)測對風(fēng)力發(fā)電企業(yè)非常重要,是電力調(diào)度中的重點、難點問題,也是研究當(dāng)中的熱點問題。風(fēng)電功率預(yù)測可以按時間尺度、空間尺度、預(yù)測形式等多個角度進(jìn)行分類,按照不同的預(yù)測模型主要可分為物理模型、統(tǒng)計模型和人工智能方法三類。物理模型方法通過將風(fēng)力、風(fēng)向角以及電機(jī)可調(diào)參數(shù)等影響因素,抽象為相應(yīng)的數(shù)學(xué)模型,在風(fēng)場中通過傳感器實時監(jiān)控相關(guān)參數(shù),實現(xiàn)電機(jī)功率的實時預(yù)測。統(tǒng)計模型方法利用統(tǒng)計學(xué)知識,將歷史采集數(shù)據(jù)進(jìn)行識別、擬合和趨勢分析,最終對風(fēng)電功率做出預(yù)測。人工智能方法則是以數(shù)據(jù)為驅(qū)動,通過深度神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)的學(xué)習(xí),提取數(shù)據(jù)內(nèi)部的關(guān)聯(lián)性和高維特征,并據(jù)此對風(fēng)電功率短期情況給出預(yù)測結(jié)果。風(fēng)電功率預(yù)測本質(zhì)上是建立風(fēng)廠內(nèi)各因素的相互關(guān)系,其預(yù)測精準(zhǔn)度必須建立在足夠多的歷史數(shù)據(jù)上。而新建風(fēng)電場往往缺少風(fēng)場內(nèi)相關(guān)信息,難以為風(fēng)電功率的預(yù)測提供支撐。
基于對抗神經(jīng)網(wǎng)絡(luò)的風(fēng)電數(shù)據(jù)生成數(shù)據(jù)清洗
由于風(fēng)電本身的不穩(wěn)定性,以及非預(yù)計停機(jī)、棄風(fēng)限電、天氣異常等原因,風(fēng)場采集的數(shù)據(jù)中往往會存在大量的異常點,這些異常點將對正常情況下的風(fēng)電功率預(yù)測產(chǎn)生影響。本文用變點分組法原理、最小二乘法原理和四分位法來處理原始數(shù)據(jù),從而實現(xiàn)異常點的剔除,另外使用臨近值補(bǔ)全的方法對缺失值進(jìn)行一個填補(bǔ)。這樣處理得到的數(shù)據(jù)更有利于風(fēng)電功率的預(yù)測。
風(fēng)電數(shù)據(jù)生成
生成對抗網(wǎng)絡(luò)屬于非監(jiān)督式學(xué)習(xí)方法,是深度學(xué)習(xí)領(lǐng)域的一個重要生成模型。其內(nèi)部主要包含生成器和判別器兩個網(wǎng)絡(luò),生成器神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)利用已有數(shù)據(jù)樣本生成新的樣本,而判別器神經(jīng)網(wǎng)絡(luò)則負(fù)責(zé)將生成樣本從真實樣本中盡可能分辨出來。兩個網(wǎng)絡(luò)相互對抗、不斷調(diào)整參數(shù),最終目的是使判別網(wǎng)絡(luò)無法判斷生成網(wǎng)絡(luò)的輸出樣本是否真實。因為有些風(fēng)電場歷史數(shù)據(jù)量較小,可以利用生成器網(wǎng)絡(luò)產(chǎn)生的樣本,進(jìn)行數(shù)據(jù)樣本的擴(kuò)充。并且對抗神經(jīng)網(wǎng)絡(luò)是基于非監(jiān)督式學(xué)習(xí),所以不需要準(zhǔn)備非常多的數(shù)據(jù)。利用風(fēng)電場已有的風(fēng)電數(shù)據(jù)來訓(xùn)練對抗生成網(wǎng)絡(luò),其中的生成模型網(wǎng)絡(luò)可以模擬真實數(shù)據(jù)的概率分布,并輸出合成樣本。而判別網(wǎng)絡(luò)需要學(xué)習(xí)區(qū)分這個生成的風(fēng)電數(shù)據(jù)是否來自真實的數(shù)據(jù)分布,經(jīng)過多輪不斷地對抗,從而使合成數(shù)據(jù)也能夠達(dá)到真實數(shù)據(jù)的效果。用于合成風(fēng)電數(shù)據(jù)的對抗生成網(wǎng)絡(luò)框架設(shè)計如圖1所示。在GAN神經(jīng)網(wǎng)絡(luò)訓(xùn)練時使用到的對抗損失函數(shù)可以下式來表示。行業(yè)曲線開放度創(chuàng)新度生態(tài)度互交度持續(xù)度可替代度影響力可實現(xiàn)度行業(yè)關(guān)聯(lián)度真實度楊乘勝,男,碩士,安徽蕪湖,高級工程師,南京華盾電力信息安全測評有限公司,研究方向:電力系統(tǒng)及其自動化。在式(1)中,z代表隨機(jī)變量,pz(z)代表z的數(shù)據(jù)分布,Pdata(x)代表真實樣本的分布,D和G分別代表判別器和生成器,minGmaxDV(D,G)在于最大化判別器D的價值函數(shù)而最小化生成器G的價值函數(shù)。在GAN神經(jīng)網(wǎng)絡(luò)整個訓(xùn)練過程中,一個隨機(jī)變量會輸入生成器G并輸出合成數(shù)據(jù),之后由判斷器D確定它是否為真數(shù)據(jù)。整個訓(xùn)練過程需要最大化判別器的概率logD(x),即讓所有的數(shù)據(jù)都被認(rèn)為來自真實的數(shù)據(jù)集,相對的要最小化生成器的概率log(1-D(G(z))),使得合成數(shù)據(jù)愈加接近真實數(shù)據(jù)的分布。網(wǎng)絡(luò)采取的是向后傳播的方式來調(diào)整內(nèi)部參數(shù),使得網(wǎng)絡(luò)能夠結(jié)合預(yù)測值和真實值之間的誤差,學(xué)習(xí)到風(fēng)電數(shù)據(jù)的高維特征。
基于遺傳算法的風(fēng)電預(yù)測
遺傳算法的理論基礎(chǔ)是達(dá)爾文的進(jìn)化論,它通過模擬自然界中競爭的方式產(chǎn)生優(yōu)勝劣汰的分化。在使用遺傳算法時,將潛在的解集設(shè)定為初始的種群,并通過遺傳算法的自然選擇原理進(jìn)行不斷地進(jìn)化,最終得出一個最優(yōu)個體作為整體的一個最優(yōu)解。遺傳算法的構(gòu)造過程可以按照以下方式進(jìn)行:(1)確定決策變量及其各種約束條件,即確定出個體的表現(xiàn)型X和問題的解空間。(2)建立優(yōu)化模型,即確定出目標(biāo)函數(shù)的類型及其數(shù)學(xué)描述形式或量化方法。(3)確定個體適應(yīng)度的量化評價方法,即確定出由目標(biāo)函數(shù)值f(X)到個體適應(yīng)度F(X)的轉(zhuǎn)換規(guī)則。(4)設(shè)計遺傳算子,即確定出選擇運(yùn)算、交叉運(yùn)算、變異運(yùn)算等遺傳算子的具體操作方法。(5)選擇運(yùn)算,選擇算子作用于群體。選擇的目的是把優(yōu)化的個體直接遺傳到下一代或通過配對交叉產(chǎn)生新的個體再遺傳到下一代。選擇操作是建立在群體中個體的適應(yīng)度評估基礎(chǔ)上的。(6)交叉運(yùn)算:將交叉算子作用于群體。遺傳算法中起核心作用的就是交叉算子。(7)變異運(yùn)算:將變異算子作用于群體。即是對群體中的個體串的某些基因座上的基因值作變動,群體P(t)經(jīng)過選擇、交叉、變異運(yùn)算之后得到下一代群體P(t+1)。遺傳算法用于風(fēng)電功率預(yù)測有以下優(yōu)點:它是以問題集的串集進(jìn)行預(yù)測的,而不是以某個節(jié)點為依據(jù)進(jìn)行的預(yù)測,這更有利于得到一個全局擇優(yōu)的結(jié)果,減少陷入局部最優(yōu)解的風(fēng)險。且遺傳算法不是采用確定性規(guī)則,而是用概率變簽規(guī)則來進(jìn)行預(yù)測的,能夠做到模糊自適應(yīng),并且具有自組織、自適應(yīng)和自學(xué)習(xí)能力。遺傳算法以上的特征都保證了風(fēng)電效率的預(yù)測能有很好的精度。在遺傳算法中,如果某個體i的適應(yīng)度fi種群大小為NP,則i被選擇的概率通過公式(2)計算:
實驗結(jié)果和分析
評價標(biāo)準(zhǔn)和對照算法為了對風(fēng)電模型的預(yù)測結(jié)果進(jìn)行評估,我們選用了平均絕對百分比誤差和均方根百分比誤差作為評估的手段。其公式如下所示:上述公式中N為預(yù)測的點數(shù),y(k)真實數(shù)據(jù),y~(k)模型產(chǎn)生的預(yù)測數(shù)據(jù)。這兩個公式主要用來評估預(yù)測值的實時誤差和時間段內(nèi)總體誤差率,能夠很好地反映出模型的單點和整體的預(yù)測效果。為驗證本文提出的GAN神經(jīng)網(wǎng)絡(luò)擴(kuò)充樣本以及后續(xù)遺傳算法對于短期風(fēng)電功率預(yù)測性能,我們將長短期記憶網(wǎng)絡(luò)(LSTM)作為對比參照算法。LSTM是一種時間循環(huán)神經(jīng)網(wǎng)絡(luò),適合于處理和預(yù)測時間序列中間隔和延遲非常長的情況,在風(fēng)電功率短期預(yù)測上已被證實是有效的方法。
仿真實驗設(shè)計與結(jié)果分析
仿真實驗使用的數(shù)據(jù)來自西班牙SotaventoGalicia風(fēng)場,由風(fēng)場中的實時傳感器每10min對相關(guān)數(shù)據(jù)進(jìn)行采取,其中包括風(fēng)向角、風(fēng)速、發(fā)電功率等信息。本文使用SotaventoGalicia風(fēng)場2022年3月1日至3月15日采集的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其中包含了共2130個訓(xùn)練樣本。并將3月16日至3月20日共426條數(shù)據(jù)進(jìn)行保留,作為訓(xùn)練后模型的測試數(shù)據(jù)集。另外使用GAN神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)進(jìn)行擴(kuò)充,共得到510個合成數(shù)據(jù)樣本,擴(kuò)充的訓(xùn)練數(shù)據(jù)集包含了2640個數(shù)據(jù)樣本。本文在pytorch深度學(xué)習(xí)框架中實現(xiàn)GAN神經(jīng)網(wǎng)絡(luò)并進(jìn)行訓(xùn)練,用Python語言實現(xiàn)遺傳算法,實驗計算機(jī)硬件配置為NVDIAGTA2060T顯卡和IntelCorei78700KCPU。訓(xùn)練中將GAN神經(jīng)網(wǎng)絡(luò)參數(shù)epoch設(shè)置為300,batchsize設(shè)置為18,學(xué)習(xí)率設(shè)置為0.001;遺傳算法基本參數(shù)設(shè)置為種群數(shù)量為20,終止代數(shù)為40,交叉概率為0.45,變異概率為0.01。為了驗證本文的GAN神經(jīng)網(wǎng)絡(luò)合成數(shù)據(jù)和遺傳算法的風(fēng)電功率預(yù)測性能,本文共設(shè)計了3個對比實驗,第一個將擴(kuò)充訓(xùn)練數(shù)據(jù)集的2640個樣本數(shù)據(jù)作為遺傳算法的輸入,并且對3月16日到20日的短期風(fēng)電功率進(jìn)行預(yù)測。另外兩個對比實驗僅僅只用到原始訓(xùn)練數(shù)據(jù)集的2130個訓(xùn)練樣本,分別用于遺傳算法和LSTM并對16日至20日的風(fēng)電功率進(jìn)行預(yù)測,實驗結(jié)果如圖3所示。通過上面的仿真結(jié)果對比,可以發(fā)現(xiàn)在未使用GAN神經(jīng)網(wǎng)絡(luò)擴(kuò)充訓(xùn)練數(shù)據(jù)集的情況下,遺傳算法依然優(yōu)于LSTM的預(yù)測性能,預(yù)測結(jié)果更加接近于真實值。而在3個對比仿真實驗中,本文提出的GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法的組合,取得了最優(yōu)異的預(yù)測結(jié)果。相對于未使用擴(kuò)充訓(xùn)練數(shù)據(jù)的遺傳算法的預(yù)測結(jié)果,GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法的預(yù)測結(jié)果更加精準(zhǔn)且在整體趨勢上更貼合真實數(shù)據(jù)。這個結(jié)果說明利用GAN神經(jīng)網(wǎng)絡(luò)合成的數(shù)據(jù)樣本,可以用來訓(xùn)練預(yù)測模型,且有助于提高最終的預(yù)測精確度。另外,為了研究不同數(shù)量訓(xùn)練樣本情況下,各類算法的預(yù)測性能的區(qū)別以及GAN神經(jīng)網(wǎng)絡(luò)擴(kuò)充數(shù)據(jù)集對預(yù)測性能的提升效果,本文將SotaventoGalicia風(fēng)場2022年3月1日至3月15日采集的2130個訓(xùn)練樣本,其中的20%,50%,70%和全部樣本選取出來,形成4個不同樣本數(shù)量的訓(xùn)練數(shù)據(jù)集。這4個訓(xùn)練數(shù)據(jù)集用于訓(xùn)練遺傳算法和LSTM,并對之后200個時間點風(fēng)電功率進(jìn)行預(yù)測。而本文提出的GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法的組合方法,首先將使用GAN神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)集進(jìn)行擴(kuò)充,合成數(shù)據(jù)量基本為原樣本數(shù)量的25%,之后合成數(shù)據(jù)和原始訓(xùn)練數(shù)據(jù)合成為擴(kuò)充訓(xùn)練數(shù)據(jù)集,用于遺傳算法并對之后200個時間點風(fēng)電功率進(jìn)行預(yù)測。實驗中使用均方根百分比誤差對各模型的預(yù)測結(jié)果性能進(jìn)行評價,評價結(jié)果如表1所示。從表1的實驗結(jié)果看,在不同數(shù)量訓(xùn)練樣本情況下,遺傳算法的預(yù)測性能依然優(yōu)于LSTM算法?;贕AN神經(jīng)網(wǎng)絡(luò)擴(kuò)充數(shù)據(jù)集的方法,在樣本數(shù)量較小時也能取得較好的預(yù)測結(jié)果。隨著樣本訓(xùn)練集大小的不斷增加,各個模型的均方百分比誤差都在逐漸減小,這是因為不斷增加的樣本給模型預(yù)測,提供了更多的信息和特征。GAN神經(jīng)網(wǎng)絡(luò)合成數(shù)據(jù)的提升效果也慢慢降低,但是依然對預(yù)測準(zhǔn)確度有一定程度地提升效果,比如在樣本只有總樣本20%和70%的時候,GAN神經(jīng)網(wǎng)絡(luò)生成數(shù)據(jù)集的提升效果分別為16.2%和8.12%,這可能是在數(shù)據(jù)量較小時模型獲得的信息更加匱乏,合成數(shù)據(jù)可能起到更大的作用。
技術(shù)總結(jié)
本文提出了基于GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法進(jìn)行短期風(fēng)電功率預(yù)測,用來解決某些風(fēng)電場缺少歷史數(shù)據(jù)而難以預(yù)測發(fā)電功率的問題。根據(jù)仿真實驗結(jié)果,我們可以得出以下結(jié)論:當(dāng)樣本數(shù)據(jù)集較小的時候,我們可以利用GAN神經(jīng)網(wǎng)絡(luò)對抗生成數(shù)據(jù),并將生成數(shù)據(jù)用于模型的訓(xùn)練和預(yù)測當(dāng)中。它有助于提高預(yù)測的準(zhǔn)確率,減少樣本量過少帶來的影響;GAN神經(jīng)網(wǎng)絡(luò)和遺傳算法的組合,在缺少樣本的情況下,也可以有效地進(jìn)行短期風(fēng)電功率的預(yù)測,相對于LSTM算法取得較好的一個預(yù)測結(jié)果。在進(jìn)一步的工作中,將充分探索GAN神經(jīng)網(wǎng)絡(luò)和其他算法的組合,在小樣本風(fēng)電功率預(yù)測上取得更精準(zhǔn)的結(jié)果。
作者:楊乘勝