技術(shù)領(lǐng)域:
本發(fā)明涉及電力系統(tǒng)碳-能復(fù)合流優(yōu)化領(lǐng)域,特別是涉及一種基于帝國主義競爭算法的碳-能復(fù)合流求解方法。
背景技術(shù):
:
近年來,由以co2為主的溫室氣體所引起的環(huán)境惡化問題愈發(fā)嚴(yán)重,碳減排及低碳經(jīng)濟成為工業(yè)界和學(xué)術(shù)界廣泛關(guān)注的重點問題。電力產(chǎn)業(yè)是co2的主要排放者之一,有義務(wù)更有責(zé)任開展低碳電力建設(shè)。然而,目前的很多低碳電力研究如:計及低碳資源的機組組合、計及低碳資源的經(jīng)濟調(diào)度以及碳捕獲與碳封存技術(shù)等,都只關(guān)注了發(fā)電側(cè)的碳排放,卻沒有從電網(wǎng)側(cè)的角度出發(fā),展開低碳電網(wǎng)調(diào)度。目前,已經(jīng)有學(xué)者依據(jù)潮流追蹤法提出了電網(wǎng)側(cè)與輸電損耗有關(guān)的碳排放量的計算方法,為將電網(wǎng)側(cè)碳排放量控制與電網(wǎng)的運行控制和潮流控制進行深層次的聯(lián)系提供了可能。電力系統(tǒng)最優(yōu)碳-能復(fù)合流模型就是從電網(wǎng)側(cè)的利益出發(fā),以電網(wǎng)低碳、經(jīng)濟及安全運行為目標(biāo)所建立的優(yōu)化模型。然而,上述模型中,發(fā)電側(cè)和電網(wǎng)側(cè)只關(guān)心自己的碳足跡和碳排放,無疑會造成碳排放的雙重計算,因此,亟需將電力系統(tǒng)的碳排放總量在發(fā)電側(cè)、電網(wǎng)側(cè)以及用戶側(cè)之間進行合理分?jǐn)偂?/p>
此外,電力系統(tǒng)的最優(yōu)碳-能復(fù)合流模型為一多約束多變量的非線性規(guī)劃問題,傳統(tǒng)的牛頓法、內(nèi)點法以及二次規(guī)劃法等過分依賴于確定的數(shù)學(xué)模型;而新興的人工智能算法如蟻群算法、人工蜂群算法、遺傳算法、粒子群算法以及強化學(xué)習(xí)算法等,又因為所解決的問題較為復(fù)雜而迭代緩慢,甚至因“維數(shù)災(zāi)難”而無法尋優(yōu)。
技術(shù)實現(xiàn)要素:
:
本申請?zhí)岢鲆环N基于多元文化遷移帝國主義競爭強化學(xué)習(xí)算法的電力系統(tǒng)最優(yōu)碳-能復(fù)合流求解方法。通過在電力系統(tǒng)最優(yōu)碳-能復(fù)合流模型中引入碳排放責(zé)任分?jǐn)倷C制,對發(fā)電側(cè)、電網(wǎng)側(cè)、用戶側(cè)的碳排放進行合理核算。通過建立文化矩陣,以及帝國內(nèi)外的競爭機制、帝國間文化交流機制和多元文化遷移機制,對電網(wǎng)側(cè)的無功功率進行快速合理分配,實現(xiàn)電網(wǎng)低碳、經(jīng)濟和安全運行。
為了解決上述技術(shù)問題,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:一種基于帝國主義競爭算法的碳-能復(fù)合流求解方法,通過采用基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法來對電力系統(tǒng)的碳-能復(fù)合流進行優(yōu)化,其特征在于,包括以下步驟;
步驟s1:初始化帝國主義競爭算法參數(shù);初始化帝國個數(shù)、帝國主義國家個數(shù)及其殖民地國家個數(shù);
步驟s2:獲取發(fā)電機出力參數(shù)、機端電壓參數(shù)、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)參數(shù)、變壓器參數(shù)、無功補償裝置參數(shù)以及源任務(wù)負(fù)荷參數(shù);
步驟s3:獲取新優(yōu)化任務(wù)的負(fù)荷參數(shù);
步驟s4:根據(jù)電力系統(tǒng)碳-能復(fù)合流優(yōu)化目標(biāo)分為有功網(wǎng)損目標(biāo)、電網(wǎng)側(cè)碳排放目標(biāo)以及電壓穩(wěn)定目標(biāo),加權(quán)后作為適應(yīng)度函數(shù),具體如下式所示:
有功網(wǎng)損目標(biāo):
電網(wǎng)側(cè)碳排放目標(biāo):cg=αpcloss+(1-βc)αpcl
其中,
電壓穩(wěn)定目標(biāo):
適應(yīng)度函數(shù):
式中,μ1、μ2、μ3為權(quán)重系數(shù),滿足:μ1∈[0,1],μ2∈[0,1],μ3∈[0,1],μ1+μ2+μ3=1;vi和vj分別是節(jié)點i和節(jié)點j的電壓幅值;θij是節(jié)點i和節(jié)點j的相角差;vimax、vimin分別是負(fù)荷節(jié)點i的電壓上下限;bij、gij分別為線路i-j的電導(dǎo)和電納;ajw(-1)是發(fā)電機w在節(jié)點j處的有功注入權(quán)重;δpij是線路i-j的有功損耗;pj’是等效無損網(wǎng)絡(luò)中j節(jié)點總有功注入;nl表示線路集合;
步驟s5:根據(jù)電力系統(tǒng)的潮流約束、電壓穩(wěn)定約束、無功補償容量約束以及其他約束條件,確定基本電力系統(tǒng)碳-能復(fù)合流模型,如下式所示:
式中:x為控制變量向量,包括發(fā)電機機端電壓、有載調(diào)壓變壓器分接頭位置、無功補償裝置的補償容量等;pgi、qgi分別代表節(jié)點i的發(fā)電有功輸出和無功輸出;pdi、qdi分別代表節(jié)點i的有功需求和無功需求;qci、vi分別為節(jié)點i的無功補償容量和電壓;tk為變壓器分接頭變比;sl為第l條線路的復(fù)功率;ni為節(jié)點集合;ng為機組集合;nc為無功補償裝置集合;nt為變壓器分接頭集合;
步驟s6:根據(jù)基本電力系統(tǒng)碳-能復(fù)合流模型及約束條件初始化可控變量,所述可控變量包括:發(fā)電機機端電壓、無功補償裝置容量以及變壓器變比;
步驟s7:對上述步驟中的當(dāng)前任務(wù)進行分類,若為源任務(wù),則隨機形成源任務(wù)初始文化矩陣;若為新任務(wù),則基于多元文化遷移提煉出新任務(wù)初始文化矩陣,新任務(wù)初始文化矩陣從源任務(wù)最優(yōu)文化矩陣得到;設(shè)源任務(wù)最優(yōu)文化矩陣為
且有:
式中:reh為針對第e個帝國,第h個源任務(wù)和新任務(wù)之間的相似度,滿足0≤reh≤1;步驟s8:各尋優(yōu)國家根據(jù)所屬帝國的文化矩陣進行動作選擇,進而求得其適應(yīng)度函數(shù),動作選擇機制如下式所示:
式中:ag為貪婪動作,即文化價值最大的動作,滿足:
步驟s9:確定各帝國的帝國主義國家,如下式所示:
式中:impe為帝國e的帝國主義國家;couej為帝國e中的第j個國家(包括帝國主義國家和殖民地);
步驟s10:各國家與環(huán)境交互后得到其立即獎勵函數(shù)值,如下式所示:
式中:k為獎勵常數(shù),滿足k>0;saeimp為帝國e中帝國主義國家的狀態(tài)-動作對集合;
步驟s11:各個尋優(yōu)國家展開有序?qū)?yōu),共同更新文化矩陣,如下式所示:
式中:α是文化學(xué)習(xí)因子;γ為折扣因子;上標(biāo)i和j分別代表第i個文化矩陣(即第i個可控變量)及第j個國家(帝國主義國家或殖民地國家);e是第e個帝國;qe表示帝國e的文化矩陣,r(sk,sk+1,ak)為尋優(yōu)國家由狀態(tài)sk經(jīng)動作ak轉(zhuǎn)移到狀態(tài)sk+1所獲得的立即獎勵函數(shù)值;(sk,ak)是第k次迭代的狀態(tài)-動作對;je是第e個帝國的國家集合;i是可控變量集合;e是帝國集合;ai和ai分別為可控變量xi的可選動作值和動作集合;
步驟s12:帝國間文化交流:落后帝國向最強帝國展開不同程度的文化學(xué)習(xí),最強帝國引導(dǎo)落后帝國學(xué)習(xí)較先進的文化,加快尋優(yōu)進程,如下式所示:
式中:de是帝國e與最強勢力帝國之間標(biāo)準(zhǔn)化文化差異;emp是勢力最強的帝國;步驟s13:通過帝國間競爭,占領(lǐng)最弱帝國的最弱殖民地,最強帝國可獲得侵占權(quán),如下式所示:
式中:σ0為最強帝國侵占因子(σ0為常數(shù),且滿足σ0∈[0,1])eag為侵占國;σ為一個在區(qū)間[0,1]內(nèi)均勻分布的隨機數(shù);pe為帝國e的爭奪實力;tpmax為最弱帝國的總勢力;
步驟s14:判斷是否達(dá)到最大迭代次數(shù),若達(dá)到,輸出發(fā)電機端電壓、無功補償裝置容量及變壓器變比的控制策略;否則,返回步驟s8,迭代繼續(xù)進行。
作為優(yōu)選,所述步驟s7中reh越大,新任務(wù)從源任務(wù)h最優(yōu)文化矩陣中獲取的信息就越多,為使得源任務(wù)歷史學(xué)習(xí)經(jīng)驗得以最大化利用,reh如下式所示:
|lde|=2e
式中:lde是帝國e的源任務(wù)集合,表征與帝國e的新任務(wù)最相似的2e個源任務(wù);pdnt為新任務(wù)的有功負(fù)荷;δpde,max是lde中的任務(wù)與新任務(wù)的最大有功偏差值;tf是遷移因子;相似度滿足:re1+re2+…+reh=1。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益之處是:本發(fā)明通過采用基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法來對電力系統(tǒng)的碳-能復(fù)合流進行優(yōu)化,并且,在電力系統(tǒng)碳-能復(fù)合流模型中考慮電力生產(chǎn)商與電力消費者之間的碳排放責(zé)任分?jǐn)?,避免碳排放的雙重核算;各個帝國采用強化學(xué)習(xí)算法中的值函數(shù)矩陣作為其文化矩陣,各尋優(yōu)國家通過與環(huán)境的相互作用對文化矩陣進行更新,并依據(jù)文化矩陣進行動作選擇以提高策略的全局性;文化矩陣中的知識會被實時存儲并通過多元文化遷移以提高后續(xù)新任務(wù)的尋優(yōu)效率;另外,采用帝國內(nèi)外的競爭機制提升殖民地的多樣性,并令落后帝國向最強帝國進行文化學(xué)習(xí)以加快尋優(yōu)進程;所采用的基于文化遷移的帝國主義競爭強化學(xué)習(xí)算法是一種較新的智能算法,相對于其它以遺傳算法、蟻群算法以及粒子群算法等的人工智能方法,具有收斂速度快、全局收斂性更強以及穩(wěn)定性更高等優(yōu)點,從而實現(xiàn)大規(guī)模電力系統(tǒng)的快速碳-能復(fù)合流優(yōu)化。
附圖說明:
下面結(jié)合附圖對本發(fā)明進一步說明。
圖1為本發(fā)明方法的流程圖;
圖2為所述實時例的電網(wǎng)拓?fù)浼盎拘畔⑹疽鈭D;
圖3為所示實施例的源任務(wù)點及新任務(wù)日負(fù)荷曲線。
具體實施方式:
下面結(jié)合附圖及具體實施方式對本發(fā)明進行詳細(xì)描述:
請參考圖1、圖2和圖3所示,本發(fā)明的一個實施方式提供一種基于帝國主義競爭算法的碳-能復(fù)合流求解方法,是基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法的電力系統(tǒng)最優(yōu)碳-能復(fù)合流求解方法,該實施方式從電網(wǎng)側(cè)的角度出發(fā),通過對電網(wǎng)側(cè)無功功率的合理分配,實現(xiàn)電網(wǎng)低碳、經(jīng)濟及安全運行;算例中把目標(biāo)函數(shù)中權(quán)重系數(shù)μ1、μ2、μ3、都設(shè)為1,表示經(jīng)濟性、低碳性和安全性對于電網(wǎng)同等重要,該方法包括以下步驟:
步驟s1,初始化算法參數(shù);
基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法的尋優(yōu)效果受到文化學(xué)習(xí)因子α、折扣因子γ、勢力權(quán)重系數(shù)ξ、最強帝國侵占因子σ0、貪婪探索率ε0、獎勵常數(shù)k、懲罰因子η、帝國集合初始大小|e|0、帝國e的國家集合初始大小|je|0和遷移因子tf等的影響,將上述參數(shù)的初始值設(shè)置表1所示:
表1icrl參數(shù)設(shè)置
步驟s2,獲取發(fā)電機出力參數(shù)、機端電壓參數(shù)、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)參數(shù)、變壓器參數(shù)、無功補償裝置參數(shù)以及源任務(wù)負(fù)荷參數(shù)。
發(fā)電機出力參數(shù)及機端電壓參數(shù)由matlab的matpower程序包計算得到,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)參數(shù)、變壓器參數(shù)及無功補償裝置參數(shù)如圖2所示,源任務(wù)為從日負(fù)荷曲線中選取出來的典型負(fù)荷斷面,如圖3所示。
步驟s3,獲取新優(yōu)化任務(wù)的負(fù)荷參數(shù),新優(yōu)化任務(wù)的負(fù)荷參數(shù)由日負(fù)荷曲線獲得,如圖3所示。
步驟s4,根據(jù)電力系統(tǒng)碳-能復(fù)合流優(yōu)化目標(biāo)分為有功網(wǎng)損目標(biāo)、電網(wǎng)側(cè)碳排放目標(biāo)以及電壓穩(wěn)定目標(biāo),加權(quán)后作為適應(yīng)度函數(shù),具體如下:
有功網(wǎng)損目標(biāo):
電網(wǎng)側(cè)碳排放目標(biāo):cg=αpcloss+(1-βc)αpcl
其中,
電壓穩(wěn)定目標(biāo):
適應(yīng)度函數(shù):
式中,μ1、μ2、μ3為權(quán)重系數(shù),滿足:μ1∈[0,1],μ2∈[0,1],μ3∈[0,1],μ1+μ2+μ3=1;vi和vj分別是節(jié)點i和節(jié)點j的電壓幅值;θij是節(jié)點i和節(jié)點j的相角差;vimax、vimin分別是負(fù)荷節(jié)點i的電壓上下限;bij、gij分別為線路i-j的電導(dǎo)和電納;ajw(-1)是發(fā)電機w在節(jié)點j處的有功注入權(quán)重;δpij是線路i-j的有功損耗;pj’是等效無損網(wǎng)絡(luò)中j節(jié)點總有功注入;nl表示線路集合。αp是生產(chǎn)商責(zé)任分?jǐn)傁禂?shù),滿足0≤αp≤1,表征發(fā)電廠分?jǐn)偊羛配額的碳排放至電網(wǎng)側(cè);βc是消費者責(zé)任分?jǐn)傁禂?shù),滿足0≤βc≤1,表征電網(wǎng)側(cè)分?jǐn)偊耤配額的碳排放量至用戶側(cè);je是第e個帝國的國家集合。
步驟s5,由電力系統(tǒng)潮流約束、電壓穩(wěn)定約束、無功補償容量約束以及其他約束條件,確定基本電力系統(tǒng)碳-能復(fù)合流模型,如下式所示:
式中:x為控制變量向量,包括發(fā)電機機端電壓、有載調(diào)壓變壓器分接頭位置、無功補償裝置的補償容量等;pgi、qgi分別代表節(jié)點i的發(fā)電有功輸出和無功輸出;pdi、qdi分別代表節(jié)點i的有功需求和無功需求;qci、vi分別為節(jié)點i的無功補償容量和電壓;tk為變壓器分接頭變比;sl為第l條線路的復(fù)功率;ni為節(jié)點集合;ng為機組集合;nc為無功補償裝置集合;nt為變壓器分接頭集合。
步驟s6,根據(jù)基本電力系統(tǒng)碳-能復(fù)合流模型及約束條件初始化可控變量,包括:發(fā)電機機端電壓、無功補償裝置容量以及變壓器變比,初始值采用matlab中matpower軟件包中‘case57’文件所給定的初始值;
步驟s7,對當(dāng)前任務(wù)進行分類,若為源任務(wù),則隨機形成源任務(wù)初始文化矩陣;若為新任務(wù),則基于多元文化遷移提煉出新任務(wù)初始文化矩陣。
設(shè)源任務(wù)最優(yōu)文化矩陣為
且有:
式中:reh為針對第e個帝國,第h個源任務(wù)和新任務(wù)之間的相似度,滿足0≤reh≤1。reh越大,新任務(wù)從源任務(wù)h最優(yōu)文化矩陣中獲取的信息就越多。為了防止不合理的文化遷移對在線學(xué)習(xí)帶來的負(fù)面影響,各個帝國所學(xué)習(xí)的源任務(wù)的個數(shù)不盡相同,因此,總有一個帝國以最合理的方式占展開文化遷移,使得源任務(wù)歷史學(xué)習(xí)經(jīng)驗得以最大化利用,如下式所示:
|lde|=2e
式中:lde是帝國e的源任務(wù)集合,表征與帝國e的新任務(wù)最相似的2e個源任務(wù),pdnt為新任務(wù)的有功負(fù)荷;δpde,max是lde中的任務(wù)與新任務(wù)的最大有功偏差值;tf是遷移因子;相似度滿足:re1+re2+…+reh=1。
步驟s8,各尋優(yōu)國家根據(jù)所屬帝國的文化矩陣進行動作選擇,進而求得其適應(yīng)度函數(shù),動作選擇機制如下式所示:
式中:ag為貪婪動作,即文化價值最大的動作,滿足:
步驟s9,帝國內(nèi)競爭:確定各帝國的帝國主義國家。各個國家的勢力由其適應(yīng)度函數(shù)值的大小來決定,適應(yīng)度函數(shù)值越大,勢力越小,因此,每次迭代中適應(yīng)度函數(shù)值最小的國家為當(dāng)前帝國內(nèi)的帝國主義國家,而其他國家被迫淪為殖民地。即:
式中:impe為帝國e的帝國主義國家;couej為帝國e中的第j個國家(包括帝國主義國家和殖民地)。
步驟s10,各國家與環(huán)境交互后得到其立即獎勵函數(shù)值,如下式所示:
式中:k為獎勵常數(shù),滿足k>0;saeimp為帝國e中帝國主義國家的狀態(tài)-動作對集合。
步驟s11,為避免經(jīng)典強化學(xué)習(xí)中的“維數(shù)災(zāi)難”,令每個國家對每個變量都建立文化矩陣,在上一個變量確定的情況下進行下一個變量的動作選擇;由此,上一個變量的既定動作即為下一個變量的狀態(tài),各個尋優(yōu)國家沿著這樣的狀態(tài)-動作鏈展開有序?qū)?yōu),共同更新文化矩陣,如下式所示:
式中:α是文化學(xué)習(xí)因子;γ為折扣因子;上標(biāo)i和j分別代表第i個文化矩陣(即第i個可控變量)及第j個國家(帝國主義國家或殖民地國家);e是第e個帝國;qe表示帝國e的文化矩陣,r(sk,sk+1,ak)為尋優(yōu)國家由狀態(tài)sk經(jīng)動作ak轉(zhuǎn)移到狀態(tài)sk+1所獲得的立即獎勵函數(shù)值;(sk,ak)是第k次迭代的狀態(tài)-動作對;je是第e個帝國的國家集合;i是可控變量集合;e是帝國集合;ai和ai分別為可控變量xi的可選動作值和動作集合。
步驟s12,帝國間文化交流:落后帝國向最強帝國展開不同程度的文化學(xué)習(xí),引導(dǎo)落后帝國學(xué)習(xí)較先進的文化,加快尋優(yōu)進程,如下式所示:
式中:de是帝國e與最強勢力帝國之間標(biāo)準(zhǔn)化文化差異;emp是勢力最強的帝國。
步驟s13,通過帝國間競爭,占領(lǐng)最弱帝國的最弱殖民地。引入最強帝國侵占因子σ0(常數(shù),且滿足σ0∈[0,1]),使最強帝國可在一定概率內(nèi)直接獲得侵占權(quán),如下式所示:
式中:eag為侵占國;σ為一個在區(qū)間[0,1]內(nèi)均勻分布的隨機數(shù);pe為帝國e的爭奪實力;tpmax為最弱帝國的總勢力。
步驟s14,判斷是否達(dá)到最大迭代次數(shù),若達(dá)到,輸出發(fā)電機端電壓、無功補償裝置容量及變壓器變比的控制策略;否則,返回步驟s8,迭代繼續(xù)進行。
通過以上步驟就可以得到電網(wǎng)側(cè)最優(yōu)碳-能復(fù)合流的優(yōu)化方案,從電網(wǎng)側(cè)立場出發(fā),實現(xiàn)電網(wǎng)的低碳、經(jīng)濟和安全運行。
本發(fā)明的基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法的電力系統(tǒng)最優(yōu)碳-能復(fù)合流求解方法相對于現(xiàn)有技術(shù)具有如下的優(yōu)點及效果:
(1)本發(fā)明設(shè)計的基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法的電力系統(tǒng)最優(yōu)碳-能復(fù)合流求解方法,加入了對發(fā)電側(cè)、電網(wǎng)側(cè)和用電側(cè)之間的碳排放責(zé)任分?jǐn)偟目紤],避免了碳排放的雙重計算。
(2)本發(fā)明設(shè)計的基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法的電力系統(tǒng)最優(yōu)碳-能復(fù)合流求解方法,加入了文化矩陣,依據(jù)文化矩陣所進行的動作選擇將大幅提升解的全局性。
(3)本發(fā)明設(shè)計的基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法的電力系統(tǒng)最優(yōu)碳-能復(fù)合流求解方法,采用了相互聯(lián)系的狀態(tài)-動作鏈,有效避免了“維數(shù)災(zāi)難”。
(4)本發(fā)明設(shè)計的基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法的電力系統(tǒng)最優(yōu)碳-能復(fù)合流求解方法,采用了帝國間文化交流機制,使得落后帝國得以向勢力最強的帝國展開學(xué)習(xí),尋優(yōu)進程明顯加快。
(5)本發(fā)明設(shè)計的基于多元文化遷移的帝國主義競爭強化學(xué)習(xí)算法的電力系統(tǒng)最優(yōu)碳-能復(fù)合流求解方法,采用了多元文化遷移機制,使得各個帝國最大化地利用源任務(wù)的學(xué)習(xí)經(jīng)驗,不僅提高了尋優(yōu)速率,也使尋優(yōu)具有較高的穩(wěn)定性。
上所述實施例僅表達(dá)了本發(fā)明的幾種實施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。