技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種基于強化學(xué)習(xí)的多路徑傳輸協(xié)議擁塞控制方法,通過建立馬爾可夫決策過程,將擁塞控制形式化表示。用發(fā)送端的各個子流的擁塞窗口大小以及各個子流的RTT來表示各個子流當(dāng)前的網(wǎng)絡(luò)狀態(tài),定義發(fā)送端調(diào)整擁塞窗口和發(fā)送間隔的動作,建立目標(biāo)方程,以獲得最大平均吞吐量和最小平均時延為目的。通過建立網(wǎng)絡(luò)模型,模擬產(chǎn)生多種網(wǎng)絡(luò)環(huán)境。在不同的網(wǎng)絡(luò)環(huán)境中,通過不斷地試錯,對當(dāng)前網(wǎng)絡(luò)環(huán)境做所有的動作,然后從環(huán)境給出的反饋中學(xué)習(xí)并優(yōu)化動作。經(jīng)過大量的線下學(xué)習(xí),使得發(fā)送端可以在某一個狀態(tài)區(qū)域做出相應(yīng)的調(diào)整擁塞窗口大小和發(fā)送間隔的動作,以使得目標(biāo)方程的值最大。
技術(shù)研發(fā)人員:薛超婧;李文中;陸桑璐
受保護的技術(shù)使用者:南京大學(xué)
技術(shù)研發(fā)日:2017.05.22
技術(shù)公布日:2017.09.15