1.一種基于多級分類層次注意力的遠程監(jiān)督關系抽取方法,其特征在于,包括如下步驟:
2.根據(jù)權利要求1所述的基于多級分類層次注意力的遠程監(jiān)督關系抽取方法,其特征在于,所述步驟1中,句子的特征提取可以由基于深度學習的句子編碼器完成,例如cnn、pcnn等。
3.根據(jù)權利要求1所述的基于多級分類層次注意力的遠程監(jiān)督關系抽取方法,其特征在于,所述步驟2中,層次注意力以句子級選擇注意力為基礎,利用關系的層次結構來提升長尾關系的抽取效果;在真實關系r對應的每個層次使用一次句子級選擇注意力,將每個層次得到的包表示進行拼接操作,輸入到softmax分類器中進行分類;通過注意力查詢機制為句子包生成歸一化的權重分布,然后采用加權求和的方式獲得整個包的包表示,最后使用包表示為對應實體對預測一個關系標簽;
4.根據(jù)權利要求1所述的基于多級分類層次注意力的遠程監(jiān)督關系抽取方法,其特征在于,所述步驟3中,層次結構編碼器把層次結構看作無向圖,采用gats來對關系的層次結構進行建模,輸出感知全局結構的關系嵌入;
5.根據(jù)權利要求1所述的基于多級分類層次注意力的遠程監(jiān)督關系抽取方法,其特征在于,所述步驟4中,多級分類框架接在層次注意力后,以各級包表示為輸入,執(zhí)行多次的局部分類;
6.根據(jù)權利要求1所述的基于多級分類層次注意力的遠程監(jiān)督關系抽取方法,其特征在于,所述步驟5中,經(jīng)過多級分類后,每級都會產(chǎn)生一個分類的概率分布,α(i)表示第i級所有關系的分類概率分布;定義第i層的預測概率向量為ni表示關系層次結構中第i層關系節(jié)點的數(shù)量;根據(jù)α(i)和關系的層次結構,可以為上一層級構造出期望的概率分布具體構造方法是,如果在關系層次結構中有一個關系節(jié)點為c,該節(jié)點有nc個孩子節(jié)點,那么關系c的分類概率值是這nc個子關系概率值的和;通過這種方式,可以使用下一層級的概率分布構造出上一層級期望得到的概率分布當期望的與真實的α(i-1)間的分布差異性越小,則相鄰層級的分類結果越合理;通過這種分布上的約束,讓獨立的局部分類間產(chǎn)生聯(lián)系,從而使多級分類過程成為一個整體;為滿足局部概率約束,為模型定義了如下的目標函數(shù):
7.根據(jù)權利要求1所述的基于多級分類層次注意力的遠程監(jiān)督關系抽取方法,其特征在于,所述步驟6中,對傳統(tǒng)的交叉熵損失函數(shù)進行改進,形成了層次損失函數(shù),其定義如下: