国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種結(jié)合語(yǔ)法樹(shù)和圖網(wǎng)絡(luò)的方面級(jí)情感分析方法

      文檔序號(hào):40376517發(fā)布日期:2024-12-20 11:58閱讀:3來(lái)源:國(guó)知局
      一種結(jié)合語(yǔ)法樹(shù)和圖網(wǎng)絡(luò)的方面級(jí)情感分析方法

      本發(fā)明涉及自然語(yǔ)言處理技術(shù),特別涉及方面級(jí)情感分析技術(shù)。


      背景技術(shù):

      1、文本情感分析是一種文本分析技術(shù),也稱為觀點(diǎn)挖掘,是針對(duì)人們對(duì)實(shí)體表達(dá)的觀點(diǎn)、評(píng)價(jià)、態(tài)度和情感進(jìn)行計(jì)算的研究。文本情感分析可以按分析粒度分為篇章級(jí)情感分析、句子級(jí)情感分析和方面級(jí)情感分析。早期階段,篇章級(jí)和句子級(jí)情感分析任務(wù)是研究的重點(diǎn)。它們假設(shè)一段文本只有一種情感,并對(duì)給定文本進(jìn)行分析并判斷其整體的情感極性。情感極性用于確定文本中表達(dá)的情感傾向是正面、負(fù)面還是中立。然而,對(duì)文本進(jìn)行整體情感分析會(huì)掩蓋其細(xì)節(jié),且整體情感并不能反映人們對(duì)意見(jiàn)目標(biāo)的、細(xì)粒度的情感表達(dá)。如果只關(guān)注整體情感而忽略具體細(xì)節(jié),可能會(huì)在推薦系統(tǒng)、問(wèn)答系統(tǒng)等現(xiàn)實(shí)應(yīng)用中計(jì)算出有誤的結(jié)果。因此,為了進(jìn)行更完整的情感分析,系統(tǒng)需要發(fā)現(xiàn)文本評(píng)論的各個(gè)方面對(duì)象,并確定文本針對(duì)每個(gè)方面所表達(dá)的情感信息,這就是方面級(jí)情感分析技術(shù)。

      2、方面級(jí)情感分析任務(wù)的目標(biāo)是找到需要評(píng)價(jià)的目標(biāo)方面詞及其對(duì)應(yīng)的情感極性。目標(biāo)方面詞可以是從實(shí)際的評(píng)論文本中提取的,也可以是預(yù)定義的。

      3、方面級(jí)情感分析是旨在識(shí)別文本中對(duì)特定方面或?qū)嶓w的情感傾向,輸出該特定方面或?qū)嶓w的情感極性。這項(xiàng)技術(shù)在許多應(yīng)用領(lǐng)域都具有重要價(jià)值,例如產(chǎn)品評(píng)論分析、社交媒體輿情監(jiān)測(cè)等。

      4、在方面級(jí)情感分析中,可以使用bert模型進(jìn)行文本編碼和情感分類。首先,將文本輸入到bert模型中,利用預(yù)訓(xùn)練的語(yǔ)言表示能力,將文本轉(zhuǎn)換為高維的語(yǔ)義表示。然后,可以在bert輸出的語(yǔ)義表示上建立分類器,以識(shí)別文本中對(duì)特定方面的情感傾向。這個(gè)分類器可以是簡(jiǎn)單的全連接層神經(jīng)網(wǎng)絡(luò),也可以是更復(fù)雜的模型,根據(jù)具體情況進(jìn)行設(shè)計(jì)。

      5、使用bert模型的優(yōu)勢(shì)在于其強(qiáng)大的語(yǔ)言理解能力和上下文感知能力,使得模型能夠更準(zhǔn)確地理解文本的含義和情感傾向。通過(guò)在預(yù)訓(xùn)練模型的基礎(chǔ)上進(jìn)行微調(diào),可以在不需要大量標(biāo)注數(shù)據(jù)的情況下,獲得在方面級(jí)情感分析任務(wù)上的良好性能。然而基于序列數(shù)據(jù)結(jié)構(gòu)的bert并不能由圖結(jié)構(gòu)組成的句信息,也就缺少了捕捉與目標(biāo)方面詞相關(guān)的上下文能力。


      技術(shù)實(shí)現(xiàn)思路

      1、本發(fā)明所要解決的技術(shù)問(wèn)題是,針對(duì)現(xiàn)有技術(shù)中訓(xùn)練時(shí)未通過(guò)類似于句子語(yǔ)法結(jié)構(gòu)捕捉句子深層的語(yǔ)義的現(xiàn)狀,提供一種提升對(duì)句子上下文的分析能力的方面級(jí)情感分析方法。

      2、本發(fā)明解決上述技術(shù)問(wèn)題采用的技術(shù)方案是,一種結(jié)合語(yǔ)法樹(shù)和圖網(wǎng)絡(luò)的方面級(jí)情感分析方法,包括以下步驟:

      3、a、訓(xùn)練過(guò)程:

      4、a1、獲取文本樣本及其對(duì)應(yīng)的目標(biāo)方面詞,并對(duì)進(jìn)文本樣本進(jìn)行預(yù)處理;

      5、a2、通過(guò)bert編碼器分別采用多個(gè)transformer結(jié)構(gòu)從預(yù)處理后的文本樣本進(jìn)行分詞得到詞向量并輸出至圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí);

      6、a3、根據(jù)接收到的詞向量構(gòu)造方面感知注意力機(jī)制及自注意力機(jī)制;將方面感知注意力機(jī)制系數(shù)及自注意力機(jī)制系數(shù)相加作為初始化矩陣;根據(jù)句法依賴樹(shù)中各個(gè)詞的依賴距離構(gòu)造句法依賴鄰接矩陣;根據(jù)語(yǔ)義組成樹(shù)中各個(gè)詞的組成距離構(gòu)造語(yǔ)義組成鄰接矩陣;將初始化矩陣、句法依賴鄰接矩陣與語(yǔ)義組成鄰接矩陣進(jìn)行加法融合得到包含圖信息的掩碼矩陣并輸出至圖神經(jīng)網(wǎng)絡(luò);圖神經(jīng)網(wǎng)絡(luò)根據(jù)接收詞向量以及掩碼矩陣,從文本的句法依賴結(jié)構(gòu)和語(yǔ)義組成結(jié)構(gòu)中提取與目標(biāo)方面詞相關(guān)的語(yǔ)義特征;將語(yǔ)義特征輸出至全連接層,全連接層輸出目標(biāo)方面詞的情感極性預(yù)測(cè)概率分布;

      7、a4、使用梯度下降法,以目標(biāo)方面詞的情感極性標(biāo)簽為約束,優(yōu)化所述bert編碼器以及圖神經(jīng)網(wǎng)絡(luò)的參數(shù),獲得訓(xùn)練好的bert模型和圖神經(jīng)網(wǎng)絡(luò);

      8、b、預(yù)測(cè)過(guò)程:

      9、b1、對(duì)待預(yù)測(cè)文字?jǐn)?shù)據(jù)進(jìn)行預(yù)處理,并確認(rèn)需要預(yù)測(cè)的目標(biāo)方面詞;

      10、b2、通過(guò)訓(xùn)練好的bert模型對(duì)經(jīng)過(guò)預(yù)處理的待預(yù)測(cè)文字?jǐn)?shù)據(jù)進(jìn)行特征提取獲得詞向量;

      11、b3、將詞向量輸入訓(xùn)練好的圖神經(jīng)網(wǎng)絡(luò),圖神經(jīng)網(wǎng)絡(luò)輸出目標(biāo)方面詞的情感極性。

      12、本發(fā)明的有益效果是:

      13、(1)本發(fā)明可以根據(jù)輸入的文本自動(dòng)判定其中給定方面的情感極性。用戶可以直接使用該情感極性判定相關(guān)內(nèi)容,減輕工作負(fù)擔(dān),減少錯(cuò)誤。

      14、(2)在訓(xùn)練過(guò)程中,不需要提前進(jìn)行文本預(yù)處理,以及分詞操作,而僅需要獲取文字作為訓(xùn)練數(shù)據(jù),減少了工作量,也避免了人工從原始文字進(jìn)行處理時(shí)容易造成的信息丟失的問(wèn)題。

      15、(3)使用的基于語(yǔ)法樹(shù)結(jié)構(gòu)的圖神經(jīng)網(wǎng)絡(luò)性能要顯著優(yōu)于以往lstm網(wǎng)絡(luò)以及普通的預(yù)訓(xùn)練模型:首先,圖神經(jīng)網(wǎng)絡(luò)比lstm網(wǎng)絡(luò)在網(wǎng)絡(luò)結(jié)構(gòu)上更復(fù)雜,網(wǎng)絡(luò)對(duì)文本與樹(shù)結(jié)構(gòu)相關(guān)的語(yǔ)義特征抽取能力遠(yuǎn)比lstm網(wǎng)絡(luò)強(qiáng),使得系統(tǒng)生成的最終情感極性預(yù)測(cè)也更準(zhǔn)確。



      技術(shù)特征:

      1.一種結(jié)合語(yǔ)法樹(shù)和圖網(wǎng)絡(luò)的方面級(jí)情感分析方法,其特征在于,包括以下步驟:

      2.如權(quán)利要求1所述方法,其特征在于,步驟a1中的對(duì)進(jìn)文本樣本進(jìn)行預(yù)處理具體包括:將文本樣本中的句子提取出來(lái),標(biāo)注句子中的目標(biāo)方面詞以及對(duì)應(yīng)的情感極性標(biāo)簽;并控制句子最大長(zhǎng)度,保證句子跨度統(tǒng)一。

      3.如權(quán)利要求1所述方法,其特征在于,方面感知注意力機(jī)制系數(shù)aasp的計(jì)算為:

      4.權(quán)利要求1所述方法,其特征在于,根據(jù)句法依賴樹(shù)中各個(gè)詞的依賴距離構(gòu)造句法依賴鄰接矩陣中各個(gè)詞的依賴距離構(gòu)造句法依賴鄰接矩陣具體為:

      5.權(quán)利要求1所述方法,其特征在于,掩碼矩陣具體為:

      6.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,其特征在于,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1所述方法的步驟。


      技術(shù)總結(jié)
      為解決現(xiàn)有技術(shù)中根據(jù)順序文本序列難以捕捉與目標(biāo)方面詞相關(guān)上下文能力的問(wèn)題,本發(fā)明提供一種結(jié)合語(yǔ)法樹(shù)和圖網(wǎng)絡(luò)的方面級(jí)情感分析方法,包括訓(xùn)練過(guò)程和預(yù)測(cè)過(guò)程;在訓(xùn)練過(guò)程,首先獲取文本樣本數(shù)據(jù)并進(jìn)行預(yù)處理;接著,通過(guò)BERT編碼器對(duì)文本數(shù)據(jù)進(jìn)行詞向量提取;再通過(guò)計(jì)算方面感知注意力、自注意力、句法依賴樹(shù)和語(yǔ)義組成樹(shù)構(gòu)成掩碼矩陣;將詞向量和掩碼矩陣輸入到圖神經(jīng)網(wǎng)絡(luò)中并將最終的輸出作為情感極性預(yù)測(cè)結(jié)果,采用梯度下降法訓(xùn)練模型參數(shù),獲得訓(xùn)練好的BERT編碼器模型和圖神經(jīng)網(wǎng)絡(luò)。應(yīng)用在預(yù)測(cè)過(guò)程,通過(guò)已經(jīng)學(xué)習(xí)到通過(guò)解析語(yǔ)法樹(shù)結(jié)構(gòu)能力的圖神經(jīng)網(wǎng)絡(luò)對(duì)從文本提取出的詞向量進(jìn)行預(yù)測(cè),最終獲得目標(biāo)方面詞的情感極性。

      技術(shù)研發(fā)人員:許毅,詹思瑜,王勇,文祎,董悅洲,楊涵杰
      受保護(hù)的技術(shù)使用者:電子科技大學(xué)
      技術(shù)研發(fā)日:
      技術(shù)公布日:2024/12/19
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1