国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于pad的漢語詞匯情感建模方法

      文檔序號(hào):6424023閱讀:612來源:國知局
      專利名稱:一種基于pad的漢語詞匯情感建模方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種情感建模方法,尤其是基于PAD模型的漢語詞匯的情感建模方法,屬于情感計(jì)算領(lǐng)域。
      背景技術(shù)
      人與計(jì)算機(jī)交互的很多媒介都是以文本為基礎(chǔ)的。文本中蘊(yùn)涵著豐富的情感信息,對(duì)應(yīng)著人類相應(yīng)的心理狀態(tài)。因此文本情感提取的研究在情感計(jì)算和智能交互領(lǐng)域有著重要意義。而文本情感的提取必須依賴于良好的情感模型,這樣才能更加準(zhǔn)確的識(shí)別用戶的情感狀態(tài)。漢語中有大量描述人類情緒和情感的詞匯,如喜悅,樂觀,憂郁。這些情感詞匯都從不同的角度反映了人的心理狀態(tài)。雖然人們可以通過個(gè)人心理感受來區(qū)分這些詞匯,但是如果期望能夠計(jì)算機(jī)也能夠準(zhǔn)確的區(qū)分這些詞匯,就需要對(duì)這些詞匯進(jìn)行量化以及聚類分析,從而實(shí)現(xiàn)情感建模。PAD模型是Mehrabian和Russell提出的維度測量模型。該模型將情緒分為愉悅度(Pleasure)——表示個(gè)體情感狀態(tài)的政府特性,激活度(Arousal)——表示個(gè)體神經(jīng)生理激活水平;優(yōu)勢度(Dominance)——表示個(gè)體對(duì)情境和他人的控制狀態(tài)。PAD模型不但給出了對(duì)情感空間進(jìn)行描述的理論構(gòu)想,同時(shí)采用量化的方法試圖建立情感空間中各種情緒范疇的定位和關(guān)系。在情感建模領(lǐng)域,目前尚未對(duì)漢語詞匯進(jìn)行針對(duì)性的建模,這在一定程度上制約了漢語文本情感識(shí)別研究的進(jìn)一步發(fā)展。而結(jié)合PAD模型的漢語詞匯情感建模方法可以解決文本情感識(shí)別領(lǐng)域中缺少情感模型這一問題。因此,提出一種有效的漢語詞匯情感建模方法具有很強(qiáng)的現(xiàn)實(shí)意義。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于提出一種能夠?qū)h語詞匯進(jìn)行情感建模的方法,以解決計(jì)算機(jī)定量識(shí)別詞匯情感的問題。本發(fā)明提供了一種基于PAD的漢語詞匯情感建模方法,包括以下步驟步驟1 建立漢語情感詞匯原始數(shù)據(jù)庫,從報(bào)紙,文摘,博客,社交網(wǎng)站及BBS等多種渠道收集表達(dá)情感的詞匯。步驟2 對(duì)漢語情感詞匯原始數(shù)據(jù)庫中的詞匯分別進(jìn)行P,A,D三個(gè)維度的標(biāo)注,標(biāo)注的范圍為-4到+4。為了使標(biāo)注客觀準(zhǔn)確,每個(gè)維度都由三個(gè)不同的評(píng)價(jià)者進(jìn)行標(biāo)注,每個(gè)詞匯都進(jìn)行三次不同的評(píng)價(jià)。每個(gè)詞匯的P、A、D量度值為這三次評(píng)價(jià)的平均值并進(jìn)行歸一化處理,使其值在(-1,+1)之間。步驟3 對(duì)所標(biāo)注的全部情感詞匯按其P、A、D量值進(jìn)行層次聚類分析。為了取得更好的聚類效果,采用歐氏距離作為聚類的距離度量,設(shè)第i個(gè)詞匯的P、A、D量度為(Pi, apcQ,則其歐氏距離如下所示
      3
      dist] = ^ipi -Pj f + (at -a} f + {dt -Cij)2對(duì)于聚類算法,則采用加權(quán)平均距離法(WPGMA)對(duì)每個(gè)集群進(jìn)行聚類。設(shè)每個(gè)集群的平均距離為Ci,則其加權(quán)平均距離如下所示Ci(CqCs) = ^diCl,Cs) + d(C ^Cq)]最后,可根據(jù)實(shí)際需求選擇聚類的個(gè)數(shù)N。步驟4 如果有一個(gè)原始數(shù)據(jù)庫中沒有的新詞,則先對(duì)其進(jìn)行PAD維度的標(biāo)注,然后計(jì)算其與最終聚類集群的歐氏距離,并將其歸類到歐氏距離最小的那個(gè)集群。本發(fā)明提供的漢語詞匯情感建模方法,其優(yōu)點(diǎn)和積極效果在于1該方法是基于情感心理學(xué)理論,從多個(gè)角度對(duì)詞匯情感進(jìn)行判別。2該方法解決了漢語情感詞匯沒有準(zhǔn)確度量與分類,不便于進(jìn)行計(jì)算機(jī)識(shí)別的問題。


      圖1漢語詞匯情感建模流程2立方空間聚類結(jié)果圖
      具體實(shí)施例方式本發(fā)明的基本思想是通過對(duì)情感詞匯進(jìn)行P、A、D三個(gè)維度的標(biāo)注,將詞匯的情感特征進(jìn)行量化,并根據(jù)層次聚類的方法將其進(jìn)行聚類分析,最終完成詞匯的情感建模。根據(jù)以上思想,本發(fā)明的流程圖如圖1所示。下面通過一個(gè)具體的實(shí)例說明該建模方法的
      具體實(shí)施例方式1、通過各種渠道收集88個(gè)情感詞匯,如下所示
      權(quán)利要求
      1. 一種基于PAD的漢語詞匯情感建模方法,其主要特征在于 步驟1 建立漢語情感詞匯原始數(shù)據(jù)庫,從報(bào)紙,文摘,博客,社交網(wǎng)站及BBS等多種渠道收集表達(dá)情感的詞匯。步驟2 對(duì)漢語情感詞匯原始數(shù)據(jù)庫中的詞匯分別進(jìn)行P、A、D三個(gè)維度的標(biāo)注,標(biāo)注的范圍為-4到+4 ;為了使標(biāo)注客觀準(zhǔn)確,本發(fā)明定義每個(gè)維度都由三個(gè)不同的評(píng)價(jià)者進(jìn)行標(biāo)注,每個(gè)詞匯都進(jìn)行三次不同的評(píng)價(jià);每個(gè)詞匯的P、A、D量度值為這三次評(píng)價(jià)的平均值并進(jìn)行歸一化處理,使其值在(_1,+1)之間。步驟3 對(duì)所標(biāo)注的全部情感詞匯按其P、A、D量值進(jìn)行層次聚類分析;為了取得更好的聚類效果,本發(fā)明采用歐氏距離作為聚類的距離度量,加權(quán)平均距離法作為聚類算法;并可以根據(jù)實(shí)際需求選擇聚類個(gè)數(shù)N。步驟4 如果有一個(gè)原始數(shù)據(jù)庫中沒有的新詞,則先對(duì)其進(jìn)行PAD維度的標(biāo)注,然后計(jì)算其與最終聚類集群的歐氏距離,并將其歸類到歐氏距離最小的那個(gè)集群。
      全文摘要
      本發(fā)明提出了一種基于PAD的漢語詞匯情感建模方法,可概括為(1)建立漢語情感詞匯原始數(shù)據(jù)庫;(2)對(duì)漢語情感詞匯原始數(shù)據(jù)庫中的詞匯分別進(jìn)行P、A、D三個(gè)維度的標(biāo)注,標(biāo)注的范圍為-4到+4;為了使標(biāo)注客觀準(zhǔn)確,本發(fā)明定義每個(gè)維度都由三個(gè)不同的評(píng)價(jià)者進(jìn)行標(biāo)注,每個(gè)詞匯都進(jìn)行三次不同的評(píng)價(jià);每個(gè)詞匯的P、A、D量度值為這三次評(píng)價(jià)的平均值并進(jìn)行歸一化處理,使其值在(-1,+1)之間;(3)對(duì)所標(biāo)注的全部情感詞匯按其P、A、D量值進(jìn)行層次聚類分析;為了取得更好的聚類效果,本發(fā)明采用歐氏距離作為聚類的距離度量,加權(quán)平均距離法作為聚類算法;并可以根據(jù)實(shí)際需求選擇聚類個(gè)數(shù)N;(4)如果有一個(gè)原始數(shù)據(jù)庫中沒有的新詞,則先對(duì)其進(jìn)行PAD維度的標(biāo)注,然后計(jì)算其與最終聚類集群的歐氏距離,并將其歸類到歐氏距離最小的那個(gè)集群。
      文檔編號(hào)G06F17/30GK102184232SQ20111012186
      公開日2011年9月14日 申請(qǐng)日期2011年5月11日 優(yōu)先權(quán)日2011年5月11日
      發(fā)明者毛峽, 江琳 申請(qǐng)人:北京航空航天大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1