一種分析語言特征的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別涉及一種分析語言特征的方法及裝置。
【背景技術(shù)】
[0002]眾所周知,語言暴力在社會生活中隨處可見,近年來已經(jīng)成為語言學(xué)界研宄的熱門話題。語言暴力指用不合邏輯和法律規(guī)范的語言風(fēng)暴,從而以語言霸權(quán)的形式,孤立和剝奪他人的某種權(quán)利,對他人造成傷害。作為一種隱性暴力,它造成的傷害容易被人忽視或者遺忘。語言暴力通常是由強勢的一方向弱勢的一方發(fā)出的。例如:上級對下級,警察對百姓,醫(yī)生對病人,教師對學(xué)生,家長對子女,教練對隊員。
[0003]隨著社會的文明度的提高,通過對音頻文件分析出語言暴力,進而減少語言暴力顯得尤為重要。但是,目前分析音頻文件的方法是由分析人員人工進行分析的,人為因素較大,因此,分析音頻文件的方法存在準確度較低、效率較差的缺陷。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實施例提供一種分析語言特征的方法及裝置,用以解決現(xiàn)有技術(shù)中存在的準確度較低、效率較差的缺陷。
[0005]本發(fā)明實施例提供的具體技術(shù)方案如下:
[0006]第一方面,提供一種分析語言特征的方法,包括:
[0007]將所述待分析的音頻文件劃分為至少一個子文件;
[0008]針對所述至少一個子文件中的任意一子文件,對所述任意一子文件進行語義分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在語義維度的語言特征;
[0009]根據(jù)所述第一分析值確定所述任意一子文件的語言特征。
[0010]結(jié)合第一方面,在第一種可能的實現(xiàn)方式中,對所述任意一子文件進行語義分析之前,還包括:
[0011]獲取預(yù)設(shè)語音特征信息;或者
[0012]獲取指定音頻文件,并從所述指定音頻文件中獲取指定語音特征信息;
[0013]對所述任意一子文件進行語義分析,具體包括:
[0014]將所述任意一子文件中與所述預(yù)設(shè)語音特征信息或者與所述指定語音特征信息對應(yīng)的信息進行語義分析。
[0015]結(jié)合第一方面,以及第一方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,將所述待分析的音頻文件劃分為至少一個子文件,具體包括:
[0016]將所述待分析的音頻文件中對應(yīng)的對話主題為同一個對話主題的對話作為一個子文件;和/或
[0017]將所述待分析的音頻文件中對應(yīng)的對話間隔小于或者等于預(yù)設(shè)間隔的任意兩段對話作為一個子文件。
[0018]結(jié)合第一方面,以及第一方面的第一至第二種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,根據(jù)所述第一分析值確定所述任意一子文件的語言特征之前,還包括:
[0019]對所述任意一子文件進行語音分析,得到第二分析值,所述第二分析值用于表征所述任意一子文件在語音維度的語言特征;
[0020]根據(jù)所述第一分析值確定所述任意一子文件的語言特征,具體包括:
[0021]計算所述第一分析值與第一預(yù)設(shè)權(quán)重值的第一乘積,及所述第二分析值與第二預(yù)設(shè)權(quán)重值的第二乘積;
[0022]根據(jù)所述第一乘積和所述第二乘積之和確定所述任意一子文件的語言特征。
[0023]結(jié)合第一方面的第一至第三種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,對所述任意一子文件進行語音分析,具體包括:
[0024]對所述任意一子文件進行非物理屬性分析,獲得非物理屬性信息;和/或
[0025]對所述任意一子文件進行物理屬性分析,獲得物理屬性信息。
[0026]結(jié)合第一方面的第一至第三種或者第四種可能的實現(xiàn)方式,在第五種可能的實現(xiàn)方式中,對所述任意一子文件進行語音分析之前,還包括:
[0027]對所述任意一子文件進行場景識別,確定場景類型;
[0028]對所述任意一子文件進行語義分析,具體包括:
[0029]根據(jù)確定的場景類型對所述任意一子文件進行語義分析;
[0030]對所述任意一子文件進行語音分析,具體包括:
[0031]根據(jù)確定的場景類型對所述任意一子文件進行語音分析。
[0032]結(jié)合第一方面的第五種可能的實現(xiàn)方式,在第六種可能的實現(xiàn)方式中,計算所述第一分析值與第一預(yù)設(shè)權(quán)重值的第一乘積,及所述第二分析值與第二預(yù)設(shè)權(quán)重值的第二乘積之前,還包括:
[0033]根據(jù)確定的場景類型調(diào)整所述第一預(yù)設(shè)權(quán)重值和所述第二預(yù)設(shè)權(quán)重值。
[0034]結(jié)合第一方面,以及第一方面的第一至第二種,或者第五種可能的實現(xiàn)方式,在第七種可能的實現(xiàn)方式中,對所述任意一子文件進行語義分析,得到第一分析值之前,還包括:
[0035]對所述任意一子文件進行物理屬性分析,獲得物理屬性信息;
[0036]對所述任意一子文件進行語義分析,得到第一分析值之后,還包括:
[0037]根據(jù)所述物理屬性信息對所述第一分析值進行調(diào)整。
[0038]結(jié)合第一方面的第七種可能的實現(xiàn)方式,在第八種可能的實現(xiàn)方式中,根據(jù)所述物理屬性信息對所述第一分析值進行調(diào)整之前,還包括:
[0039]對所述任意一子文件進行場景識別,確定場景類型;
[0040]根據(jù)所述物理屬性信息對所述第一分析值進行調(diào)整,具體包括:
[0041]根據(jù)確定的場景類型、所述物理屬性信息對所述第一分析值進行調(diào)整。
[0042]結(jié)合第一方面,以及第一方面的第一至第二種,或者第五種可能的實現(xiàn)方式,在第九種可能的實現(xiàn)方式中,對所述任意一子文件進行語義分析,得到第一分析值之前,還包括:
[0043]對所述任意一子文件進行非物理屬性分析,獲得非物理屬性信息;
[0044]對所述任意一子文件進行語義分析,得到第一分析值之后,還包括:
[0045]根據(jù)所述非物理屬性信息對得到第一分析值進行調(diào)整。
[0046]結(jié)合第一方面的第九種可能的實現(xiàn)方式,在第十種可能的實現(xiàn)方式中,根據(jù)所述非物理屬性信息對得到第一分析值進行調(diào)整之前,還包括:
[0047]對所述任意一子文件進行場景識別,確定場景類型。
[0048]結(jié)合第一方面的第十種可能的實現(xiàn)方式,在第^^一種可能的實現(xiàn)方式中,對所述任意一子文件進行非物理屬性分析,獲得非物理屬性信息,具體包括:
[0049]根據(jù)確定的場景類型,對所述任意一子文件進行非物理屬性分析,獲得非物理屬性信息。
[0050]結(jié)合第一方面的第十或者第^^一種可能的實現(xiàn)方式,在第十二種可能的實現(xiàn)方式中,根據(jù)所述非物理屬性信息對得到第一分析值進行調(diào)整,具體包括:
[0051]根據(jù)確定的場景類型、所述非物理屬性信息對得到第一分析值進行調(diào)整。
[0052]結(jié)合第一方面,以及第一方面的第一至第二種,或者第五種可能的實現(xiàn)方式,在第十三種可能的實現(xiàn)方式中,對所述任意一子文件進行語義分析,得到第一分析值之前,還包括:
[0053]對所述任意一子文件進行物理屬性分析,獲得物理屬性信息;
[0054]對所述任意一子文件進行非物理屬性分析,獲得非物理屬性信息;
[0055]對所述任意一子文件進行語義分析,得到第一分析值之后,還包括:
[0056]根據(jù)所述物理屬性信息、所述非物理屬性信息對所述第一分析值進行調(diào)整。
[0057]結(jié)合第一方面的第十三種可能的實現(xiàn)方式,在第十四種可能的實現(xiàn)方式中,根據(jù)所述物理屬性信息、所述非物理屬性信息對所述第一分析值進行調(diào)整之前,還包括:
[0058]對所述任意一子文件進行場景識別,確定場景類型。
[0059]結(jié)合第一方面的第十四種可能的實現(xiàn)方式,在第十五種可能的實現(xiàn)方式中,對所述任意一子文件進行非物理屬性分析,獲得非物理屬性信息,具體包括:
[0060]根據(jù)確定的場景類型,對所述任意一子文件進行非物理屬性分析,獲得非物理屬性信息。
[0061]結(jié)合第一方面的第十四或者十五種可能的實現(xiàn)方式,在第十六種可能的實現(xiàn)方式中,根據(jù)所述物理屬性信息、所述非物理屬性信息對所述第一分析值進行調(diào)整,具體包括:
[0062]根據(jù)確定的場景類型、所述物理屬性信息、所述非物理屬性信息對所述第一分析值進行調(diào)整。
[0063]結(jié)合第一方面,以及第一方面的第一至第十六種,或者第十七種可能的實現(xiàn)方式,根據(jù)所述第一分析值確定所述任意一子文件的語言特征,具體包括:
[0064]判斷所述第一分析值是否達到指定語言特征所對應(yīng)的預(yù)設(shè)門限值,若是,確定所述任意一子文件具有所述指定語言特征;否則,確定所述任意一子文件未具有所述指定語言特征;或者
[0065]確定所述第一分析值所屬的取值范圍;并
[0066]確定所述任意一子文件具有所述取值范圍對應(yīng)的語言特征。
[0067]結(jié)合第一方面的第三至第六種可能的實現(xiàn)方式,在第十八種可能的實現(xiàn)方式中根據(jù)所述第一乘積和所述第二乘積之和確定所述任意一子文件的語言特征,具體包括:
[0068]判斷所述第一乘積和所述第二乘積之和是否達到指定語言特征所對應(yīng)的預(yù)設(shè)門限值,若是,確定所述任意一子文件具有所述指定語言特征;否則,確定所述任意一子文件未具有所述指定語言特征;或者
[0069]確定所述第一乘積和所述第二乘積之和所屬的取值范圍;并
[0070]確定所述任意一子文件具有所述取值范圍對應(yīng)的語言特征。
[0071]第二方面,提供一種分析語言特征的裝置,包括:
[0072]劃分單元,用于將所述待分析的音頻文件劃分為至少一個子文件;
[0073]第一分析單元,用于針對所述至少一個子文件中的任意一子文件,對所述任意一子文件進行語義分析,得到第一分析值,所述第一分析值用于表征所述任意一子文件在語義維度的語言特征;
[0074]確定單元,用于根據(jù)所述第一分析值確定所述任意一子文件的語言特征。
[0075]結(jié)合第二方面,在第一種可能的實現(xiàn)方式中,還包括第一獲取單元,用于獲取預(yù)設(shè)語音特征信息;或者,獲取指定音頻文件,并從所述指定音頻文件中獲取指定語音特征信息;
[0076]所述第一分析單元在對所述任意一子文件進行語義分析時,具體為:
[0077]將所述任意一子文件中與所述預(yù)設(shè)語音特征信息或者與所述指定語音特征信息對應(yīng)的信息進行語義分析。
[0078]結(jié)合第二方面,以及第二方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,所述劃分單元具體用于:
[0079]將所述待分析的音頻文件中對應(yīng)的對話主題為同一個對話主題的對話作為一個子文件;和/或
[0080]將