語音選擇輔助裝置、語音選擇方法以及程序的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明的實(shí)施方式涉及語音選擇輔助裝置、語音選擇方法以及程序。
【背景技術(shù)】
[0002]在利用語音合成時(shí),為了選擇發(fā)音者(語音詞典)而需要實(shí)際聽取語音,因此難以從許多候選中進(jìn)行選擇。在以往提供的發(fā)音者的選擇中,作為選擇項(xiàng)的發(fā)音者即使較多也就有10種左右,但近年來漸漸成為提供了 800種以上的語音詞典。因此,作為選擇發(fā)音者的手段,提供了指定屬性(性別、年代、屬性(冷酷/沙啞/萌等)而進(jìn)行檢索的方式。此外,存在如下技術(shù),即,在再現(xiàn)環(huán)境中不存在由文本的元數(shù)據(jù)指定的發(fā)音者的語音詞典的情況下,基于元數(shù)據(jù)中記述的屬性(與上述的屬性相同)選擇代替的語音并再現(xiàn)選擇出的語音。
[0003]現(xiàn)有技術(shù)文獻(xiàn)
[0004]專利文獻(xiàn)
[0005]專利文獻(xiàn)I:日本特開2013 — 72957號(hào)公報(bào)
【發(fā)明內(nèi)容】
[0006]發(fā)明要解決的課題
[0007]但是,在指定屬性而檢索發(fā)音者的方法中,利用者難以恰當(dāng)?shù)卦O(shè)定與輸入文本的朗讀(上辦fe疔)相適合的發(fā)音者的屬性。此外,在語音詞典大量存在的情況下,即使通過屬性來檢索也有可能提供許多發(fā)音者的候選而無法縮小范圍。
[0008]本發(fā)明的實(shí)施方式是鑒于上述情況而做出的,目的在于提供一種利用者能夠容易地選擇所希望的發(fā)音者的語音選擇輔助裝置。
[0009]用于解決課題的手段
[0010]為了解決上述課題而達(dá)成目的,本發(fā)明的實(shí)施方式的特征在于,具備:受理部,接受文本的輸入;解析知識(shí)存儲(chǔ)部,存儲(chǔ)在所輸入的上述文本的特征分析中使用的文本解析知識(shí);解析部,參照上述文本解析知識(shí),對上述文本的特征進(jìn)行分析;語音屬性存儲(chǔ)部,存儲(chǔ)每個(gè)語音詞典的語音屬性;評(píng)價(jià)部,評(píng)價(jià)上述語音詞典的上述語音屬性與上述文本的特征之間的類似度;以及候選提示部,根據(jù)上述類似度,提示適合于上述文本的上述語音詞典的候選。
【附圖說明】
[0011 ]圖1是表示實(shí)施方式的語音選擇輔助裝置的功能結(jié)構(gòu)的框圖。
[0012]圖2是表示實(shí)施方式的語音屬性的例子的圖。
[0013]圖3是表示實(shí)施方式的文本解析處理的流程的流程圖。
[0014]圖4是表示實(shí)施方式的文本解析知識(shí)的例子的圖。
[0015]圖5是表示實(shí)施方式的對發(fā)音者的類似度進(jìn)行評(píng)價(jià)的處理的流程的流程圖。
[0016]圖6是表示實(shí)施方式的變形例的語音屬性的例子的圖。
[0017]圖7是表示實(shí)施方式的變形例的語音選擇輔助裝置的功能結(jié)構(gòu)的框圖。
[0018]圖8是表示實(shí)施方式的變形例的發(fā)音者的選擇履歷的例子的圖。
[0019]圖9是實(shí)施方式的根據(jù)選擇履歷對發(fā)音者的語音屬性進(jìn)行更新的處理的流程圖。
[0020]圖10是表示實(shí)施方式的語音選擇輔助裝置的硬件結(jié)構(gòu)的框圖。
【具體實(shí)施方式】
[0021 ]以下,參照附圖對本發(fā)明的實(shí)施方式進(jìn)行說明。
[0022](第一實(shí)施方式)
[0023]在第一實(shí)施方式中說明一種語音選擇輔助裝置,其能夠在輸入文本文書時(shí),從多個(gè)發(fā)音者的語音詞典之中提示基于合成語音的朗讀中使用的語音詞典的候選。圖1是表示本實(shí)施方式的語音選擇輔助裝置I的功能結(jié)構(gòu)的框圖。語音選擇輔助裝置I具備受理部101、解析部102、評(píng)價(jià)部104、候選提示部106、選擇受理部109、結(jié)果輸出部110、語音合成部107、解析知識(shí)存儲(chǔ)部103、語音屬性存儲(chǔ)部105和語音詞典存儲(chǔ)部108。另外,這些各部可以由軟件實(shí)現(xiàn),也可以由電子電路等硬件實(shí)現(xiàn)。
[0024]受理部101受理由用戶進(jìn)行的、成為語音合成中的朗讀對象的文本的輸入。解析部102—邊參照在解析知識(shí)存儲(chǔ)部103中存儲(chǔ)的文本解析知識(shí),一邊對受理部101從用戶受理的文本進(jìn)行解析。關(guān)于文本解析知識(shí)的詳請,在后面描述。
[0025]評(píng)價(jià)部104對語音屬性存儲(chǔ)部105中存儲(chǔ)的表示語音合成的每個(gè)發(fā)音者的語音特征的語音屬性和解析部102的解析結(jié)果進(jìn)行比較,之后進(jìn)行評(píng)價(jià),選出適合于將所輸入的文本通過語音合成進(jìn)行朗讀的發(fā)音者的候選。候選提示部106向用戶提示由評(píng)價(jià)部104選出的一個(gè)至多個(gè)發(fā)音者的信息。此時(shí),也可以利用語音合成部107,從語音詞典存儲(chǔ)部108中切換為與各發(fā)音者相對應(yīng)的語音詞典,將所輸入的文本的整體或一部分進(jìn)行語音合成。
[0026]選擇受理部109受理用戶從候選提示部106提示的發(fā)音者之中判斷為對于朗讀所輸入的文本而言最恰當(dāng)?shù)陌l(fā)音者的選擇。結(jié)果輸出部110向用戶提示選擇受理部109受理的用戶的判斷結(jié)果。
[0027]接下來,利用圖2說明語音屬性存儲(chǔ)部105中存儲(chǔ)的表示語音合成的每個(gè)發(fā)音者的語音特征的語音屬性。圖2中示出了語音屬性存儲(chǔ)部105中存儲(chǔ)的語音屬性的例子。如圖2所示,語音屬性通過性別、年齡層、類型、風(fēng)格(style)、形式、特征這些項(xiàng)目來表現(xiàn)。關(guān)于風(fēng)格,由朗讀代寸圭卞)、朗讀(-CfeS )、會(huì)話(正式)、會(huì)話(直率)這些觀點(diǎn)來表現(xiàn)。關(guān)于形式,由小說、教科書、郵件、會(huì)話、廣播這些觀點(diǎn)來表現(xiàn)。此外,關(guān)于特征,由適合于各發(fā)音者進(jìn)行朗讀的文章中特征性單詞的列表來表現(xiàn)。
[0028]此外,將每個(gè)發(fā)音者的性別用M(男性)/F(女性)的記號(hào)標(biāo)記,將每個(gè)發(fā)音者的年齡層用C(兒童)/Y(青年)/M(成人)/H(老人)的記號(hào)標(biāo)記,將每個(gè)發(fā)音者的類型用C(冷酷)/H(沙啞)/K(可愛)/M(萌)/G(溫柔)的記號(hào)標(biāo)記,風(fēng)格和形式用各個(gè)項(xiàng)目合計(jì)為100那樣的數(shù)值標(biāo)記。
[0029]例如,圖2的201表示,是青年男性的冷酷聲音,適合于比較正式的會(huì)話風(fēng)格,并且適合于小說及廣播的形式。此外,作為特征,可以認(rèn)為比較適合于科學(xué)技術(shù)類的內(nèi)容。另一方面,圖2的202表示,雖然在青年男性的冷酷聲音這一點(diǎn)上與201同樣,但風(fēng)格適合于直率的會(huì)話,形式適合于郵件及會(huì)話。此外,作為特征,可以認(rèn)為適合于設(shè)計(jì)、時(shí)尚這樣的比較休閑的內(nèi)容。
[0030]這樣,即使性別、年齡層、類型相同,也有風(fēng)格、形式、內(nèi)容的適合與否不同的情況。這樣的語音屬性例如可以由各個(gè)發(fā)音者自己設(shè)定以便說明自身的聲音特征,如果各發(fā)音者是例如解說員或配音員等,則也可以通過后述的解析部102的處理對過去用自身的嗓音朗讀過的文章組進(jìn)行解析,或者根據(jù)該文章組中包含的語句的頻率等將特征性語句進(jìn)行列表化等,從而作為語音屬性來使用。
[0031]另外,關(guān)于圖2中的觀點(diǎn)的種類及各觀點(diǎn)的表現(xiàn)方法,是用于具體說明本實(shí)施方式的例子,而不是將本發(fā)明的內(nèi)容限定于這些種類及表現(xiàn)方法。此外,圖2中為了進(jìn)行說明而僅記載了6人的發(fā)音者的語音屬性,但在本實(shí)施方式中,設(shè)為在語音屬性存儲(chǔ)部105中實(shí)際上存儲(chǔ)有更多的發(fā)音者的語音屬性。
[0032]此外,雖然將語音屬性的標(biāo)簽標(biāo)記為“發(fā)音者姓名”,但各語音屬性以及語音詞典不需要一定對應(yīng)于特定的人物。也可以通過將多個(gè)人物的語音進(jìn)行組合,或?qū)δ硞€(gè)人物的語音詞典加以變更,來制作不實(shí)際存在的人物的語音屬性及語音詞典,也可以是同一人物改變聲音,從而針對一個(gè)發(fā)音者對應(yīng)多個(gè)語音屬性及語音詞典。
[0033]接著,作為對本實(shí)施方式的動(dòng)作進(jìn)行說明的例子,對用戶朗讀「花子《混雑旮避時(shí)書店仍奧-C待Ot。(中間略)見覚免(DfeS本-CfeS?!惯@樣的文章的情況進(jìn)行說明。另外,該文章是仿照小說的一部分的例子。雖然實(shí)際上設(shè)想將小說整體輸入,但這里為了說明而僅將一部分作為例子來考慮。
[0034]受理部101受理用戶輸入的文章,接著送至解析部102。接著,解析部102按照圖3的流程,一邊參照在解析知識(shí)存儲(chǔ)部103中存儲(chǔ)的文本解析知識(shí),一邊對所輸入的文章進(jìn)行解析。具體而言,如圖3所示,首先,解析部102對所輸入的文章進(jìn)行詞素解析(morphologicalanalysis)(步驟S301)。詞素解析是將文章分割為單詞并賦予詞性的處理,能夠通過公知方法實(shí)現(xiàn),因此此處不作詳述。以下表示詞素解析的結(jié)果的例子。
[0035]“花子<人名(名)> + ?<助詞>/混雑<名詞> +旮<助詞>/避時(shí)<動(dòng)詞>/書店 < 名詞>+(D<助詞>/奧 < 名詞>+-e<助詞>/待o<動(dòng)詞>+7t<助動(dòng)詞>/。<句號(hào)>(中間略)見覚免 < 名詞>+仍< 助詞>/fes <動(dòng)詞>/本< 名詞<助動(dòng)詞>/。<句號(hào)>”
[0036]這里,“<〇〇>”表示詞性,“+”表示單詞的劃分,表示詞組的劃分。此外,詞性的“人名(名)”表示人名(固有名詞)的姓名的名,其他表示標(biāo)記所示的詞性。
[0037]接下來,解析部102從解析知識(shí)存儲(chǔ)部103中一一取出文本解析知識(shí)(步驟S302)。圖4是表示文本解析知識(shí)的例子的圖。文本解析知識(shí)由模式、屬性、權(quán)重這3個(gè)值構(gòu)成