国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語言學(xué)習(xí)系統(tǒng)的制作方法

      文檔序號:2619010閱讀:120來源:國知局
      專利名稱:語言學(xué)習(xí)系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種幫助學(xué)習(xí)語言的語言學(xué)習(xí)系統(tǒng)。
      背景技術(shù)
      在外語或母語的語言學(xué)習(xí),特別是發(fā)音或朗讀的自學(xué)中,廣泛使用對記錄在CD(Compact Disk)等記錄介質(zhì)上的示范聲音進行再現(xiàn),通過模仿該示范聲音來進行發(fā)音或朗讀這一學(xué)習(xí)方法。其目的在于,通過模仿示范聲音來掌握正確的發(fā)音。在這里,為了更有效地促進學(xué)習(xí),必須要評價示范聲音與自己的聲音之間的差別。但是,絕大多數(shù)情況下,記錄在CD中的示范聲音是某個特定的播音員或說母語的人的聲音。也就是說,由于對于大多數(shù)學(xué)習(xí)者來說,這些示范聲音是通過具有與自己的聲音完全不同的特征的聲音發(fā)出來的,所以存在以下問題,即,難以評價自己的發(fā)音與示范聲音相比,正確到哪種程度。
      作為解決該問題的技術(shù),有例如專利文獻1、2中所述的技術(shù)。
      專利文獻1中所述的技術(shù)是使用戶的語調(diào)、語速、音質(zhì)等參數(shù)反映到示范聲音上,將示范聲音變換為與用戶聲音相似的聲音的技術(shù)。專利文獻2中所述的技術(shù)是學(xué)習(xí)者可以從多個示范聲音之中選擇任意一種的技術(shù)。
      專利文獻1特開2002-244547號公報專利文獻2特開2004-133409號公報發(fā)明內(nèi)容但是,由專利文獻1中所述的技術(shù),雖然可以矯正語調(diào),但也存在以下問題,即,難以矯正例如英語中的“r與l”或“s和th”等發(fā)音明顯不同的發(fā)音。此外,由于需要對聲音波形進行修正,所以還存在處理復(fù)雜的問題。此外,由專利文獻2中所述的技術(shù),由于是選擇示范聲音的方式,所以存在以下問題,即,必須要學(xué)習(xí)者自己選擇示范聲音,比較煩瑣。
      本發(fā)明是鑒于上述問題而提出來的,其目的在于,提供一種利用更簡單的處理就可以使用與學(xué)習(xí)者相似的示范聲音進行學(xué)習(xí)的語言學(xué)習(xí)系統(tǒng)以及方法。
      為了解決上述課題,本發(fā)明提供一種語言學(xué)習(xí)系統(tǒng),該系統(tǒng)具有數(shù)據(jù)庫,其對于每一個講話者,將從該講話者的聲音中提取出的特征量和該講話者的一個或多個聲音數(shù)據(jù)相關(guān)聯(lián)而分別進行存儲;聲音取得單元,其取得學(xué)習(xí)者的聲音;特征量提取單元,其從利用上述聲音取得單元所取得的聲音中,提取上述學(xué)習(xí)者的聲音的特征量;聲音數(shù)據(jù)選擇單元,其對利用上述特征量提取單元提取出的上述學(xué)習(xí)者的特征量,與記錄在上述數(shù)據(jù)庫中的多個講話者的特征量進行比較,并根據(jù)該比較,從上述數(shù)據(jù)庫中選擇出一個講話者的聲音數(shù)據(jù);以及再現(xiàn)單元,其按照利用上述聲音數(shù)據(jù)選擇單元所選擇出的1個聲音數(shù)據(jù),輸出聲音。
      優(yōu)選的實施方式的特征為,上述聲音數(shù)據(jù)選擇單元包括近似度計算單元,該近似度計算單元對于每個講話者計算出近似度指數(shù),該近似度指數(shù)表示記錄在上述數(shù)據(jù)庫中的多個講話者的特征量與利用上述特征量提取單元所提取的上述學(xué)習(xí)者的特征量之差,然后,根據(jù)利用該近似度計算單元所計算出的近似度指數(shù),從上述數(shù)據(jù)庫中選擇與滿足規(guī)定條件的1個講話者的特征量相對應(yīng)的1個聲音數(shù)據(jù)。在此情況下,上述規(guī)定條件也可以是以下條件,即,選擇與表示近似度最高的近似度指數(shù)相關(guān)聯(lián)的1個講話者的聲音數(shù)據(jù)。
      另外的優(yōu)選的實施方式,該語言學(xué)習(xí)系統(tǒng)還可以具有語速變換單元,其對利用上述聲音數(shù)據(jù)選擇單元所選擇出的聲音數(shù)據(jù)的語速進行變換,上述再現(xiàn)單元按照利用上述語速變換單元變換語速的聲音數(shù)據(jù),輸出聲音。
      另外的優(yōu)選的實施方式,該語言學(xué)習(xí)系統(tǒng)還可以具有存儲單元,其存儲示范聲音;比較單元,其對上述示范聲音和利用上述聲音取得單元所取得的學(xué)習(xí)者的聲音進行比較,產(chǎn)生表示二者的近似度的信息;以及數(shù)據(jù)庫更新單元,其在由利用上述比較單元產(chǎn)生的信息所表示的近似度滿足規(guī)定條件的情況下,使利用上述聲音取得單元所取得的學(xué)習(xí)者的聲音,與利用上述特征量提取單元所提取出的特征量相關(guān)聯(lián)而追加到上述數(shù)據(jù)庫中。
      由本發(fā)明,可以再現(xiàn)具有與學(xué)習(xí)者相似的聲音特征的講話者的聲音,作為學(xué)習(xí)中的范文的聲音。因此,學(xué)習(xí)者能更正確地識別應(yīng)模仿(應(yīng)作為目標(biāo))的發(fā)音,由此,可以提高其學(xué)習(xí)效率。


      圖1是表示本發(fā)明的第1實施方式涉及的語言學(xué)習(xí)系統(tǒng)1的功能結(jié)構(gòu)的框圖。
      圖2是例示數(shù)據(jù)庫DB1的內(nèi)容的圖。
      圖3是表示語言學(xué)習(xí)系統(tǒng)1的硬件結(jié)構(gòu)的框圖。
      圖4是表示語言學(xué)習(xí)系統(tǒng)1的動作的流程圖。
      圖5是表示語言學(xué)習(xí)系統(tǒng)1中的數(shù)據(jù)庫DB1的更新動作的流程圖。
      圖6是例示示范聲音(上)及用戶聲音(下)的頻譜包絡(luò)的圖。
      具體實施例方式
      下面參照

      本發(fā)明的具體實施方式

      。
      &lt;1.結(jié)構(gòu)&gt;
      圖1是表示本發(fā)明的第1實施方式涉及的語言學(xué)習(xí)系統(tǒng)1的功能結(jié)構(gòu)的框圖。存儲部11存儲了數(shù)據(jù)庫DB1,該數(shù)據(jù)庫DB1將從講話者的聲音中提取出的特征量與該講話者聲音的聲音數(shù)據(jù)相相關(guān)聯(lián)而進行存儲。輸入部12取得學(xué)習(xí)者(用戶)的聲音,作為用戶聲音數(shù)據(jù)進行輸出。特征提取部13從學(xué)習(xí)者的聲音中提取特征量。聲音數(shù)據(jù)提取(選擇)部14將由特征提取部13提取的特征量與記錄在數(shù)據(jù)庫DB1中的特征量進行比較,并提取出滿足預(yù)先規(guī)定的條件的、1個講話者的特征量,再從數(shù)據(jù)庫DB1中提取(選擇)出與提取出的1個講話者的特征量相關(guān)聯(lián)的聲音數(shù)據(jù)。再現(xiàn)部15再現(xiàn)由聲音數(shù)據(jù)提取(選擇)部14提取(選擇)出的聲音數(shù)據(jù),通過揚聲器或者耳機等發(fā)出可聽的聲音。
      關(guān)于數(shù)據(jù)庫DB1的詳細內(nèi)容將如后所述,但語言學(xué)習(xí)系統(tǒng)1還具有用來更新數(shù)據(jù)庫DB1的下述結(jié)構(gòu)要素。存儲部16存儲了示范聲音數(shù)據(jù)庫DB2,該示范聲音數(shù)據(jù)庫DB2將作為語言學(xué)習(xí)樣本的示范聲音數(shù)據(jù)和該示范聲音的文本數(shù)據(jù)相相關(guān)聯(lián)而存儲。比較部17對由輸入部12所取得的用戶聲音數(shù)據(jù)和存儲在存儲部16中的示范聲音數(shù)據(jù)進行比較。比較的結(jié)果,如果用戶聲音滿足預(yù)先規(guī)定的條件,則DB更新部18將用戶聲音數(shù)據(jù)追加到數(shù)據(jù)庫DB1中。
      圖2是例示數(shù)據(jù)庫DB1的內(nèi)容的圖。數(shù)據(jù)庫DB1中記錄了講話者ID(圖2中為“ID001”)和從該講話者的聲音數(shù)據(jù)中提取出的特征量,該講話者ID是確定講話者的標(biāo)識符。在數(shù)據(jù)庫DB1中,還將范文ID、該范文的聲音數(shù)據(jù)、以及該范文的發(fā)音水平(后述)相相關(guān)聯(lián)而記錄,該范文ID是確定范文的標(biāo)識符。數(shù)據(jù)庫DB1具有多個由范文ID、聲音數(shù)據(jù)、以及發(fā)音水平構(gòu)成的數(shù)據(jù)組,各數(shù)據(jù)組與賦予給聲音數(shù)據(jù)的講話者的講話者ID相關(guān)聯(lián)而存儲記錄。也就是說,數(shù)據(jù)庫DB1具有從多個講話者得到的多個范文的聲音數(shù)據(jù),這些數(shù)據(jù)通過講話者ID及特征量,與每個講話者相關(guān)聯(lián)而記錄。
      圖3是表示語言學(xué)習(xí)系統(tǒng)1的硬件結(jié)構(gòu)的框圖。CPU(CentralProcessing Unit)101以RAM(Random Access Memory)102作為工作區(qū)域,讀出存儲在ROM(Read Only Memory)103或HDD(Hard DiskDrive)104中的程序并執(zhí)行。HDD 104是存儲各種應(yīng)用程序及數(shù)據(jù)的存儲裝置。此外,HDD 104還存儲數(shù)據(jù)庫DB1及示范聲音數(shù)據(jù)庫DB2。顯示器105是CRT(Cathode Ray Tube)或LCD(Liquid CrystalDisplay)等、在CPU 101的控制下顯示文字及圖像的顯示裝置。麥克風(fēng)106是用來取得用戶的聲音的聲音收集裝置,輸出與用戶發(fā)出的聲音相對應(yīng)的聲音信號。聲音處理部107具有將由麥克風(fēng)106所輸出的模擬聲音信號變換為數(shù)字聲音數(shù)據(jù)的功能,以及將存儲在HDD 104中的聲音數(shù)據(jù)變換為聲音信號并輸出給揚聲器108的功能。此外,用戶可以通過操作鍵盤109,向語言學(xué)習(xí)系統(tǒng)1輸入指令。以上所說明的各結(jié)構(gòu)要素通過總線110彼此連接。此外,語言學(xué)習(xí)系統(tǒng)1可以通過I/F(接口)111與其它設(shè)備進行通信。
      &lt;2.動作&gt;
      下面,對本實施方式涉及的語言學(xué)習(xí)系統(tǒng)1的動作進行說明。在這里,首先說明對范文的聲音進行再現(xiàn)的動作,然后再說明對數(shù)據(jù)庫DB 1的內(nèi)容進行更新的動作。在語言學(xué)習(xí)系統(tǒng)1中,通過CPU 101執(zhí)行存儲在HDD 104中的語言學(xué)習(xí)程序,而具有圖1所示的功能。此外,學(xué)習(xí)者(用戶)在語言學(xué)習(xí)程序的開始時等,操作鍵盤109,輸入確定自己的標(biāo)識符即用戶ID。CPU 101將所輸入的用戶ID存儲到RAM 102中,作為當(dāng)前正在使用系統(tǒng)的學(xué)習(xí)者的用戶ID。
      &lt;2-1.再現(xiàn)聲音&gt;
      圖4是表示語言學(xué)習(xí)系統(tǒng)1動作的流程圖。如果執(zhí)行語言學(xué)習(xí)程序,則語言學(xué)習(xí)系統(tǒng)1的CPU 101對示范聲音數(shù)據(jù)庫DB2進行檢索,制成可以利用的范文的列表。CPU 101根據(jù)該列表,在顯示器105上顯示提醒用戶選擇范文的消息。用戶按照顯示器105上所顯示的消息,從列表中存在的范文中選擇出1篇范文。CPU 101對選擇出的范文的聲音進行再現(xiàn)(步驟S101)。具體地說,CPU 101從示范聲音數(shù)據(jù)庫DB2中讀出范文的示范聲音數(shù)據(jù),并將讀出的示范聲音數(shù)據(jù)輸出給聲音處理部107。聲音處理部107對輸入的示范聲音數(shù)據(jù)進行數(shù)/模變換后,作為模擬聲音信號輸出給揚聲器108。這樣,從揚聲器108中再現(xiàn)出示范聲音。
      用戶從揚聲器108中聽到再現(xiàn)的示范聲音后,對著麥克風(fēng)模仿示范聲音而朗讀范文。也就是說,進行用戶聲音的輸入(步驟S102)。具體地說,如下所述。如果示范聲音的再現(xiàn)結(jié)束,則CPU 101在顯示器105上顯示諸如“下面輪到你了。請朗讀范文?!钡忍嵝延脩衾首x范文的消息。接著CPU 101在顯示器105上顯示“按下空格鍵后開始朗讀,如果朗讀結(jié)束請再按一次空格鍵?!钡戎甘居糜谶M行用戶聲音輸入的操作的消息。用戶按照顯示器105上所顯示的消息對鍵盤109進行操作,進行用戶聲音的輸入。也就是說,在按下鍵盤109的空格鍵后,對著麥克風(fēng)朗讀范文。如果朗讀結(jié)束了,則用戶再按一次空格鍵。
      用戶的聲音由麥克風(fēng)106變換為電信號。麥克風(fēng)106對用戶聲音信號進行輸出。用戶聲音信號由聲音處理部107變換為數(shù)字聲音數(shù)據(jù),并作為用戶聲音數(shù)據(jù)記錄到HDD 104中。CPU 101在示范聲音的再現(xiàn)完成之后,以空格鍵的按下作為觸發(fā),開始用戶聲音數(shù)據(jù)的記錄,以再次按下空格鍵作為觸發(fā),結(jié)束用戶聲音數(shù)據(jù)的記錄。也就是說,從用戶首次按下空格鍵,到再次按下空格鍵之間的用戶聲音被記錄到HDD 104之中。
      接下來,CPU 101對得到的用戶聲音數(shù)據(jù)進行特征量提取處理(步驟S103)。具體地說,如下所述。CPU 101將聲音數(shù)據(jù)分割為各個預(yù)先確定的時間段(幀)。CPU 101求出振幅頻譜的對數(shù),該振幅頻譜是將被分解為幀的、表示示范聲音數(shù)據(jù)的波形和表示用戶聲音信號的波形進行傅里葉變換之后得到的,然后,對其進行傅里葉逆變換后,得到每個幀的頻譜包絡(luò)。CPU 101從這樣得到的頻譜包絡(luò)中提取第1共振峰及第2共振峰的共振峰頻率。一般地,元音由第1及第2共振峰的分布而進行特征識別。CPU 101從聲音數(shù)據(jù)的開頭起,將從每個幀得到的共振峰頻率分布與預(yù)先確定的元音(例如“a”)的共振峰頻率分布進行匹配。如果通過匹配而判斷該幀為與元音“a”相當(dāng)?shù)膸?,則CPU 101計算出該幀的共振峰之中,預(yù)先確定的共振峰(例如第1、第2、第3這3個共振峰)的共振峰頻率。CPU 101將計算出的共振峰頻率存儲到RAM 102中,作為用戶聲音的特征量P。
      然后,CPU 101從數(shù)據(jù)庫DB1中提取(選擇)與該用戶聲音的特征量P相似的特征量相關(guān)聯(lián)的聲音數(shù)據(jù)(步驟S104)。具體地說,對所提取的特征量P和記錄在數(shù)據(jù)庫DB1中的特征量進行比較,確定與特征量P最近似的特征量。在比較中,例如在特征量P和數(shù)據(jù)庫DB1之間,計算出第1~第3共振峰頻率值的差,再計算補足三個共振峰頻率的差的絕對值的量,作為表示二者的近似度的近似度指數(shù)。CPU 101從數(shù)據(jù)庫DB1中確定所計算出的近似度指數(shù)最小的特征量,即與特征量P最近似的特征量。CPU 101再提取出與所確定的特征量相關(guān)聯(lián)的聲音數(shù)據(jù),并將提取出的聲音數(shù)據(jù)存儲到RAM 102之中。
      然后,CPU 101進行聲音數(shù)據(jù)的再現(xiàn)(步驟S105)。具體地說,如下所述。CPU 101向聲音處理部107輸出聲音數(shù)據(jù)。聲音處理部107將輸入的聲音數(shù)據(jù)進行數(shù)/模變換后,作為聲音信號輸出給揚聲器108。這樣,提取出的聲音數(shù)據(jù)作為聲音從揚聲器108中再現(xiàn)。在這里,因為聲音數(shù)據(jù)是利用特征量的匹配而提取的,所以再現(xiàn)的聲音成為與學(xué)習(xí)者的聲音特征近似的聲音。因此,對于那些僅通過聽由聲音特征完全不同于自己的講話者(播音員、說母語的人等)發(fā)出的聲音而很難模仿的范文,由于是由具有與自己非常相似的聲音特征的講話者發(fā)出的聲音,學(xué)習(xí)者也可以更準確地理解應(yīng)模仿的發(fā)音,從而使學(xué)習(xí)效率提高。
      &lt;2-2.數(shù)據(jù)庫更新&gt;
      下面,說明數(shù)據(jù)庫DB1的更新動作。
      圖5是表示語言學(xué)習(xí)系統(tǒng)1中的數(shù)據(jù)庫DB1的更新動作的流程圖。首先,利用上述步驟S101~S102的處理,進行示范聲音的再現(xiàn)及用戶聲音的輸入。然后,CPU 101進行示范聲音與用戶聲音的比較處理(步驟S201)。具體地說,如下所述。CPU 101將表示示范聲音數(shù)據(jù)的波形分割為各個預(yù)先確定的時間段(幀)。此外,CPU 101將表示用戶聲音數(shù)據(jù)的波形也同樣分割為各個幀。CPU 101以對數(shù)值求出振幅頻譜,該振幅頻譜是將被分解為幀的、表示示范聲音數(shù)據(jù)的波形和表示用戶聲音信號的波形進行傅里葉變換之后得到的,然后,對其進行傅里葉逆變換后得到每個幀的頻譜包絡(luò)。
      圖6是例示示范聲音(上)及用戶聲音(下)的頻譜包絡(luò)的圖。圖6所示的頻譜包絡(luò)由幀I~幀III這3個幀構(gòu)成。CPU 101對于每個幀,比較取得的頻譜包絡(luò),進行將二者的近似度數(shù)值化的處理。近似度的數(shù)值化(近似度指數(shù)的計算)例如可以以如下的方式進行。CPU 101可以對于整個聲音數(shù)據(jù),計算對將特征性的共振峰的頻率和頻譜密度表示在頻譜密度—頻率圖中時的兩點間的距離進行補足后的值,作為近似度指數(shù)?;蛘?,也可以對于整個聲音數(shù)據(jù),計算對特定的頻率中的頻譜密度的差進行積分后得到的值,作為近似度指數(shù)。此外,由于示范聲音和用戶聲音通常長度(時間)不同,所以優(yōu)選在上述處理之前進行使二者長度一致的處理。
      下面,再參照圖5進行說明。CPU 101根據(jù)計算出的近似度指數(shù),判斷是否進行數(shù)據(jù)庫DB1的更新(步驟S202)。具體地說,如下所述。HDD 104中預(yù)先存儲用于將取得的聲音數(shù)據(jù)追加登錄到數(shù)據(jù)庫DB 1中的條件。CPU 101判斷步驟S201中計算出的近似度指數(shù)是否滿足該登錄條件。在滿足登錄條件的情況下(步驟S202是),CPU 101使處理進入后述的步驟S203。在不滿足登錄條件的情況下(步驟S202否),CPU 101結(jié)束處理。
      在滿足登錄條件的情況下,CPU 101進行數(shù)據(jù)庫更新處理(步驟S203)。具體地說,如下所述。CPU 101對滿足登錄條件的聲音數(shù)據(jù),賦予確定該聲音數(shù)據(jù)的講話者即學(xué)習(xí)者(用戶)的用戶ID。CPU 101從數(shù)據(jù)庫DB1中檢索與用戶ID相同的用戶ID,使聲音數(shù)據(jù)與該用戶ID相關(guān)聯(lián)而追加登錄到數(shù)據(jù)庫DB1中。在從更新請求中提取出的用戶ID未在數(shù)據(jù)庫DB1中登錄的情況下,CPU 101追加登錄該用戶ID,與該用戶ID相關(guān)聯(lián)而登錄聲音數(shù)據(jù)。這樣,學(xué)習(xí)者的聲音數(shù)據(jù)被追加登錄到數(shù)據(jù)庫DB1中,進行了更新。
      以上所說明的數(shù)據(jù)庫更新的動作,可以與上述的聲音再現(xiàn)動作同時進行,也可以在聲音再現(xiàn)動作完成后進行。這樣,通過將學(xué)習(xí)者的聲音數(shù)據(jù)依次追加到數(shù)據(jù)庫DB1中,而在數(shù)據(jù)庫DB1中積累多個的講話者的聲音數(shù)據(jù)。因此,隨著語言學(xué)習(xí)系統(tǒng)1被使用,數(shù)據(jù)庫DB1中登錄的講話者的聲音數(shù)據(jù)越來越多,同時,在新的學(xué)習(xí)者使用語言學(xué)習(xí)系統(tǒng)1時,再現(xiàn)與自己特征相似的聲音的概率也會越來越高。
      &lt;3.變形例&gt;
      本發(fā)明并不局限于上述實施方式,可以進行各種變形。
      &lt;3-1.變形例1&gt;
      在上述實施方式之中,也可以在將步驟S104中提取出的聲音數(shù)據(jù)存儲到RAM 102中后,CPU 101對聲音數(shù)據(jù)進行語速變換處理。具體地說,如下所述。RAM 102預(yù)先存儲對語速變換處理前后的語速比例進行指定的變量a。CPU 101對提取出的聲音數(shù)據(jù)進行使聲音時間(從聲音數(shù)據(jù)的開頭到末尾的再現(xiàn)所需要的時間)為原來的a倍的處理。在a>1的情況下,利用語速變換處理,聲音的長度伸長。即語速變慢。相反,在a<1的情況下,利用語速變換處理,聲音的長度縮短。即語速變快。在本實施方式之中,作為變量a的初始值,設(shè)定為比1大的值。因此,在示范聲音被再現(xiàn),然后輸入用戶聲音后,以與用戶聲音相似的聲音而再現(xiàn)的范文以比示范聲音慢的方式被再現(xiàn)。因此,學(xué)習(xí)者可更加明確地識別應(yīng)模仿的發(fā)音(作為目標(biāo)的發(fā)音)。
      &lt;3-2.變形例2&gt;
      在上述實施方式之中,是步驟S104中,提取與從學(xué)習(xí)者(用戶)的聲音中提取出的特征量最近似的特征量相關(guān)聯(lián)的聲音數(shù)據(jù),但提取聲音數(shù)據(jù)的條件并不局限于與學(xué)習(xí)者聲音的特征量最近似。例如,也可以在數(shù)據(jù)庫DB1之中,預(yù)先與范文的聲音數(shù)據(jù)相關(guān)聯(lián)記錄該聲音的發(fā)音水平(表示與示范聲音的近似度的指數(shù),發(fā)音水平越高,越近似于示范聲音),將該發(fā)音水平加入聲音數(shù)據(jù)選擇的條件之中。作為具體的條件,例如也可以是如下條件,即,從發(fā)音水平大于或等于某一定水平的聲音數(shù)據(jù)當(dāng)中提取特征量最近似的?;蛘撸部梢允侨缦聴l件,即,從特征量的近似度大于或等于某值的聲音數(shù)據(jù)當(dāng)中提取出發(fā)音水平最高的。發(fā)音水平可以與例如步驟S201中的近似度指數(shù)的計算同樣地進行計算。
      &lt;3-3.變形例3&gt;
      此外,系統(tǒng)的結(jié)構(gòu)并不局限于上述實施方式中說明的。語言學(xué)習(xí)系統(tǒng)1也可以通過網(wǎng)絡(luò)與服務(wù)器裝置相連接,使服務(wù)器承擔(dān)上述語言學(xué)習(xí)系統(tǒng)的部分功能。
      此外,在上述實施方式中,CPU 101通過執(zhí)行語言學(xué)習(xí)程序,以軟件的方式實現(xiàn)作為語言學(xué)習(xí)系統(tǒng)的功能。但也可以使用與圖1所示的功能結(jié)構(gòu)要素相當(dāng)?shù)碾娮与娐返?,以硬件的方式實現(xiàn)系統(tǒng)。
      &lt;3-4.變形例4&gt;
      在上述實施方式之中,對使用第1~第3共振峰的共振峰頻率作為講話者的聲音特征量的方式進行了說明,但聲音的特征量并不限于共振峰頻率。也可以是根據(jù)頻譜圖等其它聲音分析方法計算出的特征量。
      權(quán)利要求
      1.一種語言學(xué)習(xí)系統(tǒng),其特征在于,具有數(shù)據(jù)庫,其對于每一個講話者,將從該講話者的聲音中提取出的特征量和該講話者的1個或多個聲音數(shù)據(jù)相關(guān)聯(lián)而分別進行存儲;聲音取得單元,其取得學(xué)習(xí)者的聲音;特征量提取單元,其從由上述聲音取得單元所取得的聲音中,提取上述學(xué)習(xí)者的聲音的特征量;聲音數(shù)據(jù)選擇單元,其將由上述特征量提取單元所提取出的上述學(xué)習(xí)者的特征量,與記錄在上述數(shù)據(jù)庫中的多個講話者的特征量進行比較,并根據(jù)該比較,從上述數(shù)據(jù)庫中選擇1個講話者的聲音數(shù)據(jù);以及再現(xiàn)單元,其按照由上述聲音數(shù)據(jù)選擇單元所選擇出的1個聲音數(shù)據(jù),輸出聲音。
      2.根據(jù)權(quán)利要求1所述的語言學(xué)習(xí)系統(tǒng),其特征在于,上述聲音數(shù)據(jù)選擇單元包括近似度計算單元,該近似度計算單元對于每個講話者計算出近似度指數(shù),該近似度指數(shù)表示記錄在上述數(shù)據(jù)庫中的多個講話者的特征量與由上述特征量提取單元所提取出的上述學(xué)習(xí)者的特征量之差,然后,根據(jù)由該近似度計算單元所計算出的近似度指數(shù),從上述數(shù)據(jù)庫中選擇與滿足規(guī)定條件的1個講話者的特征量相關(guān)聯(lián)的1個聲音數(shù)據(jù)。
      3.根據(jù)權(quán)利要求2所述的語言學(xué)習(xí)系統(tǒng),其特征在于,上述規(guī)定條件是,選擇1個講話者的聲音數(shù)據(jù),該聲音數(shù)據(jù)與表示近似度最高的那個近似度指數(shù)相對應(yīng)。
      4.根據(jù)權(quán)利要求1所述的語言學(xué)習(xí)系統(tǒng),其特征在于,還具有語速變換單元,其對由上述聲音數(shù)據(jù)選擇單元所選擇出的聲音數(shù)據(jù)的語速進行變換,上述再現(xiàn)單元按照由上述語速變換單元變換了語速的聲音數(shù)據(jù),輸出聲音。
      5.根據(jù)權(quán)利要求1~4中任一項所述的語言學(xué)習(xí)系統(tǒng),其特征在于,還具有存儲單元,其存儲示范聲音;比較單元,其對上述示范聲音和由上述聲音取得單元所取得的學(xué)習(xí)者的聲音進行比較,產(chǎn)生表示二者的近似度的信息;以及數(shù)據(jù)庫更新單元,其在由上述比較單元產(chǎn)生的信息所表示的近似度滿足規(guī)定條件的情況下,使由上述聲音取得單元所取得的學(xué)習(xí)者的聲音與由上述特征量提取單元所提取出的特征量相關(guān)聯(lián)而追加到上述數(shù)據(jù)庫中。
      6.一種向?qū)W習(xí)者提供語言學(xué)習(xí)用的聲音數(shù)據(jù)的方法,該方法使用以下的數(shù)據(jù)庫,該數(shù)據(jù)庫對于每一個講話者,將從該講話者的聲音中提取出的特征量和該講話者發(fā)出的聲音的1個或多個語言學(xué)習(xí)用的聲音數(shù)據(jù)相關(guān)聯(lián)而分別進行存儲,其特征在于,包括下述過程取得學(xué)習(xí)者發(fā)出的聲音的過程;從上述取得的聲音中,提取出上述學(xué)習(xí)者的聲音的特征量的過程;將上述提取出的上述學(xué)習(xí)者的特征量與記錄在上述數(shù)據(jù)庫中的多個講話者的特征量進行比較,根據(jù)該比較,從上述數(shù)據(jù)庫中選擇1個講話者的聲音數(shù)據(jù)的過程;以及按照上述選擇出的1個聲音數(shù)據(jù),輸出聲音的過程。
      全文摘要
      可以使用與學(xué)習(xí)者相似的示范聲音進行學(xué)習(xí)。設(shè)有數(shù)據(jù)庫,其對于每一個講話者,使從該講話者的聲音中提取出的特征量與該講話者發(fā)出的語言學(xué)習(xí)用的1個或多個聲音數(shù)據(jù)相對應(yīng),并分別進行存儲。提取學(xué)習(xí)者的聲音,從取得的聲音中提取出該學(xué)習(xí)者的聲音的特征量。將提取出的該學(xué)習(xí)者的特征量與存儲在上述數(shù)據(jù)庫中的多個講話者的特征量進行比較,根據(jù)該比較,從上述數(shù)據(jù)庫中選擇1個講話者的聲音數(shù)據(jù)。按照選擇出的1個聲音數(shù)據(jù),再現(xiàn)輸出語言學(xué)習(xí)用的聲音。
      文檔編號G09B5/04GK1794315SQ200510132618
      公開日2006年6月28日 申請日期2005年12月23日 優(yōu)先權(quán)日2004年12月24日
      發(fā)明者江本直博 申請人:雅馬哈株式會社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1