服務(wù)器和控制該服務(wù)器的方法
【專利摘要】本發(fā)明提供一種與顯示裝置交互的服務(wù)器。服務(wù)器包括:存儲(chǔ)單元,配置為存儲(chǔ)每個(gè)服務(wù)域的會(huì)話模式;通信單元,配置為從顯示裝置接收用戶語音;控制單元,配置為確定包括用戶語音的服務(wù)域,基于所確定的服務(wù)域的會(huì)話模式產(chǎn)生與用戶語音相對(duì)應(yīng)的響應(yīng)信息,控制通信單元向顯示裝置發(fā)送所述響應(yīng)信息。當(dāng)確定當(dāng)前接收的用戶語音包括在不同于包括先前接收的用戶語音的服務(wù)域的另一服務(wù)域時(shí),控制單元基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與當(dāng)前接收的用戶語音相對(duì)應(yīng)的響應(yīng)信息。
【專利說明】服務(wù)器和控制該服務(wù)器的方法
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求2012年6月15日向韓國知識(shí)產(chǎn)權(quán)局提交的韓國專利申請(qǐng)10-2012-0064505的優(yōu)先權(quán),該申請(qǐng)的公開通過全文引用合并于此。
【技術(shù)領(lǐng)域】
[0003]根據(jù)示例性實(shí)施例的裝置和方法涉及服務(wù)器和控制所述服務(wù)器的方法,更具體地,涉及控制能夠與用戶交互的顯示裝置的服務(wù)器,以及控制所述服務(wù)器的方法。
【背景技術(shù)】
[0004]隨著電子技術(shù)的發(fā)展,發(fā)展和廣泛應(yīng)用了多種顯示裝置,所述多種顯示裝置根據(jù)用戶的要求包括多種功能。具體地,近年來,電視(TV)連接到因特網(wǎng)并支持因特網(wǎng)服務(wù),因此,用戶通過TV可以觀看許多數(shù)字廣播頻道。
[0005]近年來,使用語音識(shí)別的技術(shù)得到發(fā)展,以便更輕松和直觀地控制顯示裝置。具體地,TV可以識(shí)別用戶語音,并執(zhí)行與用戶語音相對(duì)應(yīng)的功能,例如音量調(diào)節(jié)或頻道改變。
[0006]然而,相關(guān)領(lǐng)域中識(shí)別用戶語音的顯示裝置提供與所識(shí)別的語音相對(duì)應(yīng)的功能,但是顯示裝置無法通過用戶的會(huì)話提供交互信息。
【發(fā)明內(nèi)容】
[0007]一個(gè)或多個(gè)示例性實(shí)施例可以克服以上缺點(diǎn)和以上未描述的其它缺點(diǎn)。然而,應(yīng)理解,一個(gè)或多個(gè)示例性實(shí)施例并不要求克服上述缺點(diǎn),并且可以不克服以上描述的任何問題。
[0008]一個(gè)或多個(gè)示例性實(shí)施例提供了能夠控制顯示裝置的服務(wù)器和控制所述服務(wù)器的方法,所述顯示裝置通過考慮包括用戶語音的服務(wù)域來和用戶交互。
[0009]根據(jù)一個(gè)示例性實(shí)施例的一個(gè)方面,提供一種與顯示裝置交互的服務(wù)器。所述服務(wù)器可以包括:存儲(chǔ)器,存儲(chǔ)服務(wù)域的會(huì)話模式;通信器,配置為接收來自顯示裝置的語音表達(dá);以及控制器,配置為確定與所述語音表達(dá)有關(guān)的服務(wù)域,基于所確定的服務(wù)域的會(huì)話模式產(chǎn)生與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息,并且控制通信器向顯示裝置發(fā)送所述響應(yīng)信息。當(dāng)確定當(dāng)前接收的語音表達(dá)被包括在不同于包括先前接收的語音表達(dá)的服務(wù)域的另一服務(wù)域中時(shí),控制器基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所述當(dāng)前接收的語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息。
[0010]當(dāng)在組成服務(wù)域的空位被所述先前接收的語音表達(dá)填滿之前便確定所述當(dāng)前接收的語音表達(dá)被包括在所述另一服務(wù)域中時(shí),控制器基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所述當(dāng)前接收的語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息。
[0011]控制器確定所述當(dāng)前接收的語音表達(dá)中包括的話語意圖,基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并控制通信器向顯示裝置發(fā)送所述響應(yīng)信息。[0012]所述響應(yīng)信息包括與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)消息信息,并且顯示裝置基于所述響應(yīng)消息信息輸出與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)消息。
[0013]所述響應(yīng)信息還包括用于控制顯示裝置的功能的控制命令。
[0014]根據(jù)示例性實(shí)施例的另一方面,提供一種控制與顯示裝置交互的服務(wù)器的方法。所述方法可以包括:接收來自顯示裝置的語音表達(dá);利用會(huì)話模式確定包括所述語音表達(dá)的服務(wù)域;當(dāng)當(dāng)前接收的語音表達(dá)被包括在不同于具有先前接收的語音表達(dá)的服務(wù)域的另一服務(wù)域中時(shí),基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所述當(dāng)前接收的語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息;以及向顯示裝置發(fā)送所產(chǎn)生的響應(yīng)信息。。
[0015]所述產(chǎn)生包括:當(dāng)在組成服務(wù)域的空位被所述先前接收的語音表達(dá)填滿前確定所述當(dāng)前接收的語音表達(dá)被包括在所述另一服務(wù)域中時(shí),基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所述當(dāng)前接收的語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息。
[0016]或者,所述產(chǎn)生包括:確定在所述語音表達(dá)中包括的話語意圖,以及基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息。
[0017]所述響應(yīng)信息包括與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)消息信息,并且顯示裝置基于所述響應(yīng)消息信息輸出與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)消息。
[0018]所述響應(yīng)信息還包括用于控制顯示裝置的功能的控制命令。
[0019]如上所述,根據(jù)多個(gè)示例性實(shí)施例,盡管改變了包括語音表達(dá)的服務(wù)域,但是可以基于改變的服務(wù)域,輸出與語音表達(dá)相對(duì)應(yīng)的響應(yīng)消息。因此,可以在不考慮服務(wù)域的情況下,在用戶和顯示裝置之間實(shí)現(xiàn)無中斷的交互。
[0020]上述語音表達(dá)可以是用戶的語音表達(dá)。
[0021]根據(jù)示例性實(shí)施例的另一方面,提供了與顯示裝置交互的服務(wù)器。所述服務(wù)器可以包括:存儲(chǔ)器,存儲(chǔ)服務(wù)域的會(huì)話模式;通信器,配置接收來自顯示裝置的語音表達(dá);以及控制器,配置為在多個(gè)服務(wù)域中確定服務(wù)域,基于所確定的服務(wù)域的會(huì)話模式產(chǎn)生與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息,并且控制通信器向顯示裝置發(fā)送所述響應(yīng)信息,所述多個(gè)服務(wù)域中的每一個(gè)與相應(yīng)的會(huì)話模式有關(guān)。
[0022]控制器可以確定在接收的語音表達(dá)中包括的話語意圖,基于所述會(huì)話模式產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并且控制通信器向顯示裝置發(fā)送所述響應(yīng)信息。
[0023]根據(jù)再一示例性實(shí)施例,提供了一種控制與顯示裝置交互的服務(wù)器的方法,所述方法包括:接收來自顯示裝置的語音表達(dá);利用會(huì)話模式在多個(gè)服務(wù)域中確定與所述語音表達(dá)有關(guān)的服務(wù)域,所述多個(gè)服務(wù)域中的每一個(gè)與相應(yīng)的會(huì)話模式有關(guān);基于所確定的服務(wù)域的會(huì)話模式產(chǎn)生與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息;以及向顯示裝置發(fā)送所產(chǎn)生的響應(yīng)信息。
[0024]示例性實(shí)施例的其他方面將在【具體實(shí)施方式】中詳盡地闡述,并通過【具體實(shí)施方式】而變得顯而易見,或者可以通過實(shí)施示例性實(shí)施例而被了解。
【專利附圖】
【附圖說明】
[0025]結(jié)合附圖,通過詳細(xì)描述示例性實(shí)施例,以上和/或其它方面將更為明顯,附圖中:
[0026]圖1是示出了根據(jù)示例性實(shí)施例的交互系統(tǒng)的示意圖;[0027]圖2是示出了根據(jù)示例性實(shí)施例的顯示裝置的配置的框圖;
[0028]圖3是示出了在圖2中所示顯示裝置的詳細(xì)配置的框圖;
[0029]圖4是示出了根據(jù)示例性實(shí)施例的服務(wù)器的配置的框圖;
[0030]圖5是示出了根據(jù)示例性實(shí)施例的交互系統(tǒng)的操作的示意圖;
[0031]圖6是示出了根據(jù)示例性實(shí)施例的控制服務(wù)器的方法的流程圖。
【具體實(shí)施方式】
[0032]以下文中,結(jié)合附圖,更詳細(xì)地描述示例性實(shí)施例。
[0033]在以下描述中,即便在不同的附圖中,相同附圖標(biāo)記用于表示相同元件。提供在描述中定義的內(nèi)容,例如具體結(jié)構(gòu)和元件,以幫助對(duì)示例性實(shí)施例的全面理解。因此,應(yīng)該清楚在沒有那些具體限定的內(nèi)容時(shí)也能夠?qū)嵤┦纠詫?shí)施例。此外,因?yàn)橄嚓P(guān)領(lǐng)域公知的功能或元件可能以不必要的細(xì)節(jié)混淆示例性實(shí)施例,所以沒有詳細(xì)描述這些公知功能或元件。
[0034]圖1是示出了根據(jù)示例性實(shí)施例的交互系統(tǒng)的示意圖。如圖1所示,交互系統(tǒng)包括顯示裝置100和服務(wù)器200。盡管顯示裝置100可以是如圖1所示的智能TV,這僅是示意性的。顯示裝置可以實(shí)現(xiàn)為多種電子設(shè)備,例如,移動(dòng)電話(例如,智能電話)、臺(tái)式個(gè)人計(jì)算機(jī)(PC)、膝上式PC、導(dǎo)航系統(tǒng)等。
[0035]此處,顯示裝置100可以由遙控器(未示出)控制,以便控制顯示裝置100。例如,如果顯示裝置100實(shí)現(xiàn)為電視,則根據(jù)從遙控器(未示出)接收的控制信號(hào),可以執(zhí)行例如電源開/關(guān)、頻道改變以及音量調(diào)節(jié)等操作。
[0036]顯示裝置100可以 向服務(wù)器200發(fā)送所收集的用戶語音,服務(wù)器200可以產(chǎn)生與從顯示裝置100接收的用戶語音相對(duì)應(yīng)的響應(yīng)信息,以及向顯示裝置100發(fā)送產(chǎn)生的響應(yīng)信息。用戶的“語音”可以包括語音數(shù)據(jù)、用戶的語音化陳述、用戶的語音化提問、用戶的語音化聲音、語音化表達(dá)等。
[0037]具體地,服務(wù)器200可以確定包括用戶語音的服務(wù)域,基于所確定的服務(wù)域的會(huì)話模式,產(chǎn)生用戶的響應(yīng)信息。例如,當(dāng)收集到語音化表達(dá)“當(dāng)前在廣播的節(jié)目的名稱是什么? ”時(shí),服務(wù)器200可以確定接收的語音為廣播服務(wù)域,在存儲(chǔ)在廣播服務(wù)域中的會(huì)話模式中確定與接收的語音相對(duì)應(yīng)的響應(yīng),并向顯示裝置100傳送所述響應(yīng)。
[0038]顯示裝置100可以基于從服務(wù)器200接收到的響應(yīng)信息執(zhí)行多種操作。在上述示例中,顯示裝置100可以根據(jù)響應(yīng)信息輸出消息“所詢問的節(jié)目名稱是〇〇〇”,作為語音化表達(dá)“當(dāng)前在廣播的節(jié)目的名稱是什么?”的響應(yīng),所述消息可以是以語音或文本形式,或者是語音和文本形式的結(jié)合。
[0039]即使當(dāng)包括當(dāng)前收集的用戶語音的服務(wù)域不同于包括先前收集的用戶語音的服務(wù)域時(shí),顯示裝置100也可以輸出與當(dāng)前收集的用戶語音相對(duì)應(yīng)的響應(yīng)消息或執(zhí)行與用戶語音相對(duì)應(yīng)的功能。
[0040]也就是說,當(dāng)確定包括當(dāng)前接收的用戶語音的服務(wù)域不同于包括先前接收的來自顯示裝置100的用戶語音的服務(wù)域時(shí),服務(wù)器200可以使用另一服務(wù)域的會(huì)話模式,產(chǎn)生與當(dāng)前接收的用戶語音相對(duì)應(yīng)的響應(yīng)信息,并且向顯示裝置100發(fā)送所述響應(yīng)信息。
[0041 ] 在上述示例中,假定在接收到語音化表達(dá)“當(dāng)前在廣播的節(jié)目的名稱是什么? ”之后,從顯示裝置100接收語音化表達(dá)“今天天氣怎樣? ”在這種情況下,當(dāng)確定包括當(dāng)前接收的用戶語音的服務(wù)域是天氣服務(wù)域時(shí),服務(wù)器200在存儲(chǔ)在天氣服務(wù)域中的會(huì)話模式中,檢測(cè)與當(dāng)前接收的用戶語音相對(duì)應(yīng)的響應(yīng),并向顯示裝置100發(fā)送檢測(cè)到的響應(yīng)“讓我們知道所需的區(qū)域”。
[0042]如上所述,即使當(dāng)用戶當(dāng)前發(fā)出的語音包括于不同于包括先前發(fā)出的語音的服務(wù)域的另一服務(wù)域中時(shí),根據(jù)示例性實(shí)施例的交互系統(tǒng)可以向用戶提供連續(xù)的響應(yīng)。
[0043]圖2是示出了根據(jù)示例性實(shí)施例的顯示裝置的配置的框圖。參考圖2,顯示裝置100包括輸出單元110、語音收集單元120、通信單元130和控制單元140。
[0044]輸出單元110輸出視頻和音頻中的至少一種。具體地,輸出單元110可以以語音形式、文本形式或者兩者結(jié)合形式中的至少一種輸出與通過語音收集單元120收集的用戶語音相對(duì)應(yīng)的響應(yīng)消息。
[0045]因此,輸出單元110可以包括顯示單元(未示出)和音頻輸出單元(未示出)。
[0046]具體地,顯示單元(未示出)可以實(shí)現(xiàn)為液晶顯示器(LCD)、有機(jī)發(fā)光顯示器(OLED)、或者等離子顯示面板(PDP),并提供可由顯示裝置100提供的多種顯示屏幕。具體地,顯示單元(未示出)可以以文本形式或者圖像形式顯示與用戶語音相對(duì)應(yīng)的響應(yīng)消息。
[0047]此處,顯示單元(未示出)可以實(shí)現(xiàn)為觸摸屏類型,其中顯示單元和觸摸板形成雙層結(jié)構(gòu),觸摸屏可以配置為觸摸輸入的檢測(cè)位置、區(qū)域、或壓力。
[0048]音頻輸出單元(未示出)可以實(shí)現(xiàn)為輸出端口例如插孔等,或者實(shí)現(xiàn)為揚(yáng)聲器,以語音形式輸出與用戶語音相對(duì)應(yīng)的響應(yīng)消息。
[0049]同時(shí),輸出單元110可以輸出多種視頻和音頻。此處,所述視頻和音頻可以是組成廣播內(nèi)容、多媒體內(nèi)容等的視頻和音頻。
[0050]語音收集單元120收集用戶語音。例如,語音收集單元120可以實(shí)現(xiàn)為配置成收集用戶語音的麥克風(fēng)。語音收集單元120可以在顯示裝置100內(nèi)與顯示裝置100集成實(shí)現(xiàn),或者與顯示裝置100相獨(dú)立地實(shí)現(xiàn)。當(dāng)語音收集單元120與顯示裝置100相獨(dú)立地實(shí)現(xiàn)時(shí),語音收集單元120可以實(shí)現(xiàn)為手持型或可以放置在爐臺(tái)或桌子上的類型。語音收集單元120可以通過有線或無線網(wǎng)絡(luò)與顯示裝置100連接,并向顯示裝置100發(fā)送收集的用戶語音。
[0051]另外,語音收集單元120可以確定收集的用戶語音是否是由用戶發(fā)出的語音,并從語音中濾除噪聲(例如,空調(diào)聲音、吸塵器聲音、音樂聲音等)。
[0052]例如,當(dāng)輸入模擬用戶語音時(shí),語音收集單元120對(duì)模擬用戶語音取樣,并將用戶語音轉(zhuǎn)換為數(shù)字信號(hào)。語音收集單元120計(jì)算所轉(zhuǎn)換的數(shù)字信號(hào)的能量,確定數(shù)字信號(hào)的能量是否等于或大于預(yù)設(shè)值。
[0053]當(dāng)確定數(shù)字信號(hào)的能量等于或大于預(yù)設(shè)值時(shí),語音收集單元120去除噪音,并發(fā)送去除噪音的語音。噪音成分是在家庭環(huán)境中發(fā)生的突兀噪音(例如,空調(diào)聲音,吸塵器聲音或音樂聲音)。當(dāng)確定數(shù)字信號(hào)的能量小于預(yù)設(shè)值時(shí),語音收集單元120不對(duì)數(shù)字信號(hào)執(zhí)行處理,等待另一輸入。因此,由于除了用戶發(fā)出的語音之外的其他聲音不會(huì)激活整個(gè)音頻處理過程,所以避免了不必要的功耗。
[0054]通信單元130執(zhí)行與服務(wù)器(圖1的200)的通信。具體地,通信單元130可以向服務(wù)器200發(fā)送用戶語音并從服務(wù)器200接收與用戶語音相對(duì)應(yīng)的響應(yīng)信息。[0055]因此,通信單元130可以執(zhí)行與服務(wù)器200的通信。
[0056]例如,通信單元130可以使用有線/無線LAN(局域網(wǎng))、WAN、以太網(wǎng)、藍(lán)牙、Zigbee, USB (通用串行總線)、IEEE1394、WiFi等,執(zhí)行與服務(wù)器200的通信。為了執(zhí)行這樣的操作,通信單元130可以包括與每種通信方法相對(duì)應(yīng)的芯片或輸入端口等。例如,當(dāng)基于有線LAN方法執(zhí)行通信時(shí),通信單元130可以包括有線LAN卡(未示出)和輸入端口(未示出)。
[0057]控制單元140控制顯示裝置100的整體操作。具體地,控制單元140可以控制語音收集單元120收集用戶語音,并控制通信單元130向服務(wù)器200發(fā)送收集的用戶語音。除此之外,控制單元140可以控制通信單元130接收與來自服務(wù)器200的用戶語音相對(duì)應(yīng)的響應(yīng)信息。
[0058]控制單元140可以控制輸出單元110,以便基于從服務(wù)器200接收到的響應(yīng)信息,
輸出與用戶語音相對(duì)應(yīng)的響應(yīng)消息。
[0059]此處,響應(yīng)信息可以包括用于輸出響應(yīng)消息的響應(yīng)消息信息。響應(yīng)消息信息是這樣的信息,其中以文本形式表示與用戶語音相對(duì)應(yīng)的響應(yīng)消息,控制單元140可以基于響應(yīng)消息信息,通過輸出單元110以語音形式和文本形式中的至少一種,輸出與用戶語音相對(duì)應(yīng)的響應(yīng)消息。
[0060]具體地,控制單元140可以利用文本到語音(TTS)引擎將文本類型響應(yīng)消息信息轉(zhuǎn)換為語音,并通過輸出單元110輸出語音。此處,TTS引擎是配置為將文本轉(zhuǎn)換為語音的模塊,可以利用公開的多種TTS算法將文本轉(zhuǎn)換為語音。此外,控制單元140配置包括組成響應(yīng)消息信息的文本的用戶界面(UI)屏幕,并通過輸出單元110輸出UI屏幕。
[0061]例如,當(dāng)實(shí)現(xiàn)為電視的顯示裝置100收集用戶語音“節(jié)目什么時(shí)候開始? ”時(shí),月艮務(wù)器200可以以文本形式向顯示裝置100發(fā)送“您指哪個(gè)節(jié)目? ”。在這種情況下,控制器140可以控制從而將“您指哪個(gè)節(jié)目? ”轉(zhuǎn)換為語音,通過輸出單元110輸出語音,或者可以構(gòu)建并通過輸出單元110輸出包括“您指哪個(gè)節(jié)目? ”的文本的屏幕。
[0062]如上所述,在顯示裝置內(nèi)不執(zhí)行任何功能且控制單元140輸出與用戶語音相對(duì)應(yīng)的響應(yīng)消息的情況可以是這樣的一種情況:用戶語音可能包括請(qǐng)求執(zhí)行不能在顯示裝置100中執(zhí)行的功能的內(nèi)容,或者可能包括需要答案的提問。
[0063]例如,當(dāng)顯示裝置100實(shí)現(xiàn)為智能TV,并且輸入用戶語音“呼叫XXX”,但不支持視頻電話功能時(shí),控制單元140可以不執(zhí)行處理,并基于響應(yīng)消息信息,通過輸出單元110以文本形式和語音形式中的至少一種輸出響應(yīng)消息“不支持該功能”。此外,當(dāng)顯示裝置100實(shí)現(xiàn)為智能TV,輸入用戶語音“讓我們知道最受歡迎節(jié)目的名稱”時(shí),控制單元140可以不執(zhí)行處理,并基于響應(yīng)消息信息,通過輸出單元110以文本形式和語音形式中的至少一種輸出響應(yīng)消息“最受歡迎節(jié)目是O O O (節(jié)目的名稱)”。
[0064]響應(yīng)信息可以進(jìn)一步包括用于控制顯示裝置100的功能的控制命令。因此,基于從服務(wù)器200接收的控制命令,控制單元140可以根據(jù)顯示裝置100的類型,控制顯示裝置100的各個(gè)組件執(zhí)行在顯示裝置100內(nèi)可執(zhí)行的特定功能。
[0065]例如,當(dāng)顯示裝置100實(shí)現(xiàn)為電視,且收集到用戶語音“將音量調(diào)大”時(shí),服務(wù)器200可以向顯示裝置100發(fā)送控制命令來調(diào)大顯示裝置100的音量。在這種情況下,基于所述控制命令,控制單元140可以通過輸出單元110增加音頻音量輸出。然而,這只是一個(gè)示例,控制單元140可以根據(jù)收集的用戶語音,控制顯示裝置100的每個(gè)組件以便執(zhí)行多種操作,例如電源開/關(guān)、頻道改變和音量調(diào)節(jié)。
[0066]此外,響應(yīng)信息可以包括用于控制顯示裝置100的功能的控制命令和與根據(jù)控制命令執(zhí)行的特定功能有關(guān)的響應(yīng)消息信息。在這種情況下,控制單元140可以執(zhí)行根據(jù)執(zhí)行命令的功能,通過輸出單元110,以文本形式和語音形式中的至少一種輸出與控制命令有關(guān)的響應(yīng)消息。
[0067]例如,當(dāng)用戶語音包括可以執(zhí)行在顯示裝置100中可執(zhí)行的功能的內(nèi)容時(shí),控制單元140可以根據(jù)從服務(wù)器200接收的控制命令,執(zhí)行用戶想要的功能,并基于從服務(wù)器200接收的響應(yīng)消息信息,以文本形式和語音形式中的至少一種輸出與所執(zhí)行的功能有關(guān)的信息。例如,當(dāng)顯示裝置100實(shí)現(xiàn)為智能TV,用戶的語音表達(dá)為“將頻道改變?yōu)榈?1頻道”時(shí),控制單元140可以根據(jù)用于將頻道改變?yōu)榈?1頻道的控制命令選擇第11頻道,并基于響應(yīng)消息信息,通過輸出單元110,以文本形式和語音形式中的至少一種輸出響應(yīng)消息“頻道已改為第11頻道”或“頻道改變已經(jīng)完成”。
[0068]此外,即使包括當(dāng)前收集的用戶語音的服務(wù)域不同于包括先前收集的用戶語音的服務(wù)域時(shí),控制單元140可以輸出與當(dāng)前收集的用戶語音相對(duì)應(yīng)的響應(yīng)消息,或執(zhí)行與用戶語音相對(duì)應(yīng)的功能。
[0069]例如,假定顯示裝置100基于從服務(wù)器200接收的針對(duì)先前收集的用戶語音“當(dāng)前在廣播的節(jié)目的名稱是什么? ”的響應(yīng)信息,輸出響應(yīng)消息“所詢問的節(jié)目是O O O (節(jié)目的名稱)”。接著,當(dāng)收集到包括在不同于包括先前用戶語音的服務(wù)域的另一服務(wù)域的用戶的語音化表達(dá)“今天天氣怎樣? ”時(shí),控制單元140可以基于從服務(wù)器200接收到的響應(yīng)信息,通過輸出單元110,以語音形式和文本形式中的至少一種輸出響應(yīng)消息“讓我們知道所需的區(qū)域”。
[0070]也就是說,即使根據(jù)用戶語音還未完全填滿特定服務(wù)域中提供的空位(slot)時(shí),當(dāng)緊接著接收到包括在另一服務(wù)域中的用戶語音時(shí),控制單元140可以輸出與緊接著接收到的用戶語音相對(duì)應(yīng)的響應(yīng)消息。
[0071]因此,當(dāng)接收到包括在另一服務(wù)域中的用戶語音時(shí),服務(wù)器200可以基于所述另一服務(wù)域的會(huì)話模式,產(chǎn)生與用戶語音相對(duì)應(yīng)的響應(yīng)信息,并向顯示裝置100發(fā)送響應(yīng)信息。后面將參考圖4描述上述操作。
[0072]盡管上述示例性實(shí)施例闡述了從服務(wù)器200發(fā)送的響應(yīng)消息信息,其中響應(yīng)消息以文本形式表示,但這僅是示例性的。也就是說,響應(yīng)消息信息是組成從顯示裝置100輸出的響應(yīng)消息的語音數(shù)據(jù)本身,或組成相應(yīng)的響應(yīng)消息的部分語音數(shù)據(jù)?;蛘?,響應(yīng)消息信息可以具有控制信號(hào)的形式,所述控制信號(hào)用于使用在顯示裝置100中預(yù)存的語音或文本來輸出相應(yīng)的響應(yīng)消息。
[0073]因此,控制單元140可以通過考慮響應(yīng)消息信息的類型來輸出響應(yīng)消息。具體地,當(dāng)接收到組成響應(yīng)消息的語音消息本身時(shí),控制單元140可以以能夠在輸出單元110輸出的形式處理相應(yīng)的數(shù)據(jù),并輸出處理后的數(shù)據(jù)。
[0074]當(dāng)接收到用于輸出響應(yīng)消息的控制信號(hào)時(shí),控制單元140可以在預(yù)存在顯示裝置100中的數(shù)據(jù)中搜索與控制信號(hào)匹配的數(shù)據(jù),以能夠輸出的形式處理搜索到的語音或文本數(shù)據(jù),通過輸出單元110輸出處理后的數(shù)據(jù)。因此,顯示裝置100可以存儲(chǔ)用于提供與功能執(zhí)行有關(guān)的響應(yīng)消息的語音或文本數(shù)據(jù),或者與用于提供信息的請(qǐng)求有關(guān)的語音或文本數(shù)據(jù)。例如,顯示裝置100可以以整句的形式存儲(chǔ)數(shù)據(jù)(例如:“頻道改變已經(jīng)完成”)或組成句子的部分?jǐn)?shù)據(jù)(例如,“頻道已改為第XX頻道”)。在這種情況下,可以從服務(wù)器200接收允許使相應(yīng)的句子完整的頻道的名稱。
[0075]圖3是示出了在圖2中所示顯示裝置的詳細(xì)配置的框圖。參考圖3,除了圖2中所示的組件,顯示裝置100可以進(jìn)一步包括輸入單元150、存儲(chǔ)單元160、接收單元170和信號(hào)處理單元180。與圖2中所示組件重復(fù)的圖3中所示部分組件具有相同的功能,所以其省略詳細(xì)描述。
[0076]輸入單元150是輸入單元,配置為接收用戶的多種操作,向控制單元140發(fā)送接收的操作,并可以實(shí)現(xiàn)為輸入面板。此處,輸入面板可以是觸摸板型、包括多種功能鍵、數(shù)字鍵、專用鍵、字母鍵等的鍵區(qū)型或是觸摸屏型。除此之外,輸入單元160可以實(shí)現(xiàn)為配置成接收從遙控器發(fā)送的遙控信號(hào)的紅外(IR)接收單元(未示出),所述遙控信號(hào)用于控制顯示裝置100。
[0077]輸入單元150可以接收用于控制顯示裝置100的功能的用戶的多種操作。例如,當(dāng)顯示裝置100實(shí)現(xiàn)為智能TV時(shí),輸入單元150可以接收用于控制智能TV的功能(例如,電源開/關(guān)、頻道改變以及音量調(diào)節(jié))的用戶操作。在這種情況下,控制單元140控制其他組件執(zhí)行與來自輸入單元150的用戶操作輸入相對(duì)應(yīng)的多種功能。例如,當(dāng)接收到電源關(guān)閉命令時(shí),控制單元140可以中斷向顯示裝置100的各個(gè)組件供給的電力。當(dāng)接收到頻道改變命令,控制單元140可以控制接收單元170選擇由用戶操作所選的頻道。
[0078]具體地,輸入單元150接收用戶操作,以便啟動(dòng)用于收集用戶語音的語音識(shí)別模式。例如,輸入單元150可以實(shí)現(xiàn)為具有顯示單元的觸摸屏型,并可以顯示用于接收語音識(shí)別模式的對(duì)象(例如,圖標(biāo))?;蛘?,輸入單元150可以包括用于接收語音識(shí)別模式的單獨(dú)的按鈕。當(dāng)通過輸入單元150接收到用于啟動(dòng)語音識(shí)別模式的用戶操作時(shí),控制單元140可以激活語音收集單元120,并收集在預(yù)設(shè)范圍內(nèi)發(fā)出的用戶語音。接著,控制單元140可以控制接收與用戶語音相對(duì)應(yīng)的響應(yīng)信息,所述用戶語音是通過與服務(wù)器200通信而收集的,并且輸出響應(yīng)消息或執(zhí)行特定功能。
[0079]存儲(chǔ)單元160是一種配置為存儲(chǔ)操作顯示裝置100所必需的多種程序的存儲(chǔ)介質(zhì),可以實(shí)現(xiàn)為存儲(chǔ)器、硬盤驅(qū)動(dòng)器(HDD)等。例如,存儲(chǔ)單元160可以包括配置為存儲(chǔ)用于執(zhí)行控制單元140的操作的程序的只讀存儲(chǔ)器(ROM),配置為根據(jù)控制單元140的操作的執(zhí)行來暫時(shí)存儲(chǔ)數(shù)據(jù)的隨機(jī)存儲(chǔ)器(RAM)等。存儲(chǔ)單元160可以進(jìn)一步包括配置為存儲(chǔ)多種參考數(shù)據(jù)的電可擦除可編程只讀存儲(chǔ)器(EEPROM)等。
[0080]具體地,存儲(chǔ)單元160可以以語音或文本的形式事先存儲(chǔ)與用戶語音相對(duì)應(yīng)的多種響應(yīng)消息。因此,控制單元140可以讀取與從服務(wù)器200接收的語音消息信息(具體地,控制信號(hào))相對(duì)應(yīng)的語音和文本數(shù)據(jù)中的至少一種,向音頻輸出單元112或顯示單元111輸出讀取的數(shù)據(jù)。在這種情況下,控制單元140可以執(zhí)行信號(hào)處理,例如對(duì)語音數(shù)據(jù)解碼、放大解碼后的語音數(shù)據(jù)以及向音頻輸出單元112輸出放大后的語音數(shù)據(jù)?;蛘?,控制單元140可以配置包括組成文本數(shù)據(jù)的文本的Π屏幕,通過顯示單元111輸出Π屏幕。盡管上述示例性實(shí)施例闡述了控制單元140執(zhí)行對(duì)從存儲(chǔ)單元160讀取的語音和文本數(shù)據(jù)的信號(hào)處理,但控制單元可以控制信號(hào)處理單元180執(zhí)行對(duì)語音和文本數(shù)據(jù)的信號(hào)處理。[0081]接收單元170接收多種內(nèi)容。具體地,接收單元170接收來自配置為利用廣播網(wǎng)發(fā)送廣播節(jié)目?jī)?nèi)容的廣播站或配置為利用因特網(wǎng)發(fā)送內(nèi)容文件的網(wǎng)絡(luò)服務(wù)器的內(nèi)容。此外,接收單元170可以接收來自不同記錄介質(zhì)重現(xiàn)裝置的內(nèi)容,所述記錄介質(zhì)重現(xiàn)裝置設(shè)置于顯示裝置100內(nèi)或與顯示裝置100相連接。記錄介質(zhì)重現(xiàn)裝置是一種配置為重現(xiàn)存儲(chǔ)在不同類型記錄介質(zhì)(例如,光盤(CD)、數(shù)字多用盤(DVD)、藍(lán)光盤、存儲(chǔ)卡或者通用串行總線(USB)存儲(chǔ)器)內(nèi)的內(nèi)容的裝置。
[0082]在接收來自廣播站的內(nèi)容的示例性實(shí)施例中,接收單元170可以實(shí)現(xiàn)為包括如調(diào)諧器、解調(diào)器、均衡器等配置,所列配置在圖3中未示出。在接收來自源(例如,網(wǎng)絡(luò)服務(wù)器)的內(nèi)容的示例性實(shí)施例中,接收單元170可以實(shí)現(xiàn)為網(wǎng)絡(luò)接口卡(未示出)?;蛘?,在接收來自上述多種記錄介質(zhì)重現(xiàn)裝置的內(nèi)容的示例性實(shí)施例中,接收單元170可以實(shí)現(xiàn)為與記錄介質(zhì)重現(xiàn)裝置相連接的接口單元(未示出)。如上所述,接收單元170可以根據(jù)示例性實(shí)施例實(shí)現(xiàn)為多種類型。
[0083]信號(hào)處理單元180對(duì)通過接收單元170接收到的內(nèi)容執(zhí)行信號(hào)處理,所述內(nèi)容要從輸出單元110輸出。
[0084]具體地,信號(hào)處理單元180可以對(duì)內(nèi)容中包括的視頻信號(hào)執(zhí)行操作,例如解碼、縮放和幀率轉(zhuǎn)換,并將處理過的視頻信號(hào)轉(zhuǎn)換為能夠在顯示單元111中輸出的形式的視頻信號(hào)。此外,信號(hào)處理單元180可以對(duì)內(nèi)容中包括的音頻信號(hào)執(zhí)行信號(hào)處理,并將處理過的音頻信號(hào)轉(zhuǎn)換為能夠在音頻輸出單元112中輸出的形式的音頻信號(hào)。
[0085]圖4是示出了根據(jù)示例性實(shí)施例的服務(wù)器的配置的框圖。參考圖4,服務(wù)器200包括存儲(chǔ)單元210,通信單元220和控制單元230。
[0086]存儲(chǔ)單元存儲(chǔ)每個(gè)服務(wù)域的會(huì)話模式。此處,根據(jù)包括用戶發(fā)出的語音的主題,月艮務(wù)域可以分為“廣播”、“ VOD”、“應(yīng)用管理”、“裝置管理”、“信息(天氣、股票、新聞等)”等。然而,這只是示例性的,服務(wù)域可以根據(jù)其它多種主題分類。
[0087]更為具體地,存儲(chǔ)單元210可以包括用于每個(gè)服務(wù)域的語料數(shù)據(jù)庫。此處,語料數(shù)據(jù)庫可以實(shí)現(xiàn)為存儲(chǔ)示例性語句和相應(yīng)的響應(yīng)。也就是說,存儲(chǔ)單元210可以存儲(chǔ)多個(gè)示例性語句和對(duì)每個(gè)服務(wù)域的每個(gè)語句的響應(yīng)。除此之外,存儲(chǔ)單元210可以向每個(gè)語句附加信息,以便解釋示例性語句和對(duì)所述語句的預(yù)期響應(yīng),并存儲(chǔ)所述信息。
[0088]例如,存儲(chǔ)單元210可以包括用于廣播服務(wù)域的第一語料數(shù)據(jù)庫和用于天氣服務(wù)域的第二語料數(shù)據(jù)庫。
[0089]在這種情況下,第一語料數(shù)據(jù)庫可以存儲(chǔ)在廣播服務(wù)域中產(chǎn)生的多種會(huì)話模式。
[0090]例如,假設(shè)在廣播服務(wù)域中存儲(chǔ)示例性語句“節(jié)目什么時(shí)間開始? ”的情況。
[0091]在這種情況下,存儲(chǔ)單元120可以向語句例如“節(jié)目什么時(shí)間開始? ”附加用于解釋相應(yīng)語句的信息,并存儲(chǔ)所述信息。具體地,存儲(chǔ)單元210可以向相應(yīng)的語句附加信息:語句“節(jié)目什么時(shí)間開始”中的“節(jié)目”是指廣播節(jié)目,“什么時(shí)間開始”是用于詢問廣播時(shí)間,以及“?”意味著語句是疑問句,并存儲(chǔ)所述信息。
[0092]此外,存儲(chǔ)單元210可以向相應(yīng)的語句附加對(duì)“節(jié)目什么時(shí)間開始?”的響應(yīng),并存儲(chǔ)所述響應(yīng)。具體地,存儲(chǔ)單元210可以附加“您想知道哪個(gè)節(jié)目? ”作為響應(yīng),并存儲(chǔ)所述響應(yīng)。
[0093]然而,這僅是示例性的,存儲(chǔ)單元210可以存儲(chǔ)語句“000 (廣播節(jié)目的名稱)什么時(shí)間開始? ”,并附加用于解釋語句的信息以及對(duì)相應(yīng)的語句的響應(yīng),并存儲(chǔ)所述信息和響應(yīng)。
[0094]具體地,針對(duì)語句例如“000(廣播節(jié)目的名稱)什么時(shí)間開始? ”,存儲(chǔ)單元210可以向相應(yīng)的語句附加信息:“000(廣播節(jié)目的名稱)”是指廣播節(jié)目,“什么時(shí)間”是用于詢問廣播時(shí)間,以及“?”意味著語句是疑問句,并存儲(chǔ)所述信息。此外,存儲(chǔ)單元210可以向相應(yīng)的語句附加信息:在語句中出現(xiàn)與廣播節(jié)目有關(guān)的詞語,例如“什么時(shí)間?? ”,并存儲(chǔ)所述信息。此處,與廣播節(jié)目有關(guān)的詞語可以包括廣播節(jié)目的名稱、演員和制作人。
[0095]另外,存儲(chǔ)單元210可以向相應(yīng)的語句附加對(duì)“000(廣播節(jié)目的名稱)什么時(shí)間開始? ”的響應(yīng),并存儲(chǔ)所述響應(yīng)。具體地,存儲(chǔ)單元210可以附加“您所詢問的〈廣播節(jié)目的名稱 > 的廣播時(shí)間是〈廣播時(shí)間 >”作為對(duì)“000(廣播節(jié)目的名稱)什么時(shí)間開始? ”的響應(yīng),并存儲(chǔ)所述響應(yīng)。
[0096]如此,存儲(chǔ)單元210可以在廣播服務(wù)域中存儲(chǔ)多種會(huì)話模式。
[0097]第二語料數(shù)據(jù)庫可以存儲(chǔ)可能在天氣服務(wù)域中發(fā)生的會(huì)話模式。
[0098]例如,假設(shè)在天氣服務(wù)域中存儲(chǔ)“在000(區(qū)域的名稱)處的天氣怎么樣? ”的情況。
[0099]在這種情況下,存儲(chǔ)單元210可以向語句例如“在000(區(qū)域的名稱)處的天氣怎么樣? ”附加用于解釋相應(yīng)的語句的信息,并存儲(chǔ)所述信息。具體地,存儲(chǔ)單元210可以向相應(yīng)的語句附加信息:“在000(區(qū)域的名稱)處的天氣怎么樣? ”中的“000(區(qū)域的名稱)”是指區(qū)域的名稱,“天氣怎么樣”是用于詢問天氣,以及“?”意味著語句是疑問句,并存儲(chǔ)所
述信息。
[0100]此外,存儲(chǔ)單元210可以向相應(yīng)的語句附加對(duì)“在000(區(qū)域的名稱)處的天氣怎么樣? ”的響應(yīng),并存儲(chǔ)所述響應(yīng)。具體地,存儲(chǔ)單元210可以附加“你想知道溫度么? ”作為對(duì)“在000(區(qū)域的名稱)處的天氣怎么樣? ”的響應(yīng),并存儲(chǔ)所述響應(yīng)。
[0101]然而,這僅是示例性的,存儲(chǔ)單元210可以存儲(chǔ)語句“000(區(qū)域的名稱)的溫度怎么樣? ”,并可以向相應(yīng)的語句附加用于解釋相應(yīng)的語句的信息,以及對(duì)相應(yīng)的語句的響應(yīng)“000(區(qū)域的名稱)的溫度是〈溫度 >”,并存儲(chǔ)所述信息和響應(yīng)。
[0102]如此,存儲(chǔ)單元210可以在天氣服務(wù)域存儲(chǔ)多種會(huì)話模式。
[0103]在以上的示例性實(shí)施例中,描述了存儲(chǔ)在存儲(chǔ)單元中的示例性語句和相應(yīng)的響應(yīng)。然而,這只是示例性的,多種示例性語句和相應(yīng)的響應(yīng)可以存儲(chǔ)在每個(gè)服務(wù)域中。
[0104]通信單元220從顯示裝置100接收用戶語音。通信單元220可以包括配置為執(zhí)行與顯示裝置100通信的NFC模塊(未示出)和多種通信模塊,例如,無線通信模塊(未示出)。除此之外,通信單元220可以利用有線/無線LAN等,執(zhí)行與顯示裝置100的通信。
[0105]通信單元220可以通過因特網(wǎng)執(zhí)行與網(wǎng)絡(luò)服務(wù)器的通信,向網(wǎng)絡(luò)服務(wù)器發(fā)送多種搜索關(guān)鍵字,以及接收其相應(yīng)的網(wǎng)絡(luò)搜索結(jié)果。此處,搜索關(guān)鍵字可以包括多種網(wǎng)絡(luò)可搜索關(guān)鍵字,例如天氣相關(guān)關(guān)鍵字(例如,區(qū)域名稱、溫度、下雨的概率等)和內(nèi)容相關(guān)關(guān)鍵字(例如,電影的題目、電影的放映日、音樂的題目、歌手等),且可以預(yù)存在存儲(chǔ)單元210內(nèi)。
[0106]控制單元230控制服務(wù)器200的整體操作。具體地,控制單元230確定包括用戶語音的服務(wù)域,基于所確定的服務(wù)域的會(huì)話模式,產(chǎn)生與用戶語音相對(duì)應(yīng)的響應(yīng)信息,以及控制通信單元220向顯示裝置100傳送響應(yīng)信息。[0107]因此,控制單元230利用語音到文本(STT)算法將接收的用戶語音轉(zhuǎn)換為文本。控制單元230可以在每個(gè)語料數(shù)據(jù)庫內(nèi)檢測(cè)與轉(zhuǎn)換的文本相匹配的用戶的話語,確定包括用戶語音的服務(wù)域。[0108]具體地,控制單元230可以將文本與存儲(chǔ)在每個(gè)服務(wù)域中的語句作比較,確定與接收的文本相匹配的語句所屬的服務(wù)域作為包括用戶語音的服務(wù)域。
[0109]然后,控制單元230基于包括用戶語音的服務(wù)域,從用戶語音提取對(duì)話行為、主要行為以及組件空位。例如,控制單元230可以從用戶語音中,利用最大熵分類器(MaxEnT)提取對(duì)話行為和主要行為,利用條件隨機(jī)場(chǎng)(CRF)提取組件空位。然而,用戶語音的提取操作不僅限于此,對(duì)話行為、主要行為和組件空位可以通過已知多種方法提取。例如,控制單元230可以利用向與用戶語音相匹配的語句附加的信息,從用戶語音提取對(duì)話行為、主要行為和組件空位。
[0110]此處,對(duì)話行為表示相應(yīng)的語句是陳述、請(qǐng)求、WH-提問、或者YN提問。主要行為是通過在特定域中的會(huì)話,用相應(yīng)的話語表示所需行為的語義信息。例如,主要?jiǎng)幼骺梢园═V開/關(guān)、尋找節(jié)目、尋找節(jié)目時(shí)間、節(jié)目安排等。組件空位是在話語中表示的用于特定域的對(duì)象信息,也就是說,用于在特定域中指定想要的行為的方式的額外信息。例如,組件空位可以包括種類、節(jié)目的題目、開始時(shí)間、頻道的名稱、演員的名字等。
[0111]控制單元230可以利用提取的對(duì)話行為、主要?jiǎng)幼骱徒M件空位確定包括在用戶語音中的話語意圖,產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,向顯示裝置100發(fā)送所述響應(yīng)信息。
[0112]此處,響應(yīng)信息包括與用戶語音相對(duì)應(yīng)的響應(yīng)消息信息。響應(yīng)消息信息可以是從顯示裝置100輸出的響應(yīng)消息以文本形式表達(dá)的信息。顯示裝置100可以基于從服務(wù)器200接收到的響應(yīng)消息信息輸出與用戶語音相對(duì)應(yīng)的響應(yīng)消息。
[0113]具體地,控制單元230可以從語料數(shù)據(jù)庫提取所確定的話語意圖的響應(yīng),將所提取的響應(yīng)轉(zhuǎn)換為文本,并產(chǎn)生響應(yīng)消息信息。
[0114]例如,假定從顯示裝置100接收到用戶語音“〇〇〇(節(jié)目的名稱)什么時(shí)間開始”。在這種情況下,控制單元230可以搜索在與轉(zhuǎn)換為文本形式的用戶語音相匹配的用戶的話語中指示的語料數(shù)據(jù)庫,并確定語音“〇〇〇(節(jié)目的名稱)什么時(shí)間開始”包括在廣播服務(wù)域中。
[0115]之后,控制單元230通過對(duì)話行為確定相應(yīng)的語音的語句是提問,通過主要?jiǎng)幼饕约敖M件空位確定用戶想知道“節(jié)目〇〇〇的開始時(shí)間”。因此,控制單元230可以確定包括在接收的用戶語音中的話語意圖是“詢問節(jié)目〇〇〇(節(jié)目的名稱)的開始時(shí)間”。
[0116]之后,針對(duì)“詢問節(jié)目〇〇〇的開始時(shí)間”這一話語意圖,控制單元230從廣播服務(wù)域的語料數(shù)據(jù)庫中提取響應(yīng)“所詢問的〇〇〇的開始時(shí)間是XXX。也就是說,控制單元230可以在廣播服務(wù)域的語料數(shù)據(jù)庫中搜索與“〇〇〇(節(jié)目的名稱)什么時(shí)間開始”相匹配的響應(yīng),并提取“節(jié)目〇〇〇的開始時(shí)間是”作為響應(yīng)。在這種情況下,控制單元230可以利用電子節(jié)目指南(EPG)信息搜索“〇〇〇”的廣播開始時(shí)間,產(chǎn)生響應(yīng)消息信息“所詢問的〇〇〇的開始時(shí)間在星期六晚上7點(diǎn)”,并向顯示裝置100發(fā)送所述響應(yīng)消息信息。
[0117]此外,控制單元230可以通過使用附加到與接收的文本相匹配的語句的信息確定用戶的話語意圖。[0118]例如,假設(shè)從顯示裝置100接收“節(jié)目〇〇〇(節(jié)目的名稱)什么時(shí)間開始? ”的文本的情況。
[0119]在這種情況下,控制單元230可以確定接收的文本屬于廣播服務(wù)域,并利用附加到 “節(jié)目〇〇〇(節(jié)目的名稱)什么時(shí)間開始?”的信息從用戶語音提取對(duì)話行為、主要?jiǎng)幼饕约敖M件空位,以便找出用戶語音的話語意圖,所述“節(jié)目〇〇〇(節(jié)目的名稱)什么時(shí)間開始? ”的語句是在廣播服務(wù)域中與接收的文本相匹配的語句。
[0120]也就是說,作為用于解釋語句“節(jié)目〇〇〇(節(jié)目的名稱)什么時(shí)間開始? ”的信息,信息:“〇〇〇(節(jié)目的名稱)”是指廣播節(jié)目,“什么時(shí)間”是用于詢問廣播時(shí)間,以及“? ”意味著語句是疑問句被附加。因此,基于所述信息,控制單元230可以確定接收文本“節(jié)目〇〇〇(節(jié)目的名稱)什么時(shí)間開始?”的對(duì)話行為是疑問句,主要?jiǎng)幼魇窃儐枏V播時(shí)間,組件空位是〇〇〇(節(jié)目的名稱)。因此,控制單元230可以確定用戶語音的話語意圖是關(guān)于“〇〇〇(節(jié)目的名稱)”的“廣播時(shí)間”的“詢問”。此外,響應(yīng)于話語意圖為關(guān)于“〇〇〇(節(jié)目的名稱)”的“節(jié)目開始時(shí)間”的“詢問”,控制單元230可以從廣播服務(wù)域的語料數(shù)據(jù)庫中提取“〇〇〇的開始時(shí)間是〈廣播時(shí)間>”。
[0121]在這種情況下,控制單元230可以通過完成包括在搜索到的響應(yīng)內(nèi)的空白產(chǎn)生完整形式的語句。
[0122]例如,控制單元230可以通過在空白中寫入“〇〇〇(節(jié)目的名稱)”完成響應(yīng)“〈空白(節(jié)目的名稱)> 的廣播時(shí)間是〈廣播時(shí)間〉”。另外,控制單元230可以利用EPG(電子節(jié)目指南)信息搜索“ O O O (節(jié)目的名稱)”的廣播時(shí)間,在另一空白〈廣播時(shí)間 > 中寫入搜索到的廣播時(shí)間。因此,控制單元230可以利用完整的語句“〇〇〇(節(jié)目的名稱)的廣播時(shí)間是星期六的7點(diǎn)”,產(chǎn)生與用戶語音相對(duì)應(yīng)的響應(yīng)消息信息,并向顯示裝置100傳送所產(chǎn)生的響應(yīng)消息信息。
[0123]因此,顯示裝置100可以基于從服務(wù)器200接收的響應(yīng)消息信息,以語音形式或者以文本形式,輸出“〇〇〇(節(jié)目的名稱)的廣播時(shí)間是星期六的7點(diǎn)”。
[0124]此外,響應(yīng)信息可以進(jìn)一步包括用于控制顯示裝置100的功能的控制命令。也就是說,控制單元230可以產(chǎn)生用于引發(fā)顯示裝置100執(zhí)行與用戶的話語意圖相對(duì)應(yīng)的功能的控制命令。
[0125]因此,存儲(chǔ)單元210可以預(yù)存與用戶的話語意圖相對(duì)應(yīng)的控制命令。例如,當(dāng)用戶的話語意圖是改變頻道時(shí),存儲(chǔ)單元210可以匹配并存儲(chǔ)用于改變顯示裝置100的頻道的控制命令。當(dāng)用戶的話語意圖是安排錄制,存儲(chǔ)單元220可以匹配并存儲(chǔ)用于對(duì)顯示裝置100內(nèi)的特定節(jié)目執(zhí)行所安排的錄制的控制命令。
[0126]假定從顯示裝置100接收到用戶語音“安排〇〇〇(節(jié)目的名稱)”。在這種情況下,控制單元230可以搜索包括與轉(zhuǎn)換為文本形式的用戶語音相匹配的用戶的話語的語料數(shù)據(jù)庫,確定用戶語音“安排〇〇〇(節(jié)目的名稱)”包括在廣播服務(wù)域中。
[0127]控制單元230通過對(duì)話行為確定相應(yīng)的語音是與“請(qǐng)求”有關(guān)的語句,通過主要?jiǎng)幼骱徒M件空位確定用戶想要“安排節(jié)目〇〇〇(節(jié)目的名稱)”。因此,控制單元230可以確定包括在接收的用戶語音中的話語意圖是“請(qǐng)求安排節(jié)目〇〇〇(節(jié)目的名稱)”。
[0128]之后,控制單元230可以在存儲(chǔ)單元210中檢測(cè)與話語意圖“請(qǐng)求安排節(jié)目OOO (節(jié)目的名稱)”相對(duì)應(yīng)的控制命令,產(chǎn)生用于在顯示單元100中執(zhí)行“〇〇〇(節(jié)目的名稱)”的安排錄制功能的控制命令。在這種情況下,控制單元230可以從廣播服務(wù)域的語料數(shù)據(jù)庫中提取針對(duì)話語意圖“請(qǐng)求安排節(jié)目〇〇〇(節(jié)目的名稱)”的響應(yīng)消息信息“完成對(duì)所要求節(jié)目的安排錄制”,并向顯示裝置100傳送所述響應(yīng)消息信息。
[0129]當(dāng)控制單元230不能確定包括在當(dāng)前接收的用戶語音中的用戶的話語意圖時(shí),控制單元230可以參考先前接收的用戶語音來確定包括在當(dāng)前接收的用戶語音中的用戶的話語意圖。也就是說,控制單元230可以將當(dāng)前接收的用戶語音與存儲(chǔ)在語料數(shù)據(jù)庫中的會(huì)話模式作比較,以便確定當(dāng)前接收的用戶語音是否與會(huì)話模式中的第一用戶話語相對(duì)應(yīng),在當(dāng)前接收的用戶語音與第一用戶話語不對(duì)應(yīng)時(shí),參考先前接收的用戶語音,確定包括在當(dāng)前接收的用戶語音中的用戶的話語意圖。
[0130]例如,假定輸入用戶語音“〇〇〇(節(jié)目的名稱)什么時(shí)間開始? ”,然后輸入用戶語音“演員表? ”。在這種情況下,當(dāng)控制單元230確定用戶語音“演員表? ”與在廣播服務(wù)域中的第一用戶話語不對(duì)應(yīng)時(shí),控制單元230基于先前接收的用戶語音“〇〇〇(節(jié)目的名稱)什么時(shí)間開始? ”確定“演員表”的話語意圖。
[0131]也就是說,為了確定無法提取組件空位的用戶語音“演員表? ”的話語意圖,控制器230可以利用包括在先前接收的用戶語音中的“〇〇〇(節(jié)目的名稱)”確定“演員表? ”的話語意圖是“詢問〇〇〇(節(jié)目的名稱)的演員表”。
[0132]作為另一示例,假定輸入用戶語音“□□口(節(jié)目的名稱)? ”。在這種情況下,為了確定能夠提取主要?jiǎng)幼鞯摹啊酢蹩凇钡脑捳Z意圖,控制單元230可以利用包括在先前接收的用戶語音中的“什么時(shí)候”,確定包括在“ □□口(節(jié)目的名稱)?”中的話語意圖是“詢問節(jié)目□□口(節(jié)目的名稱)的開始時(shí)間”。
[0133]當(dāng)確定當(dāng)前接收的用戶語音包括在不同于包括先前接收的用戶語音的服務(wù)域的另一服務(wù)域中時(shí),控制單元230基于所述另一服務(wù)域的會(huì)話模式,產(chǎn)生與當(dāng)前接收的用戶語音相對(duì)應(yīng)的響應(yīng)信息。
[0134]具體地,即使在先前接收的用戶語音填滿組成服務(wù)域的所有空位之前,當(dāng)確定當(dāng)前接收的用戶語音包括在另一服務(wù)域中時(shí),控制單元230可以基于所述另一服務(wù)域的會(huì)話模式,產(chǎn)生與當(dāng)前接收的用戶語音相對(duì)應(yīng)的響應(yīng)信息。
[0135]此處,空位表示每個(gè)服務(wù)域中以從用戶語音提取的組件空位填充的空白。例如,在廣播服務(wù)域的情況下,空位表示以組件空位(例如,類型、節(jié)目的題目、開始時(shí)間、頻道的名稱或演員的名字)填充的空白。
[0136]示例性實(shí)施例在即使未填滿構(gòu)成服務(wù)域的所有空白空位時(shí),確定包括接收的用戶語音的服務(wù)域,當(dāng)用戶語音包括在不同于包括先前接收的用戶語音的服務(wù)域的另一服務(wù)域時(shí),確定相應(yīng)語首的話語意圖。
[0137]因此,控制單元230確定當(dāng)前接收的用戶語音是否與包括先前接收的用戶語音的服務(wù)域的語料數(shù)據(jù)庫相匹配。
[0138]當(dāng)確定當(dāng)前接收的用戶語音與所述語料數(shù)據(jù)庫相匹配時(shí),控制單元230利用相應(yīng)的服務(wù)域確定當(dāng)前接收的用戶語音的話語目的,產(chǎn)生與話語目的相對(duì)應(yīng)的響應(yīng)信息。上文已描述了該操作,所以將省略其重復(fù)的描述。
[0139]當(dāng)確定當(dāng)前接收的用戶語音與語料數(shù)據(jù)庫不匹配時(shí),控制單元230將當(dāng)前接收的用戶語音與另一語料數(shù)據(jù)庫作比較,確定包括當(dāng)前接收的用戶語音的服務(wù)域。[0140]接下來,控制單元230可以確定包括在當(dāng)前接收的用戶語音中的話語意圖,基于另一服務(wù)域的會(huì)話模式,產(chǎn)生與所確定話語意圖相對(duì)應(yīng)的響應(yīng)信息,以及控制通信單元210向顯示裝置100發(fā)送所述響應(yīng)信息。
[0141]也就是說,控制單元230基于包括當(dāng)前接收的用戶語音的服務(wù)域,從用戶語音提取對(duì)話行為、主要?jiǎng)幼饕约敖M件空位。然后,控制單元230可以利用所提取的對(duì)話行為、主要?jiǎng)幼饕约敖M件空位,確定包括在當(dāng)前接收的用戶語音中的話語意圖,產(chǎn)生與所確定話語意圖相對(duì)應(yīng)的響應(yīng)信息,向顯示裝置100發(fā)送所述響應(yīng)信息。其詳細(xì)描述將參考圖5描述。
[0142]圖5闡述了根據(jù)一種示例性實(shí)施例的交互系統(tǒng)的操作。
[0143]如圖5A所示,顯示裝置300與服務(wù)器(未示出)交互,并且當(dāng)接收到用戶的語音化表達(dá)“節(jié)目什么時(shí)間開始? ”時(shí),可以以語音形式輸出響應(yīng)消息“您想知道什么節(jié)目?”
[0144]然后,如圖5B所示,假定接收到包括在廣播服務(wù)域中的用戶語音“節(jié)目什么時(shí)間開始? ”和包括在另一服務(wù)域中的用戶語音“首爾的溫度是多少? ”。在這種情況下,即使在組成廣播服務(wù)域的所有空位未被填滿時(shí),服務(wù)器確定包括用戶的語音化表達(dá)(“首爾的溫度是多少? ”)的服務(wù)域。因此,當(dāng)確定相應(yīng)的語音包括在天氣服務(wù)域中時(shí),基于天氣服務(wù)域,服務(wù)器從“首爾的溫度是多少? ”中提取對(duì)話行為、主要?jiǎng)幼骱徒M件空位,確定包括在當(dāng)前接收的用戶語音中的話語意圖是“詢問首爾的溫度信息”。
[0145]然后,服務(wù)器從天氣服務(wù)域的語料數(shù)據(jù)庫中提取針對(duì)話語意圖“詢問首爾的溫度信息”的響應(yīng)“所詢問的首爾的當(dāng)前溫度是XXX”。在這種情況下,服務(wù)器可以從相應(yīng)的語音提取“首爾”和“溫度”作為關(guān)鍵字,然后向網(wǎng)絡(luò)服務(wù)器發(fā)送關(guān)鍵字,從網(wǎng)絡(luò)服務(wù)器接收關(guān)于首爾的溫度的搜索結(jié)果,然后向顯示裝置300發(fā)送響應(yīng)消息信息“首爾的當(dāng)前溫度是23°C”。因此,顯示裝置300可以以語音形式輸出“首爾的當(dāng)前溫度是23°C”,作為對(duì)包括在不同于包括先前接收的用戶語音的服務(wù)域的另一服務(wù)域中的“首爾的溫度是多少? ”的響應(yīng)。
[0146]上述示例性實(shí)施例闡述了服務(wù)器200是一個(gè)單獨(dú)的服務(wù)器,但這僅是示例性的。
[0147]也就是說,服務(wù)器200可以包括第一服務(wù)器(未示出)和第二服務(wù)器(未示出),第一服務(wù)器配置為從顯示裝置100接收用戶語音,將接收的用戶語音轉(zhuǎn)換為文本,向顯示裝置100發(fā)送轉(zhuǎn)換后的文本,第二服務(wù)器配置為接收轉(zhuǎn)換后的文本,產(chǎn)生與用戶語音相對(duì)應(yīng)的響應(yīng)信息,向顯示裝置100發(fā)送所述響應(yīng)信息。
[0148]具體地,第一服務(wù)器可以利用STT算法將從顯示裝置100接收的用戶語音轉(zhuǎn)換為文本,向顯示裝置100發(fā)送轉(zhuǎn)換后的文本。第二服務(wù)器可以基于接收的文本確定用戶的話語意圖,產(chǎn)生與用戶的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并向顯示裝置100發(fā)送所述響應(yīng)信息。
[0149]圖6是示出了根據(jù)示例性實(shí)施例的控制與顯示裝置交互的服務(wù)器的方法的流程圖。
[0150]首先,服務(wù)器從顯示裝置接收用戶語音(S410)。
[0151]其次,服務(wù)器利用預(yù)存的服務(wù)域的會(huì)話模式,確定包括用戶語音的服務(wù)域(S420)。
[0152]隨后,當(dāng)確定當(dāng)前接收的用戶語音包括在不同于包括先前接收的用戶語音的域的另一服務(wù)域中時(shí)(S430-是),服務(wù)器基于所述另一服務(wù)域的會(huì)話模式,產(chǎn)生與當(dāng)前接收的用戶語音相對(duì)應(yīng)的響應(yīng)信息(S440)。
[0153]具體地,當(dāng)在組成當(dāng)前服務(wù)域的所有空位被填滿之前便確定當(dāng)前接收的用戶語音包括在另一服務(wù)域中時(shí),服務(wù)器可以利用先前接收的用戶語音,基于所述另一服務(wù)域的會(huì)話形式,產(chǎn)生與當(dāng)前接收的用戶語音相對(duì)應(yīng)的響應(yīng)信息。此處,服務(wù)器可以確定包括在用戶語音中的話語意圖,并基于所述另一服務(wù)域的會(huì)話模式,產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,
[0154]在當(dāng)前接收的用戶語音包括在與包括先前接收的用戶語音的服務(wù)域相同的服務(wù)域中時(shí)(S430-否),服務(wù)器基于包括先前接收的用戶語音的服務(wù)域的會(huì)話模式,產(chǎn)生與當(dāng)前接收的用戶語音相對(duì)應(yīng)的響應(yīng)信息(S450)。
[0155]接下來,服務(wù)器向顯示裝置發(fā)送產(chǎn)生的響應(yīng)信息(S460)。
[0156]響應(yīng)信息可以包括與用戶語音相對(duì)應(yīng)的響應(yīng)消息信息,并且顯示裝置可以基于響應(yīng)消息信息,輸出與用戶語音相對(duì)應(yīng)的響應(yīng)消息。
[0157]此外,響應(yīng)信息可以進(jìn)一步包括用于控制顯示裝置的功能的控制命令。
[0158]由于這些示例性實(shí)施例都已詳細(xì)描述,因此將省略對(duì)其的重復(fù)描述。
[0159]可以提供一種非暫時(shí)性計(jì)算機(jī)可讀介質(zhì),其中具有用于順序執(zhí)行根據(jù)示例性實(shí)施例的控制方法的程序。
[0160]非暫時(shí)性計(jì)算機(jī)可讀介質(zhì)不是配置為暫時(shí)存儲(chǔ)數(shù)據(jù)的介質(zhì)(例如,寄存器、高速緩存器或內(nèi)存),而是配置為半永久地存儲(chǔ)數(shù)據(jù)和能夠通過裝置讀取的介質(zhì)。具體地,上述多種應(yīng)用或程序可以存儲(chǔ)和提供在非暫時(shí)性可讀介質(zhì)中,例如光盤(CD)、數(shù)字多用盤(DVD)、硬盤、藍(lán)光盤、通用串行總線(USB)存儲(chǔ)器、存儲(chǔ)卡以及只讀存儲(chǔ)器(ROM)。
[0161]在示出顯示裝置和服務(wù)器的框圖中沒有示出總線,但是在顯示裝置和服務(wù)器中的相應(yīng)組件之間的通信可以通過總線執(zhí)行。此外,也可以在每個(gè)設(shè)備中包括執(zhí)行上述多種步驟的處理器(例如,中央處理單元(CPU)或微處理器)。
[0162]上述的示例性實(shí)施例和優(yōu)點(diǎn)都僅是示例性的,并不應(yīng)理解為限制本發(fā)明概念。示例性實(shí)施例能夠容易地應(yīng)用于其他類型裝置。此外,所述示例性實(shí)施例的描述意在說明,而非限制權(quán)利要求的范圍,對(duì)所屬領(lǐng)域技術(shù)人員而言,多種替代、修改和改變是顯而易見的。
【權(quán)利要求】
1.一種與顯示裝置交互的服務(wù)器,所述服務(wù)器包括: 存儲(chǔ)器,存儲(chǔ)服務(wù)域的會(huì)話模式; 通信器,配置為接收來自顯示裝置的語音表達(dá);以及 控制器,配置為確定與所述語音表達(dá)有關(guān)的服務(wù)域,基于所確定的服務(wù)域的會(huì)話模式產(chǎn)生與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息,并且控制通信器向顯示裝置發(fā)送所述響應(yīng)信息; 其中當(dāng)確定當(dāng)前接收的語音表達(dá)被包括在不同于包括先前接收的語音表達(dá)的服務(wù)域的另一服務(wù)域中時(shí),控制器基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所述當(dāng)前接收的語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息。
2.根據(jù)權(quán)利要求1所述的服務(wù)器,其中當(dāng)在組成服務(wù)域的空位被所述先前接收的語音表達(dá)填滿之前便確定所述當(dāng)前接收的語音表達(dá)被包括在所述另一服務(wù)域中時(shí),控制器基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所述當(dāng)前接收的語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息。
3.根據(jù)權(quán)利要求2所述的服務(wù)器,其中控制器確定所述當(dāng)前接收的語音表達(dá)中包括的話語意圖,基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并控制通信器向顯示裝置發(fā)送所述響應(yīng)信息。
4.根據(jù)權(quán)利要求1所述的服務(wù)器,其中所述響應(yīng)信息包括與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)消息信息,并且顯示裝置基于所述響應(yīng)消息信息輸出與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)消肩、O
5.根據(jù)權(quán)利要求4所述的服務(wù)器,其中所述響應(yīng)信息還包括用于控制顯示裝置的功能的控制命令。
6.一種控制與顯示裝置交互的服務(wù)器的方法,所述方法包括: 接收來自顯示裝置的語音表達(dá); 利用會(huì)話模式確定包括所述語音表達(dá)的服務(wù)域; 當(dāng)當(dāng)前接收的語音表達(dá)被包括在不同于具有先前接收的語音表達(dá)的服務(wù)域的另一服務(wù)域中時(shí),基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所述當(dāng)前接收的語音表達(dá)相對(duì)應(yīng)的響應(yīng)/[目息;以及 向顯示裝置發(fā)送所產(chǎn)生的響應(yīng)信息。
7.根據(jù)權(quán)利要求6所述的方法,其中所述產(chǎn)生包括:當(dāng)在組成服務(wù)域的空位被所述先前接收的語音表達(dá)填滿前確定所述當(dāng)前接收的語音表達(dá)被包括在所述另一服務(wù)域中時(shí),基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所述當(dāng)前接收的語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息。
8.根據(jù)權(quán)利要求7所述的方法,其中所述產(chǎn)生包括:確定在所述語音表達(dá)中包括的話語意圖,以及基于所述另一服務(wù)域的會(huì)話模式產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信肩、O
9.根據(jù)權(quán)利要求6所述的方法,其中所述響應(yīng)信息包括與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)消息信息,并且顯示裝置基于所述響應(yīng)消息信息輸出與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)消息。
10.根據(jù)權(quán)利要求9所述的方法,其中所述響應(yīng)信息還包括用于控制顯示裝置的功能的控制命令。
11.根據(jù)權(quán)利要求1所述的服務(wù)器,其中所述語音表達(dá)是用戶的語音表達(dá)。
12.根據(jù)權(quán)利要求6所述的方法,其中所述語音表達(dá)是用戶的語音表達(dá)。
13.—種與顯示裝置交互的服務(wù)器,所述服務(wù)器包括:存儲(chǔ)器,存儲(chǔ)服務(wù)域的會(huì)話模式; 通信器,配置為接收來自顯示裝置的語音表達(dá);以及 控制器,配置為在多個(gè)服務(wù)域中確定服務(wù)域,基于所確定的服務(wù)域的會(huì)話模式產(chǎn)生與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息,并且控制通信器向顯示裝置發(fā)送所述響應(yīng)信息,所述多個(gè)服務(wù)域中的每一個(gè)與相應(yīng)的會(huì)話模式有關(guān)。
14.根據(jù)權(quán)利要求13所述 的服務(wù)器,其中控制器確定在接收的語音表達(dá)中包括的話語意圖,基于所述會(huì)話模式產(chǎn)生與所確定的話語意圖相對(duì)應(yīng)的響應(yīng)信息,并且控制通信器向顯示裝置發(fā)送所述響應(yīng)信息。
15.一種控制與顯示裝置交互的服務(wù)器的方法,所述方法包括: 接收來自顯示裝置的語音表達(dá); 利用會(huì)話模式在多個(gè)服務(wù)域中確定與所述語音表達(dá)有關(guān)的服務(wù)域,所述多個(gè)服務(wù)域中的每一個(gè)與相應(yīng)的會(huì)話模式有關(guān); 基于所確定的服務(wù)域的會(huì)話模式產(chǎn)生與所述語音表達(dá)相對(duì)應(yīng)的響應(yīng)信息;以及 向顯示裝置發(fā)送所產(chǎn)生的響應(yīng)信息。
【文檔編號(hào)】H04N21/258GK103517094SQ201310235180
【公開日】2014年1月15日 申請(qǐng)日期:2013年6月14日 優(yōu)先權(quán)日:2012年6月15日
【發(fā)明者】尹勝一, 車泰煥 申請(qǐng)人:三星電子株式會(huì)社