專利名稱:用于在協(xié)作環(huán)境下控制音頻的方法和系統(tǒng)的制作方法
用于在協(xié)作環(huán)境下控制音頻的方法和系統(tǒng)技術(shù)領(lǐng)域
本發(fā)明一般地涉及協(xié)作環(huán)境(collaboration environment),尤其涉及控制協(xié)作參與者的音頻流。
背景技術(shù):
旅行中的花銷和不便增加了對使得來自不同地方的參與者能夠很容易地與另一個聯(lián)系來討論話題的有效協(xié)作環(huán)境的需求。當會議呼叫為一小群討論特定話題的參與者提供了合適的環(huán)境時,會議呼叫并不適合于更大群的參與者,或者對于非常復(fù)雜問題的探討。 會議呼叫的一個問題在于承載參與者語音的音頻流是單聲道的,并且每一個參與者的語音都好像在相同的位置。在每個參與者彼此認識并且可以相互識別其他人的語音的少數(shù)參與者的會議呼叫中,非立體語音頻流是令人滿意的。但是當會議呼叫中參與者同時開始說話, 跟討論增長勢頭所發(fā)生的頻率一樣的時候,由于聆聽者無法識別誰說的什么,因而通信就迅速變得無法辨識了。許多會議系統(tǒng)通過僅僅將最活躍發(fā)言者的語音信號、以及那些試圖打斷活躍發(fā)言者且聲音最大的發(fā)言者的語音信號提供給參與者來改善這種情況。然而,這種方法有效地將會議限制于單個的發(fā)言者,并且趨向于優(yōu)選大聲并且持續(xù)的發(fā)言者。
即使沒有同時發(fā)生的會話,在單聲道會議呼叫的參與者會遇到誰正在發(fā)言的麻煩,除非他們就個人來說,非常熟悉發(fā)言者以識別他們的語音。即使發(fā)言者之前介紹了他們自己,這也可能在困難的幾分鐘之后才能識別你不熟悉的人的語音,特別是有許多參與者時。這其中極大的原因是在于每個參與者聽起來就好像他們在相同的地方,并且一個聆聽者只留下了極少的線索用于他們來回憶誰是誰。由于知道誰在會話中說話一般來說非常重要,因此每次當一個人開始說話的時候,由于聆聽者要求發(fā)言者介紹他們自己,這就會導(dǎo)致令人尷尬的中斷。
傳統(tǒng)協(xié)作環(huán)境的另一缺點,比如作為會議呼叫,是不能夠相對容易地實施用于普通面對面會議中的常見的問題解決技術(shù)。例如,在商業(yè)環(huán)境中,這對于一群雇員在會議室中面對面的見面來討論包括多個子話題的復(fù)雜話題來說是很普通的。這群人可以開始討論該話題,并且確定解決該問題的最有效的方式是將他們自己分成子群(subgroup),并且給每一個子群分配一個子話題來解決。在子群討論和解決關(guān)于他們各自的子話題的問題之后, 他們以更大的群再次會面來合作和解決所有的問題。不幸地是,在傳統(tǒng)的會議環(huán)境中,形成可以分別與另一個子群進行會話的參與者的子群、并且可以在子群完成了他們的會話之后很容易地再次形成整個群,這是非常困難的。而且,這樣的子群與上述提及的單聲道通信存在相同的困難。
考慮到傳統(tǒng)的協(xié)作環(huán)境的缺點,提供一個協(xié)作環(huán)境來實際地模擬面對面的會議, 將會是有益的。而且,提供一個協(xié)作環(huán)境來允許參與者更容易地參加多個同時存在的交談, 更容易地基于發(fā)言者語音的位置識別發(fā)言者,以及允許以簡單直觀的方式形成參與者的子群,也將會是有益的。發(fā)明內(nèi)容
本發(fā)明提供了一種協(xié)作環(huán)境,其中主持人可以定位會議參與者的語音在期望的聽覺位置。所述會議包括若干參與者和一個主持人。所述參與者和所述主持人通過諸如計算機的通信設(shè)備來通信。每一個通信設(shè)備建立與在媒體服務(wù)器中的會議處理器的通信會話。 當參與者發(fā)言時,所述通信設(shè)備產(chǎn)生包含參與者語音信號的輸入音頻流,并發(fā)送該輸入音頻流到會議處理器。所述通信會話也可以傳遞來自會議處理器的輸出音頻流到通信設(shè)備, 該通信設(shè)備可以被提供給參與者。主持人使用諸如立體聲耳機或立體聲麥克風的具有多聲道功能的設(shè)備來聆聽由會議處理器給主持人的通信設(shè)備提供的輸出音頻流。
用戶界面向主持人顯示與每一個會議參與者對應(yīng)的參與者圖標。主持人可以通過在所述用戶界面操作參與者的圖標來指定參與者語音的聽覺位置。通信設(shè)備耦合到所述會議處理器?;趶闹鞒秩私邮盏降妮斎?,所述通信設(shè)備產(chǎn)生和發(fā)送聽覺位置控制信號,指示會議處理器處理指定的輸入音頻流,以及提供能夠被諸如主持人的聆聽者所感知的輸出音頻流,就好像來自相對于聆聽者的特定聽覺位置一樣。會議處理器接收聽覺位置控制信號并處理指定的輸入音頻流以生成輸出音頻流,該輸出音頻流包括諸如頻率和/或相位特性的特性,這些特性將輸出音頻流定位在相對于聆聽者的特定聽覺位置處。特定聽覺位置可以通過聽覺位置標識符在聽覺位置控制信號中被標識,所述聽覺位置標識符包括標識相對于聆聽者的基準位置的期望聽覺位置的數(shù)據(jù)。
在會議中的一個或多個參與者也可以使用諸如立體聲耳機或立體聲麥克風的多聲道功能的設(shè)備來聆聽由會議處理器提供給對應(yīng)參與者通信設(shè)備的輸出音頻流。參與者也具有顯示表示會議中的一個或多個其他參與者的圖標的用戶界面。參與者可以操作參與者圖標以指定其他參與者的語音的聽覺位置。通信設(shè)備發(fā)送聽覺位置控制信號,指示會議處理器處理指定的輸入音頻流并提供輸出音頻流,該輸出音頻流被參與者感知,就好像來自于相對于參與者的特定聽覺位置一樣。參與者改變其他參與者聽覺位置的能力依賴于主持人授予的權(quán)限。
主持人也可以操作用戶界面以控制哪一個參與者可以聽到指定的其他參與者?;趶闹鞒秩颂幗邮盏妮斎?,通信設(shè)備發(fā)送混合控制信號到會議處理器,指示會議處理器混合已指定的輸入音頻流來形成一個或多個組合的輸出音頻流,并經(jīng)由相應(yīng)的通信會話提供該一個或多個輸出音頻流到一個或多個會議的參與者。主持人可以操作用戶界面來形成參與者子群,其中的參與者可以聽到并與相同子群中的其他參與者交談,但不能聽到并與其他子群中的參與者交談。參與者可具有顯示代表在他們各自子群中參與者的圖標的用戶界面。進一步,每一個參與者可以操作用戶界面以從聽覺上定位他們子群中的參與者的語音。
主持人可以授權(quán)一個或多個子群發(fā)起與一個或多個其它子群的會話。假如在第一個子群中的參與者獲準發(fā)起與第二子群的會話,則參與者可以操作他們的用戶界面以指示期望發(fā)起與第二子群的會話。通信設(shè)備可以向會議處理器發(fā)送混合控制信號以指示會議處理器將與第二子群的參與者相關(guān)聯(lián)的輸入音頻流混合到提供給第一子群中的參與者的輸出音頻流中。會議處理器也可以將與在第一子群中的參與者相關(guān)聯(lián)的輸入音頻流混合到被提供給第二子群中的參與者的輸出音頻流中。以這種方式,在第一和第二子群的每一個中的參與者可以聽到其他子群中的參與者。
在閱讀了以下與附圖有關(guān)的優(yōu)選實施例的詳細描述之后,本領(lǐng)域技術(shù)人員應(yīng)當知道本發(fā)明的范圍和認識到其中的另外的方面。
結(jié)合并成為本發(fā)明的一部分的附圖闡述了本發(fā)明的幾個方面,并且與說明書一起來解釋本發(fā)明的原理。
圖1為顯示了依據(jù)本發(fā)明的一個實施例的協(xié)作環(huán)境的方框圖2為顯示了依據(jù)本發(fā)明的一個實施例的用于針對主持人在協(xié)作環(huán)境中從聽覺上定位參與者的語音信號的用戶界面;
圖3為顯示了依據(jù)本發(fā)明一個實施例的會議處理器的方框圖,該處理器根據(jù)多個輸入音頻流提供不同的輸出音頻流;
圖4顯示了一個用戶界面,使得主持人能選擇在協(xié)作環(huán)境的多個參與者中的哪一個來與其他參與者協(xié)作;
圖5為顯示了用于從聽覺上定位相對于主持人的基準位置的參與者的音頻流的方法;
圖6顯示了使得主持人能形成參與者子群的用戶界面;
圖7顯示了圖6所示的用戶界面,其中在一個子群中的參與者可以聽到主持人,并且在其他子群中的參與者不能聽到主持人;
圖8A顯示了一個用戶界面,用于使得第一參與者能夠在聽覺上定位相對于第一參與者的基準位置的同一子群中其他參與者的音頻流;以及
圖8B顯示了在圖8A中的用戶界面,其用于使得一個子群能發(fā)起與第二子群的通具體實施方式
以下給出的實施例闡明了本領(lǐng)域技術(shù)人員實施本發(fā)明的必要信息,并且顯示了實施本發(fā)明的最好模式。在讀取關(guān)于附圖的以下說明后,本領(lǐng)域技術(shù)人員應(yīng)當理解本發(fā)明的概念,并識別這些沒有特別指定的概念的應(yīng)用。應(yīng)當知道這些概念和應(yīng)用都落入本公開和權(quán)利要求的范圍內(nèi)。
本發(fā)明提供了一種協(xié)作環(huán)境,其中主持人(moderator)可以定位在期望的聽覺位置處的會議參與者的語音。僅僅用于闡述的目的,本發(fā)明在這里以在線教育課程的情況被描述,其中主持人為教師,并且參與者為學生。然而,本發(fā)明可以被用在多種不同類型的協(xié)作環(huán)境,例如,其包括商業(yè)相關(guān)的會議、訓練課程等。通過用戶界面的使用,本發(fā)明必要地為主持人(以及在某些實施例中,也為一個或多個參與者提供)提供了“所見即所聞”的協(xié)作體驗。
圖1為顯示了依據(jù)本發(fā)明的實施例的協(xié)作環(huán)境10的方框圖。協(xié)作環(huán)境10包括媒體服務(wù)器12和多個通信設(shè)備14A-14E。這里通信設(shè)備14A-14E可以被集中地或者單獨地稱為通信設(shè)備14,其中討論涉及任意的或者全部的通信設(shè)備14A-14E。通信設(shè)備14為可以發(fā)送和接收語音信號的任何設(shè)備,例如可以包括計算機、PDA、諸如蘋果公司(Apple )的 iPHONE 的移動電話等。本發(fā)明一般地操作在會議的情況下,其中主持人用戶16A和多個參與者用戶16B-16E使用通信設(shè)備14A-14E來相互交談。通信設(shè)備14經(jīng)由網(wǎng)絡(luò)18與媒體服務(wù)器12可通信地耦合。通信設(shè)備14A-14E可以經(jīng)由任何合適的網(wǎng)絡(luò)接入路徑20A-20E 連接到網(wǎng)絡(luò)18,例如,數(shù)字用戶線技術(shù)、電纜調(diào)制解調(diào)器技術(shù)、蜂窩技術(shù)、Wi-Fi、藍牙等。諸如控制信號和音頻數(shù)據(jù)流的數(shù)據(jù)一般地在相應(yīng)的網(wǎng)絡(luò)接入路徑20上傳送,正如這里更詳細的說明一樣。
諸如通信設(shè)備14A的示例性通信設(shè)備14包括控制器22,該控制器包括用于控制通信設(shè)備14A的整體操作的一個或多個中央處理單元和隨機訪問存儲器(未示出)。通信設(shè)備14A也可以包括用于在通信設(shè)備14A與諸如媒體服務(wù)器12的外部設(shè)備之間通信的通信接口 M。通信設(shè)備14A還可以包括或者耦合到顯示設(shè)備沈,其中用戶界面(UI08可以顯示在顯示設(shè)備沈上,并且可由諸如主持人用戶16A的用戶來操作。在會議期間,經(jīng)由通信接口 M從媒體服務(wù)器12接收的數(shù)據(jù)可以用來更新用戶界面觀。由通信設(shè)備14A響應(yīng)于用戶界面觀的操作產(chǎn)生的數(shù)據(jù)可以經(jīng)由通信接口 M提供給媒體服務(wù)器12。通信設(shè)備 14A還優(yōu)選地包括音頻處理器30,該音頻處理器產(chǎn)生包括主持人用戶16A的語音信號的音頻流,并發(fā)送所述音頻流到媒體服務(wù)器12。音頻處理器30還從媒體服務(wù)器12接收輸出音頻流,以及經(jīng)由諸如立體聲耳機32的具有多聲道功能的設(shè)備提供輸出音頻流到主持人用戶16A。本領(lǐng)域技術(shù)人員將意識到諸如立體聲麥克風的其他具有多聲道功能的設(shè)備也可以用于提供輸出音頻流到主持人用戶16A。
通信設(shè)備14的每一個與媒體服務(wù)器12建立通信會話34,其分別標記為標號 34A-34E。通信會話34可以包括在相應(yīng)的通信設(shè)備14與媒體服務(wù)器12之間的任何類型的會話或連接,所述會話或連接能夠從相應(yīng)的通信設(shè)備14發(fā)送音頻流到媒體服務(wù)器12,并從媒體服務(wù)器12接收音頻流到相應(yīng)的通信設(shè)備14,而不考慮用于傳遞音頻流的基本物理框架,或在相應(yīng)通信設(shè)備14和媒體服務(wù)器12之間用于建立通信會話34的特殊協(xié)議。合適的協(xié)議可以包括例如TCP/IP、會話發(fā)起協(xié)議(SIP)、傳統(tǒng)PSTN信令等。通信會話34 —般物理地實現(xiàn)在相應(yīng)網(wǎng)絡(luò)接入路徑20上。
參與者用戶16B-16E使用通信設(shè)備14B-14E來參與到協(xié)作環(huán)境10中。主持人用戶16A與參與者用戶16B-16E之間的差別是基于用戶的角色,或可以是相對隨意的,以及例如,基于在協(xié)作環(huán)境10中最初安排會議的人。例如,主持人用戶16A可以是班級的教師,并且每一個參與者用戶16B-16E可以是學生??商娲?,主持人用戶16A可以簡單地為安排會議的職員,或者即將討論問題的員工群組的管理者。為了簡潔的目的,下文中主持人用戶 16A被認為是主持人16A,并且參與者用戶16B-16E被認為是參與者16B-16E。在一個實施例中,主持人16A實行的控制可以代表一個或多個參與者16B-16E??商娲?,主持人16A 和參與者16B-16E可以交換角色,其中主持人變成參與者且參與者變成主持人。
媒體服務(wù)器12包括與通信會話34連接的通信接口 38。通信接口 38可以包括用于接收來自通信會話34的輸入音頻流和通過對應(yīng)的通信會話34發(fā)送輸出音頻流所必要的硬件和軟件的任何合適的組合。例如,假如通信會話34傳遞模擬語音信號,則通信接口 38 包括線路卡,或者假如通信會話34傳遞分組語音信號,則通信接口 38包括以太網(wǎng)電路。媒體服務(wù)器12還包括交互式語音識別(IVR)處理器40,用于路由通信會話34到合適的會議。
媒體服務(wù)器12還包括在主持人16A的指示下建立參與者16B-16E與主持人16A 之間的會議的會議處理器42。會議處理器42包括在主持人16A的指示下使得會議處理器 42混合或組合多個音頻流并提供混合后的輸出音頻流給一個或多個通信會話34的混合器44。由混合器44提供的額外的功能將在后面更詳細描述。會議處理器42包括或耦合至三維(3D)空間音頻引擎(3DSAE)46,其接收輸入音頻流和聽覺位置標識符,修改音頻流,以及產(chǎn)生包括諸如相位和頻率信息的特性的輸出音頻流,所述特性從聽覺上將輸出音頻流定位在聽覺位置標識符的指示的聽覺位置上。
為了說明的目的,當會議處理器42被示為包含3DSAE 46時,3DSAE 46的功能可以與所示的會議處理器42集成,或者可以與會議處理器42分離并且經(jīng)由通信路徑耦合到會議處理器42。類似地,當混合器44被示為與3DSAE46分離時,3DSAE 46也可具有混合能力 (作為在混合器44中包含的混合能力的補充或者替代)。因此,依據(jù)期望的設(shè)計標準,會議處理器42、3DSAE46或混合器44所提供的功能可以在一個或多個模塊中由媒體服務(wù)器12 執(zhí)行。因此,為了闡明和簡潔的目的,在下文中由會議處理器42、3DSAE 46或混合器44的任何一個提供的功能通常被描述為由會議處理器42提供。媒體服務(wù)器12還包括包含中央處理單元和隨機訪問存儲器(未示出)的控制器48,其耦合到通信接口 38、IVR處理器40 和會議處理器42中的每一個,以控制其中的操作。
本發(fā)明為主持人16A提供了以下能力在期望的相對主持人16A的聽覺位置上從聽覺上定位由參與者16B-16E產(chǎn)生的音頻流。聽覺定位由會議處理器42經(jīng)由3DSAE 46提供。3DSAE 46可以通過產(chǎn)生包括頻率和相位信息的特性的輸出音頻流來從聽覺上定位音頻流,所述特性可以從聽覺上定位輸出音頻流,從而當其從一個指定位置發(fā)起的時候,可以被諸如主持人16A的聆聽者所感知。輸入音頻流可以是單聲道的或多聲道的。輸出語音信號是諸如立體聲或杜比數(shù)字(Dolby Digital) 5. 1語音信號的多聲道語音信號,并且經(jīng)由立體聲耳機32被提供給主持人16A。適合用于本發(fā)明的3DSAE可以通過位于4856E. Baseline Rd. Ste. 101,Mesa, AZ 85206 的 Diamondffare 有限公司獲取。
圖2顯示了由通信設(shè)備14A提供的并在顯示設(shè)備沈上顯示的示例性用戶界面28, 并且將結(jié)合附圖1進行描述。主持人16A操作用戶界面以從聽覺上定位與一個或多個參與者16B-16E相關(guān)聯(lián)的音頻流。主持人圖標50A代表主持人16A的基準位置。每一個參與者 16B-16E由相應(yīng)的參與者圖標50B-50E表示。用戶界面觀可以包括定位圓周52,其在主持人16A在用戶界面觀上操作一個或多個參與者圖標50B-50E的時候輔助主持人16A。定位圓周52可具有“對齊(snap-to) ”的特性(如果需要的話),其在主持人16A移動相距定位圓周52預(yù)定距離內(nèi)的參與者圖標50B-50E中的一個的情況下,將特定的參與者圖標50B-50E 置于定位圓周52的中心。
對于在用戶界面28中的每一個參與者圖標50B-50E,通信設(shè)備14A計算與相應(yīng)參與者圖標50B-50E相對于主持人圖標50A的基準位置的位置相對應(yīng)的聽覺位置標識符。聽覺位置標識符可以包括可識別相應(yīng)參與者圖標50B-50E相對于主持人圖標50A的位置的任何合適的信息。例如,聽覺位置標識符可以包括相應(yīng)參與者圖標50B-50E相對于主持人圖標50A的方位的角度,以及相應(yīng)參與者圖標50B-50E距主持人圖標50A的距離。該角度可被3DSAE 46用來通過諸如頻率和相位信息的合適特性來產(chǎn)生與相應(yīng)參與者相關(guān)聯(lián)的輸出音頻流,以便輸出音頻流當從由聽覺位置標識符指示的方向發(fā)出時,由主持人16A感知。該距離信息可被3DSAE 46用來改變輸出音頻流的響度(loudness)特性。
參考參與者圖標50C,假定參與者圖標50C最初在位置54A處。參與者圖標50C 可以通過用戶界面28缺省地被定位在這樣的位置(在被通知到媒體服務(wù)器12的通信會話34C的連接時),或者主持人16A使用諸如鼠標或觸摸屏的輸入設(shè)備預(yù)先將參與者圖標50C 拖曳到位置54A。在任何一種情況中,通信設(shè)備14A計算與位置50A對應(yīng)的聽覺位置標識符。假定聽覺位置標識符包括相對于主持人圖標50A的方位的角度偏移。還假定主持人圖標50A具有360度圓周52上朝向90度位置的方位。換句話說,主持人圖標50A “看起來” 在360度圓周52上朝向90度的方向。因此,主持人的“耳朵”分別朝向180度和0度。注意,360度圓周60是為了闡述的目的而提供,并且不必要在用戶界面觀中被圖示。
通信設(shè)備14A確定參與者圖標50C的位置54A位于90度位置處(主持人50A的正前方),并且位于與主持人圖標50A距離56處。因此在該示例中,聽覺位置標識符可包括角度90度和距離56。通信設(shè)備14A將包括聽覺位置標識符和標識通信會話34C的通信會話標識符的聽覺位置控制信號發(fā)送給媒體服務(wù)器12。3DSAE 46在由聽覺位置標識符標識的聽覺位置處從聽覺上定位與參與者16C相關(guān)聯(lián)的音頻流。
假定主持人16A拖曳參與者圖標50C到新位置MB。通信設(shè)備14A在用戶界面28 獲取參與者圖標50C的新位置54B (諸如通過獲取參與者圖標50C的x、y坐標),并且計算新的聽覺位置標識符。通信設(shè)備14A提供新的聽覺位置標識符和通信會話標識符到媒體服務(wù)器12。3DSAE 46從聽覺上定位與參與者16C相關(guān)聯(lián)的音頻流在相對于主持人圖標50A 的大約125度的位置處(S卩,從聽覺上已定位的先前音頻流的左邊35度)。例如,使用立體聲耳機32的主持人16A在將參與者圖標50C從位置54A移動之前,正聽到參與者圖標50C 的語音處于主持人16A先前聽到的參與者16C的語音的左邊。
主持人16A可以確定參與者16E的語音太大。主持人16A可以將與參與者16E對應(yīng)的參與者圖標50E從第一位置58A移動到新位置58B,其距離參與者圖標50A更遠。通信設(shè)備14A產(chǎn)生指示參與者圖標50E與主持人圖標50A之間的更遠距離的新的聽覺位置標識符,并提供新的位置標識符給媒體服務(wù)器12。3DSAE 46使用新的位置標識符來減少與參與者16E對應(yīng)的輸出音頻流的音量。
根據(jù)本發(fā)明的一個實施例,除了從聽覺上定位參與者16B-16E的音頻流之外,主持人16A還操作用戶界面觀來控制由會議處理器42混合的音頻流。通過控制音頻流的混合,主持人16A可以確定誰將參與會議,誰能夠聽到誰,以及誰可以與誰通信。在進一步的實施例中,通信設(shè)備14B-14E中的一個或多個包括具有多聲道功能的音頻設(shè)備,諸如立體聲耳機32。通信設(shè)備14B-14E也可以包括類似于用戶界面觀的用戶界面,其允許相應(yīng)的參與者16B-16E從聽覺上定位與自身相關(guān)的會議的其他參與者16B-16E的音頻流,并且通過具有多聲道功能的音頻設(shè)備監(jiān)聽從聽覺上已定位的音頻流的客戶。
圖3顯示了本發(fā)明的混合和從聽覺上定位的方框圖,其中會議處理器42產(chǎn)生多個混合的輸出音頻流,其由每一個已混合的輸出音頻流的各自的接收方從聽覺上被定位。假定參與者16B、16C的每一個具有在與各自的通信設(shè)備14B、14C相關(guān)聯(lián)的相應(yīng)的顯示設(shè)備沈上顯示的用戶界面。進一步假定,主持人16A已經(jīng)操作用戶界面觀以使得參與者16B可以聽到并與主持人16A和參與者16C交談,并且通過之前關(guān)于圖2的描述的類似方式,使得參與者16B從聽覺上定位了在期望的聽覺位置處的主持人16A和參與者16C的語音。假定參與者16C同樣聽到并與主持人16A和參與者16B交談,并且參與者16C已經(jīng)從聽覺上定位了在在期望的聽覺位置處的主持人16A和參與者16B的語音。同樣地假定主持人16A能聽到并與參與者16B和16C交談,并且已經(jīng)從聽覺上定位了在期望的聽覺位置處的參與者16B、16C。
在圖3中,符號“VS”代表語音信號,并且緊跟VS符號之后的標號指示誰產(chǎn)生了相應(yīng)的語音信號。例如,輸入音頻流60A傳遞包含主持人16A的語音信號的音頻流,如符號 “VS16A”所指示。短語“輸入”和“輸出”出于闡述的目的,并且是站在會議處理器42的角度上。因此,被發(fā)送到會議處理器42的音頻流在這里描述為“輸入”,并且從會議處理器42 發(fā)送的音頻流被描述為“輸出”。輸出音頻流62A可以包括一個或多個輸入音頻流60,其包括已經(jīng)被修改為從聽覺上被定位在指定的聽覺位置處的一個或多個輸入音頻流60。
緊跟在產(chǎn)生語音信號的用戶的身份之后的上角標“AP”表示語音信號已經(jīng)從聽覺上被會議處理器42定位。緊跟上角標“Ap”的下角標指示誰指定了聽覺位置。例如,符號 “VS16BAP16A”表示由參與者16B所產(chǎn)生的語音信號,參與者16B已經(jīng)從聽覺上被定位在由主持人16A指定的聽覺位置處。會議處理器42可以產(chǎn)生包括多個會議參與者的音頻流的“混合”輸出音頻流。例如,輸出音頻流62A包括由參與者16B(已經(jīng)由主持人16A在聽覺上被定位)產(chǎn)生的音頻流、以及由參與者16C(也已經(jīng)由主持人16A在聽覺上被定位)產(chǎn)生的音頻流,正如符號“(VS16Bap16A+VS16Cap16A),,所示。如圖3所示,會議處理器42可以從相同的輸入音頻流60A-60C產(chǎn)生多個不同的輸出音頻流62A-62C,其中每一輸出音頻流62A-62C包括由接收輸出音頻流62A-62C的各自參與者所指定的不同的聽覺位置特性。
圖4顯示了用戶界面觀,其中當新參與者加入會議時,主持人16A管理會議。當新的通信會話34連接到媒體服務(wù)器12時,媒體服務(wù)器12提供消息給識別新的通信會話 34連接的通信設(shè)備14A,并且可以包括唯一識別新的通信會話34的通信會話標識符。通信設(shè)備14A然后在用戶界面觀的第一顯示區(qū)域64提供新的參與者圖標50,諸如參與者圖標 50N-50P所示。在用戶界面觀中的每一個參與者圖標對應(yīng)特定的通信會話34和參與者16。 因此,參與者圖標50B-50P分別對應(yīng)通信會話34B-34P,并且分別對應(yīng)參與者16B-16P。參與者圖標使用諸如對應(yīng)的參與者的姓名的信息來標記,該信息可以在會話初始過程中由參與者提供給媒體服務(wù)器12。在參與者圖標50N-50P從第一顯示區(qū)域64移動到第二顯示區(qū)域66之前,一旦被主持人16A批準,參與者16N-16P可以聽到指示他們將加入到會議中的音樂或者消息。
當主持人16A選擇第一顯示區(qū)域64中的參與者圖標50N-50P,并且拖曳參與者圖標50N-50P到第二顯示區(qū)域66時,相應(yīng)的通信會話34N-34P由會議處理器42提供給輸出音頻流。會議的缺省行為可以是主持人16A選擇的。主持人16A可以配置會議,以便在缺省情況下與在第二顯示區(qū)域66中的參與者圖標50對應(yīng)的通信會話34僅僅由主持人16A 產(chǎn)生的輸入音頻流提供。可替代地,缺省配置可以是通信會話34被提供以由具有在第二顯示區(qū)域66中對應(yīng)的參與者圖標50的所有其他參與者產(chǎn)生的輸入音頻流。例如,假定主持人16A從第一顯示區(qū)域64拖曳參與者圖標50N到第二顯示區(qū)域66。進一步假定缺省行為是每一個參與者16都可以聽到其他參與者16和主持人16A。通信設(shè)備14A發(fā)送混合控制信號到會議處理器42,其識別與參與者圖標50N對應(yīng)的通信會話34N,并且發(fā)送指示會議處理器42提供輸出音頻流給通信會話34N的混合指令,所述輸出音頻流包括來自其他通信會話34的每一個的輸入音頻流。會議處理器42也將來自通信會話34N的新的輸入音頻流提供給其他通信會話34,因此每一個參與者16和主持人16A都可以聽到新的參與者16N。
優(yōu)選地,主持人16A通過用戶界面觀的操作,可以很容易地選擇主持人16A想要交流的一個或多個特定的參與者16,或者很容易地指示主持人16A想要所有的參與者16聽到主持人16A。例如,雙擊主持人圖標50A可以指示主持人16A想要對所有的參與者16說話。通信設(shè)備14A發(fā)送混合控制信號到會議處理器42,指示會議處理器42提供由主持人 16A產(chǎn)生的輸入音頻流到每一個通信會話34。用戶界面觀可以用虛線68來顯示每一個參與者16B-16M都能夠聽到主持人16A。再次雙擊主持人圖標50A,可以指示主持人16A不想任何參與者16B-16M能夠聽到主持人16A。通信設(shè)備14A發(fā)送混合控制信號到會議處理器 42,指示會議處理器42不發(fā)送由主持人16A產(chǎn)生的輸入音頻流到任何通信會話34B-34M。
單擊特定的參與者圖標50可以發(fā)起僅與參與者圖標50對應(yīng)的參與者16的直接會話。例如,假定主持人16A想要通知參與者16K “Jane”她是被分裂出去的,即其他參與者16B-16J、16L-16M都聽不見此交流。主持人16A可以單擊參與者圖標50K,通信設(shè)備14A 可以發(fā)送混合控制信號到會議處理器42,指示控制處理器42提供主持人16A的輸入音頻流僅到通信會話34K。雙擊特定的參與者圖標50B-50M可以進一步指示通信設(shè)備14A產(chǎn)生和發(fā)送混合控制信號到控制處理器42,以便相應(yīng)的參與者16的輸入音頻流僅被提供給主持人16A。在這種方式下,主持人16A可以容易直觀地與期望的任何一個參與者16B-16M中建立一對一的會話。
圖5為顯示了依據(jù)本發(fā)明的一個實施例而用于指定與已經(jīng)加入到會議中的新參與者16相關(guān)聯(lián)的音頻流的聽覺位置的一種方法的流程圖。當與新的參與者16對應(yīng)的通信會話34連接到媒體服務(wù)器12時,媒體服務(wù)器12發(fā)送標識新的通信會話34的數(shù)據(jù)到主持人16A的通信設(shè)備14A(步驟100)。用戶界面觀在第一顯示區(qū)域64(圖4)中顯示與新的通信會話34相關(guān)聯(lián)的參與者16所對應(yīng)的新參與者圖標50 (步驟10 。主持人16A選擇參與者圖標50并將參與者圖標50從第一顯示區(qū)域64移動到第二顯示區(qū)域66 (步驟104)。 基于新參與者圖標50相對于第二顯示區(qū)域64中的基準位置的位置,通信設(shè)備14A計算聽覺位置標識符(步驟106)。依據(jù)本發(fā)明的一個實施例,基準位置由主持人圖標50A的位置來指示。通信設(shè)備14A發(fā)送聽覺位置標識符和標識與參與者圖標50對應(yīng)的通信會話34的通信會話標識符到會議處理器42 (步驟108)?;趤碜砸炎R別的通信會話34的輸入音頻流,會議處理器42產(chǎn)生新的輸出音頻流,該已識別的通信會話將輸出音頻流定位在已識別的聽覺位置處。會議處理器42將新的輸出音頻流與去往主持人16A的任何其他音頻流進行混合,并提供已混合的輸出音頻流到通信會話34A,其由通信設(shè)備14A接收(步驟110)。
依據(jù)本發(fā)明的一個實施例,一個或多個參與者16B-16P具有諸如立體聲耳機的多聲道功能的設(shè)備,并且具有在相應(yīng)的通信設(shè)備14B-14P上執(zhí)行的用戶界面觀。每一個參與者16B-16P可以經(jīng)由如在圖4中描述的拖放接口為其他參與者16B-16P的每一個指定聽覺位置。各自的通信設(shè)備14B-14P可以向會議處理器42提供針對每一個各自的音頻流的聽覺位置標識符,會議處理器42可以提供唯一的混合輸出音頻流給每一個通信會話34,其從聽覺上將每一個參與者16B-16P的語音定位在期望的聽覺位置處。
圖6顯示了依據(jù)本發(fā)明的另一個實施例的用戶界面觀,其中主持人16A可以經(jīng)由用戶界面觀創(chuàng)建參與者16B-16P子群。用戶界面觀包括第一顯示區(qū)域70,其中參與者圖標50B-1到50M-1表示參與會議的相應(yīng)的參與者16B-16M。在第二顯示區(qū)域72中,主持人 16A形成了參與者圖標50B-2至50M-2的子群74A-74C,其中相應(yīng)的參與者16B-16M僅可以與各自的子群74A-74C中的其他參與者16B-16M通信。例如,假定主持人16A為老師,其他每個參與者16B-16M都為學生。主持人16A確定每一個參與者16B-16M都對三個話題之一有疑問。主持人16A想要討論特定話題的參與者16B-16M彼此碰面,并且討論一個額外的作業(yè),該作業(yè)被指定用來輔助學習話題的過程。主持人16A點擊一個新的子群圖標76,使得通信設(shè)備14A在第二顯示區(qū)域72顯示定位圓周52A。假定主持人16A單獨地或集中地從第一顯示區(qū)域70選擇參與者圖標50B-1、50G-1、50H-1、50K-1和50L-1,并且拖曳圖標到定位圓周52A上或其附近。一旦在定位圓周52A上放下參與者圖標50B-1、50G-1、50H-1、50K-1和 50L-1,如圖6所示,通信設(shè)備14A就創(chuàng)建這樣的參與者圖標的拷貝來展示在定位圓周52A 上,作為參與者圖標50B-2、50G-2、50H-2、50K-2和50L-2。如前所述,通信設(shè)備14A可以確定針對參與者圖標50B-2、50G-2、50H-2、50K-2和50L-2中每一個的聽覺位置標識符,并且如前所述,向會議處理器42提供聽覺位置標識符來為主持人16A產(chǎn)生和混合輸出音頻流。 通信設(shè)備14A還發(fā)送混合控制信號到會議處理器42,該控制信號向會議處理器42指示通信會話34B、34G、34H、34K和34L的音頻流被提供給彼此之間,但不提供給其他通信會話34。 以這種方式,參與者16B、16G、16H、16K和16L可以在彼此之間通信。
假定主持人16A對子群74B和74C重復(fù)之前討論的過程,每次拖曳參與者圖標50 到子群74B、74C中的一個或另一個(取決于相應(yīng)的參與者16需要幫助的特定的話題)?;陧憫?yīng)于主持人16A對用戶界面觀的操作由通信設(shè)備14A產(chǎn)生的混合控制信號,在各自子群中的每一個參與者16可以與在他們相應(yīng)的子群74中的其他參與者16說話,但不能與其他參與者16說話。
圖7顯示了在圖6中所示的用戶界面28的進一步實施例,其中主持人16A很容易地選擇與特定的子群74中的參與者16交談,或者可以很容易地選擇與所有的參與者16 交談。假定主持人164希望與子群74々中的參與者168、166、16!1、161(和16L交談。主持人 16A可雙擊主持人圖標50A-3,其指示通信設(shè)備14A產(chǎn)生和發(fā)送混合控制信號到會議處理器42?;旌峡刂菩盘栕R別與子群74A中的參與者16B、16G、16H、16K和16L對應(yīng)的通信會話;MB、;MG、;MH、34K和!ML,并且指示會議處理器42在與參與者圖標50B-2、50G-2、50H_2、 50K-2和50L-2對應(yīng)的聽覺位置處提供與通信會話34B、34G、34H、34K和34L相關(guān)聯(lián)的輸入音頻流給主持人16A,以及提供來自主持人16A的輸入音頻流到通信會話34B、34G、34H、34K 和34L。假如主持人16A希望跟所有的參與者16B-16M交談,則可以雙擊第一顯示區(qū)域70 中的主持人圖標50A-1。通信設(shè)備14A可以產(chǎn)生和發(fā)送混合控制信號到會議處理器42以使得所有的參與者16B-16M能夠聽到主持人16A。
依據(jù)本發(fā)明的另一個實施例,主持人16A可以授權(quán)子群74中的參與者16發(fā)起與另一個子群74中的其他參與者16的通信。例如,主持人16A可以意識到在子群74C中的參與者16C、16E、16I、16M非常清楚子群74B中討論的話題,并且假如在子群74B中的參與者16D、16F、16J需要一些幫助,則在子群74C中的參與者16C、16E、161、16M可以幫助他們。 主持人16A可以經(jīng)由用戶界面觀完成該授權(quán),例如,通過右鍵點擊子群74B,并選擇“允許與其他子群通信”菜單選項(未示出)。通信設(shè)備14A可以提供該數(shù)據(jù)給媒體服務(wù)器12來將該配置數(shù)據(jù)存儲在媒體服務(wù)器12的存儲器中。
圖8A顯示了可由子群74B中的參與者16D、16F、16J用來發(fā)起與子群74C中的參與者16C、16E、16I、16M之間的通信的用戶界面洲。假定參與者16J “John”希望發(fā)起與子群 74C中的參與者16C、16E、16I、16M之間的通信。參與者16J可以選擇子群74C并嘗試拖曳子群74C靠近子群74B。由參與者16J使用的通信設(shè)備14J將發(fā)出請求到媒體服務(wù)器12。 媒體服務(wù)器12可以核對在存儲器中的配置選項以確定主持人16A是否給予子群74B發(fā)起與子群74C之間的通信的授權(quán)。假如否,則媒體服務(wù)器12可以通知通信設(shè)備14J該行為不被允許,并且用戶界面觀不允許子群74B被拖曳到子群74C附近。然而,假定主持人16A 已經(jīng)提供了這樣的授權(quán),并且媒體服務(wù)器12通知通信設(shè)備14J請求的動作被允許。
圖8B顯示了在參與者16J拖曳子群74C到臨近子群74B之后的用戶界面28。一旦檢測到子群74C臨近子群74B,通信設(shè)備14J就創(chuàng)建混合控制信號和發(fā)送該混合控制信號到會議處理器42?;旌峡刂菩盘柨梢宰R別與在子群74C中的參與者對應(yīng)的通信會話34C、 34E.34I和34M,并且指示會議處理器42提供與通信會話:MC、;ME、34I和34M相關(guān)聯(lián)的輸入音頻流到通信會話34D、34F和34J?;旌峡刂菩盘栠€可以指示會議處理器42提供與通信會話34D、34F和34J相關(guān)聯(lián)的輸入音頻流到通信會話34C、34E、34I和34M。以這種方式,在子群74B中的每一個參與者可以與在子群74C中的參與者說話,反之亦然。通信設(shè)備14J 可指示會議處理器42在與最靠近位置線52B的參與者圖標501-2的位置所對應(yīng)的聽覺位置處從聽覺上定位與通信會話34C、34E、34I和34M對應(yīng)的輸入音頻流中的每一個,以便參與者16C、16E、16I和16M的每一個對于參與者16J來說都聽起來好像處在相同的位置。可替代地,用戶界面觀可以允許參與者16J在與參與者圖標50C-2、50E-2、501-2和50M-2的各自位置對應(yīng)的不同的聽覺位置處聽到參與者16C、16E、16I和16M中的每一個。
本發(fā)明的各個方面可以被嵌入到存儲在硬件中的指令中,并且例如,可以駐留在隨機訪問存儲器(RAM)、閃存、只讀存儲器(ROM)、電可編程ROM(EPROM)、電可擦除編程 ROM(EEPROM)、寄存器、硬盤、可移除硬盤、CD-ROM或現(xiàn)有技術(shù)已知的任何其他形式的計算機可讀存儲介質(zhì)中。示例性的存儲介質(zhì)連接到處理器以便處理器可以從存儲介質(zhì)中讀取信息并寫信息到存儲介質(zhì)中。在可替代中,存儲介質(zhì)可以集成到處理器中。處理器和存儲介質(zhì)可以駐留在ASIC中。例如,該ASIC可以駐留在媒體服務(wù)器12或通信設(shè)備14中。
本領(lǐng)域技術(shù)人員可以意識到本發(fā)明的優(yōu)選實施例的改進和修改。所有的這些改進和修改都認為是在這里公開的方面以及權(quán)利要求書的范圍內(nèi)。
權(quán)利要求
1.一種用于在協(xié)作環(huán)境中指定音頻流的聽覺位置的方法,包括 在顯示設(shè)備的用戶界面的第一顯示區(qū)域中顯示多個參與者圖標;接收與所述多個參與者圖標的第一參與者圖標對應(yīng)的第一輸出音頻流,其中所述第一輸出音頻流包括聽覺位置特性,該聽覺位置特性從聽覺上將所述第一輸出音頻流定位在第一聽覺位置處,所述第一聽覺位置對應(yīng)于所述第一顯示區(qū)域中的所述第一參與者圖標的第一位置;接收指示所述第一參與者圖標已經(jīng)被從所述第一位置移動到所述第一顯示區(qū)域中的第二位置的第一輸入;響應(yīng)于所述第一輸入,基于所述第二位置和基準位置確定與所述第二位置對應(yīng)的第一參與者圖標的第二聽覺位置;發(fā)送控制信號到會議處理器,該控制信號包括標識所述第一輸出音頻流的音頻流標識符和標識所述第二聽覺位置的聽覺位置標識符;以及接收所述第一輸出音頻流,其中所述第一輸出音頻流包括從聽覺上將第一輸出音頻流定位在所述第二聽覺位置處的聽覺位置特性。
2.如權(quán)利要求1所述的方法,其中所述多個參與者圖標包括至少4個參與者圖標,并且其中所述第一參與者圖標與第一參與者通信會話對應(yīng),第二參與者圖標與第二參與者通信會話對應(yīng);第三參與者圖標與第三參與者通信會話對應(yīng),并且第四參與者圖標與第四參與者通信會話對應(yīng),進一步包括接收請求包括所述第一參與者圖標和所述第二參與者圖標的子群的第二輸入;以及響應(yīng)于所述第二輸入,發(fā)送混合控制信號到會議處理器,其中所述混合控制信號指示所述會議處理器將與所述第一參與者相關(guān)聯(lián)的輸入音頻流提供到所述第二參與者通信會話,而不提供到所述第三參與者通信會話或所述第四參與者通信會話;以及將與所述第二參與者相關(guān)聯(lián)的輸入音頻流提供到所述第一參與者通信會話,而不提供到所述第三參與者通信會話或所述第四參與者通信會話。
3.如權(quán)利要求2所述的方法,進一步包括在所述用戶界面的第二顯示區(qū)域中顯示所述第一參與者圖標和所述第二參與者圖標。
4.如權(quán)利要求2所述的方法,進一步包括 接收指示所述子群的選擇的第三輸入;以及響應(yīng)于所述第三輸入,發(fā)送第二混合控制信號到所述會議處理器,其中所述第二混合控制信號指示所述會議處理器將與主持人相關(guān)聯(lián)的輸入音頻流提供到所述第一參與者通信會話和所述第二參與者通信會話,而不提供到所述第三參與者通信會話或所述第四參與者通信會話。
5.如權(quán)利要求4所述的方法,進一步包括接收指示所有的所述多個參與者圖標的選擇的第四輸入;以及響應(yīng)于所述第四輸入,發(fā)送第三混合控制信號到所述會議處理器,其中所述第三混合控制信號指示所述會議處理器將與所述主持人相關(guān)聯(lián)的所述輸入音頻流提供到所述第一參與者通信會話、所述第二參與者通信會話、所述第三參與者通信會話和所述第四參與者通信會話。
6.如權(quán)利要求3所述的方法,進一步包括多個第一參與者圖標,所述多個第一參與者圖標中的第一個被顯示在所述第一顯示區(qū)域中,且所述多個第一參與者圖標中的第二個被同時顯示在所述第二顯示區(qū)域中,進一步包括接收第二輸入,所述第二輸入指示在所述第二顯示區(qū)域中的所述第一參與者圖標已經(jīng)被從所述第二顯示區(qū)域中的第一位置移動到所述第二顯示區(qū)域中的第二位置;以及響應(yīng)于所述第二輸入,基于所述第二位置和第二基準位置確定與所述第二位置對應(yīng)的所述第二顯示區(qū)域中的第一參與者圖標的新的聽覺位置,其中所述新的聽覺位置與所述第二聽覺位置不同。
7.如權(quán)利要求2所述的方法,進一步包括接收第三輸入,所述第三輸入請求包括所述第三參與者圖標和所述第四參與者圖標的第二子群;以及發(fā)送所述混合控制信號到所述會議處理器,其中所述混合控制信號指示所述會議處理器將與所述第三參與者相關(guān)聯(lián)的輸入音頻流提供到所述第四參與者通信會話,而不提供到所述第一參與者通信會話或所述第二參與者通信會話;以及將與所述第四參與者相關(guān)聯(lián)的輸入音頻流提供到所述第三參與者通信會話,而不提供到所述第一參與者通信會話或所述第二參與者通信會話。
8.如權(quán)利要求7所述的方法,進一步包括接收指示授權(quán)所述第一子群發(fā)起與所述第二子群的通信的第四輸入,并且響應(yīng)于所述第四輸入,發(fā)送授權(quán)指示符到服務(wù)器,接收指示所述第一子群已經(jīng)發(fā)起與所述第二子群的通信的數(shù)據(jù),并且更新所述用戶界面以指示所述第一子群已經(jīng)發(fā)起與所述第二子群的通fn °
9.如權(quán)利要求8所述的方法,其中所述授權(quán)指示符被發(fā)送到包括所述會議處理器的媒體服務(wù)器。
10.一種媒體服務(wù)器,包括通信接口,其被配置為與主持人通信會話、第一參與者通信會話和第二參與者通信會話進行通信;以及會議處理器,其中所述會議處理器被配置為接收來自主持人的與所述第一參與者通信會話相關(guān)聯(lián)的第一聽覺位置數(shù)據(jù)和與所述第二參與者通信會話相關(guān)聯(lián)的第二聽覺位置數(shù)據(jù);接收來自所述第一通信會話的第一輸入音頻流和來自所述第二參與者通信會話的第二輸入音頻流;基于所述第一輸入音頻流和所述第二輸入音頻流產(chǎn)生第一輸出音頻流,其中所述第一輸出音頻流從聽覺上將所述第一輸入音頻流定位在由所述第一聽覺位置數(shù)據(jù)指示的聽覺位置處,并將所述第二輸入音頻流定位在由所述第二聽覺位置數(shù)據(jù)指示的聽覺位置處;以及提供所述第一輸出音頻流到所述主持人通信會話。
11.如權(quán)利要求10所述的媒體服務(wù)器,其中所述通信接口進一步被配置為與第三參與者通信會話和第四參與者通信會話進行通信,其中所述會議處理器進一步被配置為接收第一混合控制信號,并基于所述第一混合控制信號提供基于所述第一輸入音頻流的第二輸出音頻流到所述第二參與者通信會話,而不是到所述第三參與者通信會話或所述第四參與者通信會話,以及提供基于所述第二輸入音頻流的第三輸出音頻流到所述第一參與者通信會話,而不是到所述第三參與者通信會話或所述第四參與者通信會話。
12.如權(quán)利要求11所述的媒體服務(wù)器,其中所述會議處理器進一步被配置為從與所述第二通信會話對應(yīng)的第二參與者接收與所述第一參與者通信會話相關(guān)聯(lián)的第三聽覺位置數(shù)據(jù),接收來自所述第一通信會話的所述第一輸入音頻流,產(chǎn)生第四輸出音頻流,所述第四輸出音頻流從聽覺上將所述第四輸出音頻流定位在由所述第三聽覺位置數(shù)據(jù)指示的聽覺位置處,并且提供所述第四輸出音頻流到所述第二通信會話。
13.如權(quán)利要求12所述的媒體服務(wù)器,其中所述第三聽覺位置數(shù)據(jù)與所述第一聽覺位置數(shù)據(jù)不同,并且其中所述第一輸出音頻流和所述第四輸出音頻流基本是同時產(chǎn)生的,并且其中與提供所述第四輸出音頻流到所述第二通信會話同時地、所述第一輸出音頻流被提供到所述主持人通信會話。
14.如權(quán)利要求11所述的媒體服務(wù)器,其中所述會議處理器進一步被配置為接收第二混合控制信號,并且基于所述第二混合控制信號,將主持人輸出音頻流提供到所述第一參與者通信會話和所述第二參與者通信會話,而不提供到所述第三參與者通信會話或所述第四參與者通信會話。
15.如權(quán)利要求14所述的媒體服務(wù)器,其中所述會議處理器進一步被配置為接收第三混合控制信號,并且基于所述第三混合控制信號提供所述主持人輸出音頻流到所述第一參與者通信會話、所述第二參與者通信會話、所述第三參與者通信會話和所述第四參與者通信會話。
16.如權(quán)利要求11所述的媒體服務(wù)器,其中所述會議處理器進一步被配置為接收標識與所述第三參與者通信會話和所述第四參與者通信會話相關(guān)聯(lián)的聽覺位置的第三聽覺位置數(shù)據(jù);基于來自所述第三參與者通信會話的第三輸入音頻流和來自所述第四參與者通信會話的第四輸入音頻流,在由所述第三聽覺位置數(shù)據(jù)所指示的聽覺位置處提供第二輸出音頻流。
17.如權(quán)利要求10所述的媒體服務(wù)器,其中所述會議處理器進一步被配置為接收第一混合控制信號,并且基于所述第一混合控制信號將來自所述主持人通信會話的主持人輸入音頻流提供到所述第一參與者通信會話,而不提供到所述第二參與者通信會話,并且將所述第一輸入音頻流提供到所述主持人通信會話,而不提供到所述第二參與者通信會話。
18.一種計算機程序產(chǎn)品,其包括具有嵌入其中的計算可讀程序代碼的計算機可用介質(zhì),所述計算可讀程序代碼被配置為執(zhí)行實施一種用于指定音頻流的聽覺位置的方法,所述方法包括在顯示設(shè)備的用戶界面的第一顯示區(qū)域中顯示多個參與者圖標;接收與所述多個參與者圖標中的第一參與者圖標對應(yīng)的第一輸出音頻流,其中所述第一輸出音頻流包括聽覺位置特性,該特性在與所述第一顯示區(qū)域中的所述第一參與者圖標的第一位置對應(yīng)的第一聽覺位置處從聽覺上定位所述第一輸出音頻流;接收指示所述第一參與者圖標已經(jīng)被從在所述第一顯示區(qū)域中的所述第一位置移動到第二位置的第一輸入;響應(yīng)于所述第一輸入,基于所述第二位置和基準位置確定與所述第二位置對應(yīng)的第一參與者圖標的第二聽覺位置;發(fā)送控制信號到會議處理器,該控制信號包括標識所述第一輸出音頻流的音頻流標識符和標識所述第二聽覺位置的聽覺位置標識符;以及接收所述第一輸出音頻流,其中所述第一輸出音頻流包括聽覺位置特性,該特性在所述第二聽覺位置處從聽覺上定位所述第一輸出音頻流。
19.如權(quán)利要求18所述的計算機程序產(chǎn)品,其中所述多個參與者圖標包括至少4個參與者圖標,并且其中所述第一參與者圖標與第一參與者通信會話對應(yīng),第二參與者圖標與第二參與者通信會話對應(yīng);第三參與者圖標與第三參與者通信會話對應(yīng),并且第四參與者圖標與第四參與者通信會話對應(yīng),所述方法進一步包括接收請求包括所述第一參與者圖標和所述第二參與者圖標的子群的第二輸入;以及響應(yīng)于所述第二輸入,發(fā)送混合控制信號到會議處理器,其中所述混合控制信號指示所述會議處理器提供與所述第一參與者相關(guān)聯(lián)的輸入音頻流到所述第二參與者通信會話,而不是到所述第三參與者通信會話或所述第四參與者通信會話;和提供與所述第二參與者相關(guān)聯(lián)的輸入音頻流到所述第一參與者通信會話,而不是到所述第三參與者通信會話或所述第四參與者通信會話。
20.如權(quán)利要求19所述的計算機程序產(chǎn)品,進一步包括在所述用戶界面的第二顯示區(qū)域中顯示所述第一參與者圖標和所述第二參與者圖標。
21.如權(quán)利要求19所述的計算機程序產(chǎn)品,其中所述方法進一步包括 接收指示所述子群的選擇的第三輸入;以及響應(yīng)于所述第三輸入,發(fā)送第二混合控制信號到所述會議處理器,其中所述第二混合控制信號指示所述會議處理器提供與主持人相關(guān)聯(lián)的輸入音頻流到所述第一參與者通信會話和所述第二參與者通信會話,而不是到所述第三參與者通信會話或所述第四參與者通 fn會話ο
22.—種控制協(xié)作環(huán)境的計算機執(zhí)行的方法,包括在第一顯示區(qū)域中顯示第一參與者圖標和第二參與者圖標,其中所述第一參與者圖標與第一通信會話相關(guān)聯(lián),并且所述第二參與者圖標與第二通信會話相關(guān)聯(lián);檢測所述第一參與者圖標從所述第一顯示區(qū)域移動到第二顯示區(qū)域內(nèi)的一位置的移動;確定相對于基準位置的該位置所關(guān)聯(lián)的聽覺位置數(shù)據(jù); 提供所述聽覺位置數(shù)據(jù)給會議處理器;接收音頻流,所述音頻流將與所述第一通信會話對應(yīng)的第一參與者音頻流定位在由所述聽覺位置數(shù)據(jù)標識的聽覺位置處;以及提供所述音頻流給輸出設(shè)備。
全文摘要
提供了一種用于在協(xié)作環(huán)境中指定音頻流的聽覺位置的方法和系統(tǒng)。與參與者對應(yīng)的多個圖標顯示在用戶界面上。主持人可以從用戶界面的第一位置移動圖標到用戶界面的第二位置。一旦從第一位置移動圖標到第二位置,與所述第二位置對應(yīng)的聽覺位置標識符就被產(chǎn)生,并被發(fā)送到會議處理器。所述會議處理器使用所述聽覺位置標識符產(chǎn)生輸出音頻流,其從聽覺上將由所述圖標對應(yīng)的參與者所產(chǎn)生的音頻流定位在該聽覺位置處。所述輸出音頻流被提供給主持人,其使用多聲道功能設(shè)備來感知在指定的聽覺位置處的音頻流。
文檔編號H04M3/56GK102484667SQ201080030095
公開日2012年5月30日 申請日期2010年9月22日 優(yōu)先權(quán)日2009年9月22日
發(fā)明者托尼·麥考馬克, 約翰·H·尤庫姆, 約翰·科斯特洛 申請人:阿瓦雅公司