基于對會議參與者的臉部識別的交互的制作方法

文檔序號：7678456閱讀：237來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：基于對會議參與者的臉部識別的交互的制作方法
技術(shù)領(lǐng)域：
本發(fā)明一般地涉及生物測定學(xué)和視頻會議領(lǐng)域。
背景技術(shù)：
在許多情況下，視頻會議會話的個體參與者并不了解彼此或者并不對彼此進(jìn)行識別。通常，這需要在視頻會議開始時的某種介紹時段?？商娲?地，可在視頻會議會話期間進(jìn)行出于識別參與者目的的中斷。參與者可能希望與另一參與者進(jìn)行交互，例如，希望私下地向剛剛在會議中作了演講
的某個人提問，或者希望開始與那個人的即時消息(IM)會話以在與會議中的每個人分享該問題之前私下地對其進(jìn)行討論。在任一種情況下，出于共享身份信息的目的的中斷或介紹都是耗時的，不方便的，并且將打斷正常的會議討論。

從以下的詳細(xì)描述中以及從附圖中，本發(fā)明將得到更充分地理解，然而以下的詳細(xì)描述和附圖不應(yīng)被視為將本發(fā)明限制于所示出的具體實施例，而僅用于說明和理解。
圖1示出示例性視頻會議系統(tǒng)。
圖2示出在端點設(shè)備上對會議參與者的示例性顯示。
圖3示出示例性圖形用戶界面(GUI)。
圖4示出用于視頻會議系統(tǒng)的示例性操作方法。
圖5示出用于獲得關(guān)于所選出的會議參與者的身份信息的示例性方法。
圖6示出示例性節(jié)點的基本組件。
具體實施例方式
在以下描述中，為了提供對本發(fā)明的全面理解而提出了許多具體細(xì) 節(jié)，例如設(shè)備類型、系統(tǒng)配置、設(shè)備類型、通信方法等等。然而，相關(guān)領(lǐng) 域中的普通技術(shù)人員應(yīng)理解，實施本發(fā)明可能并不需要這些具體細(xì)節(jié)。
在本申請的上下文中，計算機(jī)網(wǎng)絡(luò)是按地理位置分布的、在節(jié)點之間傳輸數(shù)據(jù)的互連子網(wǎng)的集合，這些節(jié)點例如是中間節(jié)點和端節(jié)點(也稱作端點)。局域網(wǎng)(LAN)是這樣的子網(wǎng)的一個示例；通過諸如路由器、網(wǎng)
橋或交換機(jī)之類的中間網(wǎng)絡(luò)節(jié)點，多個LAN可以被進(jìn)一步互連，以擴(kuò)展
計算機(jī)網(wǎng)絡(luò)的有效"大小"并增大通信節(jié)點的數(shù)目。端點設(shè)備或節(jié)點的示例可以包括服務(wù)器和個人計算機(jī)。節(jié)點一般通過根據(jù)預(yù)定協(xié)議交換離散的數(shù)據(jù)幀或數(shù)據(jù)分組來進(jìn)行通信。
通常，端點代表端用戶、客戶端或者能夠經(jīng)由會議系統(tǒng)參與音頻會議會話的個人。可用于發(fā)起或參與會議會話的端點設(shè)備包括個人數(shù)字助理
(PDA);諸如筆記本計算機(jī)、膝上型計算機(jī)或桌上型計算機(jī)之類的個人計算機(jī)(PC);音頻/視頻家電；流媒體客戶端；具有內(nèi)置相機(jī)和麥克風(fēng) 的電視設(shè)備；或者能夠發(fā)起或參與與視頻會議系統(tǒng)進(jìn)行的交換的任何其他
設(shè)備、組件、元件或物體。
圖6示出示例性節(jié)點60的基本組件，節(jié)點60通常包括多個基本子系統(tǒng)，這些子系統(tǒng)包括處理器子系統(tǒng)61、主存儲器62和輸入/輸出(I/O)子系統(tǒng)65。數(shù)據(jù)經(jīng)由存儲器總線63在主存儲器("系統(tǒng)存儲器")62和處理器子系統(tǒng)61之間傳輸，并且經(jīng)由系統(tǒng)總線66在處理器子系統(tǒng)和I/O子系統(tǒng)之間傳輸。系統(tǒng)總線的示例可以包括傳統(tǒng)的閃電數(shù)據(jù)傳輸(或者超傳輸)總線和傳統(tǒng)的外圍組件互連(PCI)總線。節(jié)點60還可以包括耦合到系統(tǒng)總線66用于執(zhí)行附加功能的其他硬件單元/模塊64。處理器子系統(tǒng)61 可以包括一個或多個處理器和包含一組功能的控制器設(shè)備，該控制器設(shè)備包括系統(tǒng)存儲器控制器，對一種或多種系統(tǒng)總線的支持和直接內(nèi)存訪問 (DMA)引擎。
圖1示出示例性視頻會議系統(tǒng)10，其包括位于因特網(wǎng)協(xié)議(IP)網(wǎng)絡(luò) 21上的視頻會議服務(wù)器20。視頻會議服務(wù)器20包括實現(xiàn)在此描述的各種
7特征和功能的軟件(或固件)插件、模塊或增強(qiáng)。在該示例中，視頻會議
服務(wù)器20被示出為與數(shù)據(jù)庫23耦合，數(shù)據(jù)庫23用于存儲與為其舉辦會議會話的機(jī)構(gòu)相關(guān)聯(lián)的雇員以及其他個體的信息(例如，姓名、ID號、部門、電話號碼、電子郵件地址等等)。數(shù)據(jù)庫23還存儲機(jī)構(gòu)內(nèi)(并且有可能是機(jī)構(gòu)外)個人的臉部圖像數(shù)據(jù)。
在所示出的實施例中，視頻會議服務(wù)器20包括數(shù)字信號處理器
(DSP)或基于固件/軟件的系統(tǒng)，它們在服務(wù)器20的控制下混合和/或切換在其輸入端口處接收到的音頻/視頻信號。在會議服務(wù)器端口處接收到的音頻/視頻信號發(fā)源于會議或會晤的每個參與者(例如，使用端點設(shè)備12 和14的個體會議參與者)，并且可能發(fā)源于交互語音響應(yīng)(IVR)系統(tǒng)
(未示出)。會議服務(wù)器20還可以包含用于翻譯并解析參與者話音的自然語言自動話音識別(ASR)模塊以及標(biāo)準(zhǔn)的話音到文本(STT)和文本到話音(TTS)轉(zhuǎn)換器模塊，或者與這些模塊相關(guān)聯(lián)。
應(yīng)理解，在不同的具體實現(xiàn)方式中，用于會議參與者的媒體路徑可以包括音頻/視頻傳輸，例如，通過跨越多種服務(wù)、系統(tǒng)和設(shè)備的連接，穿過多個不同網(wǎng)絡(luò)(例如，因特網(wǎng)、企業(yè)內(nèi)部互聯(lián)網(wǎng)、PSTN等等)、協(xié)議
(例如，IP、異步傳輸模式(ATM)、點對點協(xié)議(PPP))而發(fā)送的實時傳輸協(xié)議(RTP)分組。
系統(tǒng)IO還示出了正在經(jīng)由端點12參與視頻會議的用戶11，端點12 包括具有相機(jī)13的PC。在該示例中，主會議包括經(jīng)由端點14與視頻會議服務(wù)器20相連接的群組18，端點14包括相機(jī)15、麥克風(fēng)16和顯示監(jiān)視器17。根據(jù)一個實施例，視頻會議服務(wù)器20包括臉部識別(FR)模塊22
(例如，軟件)，該FR模塊22可用于從圖像中檢選出(pick)某人的臉部，從場景的剩余部分中提取該臉部，并且將其與存儲在數(shù)據(jù)庫23中的臉部圖像編目(catalog)進(jìn)行比較。作為示例，F(xiàn)R模塊22可以包括軟件程序，例如由Minnesota州，Minnetonka的Identix公司銷售的Facelt , 或者由Massachusetts州，Littleton的Viisage Technology銷售的臉部識別程序。這些程序出于對人們進(jìn)行識別的目的而分析人臉圖像。
在圖1的實施例中，F(xiàn)R模塊22可以得到會議參與者的所捕捉到的
8("快照(snapshot)")臉部圖像并測量諸如眼睛之間的距離、鼻子的長度、臉的輪廓以及下巴的角度之類的特性，然后創(chuàng)建該臉部圖像的唯一
"模板"。該模板然后可以作為對象被存儲在數(shù)據(jù)庫23中。通過使用模板，模塊22可以將所捕捉到的圖像與經(jīng)存儲的圖像(例如，數(shù)據(jù)庫23中預(yù)先存在的相片)進(jìn)行比較，并且產(chǎn)生估量圖像彼此之間的相似程度的評分。也就是，模塊22通過對臉部標(biāo)志(即，所定義的臉部特征的具體比例和角度)進(jìn)行比較而操作。
在某些實現(xiàn)方式中，隨著個人略微地移動(或者通過從立體攝像機(jī)中得到更小數(shù)目的快照)，可以對一個會議參與者拍攝不同的快照，并且將其與已知數(shù)據(jù)庫的臉部特征向量進(jìn)行比較。數(shù)據(jù)庫23可以將臉部特征向量(可以唯一地標(biāo)識一個人的、從不同角度拍攝的一系列臉部圖像)與每個人的簡檔(profile) —起存儲。在一個實施例中，系統(tǒng)將視頻會議會晤中的每個所勾勒出的參與者臉部與經(jīng)存儲的編目或公司姓名地址錄
(directory)進(jìn)行匹配以識別參與者。該匹配可以在每個人或群組加入時的會議會話開始處發(fā)生，或者可以每當(dāng)參與者經(jīng)由用戶界面選擇另一參與者的臉部圖像時發(fā)生，該用戶界面在與服務(wù)器20連接的端點設(shè)備上運行。
在一個實施例中，F(xiàn)R模塊22用于與在用戶的端點設(shè)備(例如，PC 12)上運行的圖形用戶界面進(jìn)行通信，該圖形用戶界面使得用戶能夠在視頻會議期間將鼠標(biāo)或其他光標(biāo)控制設(shè)備定位在某個人的臉部圖像上。用戶然后可以"點擊"該圖像(即，對象)以獲得關(guān)于該參與者的身份信息。用戶界面然后將臉部圖像信息傳送到FR模塊22， FR模塊22然后對數(shù)據(jù) 庫23執(zhí)行査找以嘗試對所選之人的臉部進(jìn)行匹配。在另一實施例中，該界面可用于在視頻會議會話中發(fā)起與所選參與者的交互——例如，通過經(jīng) 由視頻會議服務(wù)器20開始與所選參與者的通信會話(例如，IM、電子郵件或電話)。應(yīng)理解，為了開始與所選個人的通信會話(例如IM、電子郵件或電話會話)，視頻會議會話可以是實況轉(zhuǎn)播的或者是經(jīng)記錄的。
圖2示出在端點設(shè)備12的顯示屏幕上的、對群組18中的會議參與者的示例性顯示。群組18出現(xiàn)在PC 12上所運行的GUI的視窗28中。在一個實施例中，視頻會議的每個參與者的輪廓被轉(zhuǎn)換為GUI的用戶可選擇 (例如，"點擊")以獲得關(guān)于該個人的信息的活動對象。作為示例，光
標(biāo)箭頭25被示出為由用戶定位在群組18中坐在會議桌最右側(cè)的參與者臉部上方。用戶例如可以使用光標(biāo)設(shè)備或鼠標(biāo)來包圍(encircle)或"套索 (lasso)"人的臉部以將臉部圖像轉(zhuǎn)換為活動對象。在另一實施例中，服務(wù)器20執(zhí)行例程或程序，其中每個新的視頻會議參與者在其加入視頻會話時使其臉部圖像被自動捕捉并且被轉(zhuǎn)換為"可點擊的"對象。一旦捕捉到了參與者的臉部圖像，服務(wù)器20的模塊22就可以響應(yīng)于用戶選擇或點擊該臉部圖像(即，當(dāng)光標(biāo)箭頭25定位在那個人臉部上方時)而嘗試在數(shù)據(jù)庫23中對該圖像進(jìn)行匹配。
本領(lǐng)域中的實踐者應(yīng)理解，可以通過在用戶PC上運行的軟件(即，代碼)來生成GUI。在其他情況下，GUI可以包括通過在用戶PC上運行的瀏覽器軟件來訪問的、基于協(xié)作式web的應(yīng)用。在其他情況下，GUI可以包括經(jīng)下載的應(yīng)用，或者可由參與者PC裝載或訪問的其他形式的計算機(jī)可執(zhí)行代碼。例如，用于實現(xiàn)GUI的軟件代碼可在服務(wù)器20上被執(zhí)行并且可由希望使用其中所提供的特征的用戶來訪問。
圖3示出了響應(yīng)于用戶點擊會議參與者的臉部圖像而在用戶PC或其他端點設(shè)備上產(chǎn)生的示例性圖形用戶界面(GUI)視窗30。在所示出的實施例中，當(dāng)用戶點擊視頻視窗中的會議參與者時，系統(tǒng)顯示那個人的相片 32 (從視頻視窗中復(fù)制的，或者是從文件存儲器中再現(xiàn)的)以及關(guān)于那個人的各種信息。在這種情況下，信息包括參與者的姓名、公司部門、地址所在(site location)、辦公電話號碼、經(jīng)理姓名以及電子郵件地址。所有這些信息與存儲在公司姓名地址錄/數(shù)據(jù)庫中的那個人的圖像相關(guān)聯(lián)。信息被呈現(xiàn)在視窗30的數(shù)據(jù)域33中。
視窗30的底部被示出為包括三個示例性的命令按鈕(圖標(biāo))34 — 36，其可以被用戶點擊或者以其它方式被用戶選擇。命令按鈕34將用戶返回到正在進(jìn)行的(或經(jīng)記錄的)視頻會話的視頻流(例如，圖2的視窗 28)。選擇命令按鈕35使得參與者32可能提交了的供群組查看/討論的任何附件被顯示給用戶。例如，每個參與者可能被邀請在加入會晤之前提交關(guān)于某一主題或話題的報告。命令按鈕35使得用戶能夠快速査看由特定
參與者所提交的(一個或多個)相關(guān)文檔。最后，選擇命令按鈕36使得系統(tǒng)發(fā)起用戶和參與者32之間的通信。通信可以通過預(yù)定的媒體信道 (例如，IM)或者經(jīng)由下拉選單可選，該下拉選單為用戶呈現(xiàn)各種通信選項(例如，IM、電子郵件、電話等)。
在另一實施例中，一個或多個會議參與者的諸如IM、電話號碼或電子郵件地址之類的真實的聯(lián)系詳細(xì)信息可以被禁止或隱藏以防止在某些類型的會議或會晤期間被查看。例如，在大型的電話會議或公共會晤中，個體參與者可以選擇對所有參與者隱藏其聯(lián)系信息。此外，某些參與者(例如，參與公共簡報的CEO)可以選擇完全禁止由用戶界面發(fā)起的通信。這兩個特征可以通過以下用戶界面設(shè)置來實現(xiàn)，該用戶界面設(shè)置在會議會話期間隱藏或遮蔽該用戶的識別信息。
在略微不同的實施例中，不是經(jīng)由用戶界面顯示聯(lián)系信息，而是，會議服務(wù)器可以例如基于參與者加入會議的順序，自動生成到該個人所關(guān)聯(lián) 的通信設(shè)備的臨時映射或匿名鏈接，例如 <participantl@conference.server>。以這禾中方式，請求與另一會議出席者進(jìn) 行通信的參與者僅看到臨時的映射詳細(xì)信息(其仍可用于聯(lián)系該出席者) 而無需真實地顯示該參與者的個人聯(lián)系詳細(xì)信息。換言之，可以經(jīng)由用戶界面來發(fā)起與所選出的會議參與者的通信，而不顯示關(guān)于該參與者的個人聯(lián)系信息。
應(yīng)理解，不同的實施例可以執(zhí)行用于在用戶和所選出的會晤參與者之間建立通信的不同例程/方法。例如，在一個實施例中，用戶可以被給予這樣一個選項在用戶點擊視頻視窗中的會議參與者的輪廓之后，立即開始與該參與者的電話會話。在另一實施例中，用戶可以將會晤參與者的輪廓從視頻視窗拖放到在其PC上運行的軟電話上以開始與那個人的電話會話。
在另一實施例中，用戶可以通過點擊視頻會議視窗中會晤參與者的輪廓來開始與該參與者的IM會話。在另一實施例中，用戶可以通過將會晤參與者的輪廓從視頻會議視窗拖放到在其PC上運行的IM客戶端來開始與
ii該參與者的IM會話。可替代地，用戶可以通過將視頻會議參與者的輪廓
從視頻會議視窗拖動到IM會議視窗中，來將那個人添加到正在進(jìn)行的IM 會議聊天會議中。
在另一實施例中，當(dāng)用戶點擊視頻會議視窗中一個視頻會議參與者的輪廓，或者將該參與者的臉部圖像的輪廓從視頻會議視窗拖動到諸如 Microsoft Outlook 之類的電子郵件客戶端上時，系統(tǒng)針對該參與者打開新的電子郵件消息創(chuàng)作，并自動填入所選出的參與者的電子郵件地址。
在另一實施例中，當(dāng)用戶將所勾勒出的視頻會議參與者的臉部圖像拖動到在用戶的PC桌面上運行的諸如MeetingMakerTM之類的日程安排應(yīng)用上時，會議系統(tǒng)可以在用戶和所選出的參與者之間安排新的會晤。在該實施例的略微變體中，當(dāng)用戶點擊會議會話參與者的臉部圖像或者將該參與者的輪廓從視頻會議視窗拖動到其會議日程安排應(yīng)用中的經(jīng)安排的會議上時，系統(tǒng)可以生成并向該參與者發(fā)出加入另一個現(xiàn)有會晤的邀請。
在另一實施例中，GUI可以被配置為使得用戶能夠?qū)⑽募?例如包含會議記錄的文檔)拖動到視頻會議視窗中的參與者臉部圖像上以將該文件發(fā)送(例如，電子郵件)給該參與者。
圖4示出用于視頻會議系統(tǒng)的示例性操作方法。當(dāng)視頻會議參與者從端點設(shè)備撥號進(jìn)入(dial into)會議會話時，過程開始(步驟41)。緊接在加入會話之后，系統(tǒng)自動捕捉到參與者的臉部圖像(步驟42)，然后訪問姓名地址錄數(shù)據(jù)庫以嘗試將那個人的臉部與經(jīng)存儲的圖像進(jìn)行匹配(步驟43)。一旦系統(tǒng)匹配了或識別出會議中個人的臉部圖像，那個人的身份信息就被附加到與該圖像相關(guān)聯(lián)的對象，從而避免了當(dāng)用戶后來點擊或者以其它方式選擇那個人的圖像時對數(shù)據(jù)庫査詢的需要。如果匹配成功，那么可以可選地對參與者身份進(jìn)行確認(rèn)(步驟45)。確認(rèn)過程可簡單地涉及向參與者發(fā)送的IVR詢問(例如，"你是視頻技術(shù)組的James Smith 么？")。
如果未找到對所捕捉到的臉部圖像的匹配，那么系統(tǒng)可以向參與者發(fā) 送查詢以向其本人請求其身份(塊46)。某些會議系統(tǒng)可以配置有認(rèn)證/ 識別程序以確保僅經(jīng)授權(quán)的個人被允許參與特定的會議會話。在這種情況
12下，系統(tǒng)可以使用參與者的姓名、證件號(badge number)或其他的唯一標(biāo)識符(例如，指紋)來從公司的姓名地址錄數(shù)據(jù)庫中找出關(guān)于該個人的更多信息。作為嘗試將該參與者的臉部圖像與經(jīng)存儲的或存檔的臉部圖像進(jìn)行匹配的替代，系統(tǒng)可以從所捕捉到的臉部圖像創(chuàng)建可點擊的對象，實質(zhì)上是將臉部圖像轉(zhuǎn)換為用戶可選擇對象以用于在會議會話期間基于用戶界面的關(guān)聯(lián)的目的。此外，系統(tǒng)可以通過將最近捕捉到的圖像添加到與該參與者相關(guān)聯(lián)的數(shù)據(jù)庫條目來更新數(shù)據(jù)庫。
繼續(xù)圖4的示例，如果參與者對他自己進(jìn)行了標(biāo)識并且系統(tǒng)確定該個人尚未存在于公司數(shù)據(jù)庫中(塊47)，那么新的數(shù)據(jù)庫條目可以被添加到姓名地址錄中以包括該參與者的圖像和任何可用的識別或聯(lián)系信息(塊 49)。例如，客戶、出售商或承包商(contractor)可能被邀請參與會議會話。為了輔助交互，每個這樣的參與者可以被請求/詢問以提供將與其圖像一起存儲的某些基本信息。在一個人(例如，承包商)已預(yù)先向機(jī)構(gòu)提供了關(guān)于他自己的信息(例如，姓名、街道地址、公司歸屬、電子郵件地址、電話號碼等)，但是這個人從未出席過該機(jī)構(gòu)的視頻會議的情況下，他的所捕捉到的臉部圖像可以被添加到輸入到公司數(shù)據(jù)庫的他的其他信息中。類似地，在參與者的所捕捉到的圖像與存儲在該個人的數(shù)據(jù)庫條目中的臉部圖像不匹配的情況下，姓名地址錄數(shù)據(jù)庫可以通過用新捕捉到的臉部圖像替代舊圖像而被更新(塊4S)。
應(yīng)理解，圖4的示例也可應(yīng)用于從單個端點設(shè)備撥號進(jìn)入會議會話的群組。不是捕捉單個參與者的臉部圖像并將其與姓名地址錄的經(jīng)存儲圖像進(jìn)行比較，而是，系統(tǒng)將對該群組中的每個參與者執(zhí)行相同的操作。換言之，在圖4中列出的每個步驟將被自動地應(yīng)用于出席該會議的每個個體。
在另一實施例中，視頻會議系統(tǒng)響應(yīng)于GUI的用戶點擊會議會話的參與者圖像而查詢數(shù)據(jù)庫。也就是，直到用戶選擇了特定參與者，系統(tǒng)才嘗試將在視頻饋送(video feed)中捕捉到的會議參與者的臉部圖像與存儲在公司數(shù)據(jù)庫中的圖像進(jìn)行匹配。在某些實現(xiàn)方式中，這可能涉及用戶必須在參與者臉部周圍繪制邊界或者使用套索工具將參與者臉部框住，從而使系統(tǒng)針對該臉部來創(chuàng)建對象，然后向數(shù)據(jù)庫發(fā)起査詢以嘗試將該臉部圖像與已知個人進(jìn)行匹配。為了區(qū)分該實施例，描述的前一實施例主動地進(jìn)行操作以在開始時對視頻會議會話中的每個人進(jìn)行識別，而該后一實施例對用戶選擇/請求反應(yīng)性地進(jìn)行操作，該用戶選擇/請求針對標(biāo)識特定參與者且與該特定參與者相關(guān)聯(lián)的信息。
圖5示出了根據(jù)描述的后一實施例用于獲得關(guān)于所選出的會議參與者的身份信息的示例性方法。視頻會議開始(塊51)后，會議系統(tǒng)不嘗試識別會晤的參與者，直到用戶勾勒出特定參與者的臉部(例如，通過使用
GUI來點擊人的臉部、用套索捕捉他們的臉部、在他們的臉部周圍繪制邊界或者使用其他類似的技術(shù)/方法)為止(塊52)。此時，系統(tǒng)向數(shù)據(jù)庫發(fā)送査詢，該査詢嘗試將在視頻饋送中捕捉到的臉部圖像與存儲在姓名地址錄數(shù)據(jù)庫中的圖像進(jìn)行匹配。如果匹配成功(塊56)，那么為用戶提供關(guān)于所選出的參與者的詳細(xì)信息(塊56)?？梢砸愿鞣N方式來呈現(xiàn)該信息；例如，如圖3所示。另一方面，如果數(shù)據(jù)庫査詢不成功，即沒有找到匹配，那么可以將失敗的結(jié)果通知用戶(塊55)。
取代向用戶呈現(xiàn)關(guān)于所選出的參與者的詳細(xì)信息，系統(tǒng)可以替代地向用戶呈現(xiàn)可用于與參與者進(jìn)行交互的不同通信模式的列表。例如，GUI可以打開一個視窗，該視窗為用戶呈現(xiàn)經(jīng)由IM、電子郵件、電話連接等來進(jìn)行交互的選項。通過使用鼠標(biāo)或其他的輸入設(shè)備，用戶然后可以點擊可用通信模式之一。作為響應(yīng)，系統(tǒng)經(jīng)由所選出的模式與會議參與者建立通信。例如，如果用戶從所呈現(xiàn)的列表中選擇了 IM，那么系統(tǒng)經(jīng)由適當(dāng)?shù)?通信信道、鏈接或連接在會議參與者和用戶之間建立IM會話。
應(yīng)理解，本發(fā)明的要素也可以作為計算機(jī)程序產(chǎn)品被提供，該計算機(jī) 程序產(chǎn)品可以包括其上存儲了指令的機(jī)器可讀介質(zhì)，這些指令可用于給計算機(jī)(例如，處理器或其他的電子設(shè)備)編制程序以執(zhí)行操作序列?？商?代地，可以由硬件和軟件的組合來執(zhí)行操作。機(jī)器可讀介質(zhì)可包括(但不局限于)軟盤、光盤、CD-ROM、磁光盤、ROM、 RAM、 EPROM、 EEPROM、磁卡或光學(xué)卡、傳播介質(zhì)或適用于存儲電指令的其他類型介質(zhì)/ 機(jī)器可讀介質(zhì)。例如，本發(fā)明的要素可以作為計算機(jī)程序產(chǎn)品被下載，其中，程序可以經(jīng)由通信鏈路(例如，調(diào)制解調(diào)器或網(wǎng)絡(luò)連接)作為載波或其他傳播媒介中所包含的數(shù)據(jù)信號從遠(yuǎn)程計算機(jī)或電話設(shè)備被傳輸?shù)秸埱?進(jìn)程。
此外，雖然已經(jīng)結(jié)合具體實施例描述了本發(fā)明，但是許多修改和變更也落入本發(fā)明的范圍之內(nèi)。因此，應(yīng)將說明書和附圖視為說明性的而非限制性的。
權(quán)利要求
1. 一種方法，包括從視頻會議會話的視頻流中捕捉所述視頻會議會話的參與者的臉部圖像；訪問包含多個經(jīng)存儲的臉部圖像的數(shù)據(jù)庫，每個經(jīng)存儲的臉部圖像與和個人有關(guān)的信息相關(guān)聯(lián)；將所述臉部圖像與所述經(jīng)存儲的臉部圖像中的一個匹配，并且取出與所述經(jīng)存儲的臉部圖像中的所述一個相關(guān)聯(lián)的信息。
2. 如權(quán)利要求1所述的方法，還包括創(chuàng)建所述視頻會議會話的所述參與者的臉部圖像作為用戶界面可選對象。
3. 如權(quán)利要求1所述的方法，其中，響應(yīng)于從用戶界面接收到的輸入來執(zhí)行所述捕捉。
4. 如權(quán)利要求1所述的方法，還包括對所述數(shù)據(jù)庫進(jìn)行更新以包括所捕捉到的臉部圖像。
5. 如權(quán)利要求3所述的方法，還包括在運行所述用戶界面的端點設(shè)備和與所述經(jīng)存儲的臉部圖像中的所述一個相關(guān)聯(lián)的個人之間建立通信。
6. 如權(quán)利要求1所述的方法，其中，響應(yīng)于所述參與者加入所述視頻會議會話而執(zhí)行所述捕捉。
7. —種方法，包括接收從視頻會議會話的視頻饋送中識別參與者的臉部圖像的輸入；創(chuàng)建所述臉部圖像的可選對象；響應(yīng)于所述視頻饋送期間對所述可選對象的輸入選擇，發(fā)起數(shù)據(jù)庫査詢以嘗試將所述臉部圖像與多個經(jīng)存儲臉部圖像中的一個匹配，每個經(jīng)存儲的臉部圖像與和個人有關(guān)的信息相關(guān)聯(lián)；并且如果具體的經(jīng)存儲臉部圖像與所述臉部圖像相匹配，則取出與所述具體的經(jīng)存儲臉部圖像相關(guān)聯(lián)的信息。
8. 如權(quán)利要求7所述的方法，其中，與所述具體的經(jīng)存儲臉部圖像相關(guān)聯(lián)的個人是從單個端點設(shè)備出席所述視頻會議會話的一組人中的一個。
9. 如權(quán)利要求7所述的方法，還包括捕捉所述視頻會議會話的參與者的臉部圖像。
10. 如權(quán)利要求7所述的方法，其中，所述輸入選擇是通過用戶界面生成的。
11. 如權(quán)利要求IO所述的方法，還包括在運行所述用戶界面的端點設(shè)備和與所述經(jīng)存儲臉部圖像中的所述一個相關(guān)聯(lián)的個人之間建立通信。
12. 如權(quán)利要求11所述的方法，其中，所述通信包括從運行所述用戶界面的所述端點設(shè)備被發(fā)送到與所述經(jīng)存儲臉部圖像中的所述一個相關(guān)聯(lián)的個人的端點設(shè)備的即時消息。
13. 如權(quán)利要求7所述的方法，其中，所述信息包括到所述個人的通信設(shè)備的臨時映射。
14. 一種裝置，包括顯示器；以及程序，所述程序在個人計算機(jī)(PC)上運行以在所述顯示器上產(chǎn)生圖形用戶界面(GUI)，所述GUI為所述PC的用戶提供從視頻會議會話的視頻饋送中選擇參與者的臉部圖像的能力，在所述視頻饋送期間由所述用戶作出的對所述臉部圖像的選擇致使所述PC向主辦所述視頻會議會話的服務(wù)器發(fā)送輸出，響應(yīng)于接收到所述輸出，所述服務(wù)器訪問數(shù)據(jù)庫以嘗試將所述臉部圖像與多個經(jīng)存儲臉部圖像之一匹配，每個經(jīng)存儲臉部圖像與和個人有關(guān)的信息相關(guān)聯(lián)，如果具體的經(jīng)存儲臉部圖像與所述臉部圖像相匹配，則所述服務(wù)器向所述PC發(fā)送與所述具體的經(jīng)存儲臉部圖像相關(guān)聯(lián)的個人的信息，所述程序可操作用于在所述顯示器上顯示所述信息。
15. 如權(quán)利要求14所述的裝置，其中，所述用戶界面還為所述用戶提供這樣的能力響應(yīng)于對輸入光標(biāo)設(shè)備上按鈕的點擊，請求所述服務(wù)器在所述用戶和與所述具體的經(jīng)存儲臉部圖像相關(guān)聯(lián)的個人之間建立通信。
16. 如權(quán)利要求15所述的裝置，其中，當(dāng)可通過所述輸入光標(biāo)設(shè)備來定位的光標(biāo)被定位在所述臉部圖像上時發(fā)生所述點擊。
17. 如權(quán)利要求15所述的裝置，其中，所述通信包括即時消息會話。
18. 如權(quán)利要求15所述的裝置，其中，所述通信包括電子郵件消息。
19. 如權(quán)利要求15所述的裝置，其中，所述通信包括電話呼叫。
20. —種被編碼在一個或多個介質(zhì)中用于執(zhí)行的邏輯，當(dāng)被執(zhí)行時所述邏輯可操作用于在視頻會議會話期間，捕捉所述視頻會議會話的參與者的臉部圖像；訪問包含多個經(jīng)存儲的臉部圖像的數(shù)據(jù)庫，每個經(jīng)存儲的臉部圖像與和個人有關(guān)的信息相關(guān)聯(lián)，將所述臉部圖像與所述經(jīng)存儲的臉部圖像中的一個匹配；取出與所述經(jīng)存儲的臉部圖像中的所述一個相關(guān)聯(lián)的個人的信息；并且響應(yīng)于從連接到所述視頻會議會話的端點設(shè)備接收到的輸入，向所述端點設(shè)備發(fā)送所述信息。
21. 如權(quán)利要求20所述的邏輯，其中，所述輸入包括對所述參與者的臉部圖像的用戶界面選擇。
22. 如權(quán)利要求20所述的邏輯，其中，所述介質(zhì)當(dāng)被執(zhí)行時還可操作用于在所述端點設(shè)備的用戶和與所述經(jīng)存儲的臉部圖像中的所述一個相關(guān) 聯(lián)的個人之間建立通信。
23. 如權(quán)利要求22所述的邏輯，其中，響應(yīng)于對所述用戶界面所關(guān)聯(lián) 的輸入光標(biāo)設(shè)備上按鈕的點擊，所述通信被建立。
24. 如權(quán)利要求20所述的邏輯，其中，所述信息包括身份信息。
25. 如權(quán)利要求22所述的方法，其中，所述通信包括從所述用戶的端點設(shè)備和與所述經(jīng)存儲的臉部圖像中的所述一個相關(guān)聯(lián)的個人發(fā)送的即時消息。
26. —種裝置，包括顯示器；以及用于在所述顯示器上產(chǎn)生圖形用戶界面(GUI)的部件，所述GUI為 PC的用戶提供從視頻會議會話的視頻饋送中選擇參與者的臉部圖像的能力，在所述視頻饋送期間由所述用戶作出的對所述臉部圖像的選擇致使所述PC向主辦所述視頻會議會話的服務(wù)器發(fā)送輸出，響應(yīng)于接收到所述輸出，所述服務(wù)器訪問數(shù)據(jù)庫以嘗試將所述臉部圖像與多個經(jīng)存儲臉部圖像之一匹配，每個經(jīng)存儲臉部圖像與和個人有關(guān)的聯(lián)系信息相關(guān)聯(lián)，如果具體的經(jīng)存儲臉部圖像與所述臉部圖像相匹配，則所述服務(wù)器向所述PC發(fā) 送匿名鏈接，所述部件用于在所述顯示器上顯示所述匿名鏈接，所述部件還用于響應(yīng)于對所述匿名鏈接的選擇輸入而使用所述聯(lián)系信息發(fā)起與所述個人的通信。
27.—種系統(tǒng)，包括一個或多個處理器；以及存儲器，其包括一個或多個可在處理器上執(zhí)行的指令，所述處理器在執(zhí)行所述指令時可操作用于-列出多個可用于與會議參與者進(jìn)行交互的通信模式，該列表響應(yīng) 于來自用戶界面的、從視頻會議會話的視頻饋送中選擇所述會議參與者的臉部圖像的第一輸入而被生成；并且響應(yīng)于來自所述用戶界面的、選擇所述多個通信模式之一的第二輸入，在所述用戶和所述會議參與者之間建立通信。
全文摘要
在一個實施例中，一種方法包括從視頻會議會話(圖1，10)的視頻流中捕捉視頻會議會話的參與者的臉部圖像(圖3，32)。然后訪問包含多個經(jīng)存儲臉部圖像的數(shù)據(jù)庫(圖1，23)以嘗試將該臉部圖像與經(jīng)存儲臉部圖像之一進(jìn)行匹配。每個經(jīng)存儲臉部圖像與數(shù)據(jù)庫中個人所關(guān)聯(lián)的信息相關(guān)聯(lián)，如果匹配那么該信息被取回。要強(qiáng)調(diào)的是此摘要是被提供用于符合需要摘要的規(guī)定，摘要將使得搜索者或其他讀者能夠快速地確定本技術(shù)公開的主題。
文檔編號H04M3/42GK101502088SQ200780030080
公開日2009年8月5日申請日期2007年8月7日優(yōu)先權(quán)日2006年10月11日
發(fā)明者拉比士·帕特爾, 沐酷勒·珍, 約瑟夫·F·廓里申請人:思科技術(shù)公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：拉比士.帕特爾;沐酷勒.珍;約瑟夫.F.廓里
技術(shù)所有人：思科技術(shù)公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于對會議參與者的臉部識別的交互的制作方法