[0087] 則視差為:Disparity = Xleft_XHght。由此可計算出點P在相機坐標系下的三維坐 標為:
[0088]
[0089] 因此,左相機像面(即所述的左圖像平面)上的任意一點只要能在右相機像面 (即所述的右圖像平面)上找到對應的匹配點,就可以確定出該點的三維坐標。
[0090] 圖像校正
[0091] 要計算目標點在左右兩個視圖上形成的視差,需要在二維空間上匹配對應點。為 了減少匹配搜索范圍,我們利用極線約束使得對應點的匹配由二維搜索降為一維搜索。圖 像校正的作用就是把兩幅圖像嚴格地進行對應,使得兩幅圖像的對極線在同一水平線上, 一幅圖像上任意一點與其在另一幅圖像中同一行的某個點對應,只需在該行進行一維搜索 即可匹配到對應點。本發(fā)明采用外極線約束將搜索范圍可以限制在外極線上的一個很小區(qū) 間內(nèi),提高搜索速度,同時減少假匹配點的數(shù)量。
[0092] 立體匹配
[0093] 立體匹配從圖對中的一幅圖像中選擇一種圖像特征(如圖像灰度),在另一幅 圖像中確定出同一物理結構的對應圖像特征,從而獲取這兩個特征之間的相對位置,計 算出視差,進而可根據(jù)式(2)計算三維坐標。根據(jù)約束方式的不同,已有立體匹配算法 大致分為三類:一類為局部(Local)匹配算法,包括基于區(qū)域的立體匹配算法(block matching,BM)、基于特征的立體匹配算法;另一類為全局(Global)最優(yōu)算法,該算法將匹 配過程看為尋找能量方程最小值的過程,包括基于動態(tài)規(guī)劃算法、圖割法(graphcuts)、置 信度傳播算法(beliefpropagation)等,最后還有一類是介于局部與全局之間的半全局算 法(Semi-global)。本設計采用BM局部匹配算法,同時對校正后的圖像進行金字塔多分辨 率分解,進一步降低計算復雜度,提高實時性。本設計采用下式作為匹配測度。
[0094]
[0095] 其中:dmin和d_是最小和最大視差,m是模板尺寸,IHght和I1(^是右邊和左邊的 圖像。
[0096] 讀寫場景中人頭面部的三維坐標定位
[0097] 如圖2所示,讀寫人頭面部的三維定位有兩類方法。1)可從原始圖像中檢測人臉, 獲取頭面部的二維坐標,然后基于深度圖像,找到對應的z坐標后,從而將頭面部映射到三 維空間。2)直接在三維空間中,基于3DAAM等人臉模型定位人臉。
[0098] 本發(fā)明為了提高實時性,對第一類方法進行改進。在adaboost分類之前,采用膚 色模型檢測備選人臉區(qū)域,縮小adaboost的檢測范圍,流程圖如圖2所示。
[0099] 讀寫場景中讀寫元素(書或桌面)的三維坐標定位
[0100] 如圖3所示,讀寫場景中,讀寫元素(書本或桌面)的顏色、形狀、擺放具有很多不 確定性。直接利用模式識別方法識別書本或桌面,其魯棒性不能保證。本發(fā)明針對讀寫場 景的特殊性,提出一種可靠的檢測算法:
[0101] 1)定義人臉下方的某一個封閉三維空間Q為讀寫元素(書或桌面)的待檢測區(qū) 域,定義上下方向為Z方向。
[0102] 2)在z方向上,以deltaZ為間隔,將空間Q等分為η個大小相同位置不同的三維 子空間{Ql,Q2,…Qn}。
[0103] 3)基于原始圖像和深度圖像,求取三維子空間{Q1,Q2,…Qn}的點云密度。
[0104] 4)從上向下的方向(z減少)掃描上述子空間,當所述子空間的點云密度達到目標 讀寫元素的設定閾值時,則判定當前子空間的中心位置為該目標讀寫元素的位置。
[0105] 魯棒性注釋:
[0106] 魯棒是Robust的音譯,也就是健壯和強壯的意思。它是在異常和危險情況下系統(tǒng) 生存的關鍵。比如說,計算機軟件在輸入錯誤、磁盤故障、網(wǎng)絡過載或有意攻擊情況下,能否 不死機、不崩潰,就是該軟件的魯棒性。所謂"魯棒性",是指控制系統(tǒng)在一定(結構,大?。?的參數(shù)攝動下,維持其它某些性能的特性。
【主權項】
1. 一種讀寫場景中讀寫元素三維坐標的智能認定方法,其特征在于:采用至少一個與 中央處理器連接的二維圖像傳感器,以不同位置或視角獲取至少二幅該讀寫場景中包括讀 寫人貌姿、讀寫的書本和/或依托該書本的桌面為讀寫元素在內(nèi)的原始圖像,所述中央處 理器基于該圖像傳感器標定參數(shù),采用立體匹配方法獲得與至少一幅原始圖像對應的深度 圖像并獲知所述讀寫元素中任一目標讀寫元素的三維坐標。2. 根據(jù)權利要求1所述的方法,其特征在于:所述目標讀寫元素的三維坐標按以下步 驟獲?。?1) 通過設定空間原點及邊界定義三維掃描體,該掃描體為在Z方向上具有設定厚度的 矩形體; 2) 在Z方向上,將掃描體等間隔劃分為大小相同位置不同的子掃描體; 3) 基于所述原始圖像和深度圖像,求取所有子掃描體的點云密度; 4) 沿Z軸方向掃描所述子掃描體,當掃描到的某個子掃描體的點云密度達到目標讀寫 元素的設定閾值時,則判定當前子掃描體的中心位置為該目標讀寫元素的空間位置。3. 根據(jù)權利要求2所述的方法,其特征在于:所述空間原點為讀寫人面部輪廓中的嘴 角標志點,所述目標讀寫元素為書本,在該空間原點以下Ocm- 80cm內(nèi),采用所述掃描體逐 層掃描認定該書本的三維坐標。4. 根據(jù)權利要求3所述的方法,其特征在于:采用haar特征和adaboost分類器模式 的識別方法在原始圖像中識別目標并基于深度圖像獲取所述空間原點的三維坐標。5. 根據(jù)權利要求1一4中任一項所述的方法,其特征在于:所述圖像傳感器為一個黑 白或彩色圖像傳感器,采用該圖像傳感器獲取所述深度圖像的步驟如下: 1) 設定該圖像傳感器的幾何位置或焦距,根據(jù)確定的標定物標定圖像傳感器的相機參 數(shù); 2) 對包含所述目標讀寫元素所在的場景進行成像,獲取第一幅原始圖像并保存; 3) 改變傳感器的幾何位置或焦距,對包含所述目標讀寫元素所在的場景再次進行成 像,獲取與第一幅原始圖像成極幾何約束關系的第二幅原始圖像并保存; 4) 采用局部、半全局或全局的立體匹配方法獲取視差圖并轉(zhuǎn)換為所述的深度圖像。6. 根據(jù)權利要求1一4中任一項所述的方法,其特征在于:所述圖像傳感器為二個黑 白或彩色圖像傳感器,采用該圖像傳感器獲取所述深度圖像的步驟如下: 1) 將二個圖像傳感器以左右方位分布,根據(jù)確定的標定物標定圖像傳感器的相機參 數(shù); 2) 使用二個圖像傳感器分別對包含目標讀寫元素所在的場景進行成像,獲取左向圖像 和右向圖像并保存,所述左向圖像與右向圖像成極幾何約束關系; 3) 采用局部、半全局或全局的立體匹配方法獲取視差圖并轉(zhuǎn)換為深度圖像。7. 根據(jù)權利要求6所述的方法,其特征在于:所述獲取視差圖并轉(zhuǎn)換為深度圖像采用 的是blockmatching的局部立體匹配方法。8. -種自動測量讀寫距離的方法,包括中央處理器,其特征在于:應用權利要求1 一 7中任一項所述的方法,認定讀寫場景中包括以讀寫人貌姿、讀寫的書本和/或依托該書 本的桌面為讀寫元素的三維坐標,分別確定讀寫人雙眼和置于讀寫狀態(tài)下的書本的三維坐 標,由所述中央處理器動態(tài)跟蹤并自動讀出讀寫人雙眼到所述書本的直線距離。9. 一種自動測量讀寫姿態(tài)的方法,包括中央處理器,其特征在于:應用權利要求1 - 7 中任一項所述的方法,認定讀寫場景中包括以讀寫人貌姿、讀寫的書本和/或依托該書本 的桌面為讀寫元素的三維坐標,設定讀寫人處于標準讀寫狀態(tài)時對應的標準身姿的三維坐 標,由該中央處理器動態(tài)跟蹤并獲取讀寫人動態(tài)讀寫姿勢時對應的動態(tài)身姿的三維坐標, 計算讀寫人動態(tài)身姿與標準身姿的三維坐標偏差值并輸出。10. -種自動測量讀寫姿態(tài)持續(xù)時間的方法,包括中央處理器,其特征在于:應用權利 要求1 一 7中任一項所述的方法,認定讀寫場景中包括以讀寫人貌姿、讀寫的書本和/或依 托該書本的桌面為讀寫元素的三維坐標,設定讀寫人相對于該讀寫元素處于標準讀寫狀態(tài) 時對應的標準身姿的三維坐標,由中央處理器動態(tài)跟蹤并獲取讀寫人處于該標準身姿下的 連續(xù)累積時間并輸出。
【專利摘要】一種能應用于全智能化預防近視裝置中的對青少年讀寫場景中讀寫元素三維坐標的智能認定方法及其應用,采用該方法的智能裝置能夠在讀寫場景中與青少年身體無任何接觸的狀態(tài)下,自動、準確判斷青少年讀寫姿勢的正確與否。其采用二維圖像傳感器獲取至少二幅讀寫場景的原始圖像,再采用立體匹配方法獲得與原始圖像對應的深度圖像并獲知目標讀寫元素的三維坐標。本發(fā)明通過合理設置圖像信息采集的頻度,通過中央處理器的計算可以精確獲知該讀寫場景中任意二個讀寫元素之間靜態(tài)或動態(tài)情況下的距離以及某一讀寫元素處于一種狀態(tài)維持的時間長短和判斷某一讀寫元素所處狀態(tài)是否正常。
【IPC分類】G06K9/46, G06K9/00
【公開號】CN105335699
【申請?zhí)枴緾N201510641377
【發(fā)明人】李喬亮
【申請人】李喬亮
【公開日】2016年2月17日
【申請日】2015年9月30日