專利名稱:一種基于分層矢量化的圖像信息表達體系的制作方法
技術領域:
本發(fā)明型涉及圖像信息表達領域,具體是能夠用于圖像識別任務的一種基于分層 矢量化的圖像信息表達體系。
背景技術:
圖像信息表達是圖像識別的核心步驟。目前,最著名的圖像信息表達方式是采用 基于直方圖的表達方式。這種方式首先量化圖像小模塊并將其分配到對應的直方圖筒上。 然而,這種圖像信息表達方式具有一些內在的缺陷,例如首先,直方圖表達方式帶來很大 的量化誤差;其次,直方圖方式沒有考慮圖像模塊之間的空間布局信息。這些問題阻礙了它 的信息表達能力,影響了圖像識別的效果。
發(fā)明內容
本發(fā)明的目的在于提供一種基于分層矢量化的圖像信息表達體系,它結合了外觀 特征和空間布局,在物理空間、特征空間和超級矢量空間采用分層遞進的方式進行信息的 提取和分析,大大減少了量化誤差,提高了圖像信息表達能力和識別效果。本發(fā)明為實現上述目的,通過以下技術手段實現一種基于分層矢量化的圖像信 息表達體系,包括以下步驟(1)、局部信息提取,該步驟包括首先將圖像分割為多個矩形塊,所述多個矩形塊 之間有重疊,然后在每個矩形塊上,提取圖像的局部特征信息,每個矩形塊上的局部特征信 息構成一個特征矢量;(2)、外觀特征分布描述,該步驟包括首先將來自所有圖像的所有矩形塊的特征 矢量合在一起,采用最大期望算法訓練出一個全局的高斯混合模型,然后對于每張圖像,利 用屬于這張圖的所有特征矢量,采用最大后驗概率算法對于全局的高斯混合模型進行自適 應,獲得屬于這張圖像自己的高斯混合模型,通過上述步驟,對每張圖,都獲得了一個高斯 混合模型用于精細描述它的特征矢量的分布情況;(3)空間布局信息描述,該步驟包括利用在步驟(2)中獲得的高斯混合模型對空 間布局信息進行分析和整合,首先將每個特征矢量根據其在全局高斯混合模型的每個高斯 分布上的后驗概率的大小將其分配到對應的高斯分布上。然后通過計算分配到每個高斯分 布的特征的統(tǒng)計信息,得到這個高斯分布對應形狀在空間中的布局情況,綜合所有高斯分 布的空間布局,獲得整個圖像的空間布局信息描述。(4)、監(jiān)督學習算法提取子空間,該步驟包括將通過步驟(2)和步驟(3)獲得的圖 像的外觀特征分布描述和空間布局信息描述分別整理為一個維數很高的超級矢量,在超級 矢量空間中分析和調整不同特征組合的重要系數,利用實際應用的標注信息,計算屬于同 一種類的超級矢量的方差矩陣,并且進行方差矩陣的特征分析,拋棄超級矢量中差別較大 的特征方向,保留超級矢量中差別較小的特征方向,然后獲得每張圖像針對特定應用的超 級矢量,成為最終的圖像信息描述。
所述步驟(2)中使用包含100到2000個高斯分布的高斯混合模型。所述步驟(1)中所述局部特征信息,包括圖像灰度值信息、灰度梯度信息、梯度直 方圖信息、顏色信息和紋理信息。本發(fā)明的有益效果在于能夠解決公知技術中存在的不足,綜合高效考慮圖像的 外觀特征和空間布局信息,實現圖像信息的精確有效整合,從而進一步在各種圖像識別應 用(比如人臉識別,車牌識別,圖像檢索)中取得突出的效果。本發(fā)明在物理空間、特征空 間和超級矢量空間采用分層遞進的方式進行信息的提取和分析,減少了量化誤差,提高了 圖像信息表達能力和識別效果等。
附圖1是本發(fā)明的流程圖。
具體實施例方式下面結合具體實施例,進一步闡述本發(fā)明。應理解,這些實施例僅用于說明本發(fā)明 而不用于限制本發(fā)明的范圍。此外應理解,在閱讀了本發(fā)明講授的內容之后,本領域技術人 員可以對本發(fā)明作各種改動或修改,這些等價形式同樣落于本申請所附權利要求書所限定 的范圍。本發(fā)明所述一種基于分層矢量化的圖像信息表達體系,主體結構包括以下步驟(1)、局部信息提取,該步驟包括首先將圖像自動快速的分割為多個矩形塊,所述 多個矩形塊之間有重疊,該重疊可以保證信息全部被覆蓋,不會出現遺漏,減少量化誤差。 然后在每個矩形塊上,提取圖像的局部特征信息,所述局部特征信息,包括圖像灰度值信 息、灰度梯度信息、梯度直方圖信息、顏色信息和紋理信息,每個矩形塊上的局部特征信息 構成一個特征矢量,所述特征矢量的維數一般不超過200維。(2)、外觀特征分布描述,本步驟利用多層次遞進的方式,采用高斯混合模型對已 在步驟(1)中提取的大量局部特征矢量分布進行精細描述。該步驟具體包括首先將來自 所有圖像的所有矩形塊的特征矢量合在一起,采用最大期望算法訓練出一個全局的高斯混 合模型,然后對于每張圖像,利用屬于這張圖的所有特征矢量,采用最大后驗概率算法對于 全局的高斯混合模型進行自適應,獲得屬于這張圖像自己的高斯混合模型,從而對每張圖, 都獲得了一個高斯混合模型,該模型能夠用于精細描述它的特征矢量的分布情況。(3)空間布局信息描述,在本發(fā)明中,圖片中不同矩形塊的空間布局是重要的。一 旦空間布局出現混亂,就不能呈現完整、準確的圖像,因此在利用在步驟(2)中獲得的高斯 混合模型對空間布局信息進行分析和整合中,高斯混合模型中的每個高斯分布就隱式的對 應了特征中的某種形狀。因此,可以通過分析各個高斯分布在空間中的位置信息,最終獲得 實際圖像的空間布局信息。根據上述解釋,步驟(3)在利用在步驟(2)中獲得的高斯混合 模型對空間布局信息進行分析和整合時,首先將每個特征矢量根據其在全局高斯混合模型 每個高斯分布上的后驗概率的大小,將其分配到對應的高斯分布上。然后通過計算分配到 每個高斯分布的特征的統(tǒng)計信息(例如密度,平均值和方差),得到這個高斯分布對應形狀 在空間中的布局情況,綜合所有高斯分布的空間布局,獲得整個圖像的空間布局信息描述。(4)、監(jiān)督學習算法提取子空間,該步驟包括將通過步驟(2)和步驟(3),獲得的圖像的外觀特征分布描述和空間布局信息描述分別整理為一個維數很高的超級矢量,在本 步驟中,本體系對實際應用中不同信息的重要性進行分析判斷,決定哪些信息應該舍棄,哪 些應該保留。對于不同的實際應用,需要關注的特征是不一樣的。例如同樣一張人臉,當 應用為判斷性別時,主要關注頭發(fā)的長短,眼睛、鼻子的形狀等;當應用為分析年齡時,主要 關注皮膚的光滑與否,是不是有很多皺紋等等。因此,在超級矢量空間中分析和調整不同特 征組合的重要系數,利用實際應用的標注信息,計算屬于同一種類的超級矢量的方差矩陣, 并且進行方差矩陣的特征分析,拋棄超級矢量中差別較大的特征方向,保留超級矢量中差 別較小的特征方向,從而就獲得每張圖像針對特定應用的超級矢量,成為最終的圖像信息 描述。 在步驟(2)中,為了實現精確的描述,根據圖像的大小,內容的復雜程度,優(yōu)選使 用包含100到2000個高斯分布的高斯混合模型。
權利要求
一種基于分層矢量化的圖像信息表達體系,其特征在于包括以下步驟(1)、局部信息提取,該步驟包括首先將圖像分割為多個矩形塊,所述多個矩形塊之間有重疊,然后在每個矩形塊上,提取圖像的局部特征信息,每個矩形塊上的局部特征信息構成一個特征矢量;(2)、外觀特征分布描述,該步驟包括首先將來自所有圖像的所有矩形塊的特征矢量合在一起,采用最大期望算法訓練出一個全局的高斯混合模型,然后對于每張圖像,利用屬于這張圖的所有特征矢量,采用最大后驗概率算法對于全局的高斯混合模型進行自適應,獲得屬于這張圖像自己的高斯混合模型,通過上述步驟,對每張圖,都獲得了一個高斯混合模型用于精細描述它的特征矢量的分布情況;(3)空間布局信息描述,該步驟包括利用在步驟(2)中獲得的高斯混合模型對空間布局信息進行分析和整合,首先將每個特征矢量根據其在全局高斯混合模型的每個高斯分布上的后驗概率的大小將其分配到對應的高斯分布上。然后通過計算分配到每個高斯分布的特征的統(tǒng)計信息,得到這個高斯分布對應形狀在空間中的布局情況,綜合所有高斯分布的空間布局,獲得整個圖像的空間布局信息描(4)、監(jiān)督學習算法提取子空間,該步驟包括將通過步驟(2)和步驟(3)獲得的圖像的外觀特征分布描述和空間布局信息描述分別整理為一個維數很高的超級矢量,在超級矢量空間中分析和調整不同特征組合的重要系數,利用實際應用的標注信息,計算屬于同一種類的超級矢量的方差矩陣,并且進行方差矩陣的特征分析,拋棄超級矢量中差別較大的特征方向,保留超級矢量中差別較小的特征方向,然后獲得每張圖像針對特定應用的超級矢量,成為最終的圖像信息描述。FSA00000176266400011.tif
2.根據權利要求1所述一種基于分層矢量化的圖像信息表達體系,其特征在于步驟 (2)中使用包含100到2000個高斯分布的高斯混合模型。
3.根據權利要求1或2所述一種基于分層矢量化的圖像信息表達體系,其特征在于 步驟(1)中所述局部特征信息,包括圖像灰度值信息、灰度梯度信息、梯度直方圖信息、顏 色信息和紋理信息。
全文摘要
本發(fā)明公開了一種基于分層矢量化的圖像信息表達體系,包括以下步驟(1)局部信息提取;(2)外觀特征分布描述;(3)空間布局信息描述;(4)監(jiān)督學習算法提取子空間。本發(fā)明的有益效果在于能夠解決公知技術中存在的不足,綜合高效考慮圖像的外觀特征和空間布局信息,實現圖像信息的精確有效整合,從而進一步在各種圖像識別應用(比如人臉識別,車牌識別,圖像檢索)中取得突出的效果。本發(fā)明在物理空間、特征空間和超級矢量空間采用分層遞進的方式進行信息的提取和分析,減少了量化誤差,提高了圖像信息表達能力和識別效果等。
文檔編號G06K9/46GK101923646SQ20101022016
公開日2010年12月22日 申請日期2010年7月7日 優(yōu)先權日2010年7月7日
發(fā)明者周曦 申請人:周曦