雙目立體視覺技術的實現(xiàn)及其進展論文

時間：2023-05-03 22:19:31 論文范文我要投稿

相關推薦

　　摘要：闡述了雙目立體視覺技術在國內外應用的最新動態(tài)及其優(yōu)越性。指出雙目體視技術的實現(xiàn)分為國像獲取、攝像機標定、特片提取、立體匹配和三維重建幾個步驟，詳細分析了各個步驟的技術特點、存在的問題和解決方案，并對雙目體視技術的發(fā)展做了展望。

雙目立體視覺技術的實現(xiàn)及其進展論文

　　關鍵詞：雙目立體視覺計算機視覺立體匹配攝像機標定特征提取

　　雙目立體視覺是計算機視覺的一個重要分支，即由不同位置的兩臺或者一臺攝像機（CCD）經(jīng)過移動或旋轉拍攝同一幅場景，通過計算空間點在兩幅國像中的視差，獲得該點的三維坐標值。80年代美國麻省理工學院人工智能實驗室的Marr提出了一種視覺計算理論并應用在雙睛匹配上，使兩張有視差的平面圖產(chǎn)生在深度的立體圖形，奠定了雙目立體視覺發(fā)展理論基礎。相比其他類的體視方法，如透鏡板三維成像、投影式三維顯示、全息照相術等，雙目本視直接模擬人類雙眼處理景物的方式，可靠簡便，在許多領域均極具應用價值，如微操作系統(tǒng)的位姿檢測與控制、機器人導航與航測、三維測量學及虛擬現(xiàn)實等。

　　1 雙目體視的技術特點

　　雙目標視技術的實現(xiàn)可分為以下步驟：圖像獲取、攝像機標定、特征提取、圖像匹配和三維重建，下面依次介紹各個步驟的實現(xiàn)方法和技術特點。

　　1.1 圖像獲取

　　雙目體視的圖像獲取是由不同位置的兩臺或者一臺攝像機（CCD）經(jīng)過移動或旋轉拍攝同一幅場景，獲取立體圖像對。其針孔模型如圖1。假定攝像機C1與C2的角距和內部參數(shù)都相等，兩攝像機的光軸互相平行，二維成像平面X1O1Y1和X2O2Y2重合，P1與P2分別是空間點P在C1與C2上的成像點。但一般情況下，針孔模型兩個攝像機的內部參數(shù)不可能完成相同，攝像機安裝時無法看到光軸和成像平面，故實際中難以應用。

　　上海交大在理論上對會攝式雙目體視系統(tǒng)的測量精度與系統(tǒng)結構參數(shù)之間的關系作了詳盡分析，并通過試驗指出，對某一特定點進行三角測量。該點測量誤差與兩CCD光軸夾角是一復雜的函數(shù)關系；若兩攝像頭光軸夾角一定，則被測坐標與攝像頭坐標系之間距離越大，測量得到點距離的誤差就越大。在滿足測量范圍的前提下，應選擇兩CCD之間夾角在50℃～80℃之間。

　　1.2 攝像機的標定

　　對雙目體視而言，CCD攝像機、數(shù)碼相機是利用計算機技術對物理世界進行重建前的基本測量工具，對它們的標定是實現(xiàn)立體視覺基本而又關鍵的一步。通常先采用單攝像機的標定方法，分別得到兩個攝像機的內、外參數(shù)；再通過同一世界坐標中的一組定標點來建立兩個攝像機之間的位置關系。目前常用的單攝像機標定方法主要有：

　�。�1）攝影測量學的傳統(tǒng)設備標定法。利用至少17個參數(shù)描述攝像機與三維物體空間的結束關系，計算量非常大。

　　（2）直接線性變換性。涉及的參數(shù)少、便于計算。

　�。�3）透視變換短陣法。從透視變換的角度來建立攝像機的成像模型，無需初始值，可進行實時計算。

　�。�4）相機標定的兩步法。首先采用透視短陣變換的方法求解線性系統(tǒng)的攝像機參數(shù)，再以求得的參數(shù)為初始值，考慮畸變因素，利用最優(yōu)化方法求得非線性解，標定精度較高。

　�。�5）雙平面標定法。

　　在雙攝像機標定中，需要精確的外部參數(shù)。由于結構配置很難準確，兩個攝像機的距離和視角受到限制，一般都需要至少6個以上（建議取10個以上）的已知世界坐標點，才能得到比較滿意的參數(shù)矩陣，所以實際測量過程不但復雜，而且效果并不一定理想，大大地限制了其應用范圍。此外雙攝像機標定還需考慮鏡頭的非線性校正、測量范圍和精度的問題，目前戶外的應用還有少。

　　上海大學通信與信息工程學院提出了基于神經(jīng)網(wǎng)絡的雙目立體視覺攝像機標定方法。首先對攝像機進行線性標定，然后通過網(wǎng)絡訓練建立起三維空間點位置補償?shù)亩鄬忧梆伾窠?jīng)網(wǎng)絡模型。此方法對雙目立體視覺攝像機的標定具有較好的通用性，但是精確測量控制點的世界坐標和圖像坐標是一項嚴格的工作。因此神經(jīng)網(wǎng)絡中訓練樣本集的獲得非常困難。

　　1.3 特征點提取

　　立體像對中需要撮的特征點應滿足以下要求：與傳感器類型及抽取特征所用技術等相適應；具有足夠的魯棒性和一致性。需要說明的是：在進行特征點像的坐標提取前，需對獲取的圖像進行預處理。因為在圖像獲取過程中，存在一系列的噪聲源，通過此處理可顯著改進圖像質量，使圖像中特征點更加突出。

　　1．4 立體匹配

　　立體匹配是雙目體視中最關系、困難的一步。與普通的圖像配準不同，立體像對之間的差異是由攝像時觀察點的不同引起的，而不是由其它如景物本身的變化、運動所引起的。根據(jù)匹配基元的不同，立體匹配可分為區(qū)域匹配、特征匹配和相位匹配三大類。

　　區(qū)域匹配算法的實質是利用局部窗口之間灰度信息的相關程度，它在變化平緩且細節(jié)豐富的地方可以達到較高的精度。但該算法的匹配窗大小難以選擇，通常借助于窗口形狀技術來改善視差不連續(xù)處的匹配；其次是計算量大、速度慢，采取由粗至精分級匹配策略能大大減少搜索空間的大小，與匹配窗大小無關的互相關運算能顯著提高運算速度。

　　特片匹配不直接依賴于灰度，具有較強的抗干擾性，計算量小，速度快。但也同樣存一些不足：特征在圖像中的稀疏性決定特征匹配只能得到稀疏的視差場；特征的撮和定位過程直接影響匹配結果的精確度。改善辦法是將特征匹配的魯棒性和區(qū)域匹配的致密性充分結合，利用對高頻噪聲不敏感的模型來提取和定位特征。

　　相位匹配是近二十年才發(fā)展起來的一類匹配算法。相位作為匹配基元，本身反映信號的結構信息，對圖像的高頻噪聲有很好的抑制作用，適于并行處理，能獲得亞像素級精度的致密視差。但存在相位奇點和相位卷繞的問題，需加入自適應濾波器解決。

　　1．5 三維重建

　　在得到空間任一點在兩個圖像中的對應坐標和兩攝像機參數(shù)矩陣的條件下，即可進行空間點的重建。通過建立以該點的世界坐標為未知數(shù)的4個線性方程，可以用最小二乘法求解得該點的世界坐標。實際重建通常采用外極線結束法�？臻g瞇、兩攝像機的光心這三點組成的平面分別與兩個成像平面的交線稱為該空間點在這兩個成像平面中的極線。一旦兩攝像機的內外參數(shù)確定，就可通過兩個成像平面上的極線的約束關系建立對應點之間的關系，并由此聯(lián)立方程，求得圖像點的世界坐標值。對圖像的全像素的三維重建目前僅能針對某一具體目標，計算量大且效果不明顯。

　　2 雙目體視的最新應用

　　2．1 國外研究動態(tài)

　　雙目體視目前主要應用于四個領域：機器人導航、微操作系統(tǒng)的參數(shù)檢測、三維測量和虛擬現(xiàn)實。

　　日本大阪大學自適應機械系統(tǒng)研究院研制了一種自適應雙目視覺伺服系統(tǒng)，利用雙目體視的原理，如每幅圖像中相對靜止的三個標志為參考，實時計算目標圖像的雅可比短陣，從而預測出目標下一步運動方向，實現(xiàn)了對動方式未知的目標的自適應跟蹤。該系統(tǒng)僅要求兩幅圖像中都有靜止的參考標志，無需攝像機參數(shù)。而傳統(tǒng)的視覺跟蹤伺服系統(tǒng)需事先知道攝像機的運動、光學等參數(shù)和目標的運動方式。

　　日本奈良科技大學信息科學學院提出了一種基于雙目立體視覺的增強現(xiàn)實系統(tǒng)（AR）注冊方法，通過動態(tài)修正特征點

　　的位置提高注冊精度。該系統(tǒng)將單攝像機注冊（MR）與立體視覺注冊（SR）相結合，利用MR和三個標志點算出特征點在每個圖像上的二維坐標和誤差，利用SR和圖像對計算出特征點的三維位置總誤差，反復修正特征點在圖像對上的二維坐標，直至三維總誤差小于某個閾值。該方法比僅使用MR或SR方法大大提高了AR系統(tǒng)注冊深度和精度。實驗結果如圖2，白板上三角開的三頂點被作為單攝像機標定的特征點，三個三角形上的模型為虛擬場景，烏龜是真實場景，可見基本上難以區(qū)分出虛擬場景（恐龍）和現(xiàn)實場景（烏龜）。

　　日本東京大學將實時雙目立體視覺和機器人整體姿態(tài)信息集成，開發(fā)了仿真機器人動態(tài)行長導航系統(tǒng)。該系統(tǒng)實現(xiàn)分兩個步驟：首先，利用平面分割算法分離所拍攝圖像對中的地面與障礙物，再結合機器人身體姿態(tài)的信息，將圖像從攝像機的二維平面坐標系轉換到描述軀體姿態(tài)的世界坐標系，建立機器人周圍區(qū)域的地圖；基次根據(jù)實時建立的地圖進行障礙物檢測，從而確定機器人的行走方向。

　　日本岡山大學使用立體顯微鏡、兩個CCD攝像頭、微操作器等研制了使用立體顯微鏡控制微操作器的視覺反饋系統(tǒng)，用于對細胞進行操作，對鐘子進行基因注射和微裝配等。

　　麻省理工學院計算機系統(tǒng)提出了一種新的用于智能交通工具的傳感器融合方式，由雷達系統(tǒng)提供目標深度的大致范圍，利用雙目立體視覺提供粗略的目標深度信息，結合改進的圖像分割算法，能夠在高速環(huán)境下對視頻圖像中的目標位置進行分割，而傳統(tǒng)的目標分割算法難以在高速實時環(huán)境中得到令人滿意的結果，系統(tǒng)框圖如圖3。

　　華盛頓大學與微軟公司合作為火星衛(wèi)星“探測者”號研制了寬基線立體視覺系統(tǒng)，使“探測者”號能夠在火星上對其即將跨越的幾千米內的地形進行精確的定位玫導航。系統(tǒng)使用同一個攝像機在“探測者”的不同位置上拍攝圖像對，拍攝間距越大，基線越寬，能觀測到越遠的地貌。系統(tǒng)采用非線性優(yōu)化得到兩次拍攝圖像時攝像機的相對準確的位置，利用魯棒性強的最大似然概率法結合高效的立體搜索進行圖像匹配，得到亞像素精度的視差，并根據(jù)此視差計算圖像對中各點的三維坐標。相比傳統(tǒng)的體視系統(tǒng)，能夠更精確地繪制“探測者”號周圍的地貌和以更高的精度觀測到更遠的地形。

　　2.2 國內研究動態(tài)

　　浙江大學機械系統(tǒng)完全利用透視成像原理，采用雙目體視方法實現(xiàn)了對多自由度機械裝置的動態(tài)、精確位姿檢測，僅需從兩幅對應圖像中抽取必要的特征點的三維坐標，信息量少，處理速度快，尤其適于動態(tài)情況。與手眼系統(tǒng)相比，被測物的運動對攝像機沒有影響，且不需知道被測物的運動先驗知識和限制條件，有利于提高檢測精度。

　　東南大學電子工程系基于雙目立體視覺，提出了一種灰度相關多峰值視差絕對值極小化立體匹配新方法，可對三維不規(guī)則物體（偏轉線圈）的三維空間坐標進行非接觸精密測量。

　　哈工大采用異構雙目活動視覺系統(tǒng)實現(xiàn)了全自主足球機器人導航。將一個固定攝像機和一個可以水平旋轉的攝像機，分別安裝在機器人的頂部和中下部，可以同時監(jiān)視不同方位視點，體現(xiàn)出比人類視覺優(yōu)越的一面。通過合理的資源分配及協(xié)調機制，使機器人在視野范圍、測跟精度及處理速度方面達到最佳匹配。雙目協(xié)調技術可使機器人同時捕捉多個有效目標，觀測相遇目標時通過數(shù)據(jù)融合，也可提高測量精度。在實際比賽中其他傳感器失效的情況下，僅僅依靠雙目協(xié)調仍然可以實現(xiàn)全自主足球機器人導航。

　　火星863計劃課題“人體三維尺寸的非接觸測量”，采用“雙視點投影光柵三維測量”原理，由雙攝像機獲取圖像對，通過計算機進行圖像數(shù)據(jù)處理，不僅可以獲取服裝設計所需的特征尺寸，還可根據(jù)需要獲取人體圖像上任意一點的三維坐標。該系統(tǒng)已通過中國人民解放軍總后勤部軍需部鑒定�？蛇_到的技術指標為：數(shù)據(jù)采集時間小于5s/人；提供身高、胸圍、腰圍、臀圍等圍度的測量精度不低于1.0cm。

　　3 雙目體視的發(fā)展方向

　　就又目立體視覺技術的發(fā)展現(xiàn)狀而言，要構造出類似于人眼的通用雙目立體視覺系統(tǒng)，還有很長的路要走，進一步的研究方向可歸納如下：

　�。�1）如何建立更有效的雙目體視模型，能更充分地反映立體視覺不確定性的本質屬性，為匹配提供更多的約束信息，降低立體匹配的難度。

　　（2）探索新的適用于全面立體視覺的計算理論和匹配策略，選擇有效的匹配準則和算法結構，以解決存在灰度失真、幾何畸變（透視、旋轉、縮放等）、噪聲干擾、特殊結構（平坦匹域、重復相似結構等）及遮掩景物的匹配問題；

　�。�3）算法向并行化發(fā)展，提高速度，減少運算量，增強系統(tǒng)的實用性。

　　（4）強調場景與任務的結束，針對不同的應用目的，建立有目的和面向任務的體視系統(tǒng)。

　　雙目體視這一有著廣闊應用前景的學科，隨著光學、電子學以及計算機技術的發(fā)展，將不斷進步，逐漸實用化，不僅將成為工業(yè)檢測、生物醫(yī)學、虛擬現(xiàn)實等領域的關鍵技術，還有可能應用于航天遙測、軍事偵察等領域。目前在國外，雙目體視技術已廣泛應用于生產(chǎn)、生活中，而我國正處于初始階段，尚需廣大科技工作者共同努力，為其發(fā)展做出貢獻。

【雙目立體視覺技術的實現(xiàn)及其進展論文】相關文章：

雙目立體視覺技術的實現(xiàn)及其進展05-01

雙目立體實時測距系統(tǒng)的關鍵技術研究05-02

折反射全景立體成像技術的現(xiàn)狀與進展04-29

SOG技術及其新進展05-02

淺析RNAi技術及其應用進展05-02

基于雙目視覺的相對狀態(tài)自主確定05-01

技術商品及其在市場中的實現(xiàn)04-28

技術生態(tài)化及其社會實現(xiàn)04-30

電子紙的技術進展及其社會價值04-30

SELEX技術及其應用的研究進展04-27