什么是AR
AR(Augmented Reality)增強現(xiàn)實,也叫做擴增實境。1990 年提出,是一種實時地計算攝影機影像的位置及角度并加上相應圖像的技術,它是在現(xiàn)實上疊加一層虛擬現(xiàn)實,進而擴展人類感官,與現(xiàn)實產(chǎn)生更深刻互動的一項技術。通俗一點,就是讓你看到現(xiàn)實中不存在的物體和現(xiàn)實世界融合在一起的圖像并與其交互。
AR包含了多媒體、三維建模、實時視頻顯示及控制、多傳感器溶合、實時跟蹤及注冊、場景融合等新技術與新手段。增強現(xiàn)實提供了在一般情況下,不同于人類可以感知的信息。
AR技術原理
AR技術即增強現(xiàn)實技術,它是一種將真實世界信息和虛擬世界信息“無縫”集成的新技術,是把原本在現(xiàn)實世界的一定時間空間范圍內(nèi)很難體驗到的實體信息(視覺信息,聲音,味道,觸覺等),通過電腦等科學技術,模擬仿真后再疊加,將虛擬的信息應用到真實世界,被人類感官所感知,從而達到超越現(xiàn)實的感官體驗。真實的環(huán)境和虛擬的物體實時地疊加到了同一個畫面或空間同時存在。不僅展現(xiàn)了真實世界的信息,而且將虛擬的信息同時顯示出來,兩種信息相互補充、疊加。在視覺化的增強現(xiàn)實中,用戶利用頭盔顯示器,把真實世界與電腦圖形多重合成在一起,便可以看到真實的世界圍繞著它。
值得一提的是,添加到現(xiàn)實的這些虛擬信息、虛擬物件并非靜態(tài)圖片,它們會根據(jù)攝像頭的移動,地理信息,以及各種現(xiàn)實的因素來不斷的改變形態(tài)位置,你甚至可以和他們進行觸摸、語音等交互。
AR的技術手段和表現(xiàn)形式
1.基于計算機視覺的AR
它是利用計算機視覺方法建立現(xiàn)實世界與屏幕之間的映射關系,使我們想要繪制的圖形或是3D模型可以如同依附在現(xiàn)實物體上一般展現(xiàn)在屏幕上。
想要實現(xiàn)這一點,我們就要找到現(xiàn)實場景中的一個依附平面,然后再將這個3維場景下的平面映射到我們2維屏幕上,然后再在這個平面上繪制你想要展現(xiàn)的圖形,從技術實現(xiàn)手段上可以分為2類。
第一種,Marker-based AR。事 先制作好的Marker(例如:繪制著一定規(guī)格形狀的二維碼或模板卡片),然后把Marker放到現(xiàn)實中的一個位置上,相當于確定了一個現(xiàn)實場景中的平 面,然后通過攝像頭對Marker進行識別和形態(tài)評估,并確定其位置,然后將該Marker中心為原點的坐標系稱為模板坐標系,我們要做的事情實際上是要 得到一個變換從而使模板坐標系和屏幕坐標系建立映射關系,這樣我們根據(jù)這個變換在屏幕上畫出的圖形就可以達到該圖形依附在Marker上的效果,理解其原 理需要一點3D射影幾何的知識,從模板坐標系變換到真實的屏幕坐標系需要先旋轉平移到攝像機坐標系,然后再從攝像機坐標系映射到屏幕坐標系。
第二種,Marker-Less AR。基 本原理與上面的Marker based AR相同,不過它可以用任何具有足夠特征點的物體(例如:書的封面,你的桌子)作為平面基準,而不需要事先制作特殊的模板,擺脫了模板對AR應用的束縛。 它的原理是通過一系列算法(如:SURF,ORB,F(xiàn)ERN等)對模板物體提取特征點,并記錄或者學習這些特征點。當攝像頭掃描周圍場景,會提取周圍場景 的特征點并與記錄的模板物體的特征點進行比對,如果掃描到的特征點和模板特征點匹配數(shù)量超過閾值,則認為掃描到該模板,然后根據(jù)對應的特征點坐標估計Tm 矩陣,之后再根據(jù)Tm進行圖形繪制。
2.基于地理位置信息的AR
LBS based AR,即基于地理位置信息的AR。其原理是,通過GPS獲取用戶的地理位置,然后從某些數(shù)據(jù)源(比如google)等處獲取該位置附近物體(如周圍的餐館,銀行,學校等)的POI信息(導航地圖信息,每個POI包含四方面信息,名稱、類別、經(jīng)度緯度、附近的酒店飯店商鋪等信息),再通過移動設備的電子指南針和加速度傳感器獲取用戶手持設備的方向和傾斜角度,通過這些信息建立目標物體在現(xiàn)實場景中的平面基準上。
這種AR技術利用設備的GPS功能及傳感器來實現(xiàn),擺脫了應用對二維碼或者模板卡片Marker的依賴,用戶體驗和性能都比基于計算機視覺的AR更好,也可以更好的應用到移動設備上。
一個典型的AR系統(tǒng)結構
AR的關鍵技術
1、對現(xiàn)實場景的理解和重構
在增強現(xiàn)實系統(tǒng)中,首先要解決“是什么”的問題,也就是要理解、知道場景中存在什么樣的對象和目標。第二要解決“在哪里”的問題,也就是要對場景結構進行分析,實現(xiàn)跟蹤定位和場景重構。
物體的檢測和識別技術
物體檢測和識別
物體檢測和識別的目的是發(fā)現(xiàn)并找到場景中的目標,這是場景理解中的關鍵一環(huán)。廣義的物體檢測和識別技術是基于圖像的基本信息(各類型特征)和先驗知識模型 (物體信息表示),通過相關的算法實現(xiàn)對場景內(nèi)容分析的過程。在增強現(xiàn)實領域,常見的檢測和識別任務有,人臉檢測、行人檢測、車輛檢測、手勢識別、生物識別、情感識別、自然場景識別等。
就現(xiàn)階段而言,識別檢測技術的難點之一是技術的碎片化。這一方面是由于每一類對象都會有其獨有的特征,而不同特征的提取和處理都需要實現(xiàn)一一對應,這對識別檢測是一個巨大的挑戰(zhàn)。另一方面,圖像本身還受到噪聲、尺度、旋轉、光照、姿態(tài)等因素的影響。近幾年來,隨著深度學習技術的不斷成熟,檢測和識別方法也 越來越統(tǒng)一,而性能也在不斷提高中。
2.跟蹤定位技術
跟蹤技術的方法可以分為基于硬件和基于視覺兩大類。基于硬件設備的三維跟蹤定位方法在實現(xiàn)跟蹤定位的過程中使用了一些特殊的測量儀器或設備。常用的設備包 括機械式跟蹤器、電磁式跟蹤器、超聲波跟蹤器、慣性跟蹤器以及光學跟蹤等。光學跟蹤和慣性跟蹤是比較常用的兩種硬件跟蹤方式,使用硬件設備構成的跟蹤系統(tǒng)大多是開環(huán)系統(tǒng),跟蹤精確取決于硬件設備自身的性能,其算法的擴展性要差一些,且成本相對較高。
視覺跟蹤方法具備更強的擴展性,其系統(tǒng)多為閉環(huán)系統(tǒng),更依賴于優(yōu)化算法來解決跟蹤精度問題。相 比于上述基于硬件設備的跟蹤方法,計算機視覺跟蹤方法提供了一種非接觸式的、精確的、低成本的解決方法,但是基于視覺的方法受限于圖像本身,噪聲、尺度、 旋轉、光照、姿態(tài)變化等因素都會對跟蹤精度造成較大的影響,因此更好地處理這些影響因素,研發(fā)魯棒性強的算法就成為下一步AR技術的研究重點。
根據(jù)數(shù)據(jù)的生成方式,視覺跟蹤技術的算法可以分為兩種,一種是基于模板匹配的方式,預先對需要跟蹤的target進行訓練,在跟蹤階段通過不斷的跟預存訓練 數(shù)據(jù)進行比對解算當前的位姿。這類方法的好處是速度較快、數(shù)據(jù)量小、系統(tǒng)簡單,適用于一些特定的場景,但不適用于大范圍的場景。
另外一種是SLAM方法,也就是即時定位和地圖構建技術。這類技術不需要預存場景信息,而是在運行階段完成對于場景的構建以及跟蹤。其優(yōu)點是不需要預存場 景,可以跟蹤較大范圍,適用面廣,在跟蹤的同時也可以完成對于場景結構的重建。但目前這類技術計算速度慢、數(shù)據(jù)量大、算法復雜度高,對于系統(tǒng)的要求也較高。
為了彌補不同跟蹤技術的缺點,許多研究者采用硬件和視覺混合跟蹤的方法來取長補短,以滿足增強現(xiàn)實系統(tǒng)高精度跟蹤定位的要求。
3.增強現(xiàn)實的顯示技術
目前大多數(shù)的AR系統(tǒng)采用透視式頭盔顯示器實現(xiàn)虛擬環(huán)境與真實環(huán)境的融合。根據(jù)真實環(huán)境的表現(xiàn)形式劃分,主要有視頻透視式頭盔顯示器和光學透視式頭盔顯示器兩種形式。
視頻透視式頭盔顯示器通過安裝在頭盔上的微型攝像頭獲取外部真實環(huán)境的圖像,也就是通過攝像頭來采集真實場景的圖像進行傳遞。計算機通過場景理解和分析將所 要添加的信息和圖像信號疊加在攝像機的視頻信號上,將計算機生成的虛擬場景與真實場景進行融合,最后通過類似于浸沒式頭盔顯示器的顯示系統(tǒng)呈現(xiàn)給用戶。
雖然視頻透射式頭盔在顯示上不受強光的干擾,具有比較大的視場,但由于真實環(huán)境的數(shù)據(jù)來自于攝像頭,因此會造成顯示分辨率較低的不利因素。另一方面,一旦攝 像機與用戶視點不能保持完全重合,用戶看到的視頻景象與真實景象將會存在偏差,因此會造成在某些領域(特別是工業(yè)、軍事等領域)出現(xiàn)一些安全隱患。
光學原理的透視式頭盔顯示器的基本原理則是通過安裝在眼前的一對半反半透鏡融合呈現(xiàn)出真實場景和虛擬場景。與視頻透射式不同的是,光學透視式的“實”來自于 真實的光源,經(jīng)過透視光學系統(tǒng)直接進入眼睛,計算機生成的“虛”則經(jīng)過光學系統(tǒng)放大后反射進入眼睛,最后兩部分信息匯聚到視網(wǎng)膜上從而形成虛實融合的成像 效果。
光學透視式頭盔相對來說結構簡單,分辨率更高,因其能夠直接看到外部,真實感和安全性也更強。其缺點是,在室外強光條件下顯示效果會受影響。
不難看出,兩種方案各有優(yōu)缺點,如何選擇最優(yōu)方案,目前來看,還應基于實際應用場景來進行判斷。
由于光學透射式頭盔跟實際場景結合更緊密,真實感更強,大多數(shù)廠家會選擇這種方案。對于透射式頭盔顯示器來說,單純的強調(diào)厚薄或者視場大小并沒有任何實際意 義。這是由于厚度和視場是矛盾的,要做得較薄,方便用戶使用佩戴,視場就必然變;想要擁有大視場,則其厚度就必然增大,設備就目前來說也會顯得比較笨 重,不易佩戴。因此在目前技術依舊存在障礙的情況下,大家都會采取一些折中的方案。
數(shù)字光場顯示
隨著Magic Leap的宣傳視頻,數(shù)字光場這個概念也變得廣為人知。這種不采用屏幕來做載體的顯示方式,通過記錄并復現(xiàn)光場來完成虛擬物體的顯示。通過呈現(xiàn)不同深度的圖像,使用戶在觀察近景或遠景時,可以實現(xiàn)主動的對焦,這也是光場顯示的一大優(yōu)點。
同樣,光場顯示也有不同的顯示方案,一種方案是采用多層的顯示器,如光場立體鏡。如Magic Leap采用的是光導纖維投影儀。這套方案的優(yōu)勢是可以做到很大的視場角,顯示更加符合人的真實感受。但這一方案同時也具有比較大的挑戰(zhàn)性,光場的顯示需 要比較大的計算量,并且需要有相應的手段記錄或者生成想要疊加的虛擬對象相應位置的光源信息,同時還要精細地控制投影的內(nèi)容和位置,目前這些技術還都處于 研究階段。盡管存在比較多的挑戰(zhàn),光場顯示技術仍舊是非常值得期待的一種成像方式。
AR應用領域:
醫(yī)療領域
醫(yī)生可以利用增強現(xiàn)實技術,在虛擬與現(xiàn)實之間輕易地進行手術部位的精確定位。
軍事領域
作戰(zhàn)隊伍可利用增強現(xiàn)實技術,進行方位的識別,獲得目前所在地點的地理數(shù)據(jù)等重要軍事數(shù)據(jù)。
工業(yè)領域
通過頭盔式顯示器將多種輔助信息顯示給用戶,包括虛擬儀表的面板、被維修設備的內(nèi)部結構、被維修設備零件圖等。
娛樂、游戲領域
增強現(xiàn)實游戲可以讓位于全球不同地點的玩家,共同進入一個真實的自然場景,以虛擬替身的形式,進行網(wǎng)絡對戰(zhàn)。
教育領域
從表現(xiàn)形式上吸引小朋友參與到教學中,提升對事物的興趣,從而以互動的方式探查、研究更深層次的內(nèi)容。融入增強現(xiàn)實技術后,以圖片、視頻、動畫等多種方式表現(xiàn)教學內(nèi)容,更真觀更易懂。增強現(xiàn)實特有的互動體驗,讓小朋友用眼看、用耳聽、動手做、用腦想,真正實現(xiàn)多元化教育。
家居行業(yè)
傳統(tǒng)家庭裝修也好,企業(yè)裝修也罷,在實際裝修的時候往往會發(fā)現(xiàn)裝修出來的效果并沒有預想搭配的那樣美好。各種不同材質(zhì)的裝修材料和不同風格的家具究竟是否搭配?有了 AR增強現(xiàn)實技術,不需要等到裝修后才能知道,你到了一套空曠曠還未裝修的房子就能利用AR給你的房子進行裝修,你會從你的AR設備中看到你 想要的裝修搭配。甚至價格信息,都會一目了然。同樣,如果是裝修一棟辦公樓或者是電影布局,AR在家居布置上的便利性和成本節(jié)省方面優(yōu)勢就更明顯了。
商業(yè)應用
如亞馬遜、優(yōu)衣庫以及天貓之前推的虛擬試衣間,其實也算是AR的一種。只不過現(xiàn)在Realmax的高精度面部識別技術和跟蹤技術能讓用戶體驗到全方位“立體”感受。
旅游領域
旅游產(chǎn)業(yè)AR技術對旅游業(yè)來說,同樣也是顛覆性的,它在旅游行業(yè)的應用可以有無窮無盡的探討。游客佩戴上AR設備,就能獲取當?shù)爻鞘械木包c和商場等地方的詳細介紹,自動翻譯,了解附近購物和餐飲信息只是最基本的功能。
AR的未來
2011年,全球AR營收僅為1.81億美元,而且當時AR往往被人們視作一種營銷噱頭:一種還在摸索實用應用的技術。很少有人認識到AR的潛力,開發(fā)相關應用大多也是用來快速打響名聲,或者這些應用的價值僅限于添加視頻效果這樣的博眼球之舉而已。
然而最新預測指出,到2017年,AR市場將增長至52億美元,年增長率竟逼近100%。隨著大量資金注入AR項目及AR創(chuàng)業(yè)公司,尤其是隨著 谷歌、佳能、 高通 、 微軟 等大公司的入場,我們已經(jīng)看到第一批消費級AR產(chǎn)品的涌現(xiàn)。隨著實際商業(yè)利益的出現(xiàn), AR將成為消費、醫(yī)療、移動、汽車以及制造市場中的“下一件大事”。
市場調(diào)研公司Digi-Capital給出的一組數(shù)據(jù)很值得研究:到2020年,AR的市場規(guī)模將達到1200億美元,遠高于VR的300億美元。 所以AR未來發(fā)展空間極大。這其中需要仰仗技術、內(nèi)容和應用場景的有效融合,以及硬件性能的發(fā)展和可穿戴設備的崛起。