三星(Samsung)的最新款智能手機Galaxy S9已經(jīng)準備上市,華為(Huawei)則是即將于下周在法國巴黎舉辦新產(chǎn)品P20的發(fā)表會(huì );成像技術(shù)專(zhuān)家表示,3D傳感技術(shù)已經(jīng)成為各家手機業(yè)者互別苗頭的最新競爭焦點(diǎn)。不過(guò)有一點(diǎn)還不明確的是,三星或華為的智能手機3D傳感功能是否夠資格與蘋(píng)果(Apple)的iPhone X分庭抗禮?

來(lái)自法國之市場(chǎng)研究機構Yole Developpement的MEMS與成像技術(shù)研究主管Pierre Cambou表示,因為蘋(píng)果TrueDepth攝像頭技術(shù)設立了高門(mén)坎,他預測其他競爭對手可能需要一年以上的時(shí)間才能提供iPhone X媲美的3D傳感技術(shù)。

不同于過(guò)去的“百萬(wàn)像素戰爭”,大多數智能手機業(yè)者會(huì )在3D傳感技術(shù)這條新戰線(xiàn)打得更辛苦;這是因為3D攝像頭包含眾多需要運作一致的零組件,還需要充分的供應鏈管理。

Cambou將3D攝像頭形容為“一堆子裝置(sub-devices)”,他指出:“記得蘋(píng)果iPhone X嗎?參與其中的供應商包括意法半導體(STMicroelectronics)、LG Innotek、鴻海(Foxconn)、奧地利微電子(ams)還有Lumentum。”

市場(chǎng)已有一些評論指出三星的S9前向傳感技術(shù)“令人失望”。有一篇本月稍早發(fā)表的CNET報導評論:“深入觀(guān)察三星的最新生物識別系統──以及該系統與iPhone X的Face ID之比較──結果顯示它在移動(dòng)支付上還不夠安全。”

該報導指出,“這是因為三星的臉部識別系統使用標準攝像頭來(lái)建立使用者臉部的2D圖,而蘋(píng)果的Face ID則是會(huì )建立臉部圖形的復雜3D掃描”;人們已經(jīng)在三星去年推出的Galaxy S8證實(shí),能用照片來(lái)欺騙三星的臉部識別技術(shù),顯然S9也會(huì )被一樣的手段欺騙。

至于即將發(fā)表的華為P20,有不少媒體報導都將該款手機的“三鏡頭”視為關(guān)鍵功能──為何需要3個(gè)攝影鏡頭,三個(gè)會(huì )比兩個(gè)好嗎?

為此我們詢(xún)問(wèn)了雙鏡頭技術(shù)領(lǐng)導供應商Corephotonics的市場(chǎng)營(yíng)銷(xiāo)與業(yè)務(wù)開(kāi)發(fā)副總裁Eran Briman,他表示:“三鏡頭是一個(gè)全新的技術(shù)領(lǐng)域,才剛剛起步、還未證明其價(jià)值;”他指出三攝像頭可能會(huì )有很多型態(tài)與配置,那些鏡頭可能各有目的,包括支持“低光線(xiàn)拍攝、變焦、景深、高分辨率以及整體影像質(zhì)量。”

根據Briman的說(shuō)法,三攝像頭的組合可能包括:1. 一支彩色(RGB)鏡頭、一支黑白鏡頭,第三支攝像頭則是提供超寬廣視場(chǎng)(field of view,FoV)或是兩倍遠距窄FoV;2. 一支魚(yú)眼鏡頭、一支標準廣角鏡頭以及一支兩倍望遠鏡頭;或者是3. 一支標準廣角鏡、一支兩倍望遠鏡以及一支五倍望遠鏡,以支持超級變焦(super-zoom)功能。

他指出:“也有可能是其他配置,包括不同的影像傳感器;”但重點(diǎn)在于:“相較于雙鏡頭設計,所有的三鏡頭配置都可以提供更精確的深度信息。”

Briman表示:“主要原因是,實(shí)際上其基線(xiàn)(baseline,即鏡頭間的距離)會(huì )變得更大,特別是第一個(gè)與第三個(gè)鏡頭;當基線(xiàn)數值越大,深度信息就越準確──不過(guò)在軟件方面的挑戰很大,需要處理遮蔽(occlusion)、同步等等問(wèn)題。”他補充指出:“此外藉由整合來(lái)自三個(gè)攝像頭的信息,理論上可以得到更好的深度信息。”

換句話(huà)說(shuō),華為的三鏡頭方案顯然是為了展現該公司在強化深度傳感技術(shù)方面的努力成果──雖然未經(jīng)證實(shí),業(yè)界猜測高通(Qualcomm)是華為的3D傳感技術(shù)合作伙伴;在去年夏天,高通宣布與奇景光電(Himax Technologies)合作打造完全整合的結構光模塊(structured light module,SliM)。高通當時(shí)表示,其3D深度傳感攝像頭模塊將在今年第一季量產(chǎn)。

3D傳感技術(shù)領(lǐng)域有哪些重要廠(chǎng)商?

那么在智能手機3D傳感技術(shù)領(lǐng)域有哪些關(guān)鍵供應商?在我們討論這個(gè)題目之前,先復習一下蘋(píng)果的3D攝像頭運作原理:iPhoneX_TrueDepthModuleAnalysis蘋(píng)果TrueDepth攝像頭結構 (來(lái)源:Yole Developpement)

如同Yole先前所解釋的,iPhone X能識別使用者臉部并解鎖手機,是結合了ToF測距傳感器與紅外線(xiàn)“結構光”相機,因而能使用均勻的“泛光”或“位圖案”照明。首先,iPhone X結合了紅外線(xiàn)相機與泛光感應組件,從而在手機前方投射出均勻的紅外光;接著(zhù)拍攝影像,并此觸發(fā)臉部識別算法。

然而,這種臉部識別功能并非持續運作。連接到飛行時(shí)間(ToF)測距傳感器的紅外線(xiàn)相機發(fā)出信號,指示相機在偵測到臉部時(shí)拍攝照片。iPhone X接著(zhù)啟動(dòng)其點(diǎn)陣式投射器拍攝影像。然后將一般影像和位圖案影像傳送至應用處理單元(APU),用于進(jìn)行神經(jīng)網(wǎng)絡(luò )訓練,以識別手機使用者以及解鎖手機。

Yole的Cambou指出,此時(shí)尚未開(kāi)始進(jìn)行3D影像的運算,3D信息包含在位圖案影像中。“為了執行3D應用,同一個(gè)APU可以使用另一種計算影像深度地圖的算法;”他補充:“由于采用了運算密集的結構光途徑,iPhone X充份利用了A11芯片的強大處理能力。使用神經(jīng)網(wǎng)絡(luò )是得以實(shí)現這一設計的關(guān)鍵技術(shù)。”

基本上有三種類(lèi)型的技術(shù)能實(shí)現3D傳感,包括立體視覺(jué)(stereo vision)、結構光以及ToF傳感;Yole所提供的以下表格可以看到這三種技術(shù)的優(yōu)缺點(diǎn)與特性比較:

depth-sensingtech三大3D傳感技術(shù)比較 (來(lái)源:Yole Developpement)

而因為每個(gè)3D攝像頭都包含了一堆子裝置,Yole針對以上三種類(lèi)型技術(shù)提供了一些組件供應商組合線(xiàn)索。

首先,立體視覺(jué)或主動(dòng)立體視覺(jué)(active stereo),能透過(guò)結合由Omnivision或ST提供的全局快門(mén)近紅外線(xiàn)(NIR)攝像頭,以及歐司朗(Osram)、Lumentum、Finisar的NIR照明(可選),還有Iniutive、英特爾(Intel)/Movidius所提供的3D硬件加速器(即視覺(jué)處理器)。

其次在結構光部分,必要的子裝置包括全局快門(mén)NIR攝像頭,一樣是有Omnivision或ST等供應商;還有結構NIR照明組件(可選),供應商是奧地利微電子、奇景光電、韓國業(yè)者Namuga以及歌爾(Goertek);此外是3D重建軟件,供應商有Apple Primesense、Mantis、Namuga與奧比中光(Orbbec)。

第三種ToF方案,則需要供應商包括pmd、Sony/Softkinetic的ToF鏡頭,以及歐司朗、Lumentum、Finisar與奧地利微電子等廠(chǎng)商的NIR照明組件(可選)。Cambou指出,奧地利微電子與意法都提供ToF近接探測器,但只支持幾個(gè)像素,輛家公司都還未開(kāi)發(fā)ToF攝像頭。

蘋(píng)果設下的高競爭門(mén)坎

假設iPhone X的TrueDepth如同Yole所說(shuō)的遠勝所有競爭者,究竟其他3D傳感技術(shù)方案是少了什么?

對此Cambou認為,“神經(jīng)引擎”(neural engine)是一個(gè)關(guān)鍵,也是蘋(píng)果的競爭對手難以跨越的障礙:“高通顯然已經(jīng)有了‘me too’解決方案…但還未看到成果;”此外他表示:“你需要夠力的2D-3D攝影系統,適合智能手機前置、成本要低于15美元,”這不是完全不可能,但真的很難做到。

APPLEiPhoneXOPTICALHUBCOSTINGiPhone X的光學(xué)中樞系統成本 (來(lái)源:Yole Developpement與System Plus Consulting)

此外Cambou補充,該系統還需要達到一定程度的生物識別效果,如果一張照片就能騙過(guò)系統,那方案就沒(méi)用;他認為這是問(wèn)題所在:“蘋(píng)果從一開(kāi)始就知道要用3D攝像頭來(lái)做什么,是包括生物識別方案在內的用戶(hù)接口,”而其他競爭對手只是嘗試要賣(mài)廉價(jià)版的相同功能。

Cambou指出:“蘋(píng)果識別系統需要的性能等級,已經(jīng)設立了超越所有競爭者技術(shù)能力的標準;奇景光電的窘境意味著(zhù)手機業(yè)者還沒(méi)有充分了解其應用重點(diǎn)。”

那除了高通與奇景光電的合作,還有其他案例嗎?Cambou指出,聯(lián)發(fā)科(Mediatek)也打算以APU供應商的角色加入3D傳感戰場(chǎng),打算以卷積神經(jīng)網(wǎng)絡(luò )(CNN)──類(lèi)似于蘋(píng)果的神經(jīng)引擎──來(lái)支持生物識別;而他表示,聯(lián)發(fā)科顯然會(huì )在未來(lái)替小米(Xiaomi)提供CNN加速器,將與奧比中光設計的3D攝像頭結合。 3Dimaging_sensingmarket3D傳感技術(shù)市場(chǎng)預測 (來(lái)源:Yole Developpement)

Cambou還表示,如果手機的臉部識別系統將會(huì )用于移動(dòng)支付,我們永遠可以爭論哪種3D攝像頭模塊更安全,但有一件不可忽略的事情,就是中國因素。舉例來(lái)說(shuō),最終只要支付寶認定哪種3D傳感技術(shù)夠好,就會(huì )被中國市場(chǎng)認可──中國有一大部分人口都已經(jīng)依賴(lài)像是微信支付、支付寶等移動(dòng)支付方案,而這會(huì )成為3D傳感技術(shù)贏(yíng)家的最大決定因素。