這次是一家稱(chēng)為T(mén)hinCI(發(fā)音為‘Think-Eye’)的公司,由一位出身英特爾背景的資深工程師/架構師Dinakar Munagala創(chuàng )辦。

然而,令人驚訝的是,這家位于美國加州的新創(chuàng )公司不僅有資本雄厚、擁有技術(shù)專(zhuān)精的大廠(chǎng)支持,而且還提供了一種獨特的「大規模平行架構」,Munagala稱(chēng)其為“專(zhuān)為視覺(jué)處理和深度學(xué)習而生”。

Munagala承諾,相較于其它深度學(xué)習/視覺(jué)處理方案,該公司目前專(zhuān)利申請中的芯片架構可以帶來(lái)兩個(gè)數量級的性能提升。

從一座車(chē)庫開(kāi)始,并以有限的資金熬過(guò)6年之后,ThinCI在上個(gè)月公開(kāi)亮相。該公司最近還吸引了兩家大型一線(xiàn)汽車(chē)供貨商成為其機構投資者,而且還有一批在技術(shù)領(lǐng)域聲譽(yù)顯赫的大廠(chǎng)成為其私人投資者。

這兩家汽車(chē)供貨商分別是DENSO International America, Inc.,以及Magna International Inc.。私人投資者包括ThinCI董事會(huì )主席和Tallwood Venture Capital的管理合伙人Dado Banatao、英特爾架構部門(mén)前執行副總裁、總經(jīng)理Dadi Perlmutter、巴斯夫(BASF)監事會(huì )主席和戴姆勒(Daimler)監事會(huì )成員Jurgen Hambrecht以及其他幾位背景雄厚的資深人士。

簡(jiǎn)單、靈活

他們?yōu)槭裁赐顿YThinCI?Perlmutter認為,“在整個(gè)職業(yè)生涯中,我非常欣賞簡(jiǎn)單和靈活性。我并不喜歡一些蠻橫粗暴的方法,但著(zhù)重于研究新運算問(wèn)題的瓶頸,并且經(jīng)由尋找新途徑發(fā)現克服瓶頸的方法。ThinCI就是這么做的。”

當其它解決方案受限于數據的移入與移出,只為了填飽饑餓的巨大運算引擎時(shí),Perlmutter形容ThinCI運算是一種“專(zhuān)為深度學(xué)習量身打造的繪圖分析法,省去了大量不必要的內存存取程序。”

而其最終的結果如何?“它不僅加快了指令周期,而且降低了成本和功耗”,他補充說(shuō)。

Munagala說(shuō)自己從六年前開(kāi)始,就懷抱著(zhù)開(kāi)發(fā)一種新芯片架構,以滿(mǎn)足下一代技術(shù)(如深度學(xué)習)需求的夢(mèng)想,因此毅然決然地離開(kāi)英特爾。

然而,ThinCI并未透露其處理器架構細節,而僅稱(chēng)其為“一種革命性的繪圖串流處理器” (Graph Streaming Pocessor)。Munagala解釋?zhuān)侵?ldquo;一種大規模的平行架構,專(zhuān)為同時(shí)處理任務(wù)圖形的多項運算節點(diǎn)而設計。”

深度學(xué)習本質(zhì)上是以一組算法為基礎,透過(guò)具有多個(gè)處理層、由線(xiàn)性與非線(xiàn)性交易組成的深度繪圖,嘗試在數據中建模高層級抽象。

ThinCI架構的獨特之處似乎就在于其處理深度繪圖的方式。

Munagala解釋?zhuān)?ldquo;ThinCI架構利用極端平行為整個(gè)繪圖任務(wù)串流數據,”取代以多個(gè)處理層透過(guò)深度繪圖連續處理數據的方式。

正如Perlmutter所說(shuō)的, ThinCI處理器架構的另一個(gè)關(guān)鍵要素是可編程性。他解釋說(shuō),許多人犯了針對特定方案進(jìn)行硬件客制的錯誤,而歷史教訓是:?jiǎn)?wèn)題是不斷變化的,而程序設計人員擁有巨大的創(chuàng )造力。Perlmutter表示,ThinCI需要的是一種對處理器進(jìn)行編程以實(shí)現可不斷發(fā)展新方案的方法。

很顯然地,這正是ThinCI所提供的。Munagala指出,設計人員在使用業(yè)界標準API的同時(shí),也受益于獨特的編程方法。這使其簡(jiǎn)化打造為其處理器優(yōu)化的深度網(wǎng)絡(luò )。

相較于市場(chǎng)上的其它處理器,Munagal以GPU為例指出,盡管GPU已被用于深度學(xué)習(如Nvidia),但它并非為數據分析而設計的。它在視覺(jué)處理方面的效率不高,而且不僅功耗高、還需大量的內存?!笵SP的問(wèn)題則是編程的效率低且復雜。

那么,硬線(xiàn)組件如何?也不可行!因為對固定方案來(lái)說(shuō),用于深度學(xué)習的算法變化太快。而CPU僅適于通用目的,因為它的效能不佳且功耗過(guò)高。

芯片上繪圖執行

相形之下,ThinCI的視覺(jué)運算引擎獨到之處在于它提供了芯片上繪圖執行(on-die graph execution)。它是專(zhuān)為加速卷積神經(jīng)網(wǎng)絡(luò )(CNN)、深層神經(jīng)網(wǎng)絡(luò )(DNN)和其它復雜算法而設計的。更重要的是,該公司表示,來(lái)自攝影機傳感器的資料儲存和處理都在芯片上完成,而無(wú)需DRAM存取。20161104-AI-1ThinCI的視覺(jué)運算引擎(VISCEN)硬件架構 來(lái)源:ThinCI

因此,Munagala認為,相較于其它的處理架構,ThinCI的視覺(jué)運算引擎可以帶來(lái)更高性能、更低功耗、可編程性以及更少內存占用。

當然,視覺(jué)處理SoC市場(chǎng)已開(kāi)始出現一些新的處理器。例如。最近被英特爾收購的Movidius就是一個(gè)很好的例子。它提供專(zhuān)為嵌入式市場(chǎng)設計的視覺(jué)處理器。

針對目前在深度學(xué)習中使用的架構,Munagala說(shuō):“就性能/體積、性能/功耗指針來(lái)說(shuō),ThinCI的解決方案更高出了13倍。”更重要的是,就架構來(lái)說(shuō),我們的方案更具前瞻性,它能解決其它架構無(wú)法解決的問(wèn)題。他同時(shí)還強調簡(jiǎn)單編程模型的重要性。

獲一線(xiàn)汽車(chē)供貨商青睞

從兩家大型一線(xiàn)供貨商投資ThinCI來(lái)看,清楚地反映了三件事:第一,汽車(chē)產(chǎn)業(yè)對視覺(jué)處理和深度學(xué)習技術(shù)的巨大需求(他們認為尚未看到全貌);其次,對于讓自動(dòng)駕駛成為現實(shí)的堅定承諾;最后,一線(xiàn)廠(chǎng)商特別需要看到技術(shù)上的突破,讓他們有足夠的籌碼與新貴金主平起平坐地談判。 只需看看去年7月宣布成立的Mobileye/Intel/BMW聯(lián)盟。很顯然地,一線(xiàn)供貨商都缺席了。

“DENSO一直在研究計算機視覺(jué)處理領(lǐng)域的新發(fā)展,而我們對ThinCI的投資更展現了堅定信念,即ThinCI的技術(shù)將很快成為下一代自動(dòng)駕駛系統的關(guān)鍵組件——未來(lái)的新系統需要先進(jìn)的運算技術(shù)結合深度學(xué)習能力,”DENSO創(chuàng )投總監Tony Cannestra在一份聲明中說(shuō)。

Magna技術(shù)長(cháng)Swamy Kotagiri也表示:“我們很高興能結合ThinCI在處理和軟件領(lǐng)域的強項,以及Magna對于汽車(chē)系統的整體理解。”

在汽車(chē)市場(chǎng)之外

ThinCI并不僅著(zhù)眼于汽車(chē)市場(chǎng)。畢竟,汽車(chē)領(lǐng)域的進(jìn)展一向十分緩慢,特別是考慮到在最終生產(chǎn)前必須進(jìn)行的所有測試和認證。但這對在其它領(lǐng)域尋找近期機會(huì )的任何新創(chuàng )公司都意味深長(cháng)。

Munagala解釋?zhuān)曈X(jué)處理和深度學(xué)習應用「可以應用在任何地方」,從自然用戶(hù)接口到監控攝影機甚至白色家電。

Perlmutter同意這樣的看法?!钙?chē)只是深度學(xué)習的一類(lèi)應用,但深度學(xué)習卻可因應大量的新問(wèn)題類(lèi)型。

他解釋說(shuō),「創(chuàng )造適用于所有類(lèi)似人類(lèi)行為的適應性方案,包括從視覺(jué)、語(yǔ)音,一直到巨量數據收集的優(yōu)化算法,以及復雜的BOT與輔助等。

Perlmutter認為,深度學(xué)習成效卓著(zhù),特別是當我們從智能手機轉移到增強實(shí)境(AR)類(lèi)裝置時(shí)。他說(shuō),“我們與AR裝置的互動(dòng),以及需要它提供的復雜程度(在辦公室、制造廠(chǎng)房和旅途中),將遠遠超越當今與智能型手機互動(dòng)的笨拙方式。”

值得慶幸的是,ThinCI在嵌入式市場(chǎng)的優(yōu)勢在于其視覺(jué)運算引擎具有很高的可擴展性。 Munagala說(shuō):“我們能因應從可穿戴式裝置到內建通用軟件堆棧的服務(wù)器等領(lǐng)域的多樣化市場(chǎng)。”20161104-AI-2新興應用需要新的視覺(jué)處理技術(shù) 來(lái)源:ThinCI

時(shí)間表

根據ThinCI,其視覺(jué)運算引擎架構“已在2015年告一段落,其測試芯片也已經(jīng)完成驗證了。”該公司目前正籌措資金以實(shí)現計劃于2017年啟動(dòng)的首次芯片生產(chǎn)。從今年初開(kāi)始,ThinCI已經(jīng)完成其軟件工具套件的beta測試。

ThinCI的投資者對于該團隊所提供的成果也信心滿(mǎn)滿(mǎn)。巴斯夫監事會(huì )主席和戴姆勒監事會(huì )成員Jurgen Hambrecht表示,由于ThinCI擁有杰出的團隊和能力,讓他決定了個(gè)人投資。

Hambrecht更看好的是,“ThinCI將為多樣化的產(chǎn)業(yè)應用帶來(lái)突破性的硬件軟件。”