在A(yíng)lphaGo阿法狗第一局戰勝?lài)甯呤掷钍朗?,英國《金融時(shí)報》中文版頭條文章為:互聯(lián)網(wǎng)終結,人工智能崛起。此時(shí)此刻,互聯(lián)網(wǎng)時(shí)代的領(lǐng)先者和弄潮兒不落窠臼,一場(chǎng)革命就要到來(lái),他們似乎正在拋棄互聯(lián)網(wǎng):
2015年和2016年,整個(gè)Google都在推動(dòng)一件事——改名Alphabet,希望徹底脫掉互聯(lián)網(wǎng)公司的標簽,在原來(lái)的搜索引擎、YouTube和Android之外,將Calico(生命工程相關(guān))、Google Ventures(創(chuàng )新投資部門(mén))、GoogleX(研發(fā)自動(dòng)駕駛汽車(chē)、智能隱形眼鏡和提供互聯(lián)網(wǎng)服務(wù)的熱氣球等)都歸到Alphabet旗下。Google似乎已經(jīng)意識到“互聯(lián)網(wǎng)”時(shí)代正在終結。
同樣在此刻,全球最頂尖的精英也在拋棄互聯(lián)網(wǎng)——斯坦福、MIT(麻省理工)、CMU(卡內基梅?。?、伯克利四所名校人工智能專(zhuān)業(yè)的博士生第一份offer(工作合同)已經(jīng)可以拿到200-300萬(wàn)美金。掠奪這些人才的公司大體上在一個(gè)比較小的范圍內,Google(現更名Alphabet)、Facebook、IBM、蘋(píng)果、微軟、亞馬遜、特斯拉…一長(cháng)串的金光閃閃的公司。
互聯(lián)網(wǎng)的精英人才在硅谷現在的起薪應該是20萬(wàn)美金左右。10倍!還有什么比工資更敏感的價(jià)值判斷呢?這種人才軍備競賽情況在商業(yè)歷史上從來(lái)沒(méi)有發(fā)生過(guò)。
阿法狗和Atlas機器人的相繼出現,把即將到來(lái)的人工智能從幕后推送到幕前,谷歌在為這個(gè)全新的“人機智能時(shí)代”蓄勢,一如當年的美國集中西方最優(yōu)秀的科學(xué)家開(kāi)啟了震驚全球的“曼哈頓計劃”。
AlphaGo在短短幾個(gè)月實(shí)現性能的大幅提升,用五個(gè)月走完了IBM“深藍”4年的路,這樣驚人的學(xué)習能力是人類(lèi)可望而不可及的。美國啟動(dòng)了“腦研究計劃”(BRAIN Initiative)、歐盟啟動(dòng)了“人類(lèi)大腦工程”(Human Brain Project),目前全球人工智能企業(yè)已經(jīng)超過(guò)了900家,總估值超過(guò)87億美元。
近年來(lái),深度學(xué)習(deep learning)已經(jīng)在圖像識別、語(yǔ)音識別等領(lǐng)域獲得了一些應用。目前深度學(xué)習技術(shù)應用最多的還是視覺(jué)領(lǐng)域,即對圖像和視頻的分析。在圖像分析方面,比如人們熟悉的人臉識別、文字識別和大規模圖像分類(lèi)等,深度學(xué)習大幅提升了復雜任務(wù)分類(lèi)的準確率,使得圖像識別、語(yǔ)音識別以及語(yǔ)義理解準確率大幅提升。
Google已經(jīng)著(zhù)手開(kāi)發(fā)人工智能的實(shí)際應用,多次公開(kāi)場(chǎng)合討論過(guò)深度學(xué)習技術(shù),比如深度學(xué)習是如何幫助Android手機提高語(yǔ)音識別準確率;谷歌自動(dòng)駕駛通過(guò)深度學(xué)習識別道路、交通信號燈、路標等。
據悉,谷歌與半導體新創(chuàng )企業(yè)Movidius展開(kāi)合作,正在開(kāi)發(fā)配備“深度學(xué)習(Deep Learning)”人工智能最新技術(shù)的智能手機。如果智能手機內置圖像識別功能,就可以即時(shí)本地處理圖像和識別被攝體。人臉識別支付、標識和招牌翻譯等手機的各種新用途將成為可能。
芯片商扎堆深度學(xué)習,高通打出驍龍820
然而,對于半導體產(chǎn)業(yè)來(lái)說(shuō),最重要或許也最實(shí)際的問(wèn)題是:深度學(xué)習將會(huì )深入智能手機、可穿戴設備或是自動(dòng)駕駛汽車(chē)中使用的微型芯片嗎?也就說(shuō),我們得讓更小的設備具備深度學(xué)習的能力,使其得以實(shí)現高性能與低功耗才是關(guān)鍵。
結合用于偵測運動(dòng)和音頻信號的傳感器、快速的存儲器訪(fǎng)問(wèn),以及高功效的數據處理方法,這些系統可以擁有真正的“認知”能力,甚至在不遠的將來(lái)構成一個(gè)用于人工智能移動(dòng)設備的平臺。同時(shí),重要的是優(yōu)化現有的架構來(lái)實(shí)現“智能視覺(jué)”功能,比如3D深度圖和感知、物體識別以及增強現實(shí),還有一些核心的計算圖像學(xué)功能,比如圖像縮放、HDR、圖像再對焦,以及微光圖像增強。
現在已經(jīng)有充份的證據顯示芯片供貨商對深度學(xué)習的興趣不斷增加,卷積神經(jīng)網(wǎng)絡(luò )(CNN)正廣泛地應用在影像與視頻辨識領(lǐng)域。
“毫無(wú)疑問(wèn)地,深度學(xué)習確實(shí)是改變游戲規則的一大突破,”嵌入式視覺(jué)聯(lián)盟(EVA)創(chuàng )辦人Jeff Bier以計算機視覺(jué)為例表示,深度學(xué)習具有強大的影響力,“必須說(shuō)的是,目前它還只是一種經(jīng)驗領(lǐng)域。人們正在嘗試不同的東西。”
高通去年推出了首款可‘模擬人腦’的Zeroth認知運算平臺——具有“計算機視覺(jué)、設備上深度學(xué)習、可辨識場(chǎng)景與對象的智能相機,以及閱讀文本與手寫(xiě)”的能力,并宣稱(chēng)驍龍820是一顆智能芯片。
Nvidia在去年三月的GPU技術(shù)大會(huì )上使用汽車(chē)和先進(jìn)駕駛輔助系統(ADAS)作為應用重點(diǎn),配合Elon Musk的意見(jiàn)和評論,希望表明自動(dòng)駕駛汽車(chē)的挑戰幾乎已被完全克服了。另一方面,隨著(zhù)時(shí)間的推移,加上一些著(zhù)眼于降低功耗的調整與改良,無(wú)處不在的3D感知、3D跟蹤,以及圖像搜索等許多技術(shù)和應用正在快速進(jìn)入智能手機,以及其他以電源或電池供電的嵌入式系統中。
DSP IP平臺授權廠(chǎng)商CEVA公司宣布推出實(shí)時(shí)神經(jīng)網(wǎng)絡(luò )軟件框架CEVA深層神經(jīng)網(wǎng)絡(luò ),以簡(jiǎn)化低功耗嵌入式系統中的機器學(xué)習部署。包括用于圖像分類(lèi)、定位和目標識別的實(shí)時(shí)示例模型,用于目標和場(chǎng)景識別、先進(jìn)駕駛輔助系統(ADAS)、人工智能(AI)、視頻分析、增強現實(shí)(AR)、虛擬現實(shí)(VR)和類(lèi)似的計算機視覺(jué)應用。
飛思卡爾收購計算機視覺(jué)IP供應商CogniVue。CogniVue總部位于加拿大渥太華,是一家從事影像認知IP開(kāi)發(fā)的企業(yè),過(guò)去4年是飛思卡爾最新駕駛輔助系統(ADAS)單芯片(SoC)解決方案主要視覺(jué)IP的供應商。
TI、Nvidia、英飛凌、高通、谷歌等大廠(chǎng)都在進(jìn)行自動(dòng)駕駛汽車(chē)中使用的微型計算機視覺(jué)芯片設計的研究,致力于開(kāi)發(fā)針對神經(jīng)網(wǎng)絡(luò )(CNN)優(yōu)化的SoC架構。其中最厲害的是以色列公司——Mobileye——他們可以提供最完整解決方案。
為了實(shí)現視覺(jué)類(lèi)芯片的深度學(xué)習應用,芯片供貨商用盡了從CPU、GPU到FPGA和DSP的一切,有關(guān)CNN的爭論才剛剛開(kāi)始。
人工智能型移動(dòng)芯片面世還要多久?
“你不需要做出決定,因為深度學(xué)習將會(huì )為你做決定。”在深度學(xué)習架構中,你可以將所有的步驟整合于一。
學(xué)習和訓練過(guò)程先在專(zhuān)用設施完成,例如利用數據中心的超級計算機。然后,將第一階段中的大量數據集轉為‘設定’和‘協(xié)同效率’應用到嵌入式系統中。
隨著(zhù)許多圖像處理與增強功能也都使用計算機視覺(jué)技術(shù),計算機視覺(jué)和圖像處理技術(shù)之間的區別正在變得越來(lái)越模糊。最直接的例子就是多幀圖像增強功能,比如HDR、圖像縮放與再對焦--拍攝多個(gè)連續的圖像,然后將它們融合在一起,得到更高質(zhì)量的畫(huà)面。
雖然我們稱(chēng)之為“圖像增強”,但這其實(shí)涉及大量的計算機視覺(jué)處理來(lái)“register”圖像,既完成兩幀或三幀畫(huà)面之間的匹配?,F在,用戶(hù)認為這種基本功能是理所當然的,但其實(shí)它需要非常強大的處理能力,使得對于專(zhuān)門(mén)的、高性能的數字信號處理 (DSP)的需求將會(huì )增加。
高通公司(Qualcomm) 在Uplinq 2013上發(fā)布了文章,很好地描繪出用于各種不同處理功能的像素功率和時(shí)間關(guān)系。圖中展示了三個(gè)處理器,包括一個(gè)在1.2 GHz下運行的單核CPU、一個(gè)四核CPU,以及一個(gè)在690 MHz下運行的DSP。
圖:描繪不同處理器在處理每個(gè)像素時(shí)需要的處理能力和時(shí)間,表明了DSP結合CPU用于視覺(jué)處理的優(yōu)勢。為了優(yōu)化功耗和性能,結合CPU、DSP和GPU可能是總體來(lái)說(shuō)最好的方法。
然而,隨著(zhù)我們轉向在移動(dòng)平臺上實(shí)現類(lèi)似人類(lèi)的視覺(jué)、人工智能和增強現實(shí)應用,可能需要重新思考所需的處理架構。結合傳感器融合和先進(jìn)深度學(xué)習算法(比如CNN),這些非常先進(jìn)的計算密集型應用將提供更具環(huán)境感知和情境感知的用戶(hù)體驗,但是在電池壽命方面卻要作出取舍。
設計人員面臨的挑戰,是一方面要實(shí)現具有智能感知能力的設備,同時(shí)在另一方面維持可接受的電池壽命。有幾種方法來(lái)實(shí)現這一點(diǎn)。例如,可以使用來(lái)自高通或Nvidia的GPU來(lái)支持CPU。這已經(jīng)在許多智能手機中實(shí)現了。然而,降低功耗這一持續性的強制需求驅使我們將特定的處理密集型功能分散給針對視覺(jué)處理進(jìn)行優(yōu)化的DSP處理器。在處理物體識別和跟蹤時(shí),對比當下最先進(jìn)的GPU簇群,使用這種方法可以節省高達9倍的功耗。
然而,即使具備這種功耗水平,移動(dòng)設備仍然不太可能很快地使用面部識別來(lái)進(jìn)行人群搜索,因為此功能對于處理能力的要求還是太高了。不過(guò),低功耗處理器和經(jīng)過(guò)特定優(yōu)化的處理器架構的面世帶來(lái)了希望,使得我們在這個(gè)領(lǐng)域內正在取得實(shí)質(zhì)的進(jìn)展。這類(lèi)進(jìn)展是MIT Technology Review將深度學(xué)習稱(chēng)為2013年十項技術(shù)突破之一的原因所在。除了GTC上進(jìn)行了相關(guān)演示,微軟、百度,以及Cognivue也展示了一些研究成果。此后,這個(gè)領(lǐng)域中還有其他長(cháng)足發(fā)展。
此外,Aziana (澳大利亞)最近宣布與BrainChip(美國加州)合并,后者是專(zhuān)門(mén)以硬件方式實(shí)施人工智能的企業(yè),并已經(jīng)著(zhù)眼于開(kāi)發(fā)用于移動(dòng)平臺的人工智能。雖然支持強大處理能力的架構和超低功耗處理是至關(guān)重要的,但隨著(zhù)云連接變得更普及、更快捷,若我們將盡可能多的處理開(kāi)銷(xiāo)分配到云中,也是合乎情理的。這將會(huì )走向智能的處理性能分配。在云做最適合在云中處理的工作,在移動(dòng)設備做最適合移動(dòng)設備處理的工作,盡可能高效地依據架構分配功能,比如使用CPU來(lái)分配GPU和DSP之間的負載。用高通公司的說(shuō)法,就是使用合適的引擎來(lái)做合適的工作。
“寒武紀”芯片——中國AI的抗旗者
世界排行榜榜首中國圍棋抗旗者17歲的柯潔已向阿法狗約戰,捍衛人類(lèi)尊嚴。美國通過(guò)人工智能再次展示其科技領(lǐng)域全球領(lǐng)先地位,在中國AI研究的抗旗者在哪?實(shí)力幾何?
在國內,大批科技公司也開(kāi)始進(jìn)入到這個(gè)市場(chǎng)。2014年科技部“863 計劃”啟動(dòng)《基于大數據的類(lèi)人智能關(guān)鍵技術(shù)與系統》項目,同時(shí)醞釀啟動(dòng)“中國腦計劃”。在企業(yè)方面,阿里巴巴推出了國內首個(gè)可視化云計算智能平臺 “DTPAI”;騰訊則推出了撰稿機器人Dreamwriter;新秀科大訊飛則在語(yǔ)音和語(yǔ)言方面也擁有了核心技術(shù)積累和產(chǎn)業(yè)基礎。
而作為國內最早介入人工智能研發(fā)的企業(yè)之一,百度在人工智能研究方面的布局則遠非幾個(gè)獨立產(chǎn)品或是幾個(gè)垂直領(lǐng)域所能描述。2014年,百度在硅谷成立人工智能實(shí)驗室,側重于研究人工智能和深度學(xué)習的前沿技術(shù),這使得百度在硅谷現有開(kāi)發(fā)能力的基礎上進(jìn)一步增強了研究能力。與此同時(shí),百度挖角谷歌大腦之父吳恩達,隨即成立由吳恩達領(lǐng)銜的深度學(xué)習實(shí)驗室,主攻智能駕駛和語(yǔ)音識別兩個(gè)方向。
截止目前,百度人工智能實(shí)驗室搭建了作為百度人工智能核心的“百度大腦”,融合了深度學(xué)習算法、數據建模、大規模GPU并行化平臺等技術(shù),實(shí)現了實(shí)時(shí)學(xué)習和成長(cháng),它擁有200億個(gè)參數,構成了一套巨大的深度神經(jīng)網(wǎng)絡(luò ),是利用計算機技術(shù)模擬人的大腦的智慧,如學(xué)習、記憶、推理、搜索、分析、歸納、創(chuàng )新,甚至模擬和擁有人的情感、意識,使計算機或機器人能夠勝任一些通常需要人類(lèi)智能才能完成的復雜工作。
在核心處理器領(lǐng)域,中國科學(xué)院計算技術(shù)研究所陳云霽、陳天石課題組提出的深度學(xué)習處理器指令集DianNaoYu被計算機體系結構領(lǐng)域頂級國際會(huì )議ISCA2016(International Symposium on Computer Architecture)所接收,其評分排名所有近300篇投稿的第一名。2014年,陳云霽入選《麻省理工科技評論》35歲以下的全球最佳35名創(chuàng )新人士。
一同問(wèn)世的還有全球首個(gè)深度學(xué)習處理器架構寒武紀。陳云霽在接受采訪(fǎng)時(shí)表示,事實(shí)上,中國在智能這樣的新興領(lǐng)域和國外差距不大,甚至在智能芯片上是引領(lǐng)世界的。例如我們的寒武紀,美國的哈佛、斯坦福、MIT、哥倫比亞等高校都跟在我們后面做。谷歌甚至需要使用上萬(wàn)個(gè)x86 CPU核運行7天來(lái)訓練一個(gè)識別貓臉的深度學(xué)習神經(jīng)網(wǎng)絡(luò )。將來(lái)如果使用了帶有“DianNaoYu(電腦語(yǔ))”指令集的“寒武紀”處理器,深度學(xué)習的運算速度會(huì )得到明顯提升。
陳云霽還表示,正在成立寒武紀公司,進(jìn)行深度學(xué)習處理器的產(chǎn)業(yè)化,公司即將完成天使輪融資。相信我們的產(chǎn)品一旦流片,很多國內外公司都會(huì )非常感興趣。