谷歌(Google)資深院士Jeff-Dean在近日于美國舊金山舉行的SIGMOD 2016大會(huì )發(fā)表專(zhuān)題演說(shuō)時(shí)所言,我們現在最需要從機器學(xué)習中取得的是“理解力(understanding)”。
“我們現在有充足的運算資源,以及足夠大規模的、有趣的數據集;”Dean對SIGMOD大會(huì )的聽(tīng)眾們表示:“我們可以?xún)Υ娲罅康挠腥べY料,但我們真正需要的是理解那些數據。”
在專(zhuān)題演說(shuō)中,Dean概述了機器學(xué)習(machine learning,ML)與神經(jīng)網(wǎng)絡(luò )的歷史,還有利用以影音呈現的原始數據編程模型之不同方法;他也詳細介紹Google初具規模的ML研究成果,該公司最近將在歐洲設置一個(gè)機器學(xué)習研究中心。Google繼去年發(fā)表TensorFlow算法后,又宣布自己開(kāi)發(fā)了命名為張量處理單元(TPU)的人工智能加速器芯片。
Dean表示:“隨著(zhù)時(shí)間推移,我們看到越來(lái)越多利用ML技術(shù)來(lái)解決各種問(wèn)題的成功案例,這導致了Google內部數百個(gè)開(kāi)發(fā)團隊對相關(guān)技術(shù)的使用出現真正大幅度成長(cháng)。”
Google對深度學(xué)習技術(shù)的使用趨勢(來(lái)源:SIGMOD/Jeff Dean)
Dean舉例指出,Google的語(yǔ)音識別開(kāi)發(fā)團隊,透過(guò)利用神經(jīng)網(wǎng)絡(luò )將字詞錯誤率降低了30%;該團隊以神經(jīng)網(wǎng)絡(luò )取代了語(yǔ)音識別流水線(xiàn)(pipeline)的聲學(xué)模型──也就是利用原始音波來(lái)判別聲音與字詞──并達成了二十年來(lái)最大幅度的改善成果。
利用機器學(xué)習與神經(jīng)網(wǎng)絡(luò )技術(shù)解決的基礎性問(wèn)題,也能在其他領(lǐng)域看到,例如醫療與衛星影像;在這些案例中,可能是需要在地圖上識別某棟房子以勘查太陽(yáng)能光電板的安裝,或是進(jìn)行糖尿病患黃斑部病變的篩選。用于語(yǔ)音識別的相同模型,可以輕易被利用來(lái)解決其他問(wèn)題。
“那些模型有很多類(lèi)似的地方;”Dean指出,Google翻譯應用程序現在可以利用畫(huà)素識別(pixel identification),實(shí)時(shí)將符號翻譯成不同語(yǔ)言。
機器學(xué)習的未來(lái)發(fā)展
不過(guò)在機器學(xué)習以及神經(jīng)網(wǎng)絡(luò )的理解能力發(fā)展方面,還有一些待克服的障礙;包括模型必須要能在無(wú)人監督的狀況下學(xué)習、處理多任務(wù)任務(wù)并轉換學(xué)習,還有根據現實(shí)世界情況采取行動(dòng)(也被稱(chēng)為強化學(xué)習)。
Dean表示,研究人員已經(jīng)開(kāi)始關(guān)注機器學(xué)習的隱私保護技術(shù),并將該模型架構添加到mdash廣告程序中;在這部分的機器學(xué)習中,人類(lèi)的互動(dòng)扮演在權衡時(shí)扮演重要角色,是很大的進(jìn)步:“確保你提供的資料實(shí)際遵循你想要的隱私權政策很重要,或者你可以強加更高層級的政策到模型之上。”
從系統的角度來(lái)看,Dean表示下一個(gè)挑戰是如何:“利用高層級的機器語(yǔ)言算法描述,以及將那些不同的描述映像到廣泛的不同硬件上;”他也期望能將機器學(xué)習整合到更多傳統的數據處理方案中。
摩爾定律(Moore’s Law)的尾端為機器學(xué)習提供了有趣的發(fā)展方向,Dean預期會(huì )有越來(lái)越多進(jìn)行機器學(xué)習運算的異質(zhì)或特制硬件;Google的TensorFlow ASIC是一個(gè)例子,而最近則是嘗試利用以TensorFlow啟動(dòng)的機器人進(jìn)行大規模數據收集。
“我認為這一次神經(jīng)網(wǎng)絡(luò )已經(jīng)準備就緒;在90年代,我認為它們雖然帶來(lái)很多激勵,但就是缺乏運算資源。而現在,我想該類(lèi)技術(shù)已經(jīng)展現它們能解決相關(guān)有趣問(wèn)題的能力;”Dean結論指出:“如果你還沒(méi)考慮如何為數據庫提供深度神經(jīng)網(wǎng)絡(luò ),現在應該要開(kāi)始了。”