算力智庫:機器智能(néng)之路怎麽走?先從智能(néng)立體(tǐ)視覺開始

來源:算力智庫時間:2019-04-16


作(zuò)者:生煎

編輯:高斯


算力說:

3月底結束的機器視覺展上,一衆國(guó)内廠家在設備、鏡頭、識别等層面互相競技(jì ),有(yǒu)一家公(gōng)司的氣質(zhì)卻有(yǒu)點與衆不同。偉景智能(néng)另辟蹊徑,不走平面識别,通過立體(tǐ)視覺實現了更高效的機器學(xué)習能(néng)力。從二維走向三維,能(néng)否實現“降維打擊”呢(ne)?算力智庫專訪偉景智能(néng)創始人董霄劍,解碼一家創立兩年卻能(néng)獨樹一幟的科(kē)創企業。


最近Netflix的動畫短篇合集《愛,死亡和機器人》以豆瓣9.4的高分(fēn)刷爆社交網絡,該劇以優質(zhì)的畫面和故事探讨了人性、社會、未來、家園和毀滅等概念。其中(zhōng),《齊馬的藍》以一個機器人藝術家從萬衆矚目到回歸本源的故事成為(wèi)短篇集中(zhōng)最意味深長(cháng)的一篇。


1555386451863973.bmp

人工(gōng)智能(néng)機器人齊馬


《齊馬的藍》講述了一台泳池清潔機器人齊馬被一代代科(kē)學(xué)家賦予越來越多(duō)的感知能(néng)力和智能(néng),并成為(wèi)一位畫家。齊馬可(kě)以深入熔岩、海底、宇宙,去感知人類所達不到的區(qū)域,并創作(zuò)出獨一無二的瑰麗畫作(zuò)。它的作(zuò)品最獨特的地方,在于其畫作(zuò)中(zhōng)間會有(yǒu)一塊方形的藍色,被人們譽為(wèi)齊馬藍。


而在其創作(zuò)生涯的最高峰,齊馬選擇了在衆人面前抛棄自己所有(yǒu)的智能(néng),回歸最原始的狀态,回到一台初級泳池清潔機器人。人們才知道原來齊馬作(zuò)品中(zhōng)那一抹齊馬藍就是他(tā)最初的創作(zuò)者泳池中(zhōng)的瓷磚顔色。


1555386500192179.bmp

齊馬的藍


抛開故事中(zhōng)蘊含的禅意和輪回的探讨,其涉及的機器感知層面,對從業者來說,也有(yǒu)一定借鑒意義。


“現在很(hěn)多(duō)的視覺學(xué)習采用(yòng)的基于大量平面圖像進行訓練,不僅圖像的需求量大,而且所需的标注工(gōng)作(zuò)量也很(hěn)大。在一定的意義上接近于‘Deep Training’。在很(hěn)多(duō)在訓練集中(zhōng)未出現的物(wù)體(tǐ)角度、存在場景、動态組合時會出現問題。”偉景智能(néng)的創始人董霄劍對算力智庫表示。


董霄劍博士曾經是國(guó)内通訊行業領軍企業展訊通信首席科(kē)學(xué)家,2016年創立了機器視覺公(gōng)司偉景智能(néng),隻用(yòng)了兩年時間,完成了産(chǎn)品開發到應用(yòng)。算力智庫在3月底的上海機器視覺展上,和董霄劍聊了聊機器視覺的現狀和未來。


展會上,鏡頭、紅外線(xiàn)、攝像設備一應俱全,一應國(guó)内廠家比畫質(zhì)比識别比速度,甚至還有(yǒu)不少已經做出了可(kě)以搬運貨物(wù)的機器人、自動識别瑕疵的生産(chǎn)線(xiàn)等産(chǎn)品。而偉景智能(néng)的氣質(zhì)卻有(yǒu)點不同。


“偉景智能(néng)最大的不同在于我們強調的是首先發展智能(néng)立體(tǐ)視覺,然後基于此發展真正的機器智能(néng)。我們的每個落地應用(yòng)不是僅僅針對其具(jù)體(tǐ)的需求而單純研究這個應用(yòng)技(jì )術,而是将這個應用(yòng)的需求作(zuò)為(wèi)我們‘智能(néng)眼’的一部分(fēn)功能(néng)而拓展。”董霄劍表示。



3.jpg

偉景智能(néng)創始人董霄劍


機器識别不是“放大鏡”


董霄劍認為(wèi),機器視覺領域,大家普遍運用(yòng)的是平面視覺,對每一個物(wù)體(tǐ)的識别率需要依靠大量的機器學(xué)習,費時費力,而運用(yòng)立體(tǐ)視覺,可(kě)以大大減少機器的識别時間,增加識别率,幫助機器人建立自己的立體(tǐ)認知,這對機器智能(néng)識别來說,意義重大。


生産(chǎn)線(xiàn)上的瑕疵檢測被很(hěn)多(duō)廠家作(zuò)為(wèi)經典案例,宣傳自己的精(jīng)度、識别率、識别速度等。這隻是機器識别最簡單的應用(yòng)案例,在面對更加複雜的場景尤其是自動駕駛這樣需要機器識别并作(zuò)出判斷的時候,簡單的平面識别不再适用(yòng)。


董霄劍提出了一個很(hěn)有(yǒu)意義的觀點,即我們要做的是從機器的角度去看,而不是讓機器幫你看。簡單解釋,即讓機器自行識别,作(zuò)出判斷,給出反饋,而非簡單為(wèi)人類實現更細緻的檢測或觀察。“那隻能(néng)被成為(wèi)‘放大鏡’,而不是真正的機器眼。”董霄劍說。


偉景智能(néng)有(yǒu)個很(hěn)有(yǒu)趣的應用(yòng)案例,立體(tǐ)視覺引導自動化擠牛奶系統。通過對奶牛三維空間定位及姿态角度檢測,将數據傳輸給機械裝(zhuāng)置,實現自動擠奶。這種功能(néng)的實現需要高精(jīng)度的立體(tǐ)定位數據為(wèi)機械臂提供操作(zuò)指引,這對平面識别來說,幾乎是不可(kě)能(néng)完成的任務(wù),但是通過立體(tǐ)視覺,不僅能(néng)高效完成,機器對奶牛的識别學(xué)習也非常高效。據介紹,偉景智能(néng)的産(chǎn)品通過立體(tǐ)視覺,隻需數小(xiǎo)時就可(kě)以對某一物(wù)體(tǐ)進行識别。


“這個世界是三維的,從三維去認知,才是最快的方式。為(wèi)什麽要把三維的空間壓縮到二維世界再去費工(gōng)費力地認知呢(ne)?這就類似于你很(hěn)少發現自然界中(zhōng)有(yǒu)少于一個眼睛的生物(wù)體(tǐ),甚至我們幻想的外星球的人也是‘多(duō)目的’”。


1555386754212806.bmp

偉景智能(néng)的自動化擠牛奶系統


發展“Natural Learning®”


董霄劍曾經在某論壇上表示:未來的智能(néng)是機器真正自主産(chǎn)生智能(néng),而不是培養智能(néng)。


偉景智能(néng)的理(lǐ)想是機器智能(néng),做機器智能(néng),首先必須讓機器看見世界,然後讓他(tā)去思考,隻有(yǒu)立體(tǐ)視覺才能(néng)通向自主智能(néng)和機器智能(néng)。


對于這段話,董霄劍解釋道,對于機器學(xué)習來說,永遠(yuǎn)都存在corner case(邊角案例),而corner case是無窮盡的。以自動駕駛為(wèi)例,路上會出現的情況各種各樣,即便是通過大數據深度學(xué)習,仍然會有(yǒu)新(xīn)的狀況出現,隻要無法窮盡所有(yǒu)的狀況,就存在很(hěn)大的風險。


因此,偉景智能(néng)要發展的是我們稱之為(wèi)“Natural Learning”,就是基于自然感知的智能(néng)化,包括視覺、聽覺、觸覺等綜合感知層面的感知智能(néng)化,通過記憶、聯想、語義、遷移等邏輯發展手段來發展機器認知智能(néng)。目前我們的工(gōng)作(zuò)首先重點在于發展具(jù)有(yǒu)這些特點的“智能(néng)立體(tǐ)感知”理(lǐ)論和技(jì )術。


從立體(tǐ)視覺的角度來說,自動駕駛要做的是識别出某個物(wù)體(tǐ),然後判斷,不能(néng)撞上去。而非通過海量的數據告訴機器:人不能(néng)撞、動物(wù)不能(néng)撞、牆不能(néng)撞……甚至要細化到某個物(wù)體(tǐ)的不同形狀和各種實際使用(yòng)時的路況。


深度學(xué)習方法的使用(yòng)在很(hěn)多(duō)實際領域取得了很(hěn)好的效果。例如人臉識别、圖像識别、醫(yī)學(xué)影像等。但這不是機器學(xué)習的全部,我們不能(néng)神話這個方法。理(lǐ)論需要探索和突破,尤其是對于方興未艾的人工(gōng)智能(néng)來講。條條道路通羅馬,但一定要走在通往羅馬的道路上。簡單的拿(ná)來主義不具(jù)有(yǒu)長(cháng)期的延續性。從這個角度講,要實現智能(néng)視覺的道路還很(hěn)長(cháng)。 


機器智能(néng)要發展,還得靠視覺


董霄劍将偉景智能(néng)的産(chǎn)品比作(zuò)機器智能(néng)的眼睛,如果機器智能(néng)要發展,第一步是要發展智能(néng)視覺,而現階段還隻是智能(néng)視覺的起步階段。


客觀來說,5G時代來臨之後會極大推動科(kē)技(jì )行業的發展。5G主要解決了兩個問題,首先是數據的超高速傳輸,讓所有(yǒu)大數據能(néng)高速彙集到某端點。第二點是極大縮短時延響應,提高響應速度。5G對機器智能(néng)會有(yǒu)極大的推動作(zuò)用(yòng),例如基于場景的快速訓練和認知如自動駕駛。會拓展數據量很(hěn)大的立體(tǐ)視覺圖像的傳輸及智能(néng)化綜合應用(yòng),因此,5G技(jì )術對智能(néng)立體(tǐ)視覺的發展有(yǒu)直接的推動作(zuò)用(yòng)。 


1555386829218217.bmp

立體(tǐ)視覺實現機器識别不同形狀并放置在指定區(qū)域


而要通過智能(néng)視覺實現的機器的智能(néng)程度,董霄劍以桌面上三台手機舉例,我告訴機器人,把我的手機拿(ná)過來。“這裏涉及到了機器智能(néng)兩個層面的認知,首先是視覺層面的快速認知,機器人能(néng)通過立體(tǐ)視覺迅速識别出桌上的手機,同時,在三台手機中(zhōng),認出桌上哪一台是我的手機。另一個層面是語音識别,能(néng)夠讓機器人将語言詞彙和物(wù)體(tǐ)認知結合在一起,并實現操作(zuò),這才是機器智能(néng)和智能(néng)視覺要實現的目标之一。”


“智能(néng)視覺是從感知層面上升到認知層面,再回歸到感知層面,讓機器人不僅看到世界,還能(néng)看懂世界。”董霄劍的總結和《齊馬的藍》中(zhōng)機器人齊馬通過感知所描繪出絢爛畫作(zuò)不謀而合。


而動畫中(zhōng)的齊馬甚至更進一步,通過感知勘破了世間萬物(wù),最終選擇了回歸本源,回歸最真實的自己。 


文(wén)章原文(wén)鏈接:https://mp.weixin.qq.com/s/38pC38BhI3tztDXOmbumdg