Xtecher:Vizum董霄劍:給機器一雙眼,2米内視覺誤差小(xiǎo)于1毫米

來源:Xtecher時間:2017-06-16

蕭伯納曾說過,你看見一樣東西就會問“為(wèi)什麽”,而我會夢想那些還未出現的東西,并且問“為(wèi)什麽不?”。


當為(wèi)所有(yǒu)機器人裝(zhuāng)上一雙眼睛的夢想呈現在董霄劍面前時,他(tā)問自己:為(wèi)什麽不呢(ne)?

作(zuò)者|安(ān)妮的盒子

編輯|小(xiǎo)魚、甲小(xiǎo)姐

網址|www.xtecher.com

微信公(gōng)衆号ID|Xtecher


眼睛是心靈的窗戶,是人類獲取外部信息最重要的感覺器官。而董霄劍要做的事,是給機器人都裝(zhuāng)上一雙智慧的眼睛,讓它們看懂這個世界。


于是他(tā)做出一個重要的決定——進軍人工(gōng)智能(néng)領域,專攻立體(tǐ)智能(néng)視覺。


1537960860297027.jpg

原展訊通信首席科(kē)學(xué)家、偉景智能(néng)( Vizum)CEO董霄劍


2016年6月3日,董霄劍放棄令許多(duō)人羨慕的高薪、高管職位,全身心地投入到這項事業中(zhōng)去,創辦(bàn)了專注研究和發展機器視覺的北京偉景智能(néng)科(kē)技(jì )有(yǒu)限公(gōng)司(以下簡稱Vizum)。


走進董霄劍的辦(bàn)公(gōng)室,一本《圖像處理(lǐ)、分(fēn)析與機器視覺》和其它的一些技(jì )術資料躺在他(tā)的辦(bàn)公(gōng)桌上。


“這裏面沒有(yǒu)我想要的答(dá)案。”董霄劍告訴Xtecher記者。


這是一個全新(xīn)的挑戰,答(dá)案的确無處可(kě)尋,隻有(yǒu)做出真正的創新(xīn)才能(néng)獲得打開這扇“心靈之窗”的鑰匙。創業後的董霄劍已經做好絕不回頭的打算。


輕松的事情,都不叫創新(xīn)


這位在展訊曆史上不多(duō)的、上上下下都稱之為(wèi)“董博”的首席科(kē)學(xué)家總是喜歡看“大勢”,并且頭腦極其活躍,是個極緻的思考者。


很(hěn)多(duō)人都是通過“AlphaGo”知道的人工(gōng)智能(néng),但董霄劍卻并非“随大溜”。事實上,早在2011年,時任展訊通信首席科(kē)學(xué)家的董霄劍在考慮展訊技(jì )術發展計劃時就大膽提出:要大力發展人工(gōng)智能(néng)!而當時,他(tā)主要看好的就是人臉識别的巨大市場前景。


這在當時絕對算得上是一件非常超前的事了,那時很(hěn)多(duō)人甚至要特别去搜索一下人工(gōng)智能(néng)為(wèi)何物(wù);還有(yǒu)的人則認為(wèi),在中(zhōng)國(guó)發展人工(gōng)智能(néng)是想都不敢想的事情。


董霄劍卻很(hěn)堅定,他(tā)相信這是高科(kē)技(jì )公(gōng)司早晚要去涉足的領域,且随着各種算法性能(néng)和芯片處理(lǐ)能(néng)力的提升,人工(gōng)智能(néng)一定會大放異彩。除此之外,他(tā)還開始思考人工(gōng)智能(néng)最應該解決什麽樣的問題。


他(tā)觀察到,現在行業内做視覺識别的,多(duō)半是從一個角度形成機器對物(wù)體(tǐ)的平面識别,可(kě)人類看到的事物(wù)一定是立體(tǐ)的,單從這一點來看,平面就注定無法讓物(wù)體(tǐ)擁有(yǒu)類人水平的視覺識别能(néng)力。


除此之外,如何在“看”世界後,讓機器真正“看懂”世界,這就要求視覺識别在基于感知層、認知層的層面上擁有(yǒu)進一步的“思考能(néng)力”,包括信息處理(lǐ)以及機器自我語言處理(lǐ)。想要讓未來的機器人理(lǐ)解和傳遞信息,必須從“教會”機器人“看懂”這個世界開始。


一個始終萦繞在董霄劍腦海中(zhōng)的問題,什麽樣的眼睛才能(néng)幫助機器人真正看清、看懂這個世界?


“首先它要是‘一雙’才行,人類進化幾千年形成現在的器官形态,是一件很(hěn)美妙的事情,也是大自然最為(wèi)合理(lǐ)的構造,所以機器人的眼睛也應該是雙目/多(duō)目的。”董霄劍說,“并且它還應該是立體(tǐ)的、彩色的,且一定是高精(jīng)度、可(kě)量化的。我們的智能(néng)視覺不僅是表面簡單的圖像分(fēn)類,而是能(néng)智能(néng)地解決實際的應用(yòng)問題。 ”


顯然董霄劍要做的是核心的統一化的立體(tǐ)智能(néng)視覺技(jì )術和産(chǎn)品,是突破性的理(lǐ)論和産(chǎn)品創新(xīn)。這樣的要求對技(jì )術和理(lǐ)論的挑戰非常大,傳統的應用(yòng)于機器人的視覺技(jì )術可(kě)以簡單的概括為(wèi)“有(yǒu)認知無立體(tǐ),有(yǒu)立體(tǐ)無認知”。


長(cháng)期從事通信芯片系統和算法研究使他(tā)有(yǒu)着深厚的信号處理(lǐ)理(lǐ)論功底。他(tā)所具(jù)有(yǒu)的跨學(xué)科(kē)綜合理(lǐ)論技(jì )術——雷達信号處理(lǐ)+通信信号處理(lǐ)+圖像信号處理(lǐ)+芯片系統研究——使得Vizum能(néng)夠把各個領域的理(lǐ)論技(jì )術移花(huā)接木(mù)的應用(yòng)到視覺計算領域從而巧妙破解了這些技(jì )術障礙和難題并展現出可(kě)持續提高的技(jì )術路線(xiàn)。


“事實上,在未來的‘智能(néng)+物(wù)聯網+5G通信+芯片’的大潮中(zhōng)正好是我們大展身手的好機會。未來,我們會推出基于5G網絡的具(jù)有(yǒu)智能(néng)感知和認知的物(wù)聯網芯片,而機器的增強感知就從我們的智能(néng)眼開始。”


董霄劍所帶領的團隊不僅在智能(néng)圖像處理(lǐ)領域擁有(yǒu)深厚的理(lǐ)論基礎,而且在立體(tǐ)視覺、物(wù)體(tǐ)識别、深度學(xué)習的融合應用(yòng)上也擁有(yǒu)深厚的技(jì )術積累,加上他(tā)本人快速研發和實現産(chǎn)品化的能(néng)力,Vizum很(hěn)快得到業界和資本的關注。


2017年5月22日,Vizum完成來自産(chǎn)業領軍方的5000萬元人民(mín)币A輪融資,這是Vizum繼2016年底完成來自恒坤睿金、将門創投的數千萬級天使輪投資後,在半年的時間裏完成的第二次融資。


從六年前認定人工(gōng)智能(néng)領域的發展方向,到如今自己挂帥創立Vizum,一切看上去都順理(lǐ)成章而又(yòu)厚積薄發。而對于自己要做的事,他(tā)已經做好迎難克堅的準備:“這的确不是一個輕松的挑戰,偉大公(gōng)司的成功是需要用(yòng)難題做鋪路石的。”


别站在人群中(zhōng),要站在跑道上


碩士畢業的第一年,董霄劍就已經成為(wèi)百萬富翁。


那是1992年,最火的科(kē)技(jì )産(chǎn)品當屬腰間的尋呼機。和其他(tā)琢磨着如何攢下在當時不菲的一筆(bǐ)錢來買一台尋呼機的同齡人不同,雷達信号處理(lǐ)專業出身的董霄劍已自己動手做起尋呼機系統。

當時尋呼機的編碼卡都是國(guó)外設計和生産(chǎn),技(jì )術被卡着脖子,價格當然由别人定,成本百來塊的東西,國(guó)外産(chǎn)品的售價可(kě)以賣到3萬5千塊。


那一年,董霄劍就成為(wèi)國(guó)際一線(xiàn)廠商(shāng)在尋呼這塊業務(wù)上的最大勁敵。他(tā)敏銳感覺到這個市場機會,并用(yòng)了五個月的時間,自己親手焊闆子、寫代碼,硬是把尋呼機編碼卡給做出來了,售價隻有(yǒu)5000塊,價格是進口産(chǎn)品的零頭。由他(tā)創辦(bàn)的尋呼公(gōng)司所開發的編碼卡和尋呼軟件在華東地區(qū)的市場占有(yǒu)率一度高達30%。

 

1537960803521514.png

上世紀90年代初,尋呼機是最炫酷的科(kē)技(jì )産(chǎn)品


一個好玩的段子至今讓董霄劍記憶猶新(xīn)。”他(tā)喜歡打籃球,當時很(hěn)少人有(yǒu)手機,總是湊不齊人一起打球,于是他(tā)幹脆給幾個朋友各送了一台尋呼機,從此再也不愁打球湊不齊人了!”


四年後,拿(ná)到人生第一桶金的董霄劍面對許多(duō)機會和選擇,但他(tā)最終決定去東南大學(xué)攻讀無線(xiàn)電(diàn)工(gōng)程博士學(xué)位。總是着眼于大勢的他(tā)又(yòu)一次預見了時代的發展方向——移動通訊。


面對躁動的一切,能(néng)夠放棄漫天飛的鈔票而選擇重返校園深造,這在許多(duō)人看來實在不可(kě)思議。他(tā)描述,20年前,“大哥(gē)大”還是奢侈品,“下海”經商(shāng)的人極其活躍,我國(guó)的東南部率先富了起來,人們蠢蠢欲動,都希望抓住一夜暴富的機會。


“我始終覺得想要實現一個目标,必須全力以赴、心無旁貸。别站在人群中(zhōng),要站在跑道上!在專業領域和最牛的人一起做事情。”


博士畢業後,董霄劍憑借其深厚的技(jì )術積累、獨到的市場洞察力和對創新(xīn)的不懈追求,在2006年受邀加入了展訊通訊,擔任全新(xīn)的WD部門負責人,目标瞄準CMMB、WCDMA和WIMAX産(chǎn)品。


期間,他(tā)和他(tā)的團隊曾用(yòng)2個月時間研發出适應廣電(diàn)數字電(diàn)視廣播标準的CMMB系統設計方案,是“從拿(ná)到标準到系統設計完成”業界最快的經典案例之一。這款産(chǎn)品不僅各方面都滿足行業高标準,也是市場上第一顆CMMB的SOC芯片,到CMMB芯片量産(chǎn)隻用(yòng)了10個月。


2009年,為(wèi)了提高某款初期TD芯片在中(zhōng)移的外場測試中(zhōng)的通信性能(néng),董霄劍帶領30個左右的上海工(gōng)程師到北京,封閉式開發,從穿T-shirt的季節到穿棉襖的季節,最終實現了使用(yòng)此芯片的手機系列的入網和成功入庫。憑借在TD-SCDMA和CMMB項目開發上展現的技(jì )術實力和研發組織能(néng)力,董霄劍被任命為(wèi)展訊通信首席科(kē)學(xué)家,獲得了展訊最高技(jì )術級别,也成為(wèi)整個公(gōng)司那時唯一一個達到這一技(jì )術級别的人。


也正是從2009年起,董霄劍開始負責展訊全新(xīn)一代的TD-SCDMA\EDGE\GSM多(duō)模40nm芯片的系統算法設計,這款芯片将展訊多(duō)模芯片産(chǎn)品的性能(néng)提升到一個新(xīn)的高度,其通話穩定性和數據吞吐量都是行業第一,成為(wèi)展訊曆史上的經典。而後,董霄劍又(yòu)帶領的一個15人的算法團隊從标準開始進行LTE産(chǎn)品的系統設計,最終完成LTE的MODEM算法,軟硬件架構和射頻需求等設計。


1537960767472137.jpg

在展訊時的“董博”


從業近20年,讓董霄劍成為(wèi)移動通訊時代當之無愧的風雲人物(wù),也讓他(tā)愈加深刻地感受到:将一個研究的理(lǐ)論變成真正的産(chǎn)品,其付出、努力和艱辛要遠(yuǎn)遠(yuǎn)大于單純的技(jì )術“點”的突破,這要求實踐者不僅擁有(yǒu)深厚的理(lǐ)論知識,而且還需要他(tā)們熟悉産(chǎn)品的研發過程。


這一次,他(tā)又(yòu)站在了為(wèi)所有(yǒu)機器人和移動設備裝(zhuāng)上一雙類人的“眼睛”的賽道上,決意一搏。


最美好的願望,一定最瘋狂


人類文(wén)明的發展已經到了人工(gōng)智能(néng)時代,這是一個不以人的意志(zhì)為(wèi)轉移的時代。


在這樣一個産(chǎn)品化的時代,董霄劍認為(wèi),一個公(gōng)司和一個研究機構在實現一個偉大的産(chǎn)品上應有(yǒu)着天然的不同——最明顯的是公(gōng)司可(kě)以針對市場需求,系統地組織一項技(jì )術以及一個産(chǎn)品、吸收社會各種資源來做一件事情,而研究機構隻需要一個技(jì )術點就可(kě)以了,在這點上,純研究機構不太可(kě)能(néng)成為(wèi)偉大産(chǎn)品的創造者。


可(kě)身邊的人卻時常可(kě)以在如今的董霄劍身上看到一個在研究機構裏搞研究的人的身影——他(tā)鑽研成像的原理(lǐ),和自己的團隊讨論計算機視覺技(jì )術,甚至探索起光的本質(zhì)……


很(hěn)多(duō)人認為(wèi),給所有(yǒu)機器人和移動設備裝(zhuāng)上一雙類人的“眼睛”,讓他(tā)們能(néng)認知、理(lǐ)解外部世界,并最終實現真正的智能(néng),這聽上去更像是一個不可(kě)能(néng)完成的願望,美好又(yòu)瘋狂。

“就是要做别人想都不敢想的事。”董霄劍笑着說。


縱觀他(tā)的職業生涯,曆經三次大轉型,最讓人稱揚的是每次對時代發展脈絡的準确把握,從雷達到尋呼,從尋呼到手機,從手機到人工(gōng)智能(néng),每一次新(xīn)技(jì )術趨勢的到來,董霄劍都是這個領域積極活躍的前鋒。


能(néng)抓住機遇,發揮創新(xīn)者的潛質(zhì)、資質(zhì)、能(néng)力,成為(wèi)這個領域的弄潮兒,這讓他(tā)感到興奮。


如今,Vizum團隊核心成員皆來自國(guó)内外知名(míng)半導體(tǐ)公(gōng)司,在手機基帶芯片、物(wù)聯網、智能(néng)硬件等領域有(yǒu)大量成功開發案例,參與量産(chǎn)的芯片總計近20款,涉及通信及多(duō)媒體(tǐ),累計總銷量達數億片……


有(yǒu)了前沿的創新(xīn)理(lǐ)論、豐富的工(gōng)程經驗,加上團隊高效的執行力以及快速實現産(chǎn)品叠代的能(néng)力,成立半年的Vizum就在去年年底推出可(kě)市場化、應用(yòng)性高的機器智能(néng)眼産(chǎn)品——ViEye。


ViEye可(kě)以完成3D數據獲取和物(wù)體(tǐ)識别,主要聚焦于與機器人配合的工(gōng)業應用(yòng)場景。它給機器人和設備提供的不是一種簡單的數據羅列和視覺圖像,而是一個在其自我認知基礎上“看到”的立體(tǐ)而豐富的世界,并能(néng)根據特定需求自主呈現高精(jīng)度3D坐(zuò)标及高精(jīng)細度目标尺寸等量化信息,目前的産(chǎn)品2米内視覺誤差為(wèi)1毫米。随着認知能(néng)力和芯片集成度的不斷提高,ViEye的功能(néng)将不斷增強,機器人也會有(yǒu)越來越明亮和智慧的“眼睛”。


正如Vizum的預期,産(chǎn)業界對ViEye的反響極其強烈,“實際上,這是‘機器換人’強大趨勢的一個側面反映和必然的現實”董霄劍說。


1537960715873107.jpg

ViEye産(chǎn)品原型圖


而在董霄劍心中(zhōng),Vizum的産(chǎn)品還要挑戰更多(duō)。他(tā)告訴Xtecher,今年,ViEye産(chǎn)品應用(yòng)功能(néng)将擴展至3D場景重建、3D人臉識别和智能(néng)認知,滿足移動避障、環境認知等應用(yòng)的需求。


為(wèi)了這個既瘋狂又(yòu)美好的願望,他(tā)現在每天堅持快走,每周都會抽空去遊泳。“我們正在追求的目标很(hěn)遠(yuǎn)大也極富挑戰。”董霄劍堅信Vizum将會成為(wèi)一個偉大的機器智能(néng)公(gōng)司,為(wèi)此他(tā)必須保持精(jīng)力充沛。“我的投資人對我隻有(yǒu)一個要求,就是堅持運動。”


原文(wén)鏈接:http://www.xtecher.com/Xfeature/view?aid=6728