《機器視覺》雜志(zhì)專訪偉景智能(néng) CEO 董霄劍博士

來源:偉景智能(néng)時間:2023-05-18

1684376149125258.jpg

有(yǒu)一顆始終仰望星空的情懷,才能(néng)使目光所及更長(cháng)遠(yuǎn)。偉景智能(néng)一直憧憬着機器人與人類共存的世界,并堅信未來必定有(yǒu)機器人一席之地。他(tā)們緻力于為(wèi)機器人賦予“慧眼”,創造機器人的感知和認知,并以機器視覺為(wèi)着力點推動機器人“自然學(xué)習”。近日,北京偉景智能(néng)科(kē)技(jì )有(yǒu)限公(gōng)司創始人董霄劍做客《機器視覺》雜志(zhì),分(fēn)享了他(tā)的“慧眼”與機器人“藍圖”。



01從平面視覺到立體(tǐ)視覺

2015年,AlphaGo尚未出現,技(jì )術的積累造成一個突變,那就是人工(gōng)智能(néng),董霄劍敏銳地感覺到人工(gōng)智能(néng)的潮水正在洶湧而來。在那時董霄劍就決定做機器人,并認定未來是機器人的世界,而機器人的必然選項就是具(jù)有(yǒu)一雙主導操作(zuò)的 “慧眼”,讓他(tā)們像人一樣去生活和工(gōng)作(zuò)。機器人對視覺“感知”的需求一定是“立體(tǐ)的”+“彩色的”,以其團隊在芯片行業的從業經驗,董霄劍及其團隊成立了一家立體(tǐ)視覺公(gōng)司,先做标準化的通用(yòng)視覺産(chǎn)品,直至做成芯片形式的産(chǎn)品,進而滿足機器人的視覺認知需求。


“在我們創業的時候,那時的機器視覺領域普遍是應用(yòng)在工(gōng)業生産(chǎn)流水線(xiàn)上的平面視覺,生産(chǎn)線(xiàn)中(zhōng)的瑕疵檢測被很(hěn)多(duō)廠家作(zuò)為(wèi)經典案例,例如宣傳自己的精(jīng)度、識别率、識别速度等,然而面對更為(wèi)複雜的場景,如自動駕駛等需要機器識别并作(zuò)出判斷的場景,簡單的平面識别已不再适用(yòng)。”董霄劍回憶道。


基于這樣的痛點,偉景自主研發了基于“立體(tǐ)視覺+自然學(xué)習(Natural Learning®)”的雙目智能(néng)視覺技(jì )術,具(jù)備可(kě)認知、可(kě)學(xué)習、累積性、疊加性等特性,幫助機器人更好地感知立體(tǐ)世界。“我們要做的是從機器的角度去看,而不是讓機器幫你看。簡單解釋,即讓機器自主識别,作(zuò)出判斷,給出反饋,而非簡單為(wèi)人類實現更細緻的檢測或觀察。那隻能(néng)被稱為(wèi)‘放大鏡’,而不是真正的機器眼”,董霄劍說。


偉景始終秉承“做突破的事情,做創新(xīn)的事情”,偉景智能(néng)提供的産(chǎn)品實際上是“硬件+平台”的戰略。所以技(jì )術方面,從立體(tǐ)視覺的可(kě)見光智能(néng)感知相機,到基于線(xiàn)激光的高精(jīng)度RGBD相機,都具(jù)有(yǒu)“前端智能(néng)、大景深、大視野、高速度、高精(jīng)度、抗反光、抗強光”的特點,現階段一款産(chǎn)品同時具(jù)備以上特點是相當領先的。此外,偉景智能(néng)還提供豐富的SDK(軟件開發工(gōng)具(jù)包),在産(chǎn)品工(gōng)業化方面也進行了攻克。偉景智能(néng)産(chǎn)品均為(wèi)标準工(gōng)業級相機,産(chǎn)品設計的接口、細節、高低溫測試都始終堅持精(jīng)益求精(jīng)。



02立體(tǐ)視覺與人形機器人

人工(gōng)智能(néng)時代的大門已經敞開,人類的生活方式即将開始發生巨大的變化,偉景發展戰略聚焦于“立體(tǐ)視覺”+“人形機器人”雙輪驅動,于2017年9月成立陝西偉景機器人科(kē)技(jì )有(yǒu)限公(gōng)司(英文(wén)名(míng)“ViHero”),專注于人形智能(néng)機器人的研發。于2019年9月研發完成第一代人形智能(néng)服務(wù)機器人(創世紀版),并于同年10月在世界機器人大會上進行了産(chǎn)品首發。


董霄劍認為(wèi),人形機器人是最為(wèi)人類接受及最适應人類生活及情感的形态,是家庭服務(wù)機器人的終極目标。ViHero就是這樣一款人形智能(néng)機器人,偉景機器人賦予“她”人的形态及人的功能(néng),她可(kě)以與人建立起友好的交互方式,成為(wèi)人類最好的朋友和最親密的助手,今天她已經真實地展現在我們面前。說起ViHero,記者可(kě)以感覺到董霄劍将ViHero當做一個真正的“人”來對待,而非一款産(chǎn)品。


據介紹,ViHero機器人是一款全新(xīn)的面向社會和家庭的專業級人形智能(néng)服務(wù)機器人,她集各類智能(néng)技(jì )術于一身,包括機器人本體(tǐ)、機器視覺、語義解析、人機交互、運動控制、智能(néng)抓取以及自然學(xué)習、大數據、雲端控制等内容。不僅可(kě)以廣泛應用(yòng)于迎賓、講解以及訓練等場景,還可(kě)以進入社區(qū)和家庭,深度參與我們日常的工(gōng)作(zuò)和生活,比如輔助老人起居及看護孩童陪伴學(xué)習等。


偉景機器人所融入的技(jì )術體(tǐ)現在“腦”、“身體(tǐ)”、“眼”、“手”、“聽”、“說”等各個功能(néng),其中(zhōng)有(yǒu)很(hěn)多(duō)創新(xīn)和獨創性的技(jì )術。具(jù)體(tǐ)體(tǐ)現在機器人身上的機械結構、部件設計、智能(néng)控制、視覺伺服和智慧學(xué)習等,累計知識産(chǎn)權多(duō)達150餘項。以ViHero具(jù)有(yǒu)的獨創的視覺伺服控制技(jì )術為(wèi)例,該技(jì )術采用(yòng)了偉景自主研發的智能(néng)立體(tǐ)視覺技(jì )術,使得ViHero真正成為(wèi)替人類工(gōng)作(zuò)幹活的智能(néng)服務(wù)機器人,而不是隻會對話的智能(néng)音箱。



1684376211208632.jpg


03基于自動機器學(xué)習的立體(tǐ)視覺智能(néng)認知技(jì )術

據董霄劍與記者介紹道,偉景研發的“基于自動機器學(xué)習的立體(tǐ)視覺智能(néng)認知技(jì )術”是一種更接近人以及機器人的自然認知能(néng)力,是基于理(lǐ)解式的自學(xué)習過程,無需經過前期大量圖片的認知及訓練,是通過物(wù)體(tǐ)自然特征進行快速學(xué)習的人工(gōng)智能(néng)技(jì )術。具(jù)備彩色、立體(tǐ)、高精(jīng)度、可(kě)描述、可(kě)量化、自我學(xué)習、數據共享、數據傳輸的智能(néng)化感知及認知能(néng)力,通過立體(tǐ)相機采集并處理(lǐ)得到的立體(tǐ)深度數據進行智能(néng)化的識别、認知、定位功能(néng),并可(kě)為(wèi)機器人提供一雙可(kě)引導操作(zuò)的智能(néng)化眼睛。在應用(yòng)上,可(kě)通過該技(jì )術進行三維空間的物(wù)體(tǐ)定位、物(wù)體(tǐ)識别、機器人引導、物(wù)體(tǐ)測量、物(wù)體(tǐ)計數、物(wù)體(tǐ)表面缺陷檢測等,比現有(yǒu)市面上的二維平面視覺技(jì )術更具(jù)有(yǒu)數據信息多(duō)樣性及快速學(xué)習能(néng)力等。


提及偉景基于“Natural Learning®”自然學(xué)習體(tǐ)系及立體(tǐ)視覺技(jì )術,董霄劍告訴記者公(gōng)司已開發了多(duō)款3D立體(tǐ)視覺相機和解決方案系統。其中(zhōng),3D立體(tǐ)視覺相機包括智光眼、極光眼、智能(néng)眼、RGBD彩色立體(tǐ)相機;應用(yòng)領域涉及工(gōng)業自動化、智慧礦山(shān)、鋼鐵冶金、鐵路、智慧農業等行業,已經完成300+個落地化智能(néng)視覺開發項目,客戶覆蓋50+家國(guó)内外上市公(gōng)司及央企。依靠自然學(xué)習的方法使偉景智能(néng)在這些領域中(zhōng)快速推出适合場景的解決方案。例如,物(wù)流包裹分(fēn)揀、輸送機流量體(tǐ)積監控系統,鋼筋計數系統,鋼筋自動焊标系統,高線(xiàn)挂标自動定位系統,高鐵吊弦檢測系統,全方位人體(tǐ)彩色3D建模系統,立體(tǐ)視覺引導機械臂抓取系統等。同時自主研發的立體(tǐ)智能(néng)視覺技(jì )術及産(chǎn)品鞏固了偉景立體(tǐ)智能(néng)視覺在市場中(zhōng)的創新(xīn)者地位。



1684376233310648.jpg


04緊貼市場,布局未來

随着市場的開放,國(guó)内機器視覺技(jì )術水平将會得到快速發展,在過去10年中(zhōng)國(guó)内企業機器視覺理(lǐ)論和産(chǎn)品化上均取得較大進步的基礎上,随着中(zhōng)國(guó)智能(néng)制造的快速發展,尤其是機器換人,其中(zhōng)包括人形機器人快速應用(yòng),以市場化為(wèi)主導機器視覺企業産(chǎn)品得到實質(zhì)性提高。面對這樣的趨勢,董霄劍透露道,未來幾年偉景智能(néng)将繼續在飛虎平台、手持式三維掃描儀、人形機器人三個方向重點布局,并對此做了詳細介紹。


随着工(gōng)業生産(chǎn)更加多(duō)樣化、非标化,機器人能(néng)夠勝任更複雜的工(gōng)作(zuò),機器人不僅要有(yǒu)更好、更快的控制系統,還需具(jù)備一雙感知及認知環境的眼睛。飛虎平台快速的應用(yòng)開發對于潛在客戶非常重要。目前廣泛應用(yòng)于鋼筋自動化焊标、盤條挂标、耐火磚自動化抓取、鋼闆自動化抓取等場景。對于機械臂抓取操作(zuò)過程來說,找到抓取點的位置和姿态方向,吊裝(zhuāng)應用(yòng)時找到吊鈎的位置和吊取方向等,都需要基于立體(tǐ)視覺的智能(néng)化開發過程。這些過程具(jù)有(yǒu)統一的流程,而飛虎平台就是能(néng)解決統一化、規範化、标準化的流程問題的平台系統。


偉景即将推出的手持式三維掃描儀是一款全新(xīn)硬件平台,它主要布控在智慧工(gōng)地等方面。如鋼筋計數,目前工(gōng)地常用(yòng)的方法是人工(gōng)盤點,存在着計數數量大、耗時長(cháng)、容易出錯等問題,并且不符合生産(chǎn)透明化,智慧工(gōng)地的要求。市面上現有(yǒu)的解決方案,采用(yòng)平面視覺拍照原理(lǐ),利用(yòng)手機照片做處理(lǐ)計數,計數準确率不足90%,遠(yuǎn)遠(yuǎn)滿足不了實際需求。而偉景的手持式三維掃描儀具(jù)備便攜、高集成、移動化的特點,結合算法功能(néng),可(kě)以将公(gōng)司産(chǎn)品應用(yòng)範圍從B端拓展到小(xiǎo)B端,直接用(yòng)戶可(kě)以是建築工(gōng)地、鋼筋分(fēn)銷商(shāng)、智慧工(gōng)地集成商(shāng)等,産(chǎn)品銷售模式靈活性很(hěn)高。


偉景智能(néng)仍會繼續強化人行機器人,在ViHero第一代的基礎上,公(gōng)司将繼續提升視覺伺服的精(jīng)度、可(kě)靠性;加強機器臂和機器手的靈活性;通過引入ChatGPT為(wèi)代表的語言大模型,快速提高ViHero與人類的交互體(tǐ)驗,完成下一代ViHero的真正商(shāng)業化落地。


“偉大的創造不僅僅在于它的功能(néng),而在于它能(néng)夠打開人們的聯想,讓改變自主發生。”采訪臨近結束,董霄劍總結道,“偉景智能(néng)絕不是僅僅為(wèi)了實現某一功能(néng)而去創造,而是始終将機器人看作(zuò)是一個能(néng)夠自我成長(cháng)的物(wù)種,并堅定地在創造機器人的感知和認知。”