【ZiDongHua之“創(chuàng)新自化成”收錄關(guān)鍵詞:機器視覺 機器人 智能駕駛 元宇宙
 
  助力具身智能,機器視覺取得新突破|產(chǎn)業(yè)新“秀”
 
  轉(zhuǎn)載自:上海嘉定
 
  家政機器人可以精準拿起桌面的杯子,清潔好再準確地放回去;咖啡機器人可以像真人服務員一樣,把做好的咖啡遞到顧客手里……在具身智能的發(fā)展過程中,機器視覺起著至關(guān)重要的作用。
 
  近日,位于菊園新區(qū)“嘉定科創(chuàng)核”的科研院所中國科學院上海微系統(tǒng)與信息技術(shù)研究所在機器視覺領(lǐng)域取得重要進展,該所仿生視覺系統(tǒng)實驗室李嘉茂研究員團隊提出全新雙目立體深度估計方法,可有效提升視差預測效率和精度。
 
  機器視覺與人類視覺原理相似,分別單獨使用左右眼去觀察一個物體。被視物體在兩個視角中的相對位置會存在一定的偏移,人類視覺系統(tǒng)可以根據(jù)偏移去判斷該物體的距離遠近。機器視覺則使用圖像采集機器模擬人眼,通過算法來判斷物體的大小以及相互間的距離,并根據(jù)結(jié)果控制設(shè)備的動作。該技術(shù)是自主智能機器人、智能駕駛、元宇宙、工業(yè)檢測、醫(yī)療自動化等眾多領(lǐng)域的基礎(chǔ)關(guān)鍵技術(shù)。
 
  以往,在機器視覺進行距離判斷的過程中,對采集的圖像有著十分嚴格的精度標準。但是在實際應用環(huán)境中,圖像采集往往會受到諸如碰撞、機械振動和溫度變化等因素的影響,導致參數(shù)發(fā)生偏移,從而顯著降低估計精度,甚至導致算法的崩潰。
 
  “雙目深度估計的主流做法是在使用前進行離線標定,對標定與校正精度要求也很高,如果在使用中出現(xiàn)問題就需要返廠重新標定,這在很多應用中是不現(xiàn)實的。”李嘉茂研究員介紹,團隊另辟蹊徑,基于頻率濾波,降低對高標準圖像的依賴性,提出全新的立體匹配方法進行預估。
 
 
  在自采集數(shù)據(jù)集上,團隊算法顯著提升視差預測精度
 
  頻率濾波是常用的數(shù)字圖像技術(shù),通過改變圖像中不同頻率的成分,達到圖像增強、去噪等目的。全新立體匹配方法在添加合成誤差的公開數(shù)據(jù)集KITTI2015、KITTI2012、Middlebury、ETH3D和帶有真實誤差的自采集數(shù)據(jù)上進行驗證,均表現(xiàn)了良好的性能,有效保證了視差預測精度。
 
  據(jù)介紹,中國科學院上海微系統(tǒng)與信息技術(shù)研究所仿生視覺系統(tǒng)實驗室主要開展無人系統(tǒng)視覺感知、芯片及系統(tǒng)關(guān)鍵技術(shù)研究及應用。“目前,具身智能、低空經(jīng)濟等未來產(chǎn)業(yè)快速發(fā)展,雙目視覺微系統(tǒng)具有較為廣闊的應用空間。我們提出的新方法不依賴此前的預處理,能更好地保證應用的穩(wěn)定性。”李嘉茂說。
 
 
  中國科學院上海微系統(tǒng)與
 
  信息技術(shù)研究所雙目視覺微系統(tǒng)
 
  歡迎轉(zhuǎn)發(fā),但請注明出處“上海經(jīng)信委”