近日,大華股份基于深度學習的雙目立體匹配算法,刷新了KITTI Vision Benchmark中雙目立體匹配競賽的最好成績,超越了其它一流AI公司和頂尖的學術研究機構,以及ICCV、ECCV、CVPR相關論文中的雙目立體匹配研究成果,這標志著大華股份在雙目立體匹配算法領域處于領先水平。
大華股份在AI技術領域持續(xù)耕耘與創(chuàng)新,不斷提升算法、算力的核心競爭力。2018年,大華股份取得道路分割、車輛跟隨、多目標跟蹤、3D目標檢測、人體檢測、車輛檢測、場景流、光流、行人檢索等12項全球AI排行榜第一;2019年,大華股份取得行人重識別、目標實例分割、圖像語義分割、步態(tài)識別、遙感圖像分析等十項全球AI排行榜第一。2020年初,大華股份在 MIT Scene Parsing Benchmark場景解析任務中取得了第一。本次在雙目立體匹配算法領域再次取得新突破。大華股份積極加速AI技術成果向現(xiàn)實生產力轉化,賦能行業(yè)智能化升級。
大華股份AI最新雙目立體匹配算法評測全球排名第一(提交時間:2020.04.07)
(截圖來源:www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=stereo)
關于KITTI:
KITTI數(shù)據(jù)集由德國卡爾斯魯厄理工學院和豐田美國技術研究院聯(lián)合創(chuàng)辦,是目前國際上最大的計算機視覺算法評測數(shù)據(jù)集之一。數(shù)據(jù)集用于評測立體匹配(stereo)、光流(flow)、場景流(sceneflow)、視覺里程計(visual odometry)、物體檢測(object detection)和跟蹤(tracking)、道路分割(road)、語義分割(semantics)等計算機視覺技術在車載環(huán)境下的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù),每張圖像中最多包含15輛車和30個行人,且存在不同程度的遮擋與截斷。
雙目立體匹配:
雙目立體匹配是場景三維感知的重要手段,在3D重建,智能機器人、自動駕駛、AR等領域中有著廣泛的應用。雙目立體匹配算法通過對左右目相機拍攝的圖像進行相似性匹配,并獲得視差圖,隨后根據(jù)立體幾何原理推測場景深度。
在本次國際測評中,大華基于自主研發(fā)的深度學習平臺,開發(fā)了一種基于深度神經網絡的立體匹配算法。該算法采用了ASPP的結構對輸入圖像進行多尺度特征提取,并將傳統(tǒng)的SGM算法融入到神經網絡中。此外,在訓練過程中加入了額外的自監(jiān)督學習策略,有效地提高了算法的精度。
輸入圖像(一)
可視化視差圖(一)
誤差圖(一)
輸入圖像(二)
可視化視差圖(二)
誤差圖(二)
△以上圖片為該國際權威評測數(shù)據(jù)集的立體匹配算法效果圖
大華實際產品和未來產品中的應用
➢室外3D重建:
場景視差圖
➢起立檢測:
場景視差圖
本次評測中使用的技術已在大華雙目攝像機等產品中得到應用,提升了雙目攝像機的捕獲目標深度數(shù)據(jù)、目標分離等性能,賦能場景化應用價值。