會員動態(tài) | 第一!科大訊飛再度刷新Cityscapes世界紀(jì)錄 32/64

發(fā)布日期:2021-08-27 10:54
喜報!科大訊飛憑借在道路目標(biāo)檢測領(lǐng)域多年的技術(shù)探索,刷新了Cityscapes 3D目標(biāo)檢測任務(wù)的全球最好成績,得到檢測分?jǐn)?shù)(DS)42.9,取得了該項評測的第一名。

這個獎項,有什么用?



來,簡單出道題:
上圖中,黑色車體是否越過了交通線?
答案 —— 當(dāng)然是沒有。

但對于機器來說,通過2D檢測外邊框和右側(cè)交通線相交(如白線所示),通過二維平面相交關(guān)系判斷,會認(rèn)定車輛壓線行駛。

科大訊飛將2D目標(biāo)檢測技術(shù)升級至3D,從三維的檢測結(jié)果分析,能夠判斷出車體并沒有越過交通線(如彩線所示)。

此次,是科大訊飛繼2017年、2018年參與測評之后,再一次刷新Cityscapes的世界紀(jì)錄。



此次評測,科大訊飛借鑒了已在城市交通出行場景下應(yīng)用的Anchor-Free車輛檢測技術(shù),將2D目標(biāo)檢測技術(shù)升級至3D,并結(jié)合3D到2D重投影的特殊先驗信息進行算法遷移。

通過結(jié)合語義、上下文信息、位置先驗信息以及目標(biāo)形狀先驗信息等,提取精確的3D目標(biāo)檢測框,構(gòu)建形成一套具有豐富上下文信息的多層次單目3D目標(biāo)檢測方案。
 
什么是Cityscapes和3D目標(biāo)檢測任務(wù)?

我們知道,在深度學(xué)習(xí)圖像語意分割的訓(xùn)練過程中,需要有數(shù)據(jù)集及分好類的標(biāo)簽,這樣才可以讓神經(jīng)網(wǎng)絡(luò)進行學(xué)習(xí),進而訓(xùn)練出模型。

Cityscapes便是包含城市大量街道圖片、視頻用來訓(xùn)練識別的數(shù)據(jù)集。

由戴姆勒(DAIMLER)等在內(nèi)的三家德國單位聯(lián)合提供,吸引了華為、阿里、微軟、北大、中科院、MIT等上百個國內(nèi)外著名AI實驗室和頂尖學(xué)術(shù)研究機構(gòu)積極參與,是CVPR、ECCV等國際頂級會議中實例分割任務(wù)常用的權(quán)威測試數(shù)據(jù)集。

2020年,在CVPR workshop上,Cityscapes公開了新的單目圖像3D目標(biāo)檢測評測集,包含car, truck, bus, train, bicycle, motorcycle共6種類別目標(biāo)。

每種目標(biāo)需要檢測出其在空間中的三維坐標(biāo)位置,目標(biāo)的長、寬、高以及目標(biāo)在空間中的旋轉(zhuǎn)姿態(tài)。基于視覺的3D目標(biāo)檢測,是圖像處理和計算機視覺領(lǐng)域的重要研究方向之一。



基于視覺的3D目標(biāo)檢測有什么重要意義?

基于科大訊飛在AI+3D視覺技術(shù)的結(jié)合探索之下,未來3D目標(biāo)檢測將能在城市治理、工業(yè)智能、機器智能、智能駕駛等多方面發(fā)揮廣泛的作用:

  • 提供參考:通過三維目標(biāo)檢測技術(shù),可以感知目標(biāo)的三維尺寸信息、空間位置;
  • 精準(zhǔn)判斷:通過空間位置感知,可以更精準(zhǔn)地判斷目標(biāo)和參照物之間的位置關(guān)系。

比如,在城市交通管理場景中,當(dāng)前交通違法判定主要還是依靠固定攝像頭抓拍、二維圖像判定的方式,往往存在視覺盲區(qū)。若將3D目標(biāo)檢測技術(shù)接入公安交警現(xiàn)有的交通視頻智能分析平臺,與AI巡檢相結(jié)合,可以進一步精確判定車輛車型。

基于空間位置感知和連續(xù)軌跡跟蹤,計算出車輛的行駛速度、空間軌跡等,為越斑馬線停車、超速抓拍、擁堵感知等違法異常事件判斷提供更實時、更精準(zhǔn)的決策依據(jù)。

這不僅能夠達到對已有設(shè)備資源的最大化利用,實現(xiàn)降本提效,還能夠提升城市數(shù)字化治理能力,助力文明出行、平安出行。

AI賦能,建設(shè)美好世界

如何讓機器變得更加“聰明”,具備足夠的學(xué)習(xí)能力,并更精準(zhǔn)地貼合現(xiàn)實使用需求,是所有人工智能研發(fā)團隊所需解決的最大難題。

科大訊飛直面檢測精細度更高、場景更為復(fù)雜、挑戰(zhàn)難度更大的3D目標(biāo)檢測任務(wù),并一舉刷新了世界紀(jì)錄,意味著科大訊飛已經(jīng)具備了強大的AI技術(shù)硬核實力。

多年來,科大訊飛在人工智能領(lǐng)域百花齊放,在基于深度學(xué)習(xí)的通用核心技術(shù)上厚積薄發(fā)。

不僅在智能語音、機器翻譯等大眾熟悉的領(lǐng)域上在多項國際權(quán)威賽事上取得第一,實際上,科大訊飛在教育圖文、人臉識別等計算機視覺領(lǐng)域也深耕多年,并已運用在教育、醫(yī)療、金融等多個行業(yè)。

未來,科大訊飛將繼續(xù)堅持源頭技術(shù)創(chuàng)新路線,秉持“頂天立地”的理念,加快開放應(yīng)用場景,促進AI技術(shù)和各種應(yīng)用場景相結(jié)合,加速人工智能技術(shù)落地,建設(shè)美好世界。


科大訊飛股份有限公司簡介
科大訊飛股份有限公司成立于1999年,是亞太地區(qū)知名的智能語音和人工智能上市企業(yè)。自成立以來,長期從事語音及語言、自然語言理解、機器學(xué)習(xí)推理及自主學(xué)習(xí)等核心技術(shù)研究并保持了國際前沿技術(shù)水平;積極推動人工智能產(chǎn)品研發(fā)和行業(yè)應(yīng)用落地,致力讓機器“能聽會說,能理解會思考”,用人工智能建設(shè)美好世界。