會(huì)員動(dòng)態(tài) | 第一!科大訊飛再度刷新Cityscapes世界紀(jì)錄 32/64

發(fā)布日期:2021-08-27 10:54
喜報(bào)!科大訊飛憑借在道路目標(biāo)檢測(cè)領(lǐng)域多年的技術(shù)探索,刷新了Cityscapes 3D目標(biāo)檢測(cè)任務(wù)的全球最好成績(jī),得到檢測(cè)分?jǐn)?shù)(DS)42.9,取得了該項(xiàng)評(píng)測(cè)的第一名。

這個(gè)獎(jiǎng)項(xiàng),有什么用?



來(lái),簡(jiǎn)單出道題:
上圖中,黑色車(chē)體是否越過(guò)了交通線?
答案 —— 當(dāng)然是沒(méi)有。

但對(duì)于機(jī)器來(lái)說(shuō),通過(guò)2D檢測(cè)外邊框和右側(cè)交通線相交(如白線所示),通過(guò)二維平面相交關(guān)系判斷,會(huì)認(rèn)定車(chē)輛壓線行駛。

科大訊飛將2D目標(biāo)檢測(cè)技術(shù)升級(jí)至3D,從三維的檢測(cè)結(jié)果分析,能夠判斷出車(chē)體并沒(méi)有越過(guò)交通線(如彩線所示)。

此次,是科大訊飛繼2017年、2018年參與測(cè)評(píng)之后,再一次刷新Cityscapes的世界紀(jì)錄。



此次評(píng)測(cè),科大訊飛借鑒了已在城市交通出行場(chǎng)景下應(yīng)用的Anchor-Free車(chē)輛檢測(cè)技術(shù),將2D目標(biāo)檢測(cè)技術(shù)升級(jí)至3D,并結(jié)合3D到2D重投影的特殊先驗(yàn)信息進(jìn)行算法遷移。

通過(guò)結(jié)合語(yǔ)義、上下文信息、位置先驗(yàn)信息以及目標(biāo)形狀先驗(yàn)信息等,提取精確的3D目標(biāo)檢測(cè)框,構(gòu)建形成一套具有豐富上下文信息的多層次單目3D目標(biāo)檢測(cè)方案。
 
什么是Cityscapes和3D目標(biāo)檢測(cè)任務(wù)?

我們知道,在深度學(xué)習(xí)圖像語(yǔ)意分割的訓(xùn)練過(guò)程中,需要有數(shù)據(jù)集及分好類(lèi)的標(biāo)簽,這樣才可以讓神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),進(jìn)而訓(xùn)練出模型。

Cityscapes便是包含城市大量街道圖片、視頻用來(lái)訓(xùn)練識(shí)別的數(shù)據(jù)集。

由戴姆勒(DAIMLER)等在內(nèi)的三家德國(guó)單位聯(lián)合提供,吸引了華為、阿里、微軟、北大、中科院、MIT等上百個(gè)國(guó)內(nèi)外著名AI實(shí)驗(yàn)室和頂尖學(xué)術(shù)研究機(jī)構(gòu)積極參與,是CVPR、ECCV等國(guó)際頂級(jí)會(huì)議中實(shí)例分割任務(wù)常用的權(quán)威測(cè)試數(shù)據(jù)集。

2020年,在CVPR workshop上,Cityscapes公開(kāi)了新的單目圖像3D目標(biāo)檢測(cè)評(píng)測(cè)集,包含car, truck, bus, train, bicycle, motorcycle共6種類(lèi)別目標(biāo)。

每種目標(biāo)需要檢測(cè)出其在空間中的三維坐標(biāo)位置,目標(biāo)的長(zhǎng)、寬、高以及目標(biāo)在空間中的旋轉(zhuǎn)姿態(tài)?;谝曈X(jué)的3D目標(biāo)檢測(cè),是圖像處理和計(jì)算機(jī)視覺(jué)領(lǐng)域的重要研究方向之一。



基于視覺(jué)的3D目標(biāo)檢測(cè)有什么重要意義?

基于科大訊飛在AI+3D視覺(jué)技術(shù)的結(jié)合探索之下,未來(lái)3D目標(biāo)檢測(cè)將能在城市治理、工業(yè)智能、機(jī)器智能、智能駕駛等多方面發(fā)揮廣泛的作用:

  • 提供參考:通過(guò)三維目標(biāo)檢測(cè)技術(shù),可以感知目標(biāo)的三維尺寸信息、空間位置;
  • 精準(zhǔn)判斷:通過(guò)空間位置感知,可以更精準(zhǔn)地判斷目標(biāo)和參照物之間的位置關(guān)系。

比如,在城市交通管理場(chǎng)景中,當(dāng)前交通違法判定主要還是依靠固定攝像頭抓拍、二維圖像判定的方式,往往存在視覺(jué)盲區(qū)。若將3D目標(biāo)檢測(cè)技術(shù)接入公安交警現(xiàn)有的交通視頻智能分析平臺(tái),與AI巡檢相結(jié)合,可以進(jìn)一步精確判定車(chē)輛車(chē)型。

基于空間位置感知和連續(xù)軌跡跟蹤,計(jì)算出車(chē)輛的行駛速度、空間軌跡等,為越斑馬線停車(chē)、超速抓拍、擁堵感知等違法異常事件判斷提供更實(shí)時(shí)、更精準(zhǔn)的決策依據(jù)。

這不僅能夠達(dá)到對(duì)已有設(shè)備資源的最大化利用,實(shí)現(xiàn)降本提效,還能夠提升城市數(shù)字化治理能力,助力文明出行、平安出行。

AI賦能,建設(shè)美好世界

如何讓機(jī)器變得更加“聰明”,具備足夠的學(xué)習(xí)能力,并更精準(zhǔn)地貼合現(xiàn)實(shí)使用需求,是所有人工智能研發(fā)團(tuán)隊(duì)所需解決的最大難題。

科大訊飛直面檢測(cè)精細(xì)度更高、場(chǎng)景更為復(fù)雜、挑戰(zhàn)難度更大的3D目標(biāo)檢測(cè)任務(wù),并一舉刷新了世界紀(jì)錄,意味著科大訊飛已經(jīng)具備了強(qiáng)大的AI技術(shù)硬核實(shí)力。

多年來(lái),科大訊飛在人工智能領(lǐng)域百花齊放,在基于深度學(xué)習(xí)的通用核心技術(shù)上厚積薄發(fā)。

不僅在智能語(yǔ)音、機(jī)器翻譯等大眾熟悉的領(lǐng)域上在多項(xiàng)國(guó)際權(quán)威賽事上取得第一,實(shí)際上,科大訊飛在教育圖文、人臉識(shí)別等計(jì)算機(jī)視覺(jué)領(lǐng)域也深耕多年,并已運(yùn)用在教育、醫(yī)療、金融等多個(gè)行業(yè)。

未來(lái),科大訊飛將繼續(xù)堅(jiān)持源頭技術(shù)創(chuàng)新路線,秉持“頂天立地”的理念,加快開(kāi)放應(yīng)用場(chǎng)景,促進(jìn)AI技術(shù)和各種應(yīng)用場(chǎng)景相結(jié)合,加速人工智能技術(shù)落地,建設(shè)美好世界。


科大訊飛股份有限公司簡(jiǎn)介
科大訊飛股份有限公司成立于1999年,是亞太地區(qū)知名的智能語(yǔ)音和人工智能上市企業(yè)。自成立以來(lái),長(zhǎng)期從事語(yǔ)音及語(yǔ)言、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等核心技術(shù)研究并保持了國(guó)際前沿技術(shù)水平;積極推動(dòng)人工智能產(chǎn)品研發(fā)和行業(yè)應(yīng)用落地,致力讓機(jī)器“能聽(tīng)會(huì)說(shuō),能理解會(huì)思考”,用人工智能建設(shè)美好世界。