
亮相2018 CVPR,賦能人工智能
發(fā)布時(shí)間 : 2020-09-18 閱讀量 : 2763
美國(guó)當(dāng)?shù)貢r(shí)間2018年6月18日,世界頂級(jí)圖像會(huì)議:國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(CVPR2018)在美國(guó)鹽城湖開(kāi)幕。
CVPR是IEEE一年一度的學(xué)術(shù)性會(huì)議,會(huì)議的主要內(nèi)容是計(jì)算機(jī)視覺(jué)與模式識(shí)別技術(shù)。該會(huì)議每年舉辦一次,每次都會(huì)吸引全球人工智能領(lǐng)域知名的企業(yè)、學(xué)者及研發(fā)人員參加。相比去年的CVPR,本屆會(huì)議參會(huì)人數(shù)有了進(jìn)一步增加,達(dá)到6000+人次。同時(shí),吸引了微軟、IBM、谷歌、特斯拉、Uber、百度等眾多全球知名企業(yè)和計(jì)算機(jī)視覺(jué)技術(shù)公司悉數(shù)亮相。
智能駕駛企業(yè)扎堆
CVPR2018的一個(gè)最大的亮點(diǎn)就是諸多自動(dòng)駕駛公司扎堆亮相,場(chǎng)面史無(wú)前例。alphabet旗下的無(wú)人車(chē)企業(yè) Waymo、通用旗下的自動(dòng)駕駛公司 Cruise Automation、前谷歌無(wú)人車(chē)項(xiàng)目 CTO Chris Urmson 創(chuàng)辦的 Aurora,均將其無(wú)人車(chē)開(kāi)到了 CVPR的展臺(tái)。除了全站自動(dòng)駕駛方案企業(yè)以外,Deepen.ai等智能駕駛細(xì)分領(lǐng)域的企業(yè)也來(lái)到了CVPR。作為東道主,美國(guó)本土企業(yè)也不甘示弱,Uber、Lyft Level5、AutoX、Ouster、DeepMap 以及Aptiv&nuTonomy等等均亮相在CVPR2018。國(guó)內(nèi)龍頭企業(yè)BAT、滴滴、京東、華為均帶來(lái)了自己在智能駕駛及計(jì)算機(jī)視覺(jué)方面的解決方案。
CVPR不僅有眾多企業(yè),還吸引了廣大學(xué)者和高質(zhì)量論文,讓我們一起看看都有那些計(jì)算機(jī)視覺(jué)方面的論文出爐。
部分監(jiān)督實(shí)例分割
由于先進(jìn)的實(shí)例分割算法需要強(qiáng)監(jiān)督樣本進(jìn)行訓(xùn)練。目前的訓(xùn)練數(shù)據(jù)類(lèi)別有限而增添一個(gè)新類(lèi)別的強(qiáng)監(jiān)督實(shí)例分割樣本十分耗時(shí)耗力。目前,畫(huà)框標(biāo)注的樣本容易獲得。此篇文章提出不依靠完整的實(shí)例分割標(biāo)記來(lái)生成對(duì)于所有類(lèi)都有效的高質(zhì)量分割模型。具體而言就是采用混合的數(shù)據(jù)集,其中一小部分是精細(xì)標(biāo)注的,其余都是采用畫(huà)框標(biāo)注,算法以這兩種數(shù)據(jù)作為輸入,優(yōu)惠活動(dòng)大廳通過(guò)在Mask RCNN中引入轉(zhuǎn)移學(xué)習(xí)法,將模型輸出的畫(huà)框信息轉(zhuǎn)換成精細(xì)標(biāo)注,從而達(dá)到所有對(duì)象類(lèi)別示例分割的目的。
從圖像的檢測(cè)到圖像理解
(圖為以人為中心標(biāo)注示例)
目前的圖像識(shí)別主要針對(duì)圖像中單個(gè)人或物進(jìn)行識(shí)別,Kaiming的這篇文章介紹了一種從圖像的檢測(cè)向圖像理解的研究方向過(guò)渡的方法。根據(jù)“人 動(dòng)作 物體”三元素之間的關(guān)系,理解人與物體之間交互。圖像中物體與人的動(dòng)作充分說(shuō)明了人與物體的交互作用,這樣很大程度上減少了需要標(biāo)注的物體種類(lèi),只需標(biāo)注與人的動(dòng)作緊密聯(lián)系的物體即可理解人與物體的交互。
作為全球知名大數(shù)據(jù)資源服務(wù)商,在人工智能領(lǐng)域深耕多年的()也在CVPR2018亮相。在展會(huì)上,展示了無(wú)人駕駛、智能醫(yī)療、智能安防等方面的最新數(shù)據(jù)集和解決方案。 在人工智能領(lǐng)域深耕多年,深刻體會(huì)市場(chǎng)的數(shù)據(jù)需求,準(zhǔn)確把握客戶的需求,為客戶提供專(zhuān)業(yè)、精準(zhǔn)、多樣的圖像數(shù)據(jù)。同時(shí)提供圖像數(shù)據(jù)的標(biāo)注服務(wù),包括關(guān)鍵點(diǎn)標(biāo)注、多邊形標(biāo)注、精細(xì)標(biāo)注等,這些數(shù)據(jù)可以應(yīng)用到無(wú)人駕駛、智能安防、智慧醫(yī)療、人臉識(shí)別等領(lǐng)域。
憑借嚴(yán)格的服務(wù)流程、質(zhì)量控制規(guī)范及自主研發(fā)的智能數(shù)據(jù)處理系統(tǒng),為客戶提供專(zhuān)業(yè)精準(zhǔn)的數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù)。