重慶2018年4月4日電 /美通社/ -- 日前,人工智能“國家隊(duì)”云從科技在跨鏡追蹤技術(shù)(ReID)上取得重大突破。同時(shí)在Market-1501、CUHK03、DukeMTMC-reID三個(gè)數(shù)據(jù)集上從悉尼科技大學(xué)、南洋理工、中科院自動(dòng)化所、清華大學(xué)等多家知名高校、企業(yè)與研究機(jī)構(gòu)脫穎而出,刷新了世界記錄。
其中較高在Market-1501上的首位命中率(Rank-1 Accuracy)達(dá)到96.6%,打破了之前阿里iDST在2018年1月創(chuàng)造的世界紀(jì)錄,讓跨鏡追蹤技術(shù)(ReID)在準(zhǔn)確率上首次達(dá)到商用水平,人工智能即將從“刷臉”跨到“識(shí)人”的新紀(jì)元。
領(lǐng)先算法 同時(shí)刷新三項(xiàng)紀(jì)錄
跨鏡追蹤技術(shù)(Person Re-Identification,簡稱 ReID)是現(xiàn)在計(jì)算機(jī)視覺研究的熱門方向,是利用計(jì)算機(jī)視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。
簡單來說,它可以無需人臉,只用看穿著、體態(tài)、發(fā)型就“認(rèn)出”你。
該技術(shù)可以作為人臉識(shí)別技術(shù)的重要補(bǔ)充,可以對(duì)無法獲取清晰拍攝人臉的行人進(jìn)行跨攝像頭連續(xù)跟蹤,增強(qiáng)數(shù)據(jù)的時(shí)空連續(xù)性。該技術(shù)可以廣泛應(yīng)用于視頻監(jiān)控、智能安保、智能商業(yè)等領(lǐng)域。
Market-1501、CUHK03、DukeMTMC-reID是當(dāng)前衡量ReID技術(shù)的較權(quán)威主流的數(shù)據(jù)集。首位命中率(Rank-1 Accuracy)、平均精度均值(Mean Average Precision,mAP)是衡量ReID技術(shù)水平的核心指標(biāo)。
云從科技在這三個(gè)數(shù)據(jù)集中都刷新了業(yè)內(nèi)較好的水平,在Market-1501數(shù)據(jù)集的Rank-1 Accuracy達(dá)到驚人的95.7%,使用Re-Ranking 技術(shù)后更是達(dá)到96.6%。mAP是更加全面衡量ReID算法效果的指標(biāo),它要求將檢索圖片與被檢索圖片都匹配正確,而不止首位命中。云從科技此次將Market-1501的mAP指標(biāo)將現(xiàn)在較好的水平提高了近5%,達(dá)到86.9%,使用Re-Ranking技術(shù)之后更是達(dá)到了94.2 %。能夠獲得如此大幅度的突破,充分說明云從科技ReID的研究成果的價(jià)值,該成果必然能夠推動(dòng)ReID技術(shù)的大幅進(jìn)步,也使得ReID加速實(shí)際應(yīng)用。
為什么我們需要跨鏡追蹤(ReID)技術(shù)?
人臉識(shí)別技術(shù)經(jīng)過進(jìn)幾年的發(fā)展,已較為成熟,在眾多的場景與產(chǎn)品中都已有應(yīng)用,但人臉識(shí)別技術(shù)只用到了人的臉部信息,而沒有利用人體其它信息,例如衣著、姿態(tài)、行為等,另外在應(yīng)用時(shí)必須要能抓拍到人臉,這在很多場景下無法滿足,例如低頭、背影、模糊身形、帽子遮擋等等。
而跨鏡追蹤(ReID)技術(shù)正好能夠彌補(bǔ)人臉識(shí)別技術(shù)不足,跨鏡追蹤(ReID)技術(shù)能夠根據(jù)行人的穿著、體態(tài)、發(fā)型等信息認(rèn)知行人。這將人工智能的認(rèn)知水平提高到一個(gè)新的階段,現(xiàn)在跨鏡追蹤(ReID)已成為人工智能領(lǐng)域的重要研究方向。
但現(xiàn)有的研究成果還不是很成熟,離實(shí)際商用的要求還有一定距離。而云從科技的跨鏡追蹤(ReID)技術(shù)獲得了重大突破,將現(xiàn)有的技術(shù)水平提高到一個(gè)新的階段,這將大大推動(dòng)業(yè)界技術(shù)研究與應(yīng)用落地的進(jìn)度,也將大大推動(dòng)人工智能由“刷臉”跨進(jìn)全面“識(shí)人”的新紀(jì)元。
跨鏡追蹤(ReID)技術(shù)有哪些難點(diǎn)?
跨鏡追蹤(ReID)技術(shù)與人臉識(shí)別技術(shù)類似,存在較多的困難點(diǎn)需要克服,例如光線、遮擋、圖片模糊等客觀因素。另外,行人的穿著多樣,同一人穿不同的衣服,不同的人穿相似的衣服等等也對(duì)跨鏡追蹤(ReID)技術(shù)提出更高的要求。
行人的姿態(tài)多變導(dǎo)致人臉上廣泛使用的對(duì)齊技術(shù)也在跨鏡追蹤(ReID)失效。行人的數(shù)據(jù)獲取難度遠(yuǎn)遠(yuǎn)大于人臉識(shí)別數(shù)據(jù)獲取難度,而行人的信息復(fù)雜程度又遠(yuǎn)遠(yuǎn)大于人臉,這兩個(gè)因素疊加在一起使得跨鏡追蹤(ReID)的算法研究變得更加困難,也更加重要。通過算法的有效設(shè)計(jì),降低對(duì)數(shù)據(jù)依賴來實(shí)現(xiàn)跨鏡追蹤(ReID)效果的突破是現(xiàn)在業(yè)內(nèi)的共識(shí)。
本次云從提出通過融合行人的全局信息以及具有辨識(shí)力的多粒度局部信息的思路,為解決ReID問題提供了一個(gè)非常不錯(cuò)的思路。云從科技本次提出的方案有幾大優(yōu)勢(1)結(jié)構(gòu)精巧:該方案實(shí)現(xiàn)了端到端的直接學(xué)習(xí),并沒有增加額外的訓(xùn)練流程;(2)多粒度:融合了行人的整體信息與有區(qū)分度的多粒度細(xì)節(jié)信息;(3)關(guān)注細(xì)節(jié):模型真正懂得什么是人,模型會(huì)把注意力放在膝蓋,衣服商標(biāo)等能夠顯著區(qū)分行人的一些核心信息上。
“刷臉”是計(jì)算機(jī)視覺領(lǐng)域重要的應(yīng)用,而“識(shí)人”將促使計(jì)算機(jī)視覺行業(yè)進(jìn)入新的發(fā)展階段。云從科技在“識(shí)人”方向的眾多細(xì)分領(lǐng)域已經(jīng)有深入的研究,例如行人檢測、行人結(jié)構(gòu)化信息提取、人體關(guān)鍵點(diǎn)檢測、姿態(tài)估計(jì)、行為動(dòng)作識(shí)別等。技術(shù)的落地會(huì)讓大家能夠更快地體會(huì)到“識(shí)人”的人工智能對(duì)智能安防、人機(jī)互動(dòng)、自動(dòng)駕駛、智能商業(yè)、家居生活等各方面的幫助與提升。