近日,中國科學院沈陽自動化研究所機器人視覺研究組在遮擋行人重識別領域取得新進展,提出了一種遮擋行人重識別算法。該研究成果在線發(fā)表于工業(yè)信息領域國際期刊IEEE Transactions on Industrial Informatics(中國科學院一區(qū)Top類,IF:12.3)。
行人重識別指通過非重疊攝像頭檢索同一個行人目標,是行人檢測和行人跟蹤的重要環(huán)節(jié),可用于視頻監(jiān)控、交通管理、智能安防、刑事偵查、多機協(xié)同檢測等。然而,大多數(shù)現(xiàn)有的行人重識別方法都基于目標在圖像中完整可見的假設,由于真實場景中存在汽車、廣告牌、樹木等遮擋物,導致識別目標難以匹配。
科研人員針對這一問題提出了一種基于Transformer注意力機制的遮擋行人重識別算法。研究中發(fā)現(xiàn)在利用Transformer提取行人特征時,淺層網絡提取的特征分布在局部目標區(qū)域;中間層網絡的注意力集中在可見行人部分;高層網絡的注意力聚焦全局行人特征。基于這一發(fā)現(xiàn),研究團隊提出了跳連接聚合Transformer網絡(SCAT),利用中間層特征、高層特征和細粒度局部特征來增加特征多樣性,提升遮擋行人目標的重識別精度。在多個數(shù)據集上驗證了所提方法的有效性,包括遮擋數(shù)據集、部分數(shù)據集和全身數(shù)據集。
研究成果得到了國家自然科學基金委員會、中國科學院青年創(chuàng)新促進會和機器人學國家重點實驗室的大力支持。