摘要:提供了一個(gè)較大規(guī)模的基于RGB-D攝像機(jī)的人體復(fù)雜行為數(shù)據(jù)庫(kù)DMV(Dynamic and multiview)action3D,從2個(gè)固定視角和一臺(tái)移動(dòng)機(jī)器人動(dòng)態(tài)視角錄制人體行為。數(shù)據(jù)庫(kù)現(xiàn)有31個(gè)不同的行為類,包括日常行為、交互行為和異常行為類等三大類動(dòng)作,收集了超過(guò)620個(gè)行為視頻約60萬(wàn)幀彩色圖像和深度圖像,為機(jī)器人尋找最佳視角提供了可供驗(yàn)證的數(shù)據(jù)庫(kù)。為驗(yàn)證數(shù)據(jù)集的可靠性和實(shí)用性,本文采取4種方法進(jìn)行人體行為識(shí)別,分別是基于關(guān)節(jié)點(diǎn)信息特征、基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)和條件隨機(jī)場(chǎng)(Conditional random field,CRF)結(jié)合的CRFasRNN方法提取的彩色圖像HOG3D特征,然后采用支持向量機(jī)(Support vector machine,SVM)方法進(jìn)行了人體行為識(shí)別;基于3維卷積網(wǎng)絡(luò)(C3D)和3D密集連接殘差網(wǎng)絡(luò)提取時(shí)空特征,通過(guò)softmax層以預(yù)測(cè)動(dòng)作標(biāo)簽。實(shí)驗(yàn)結(jié)果表明:DMV action3D人體行為數(shù)據(jù)庫(kù)由于場(chǎng)景多變、動(dòng)作復(fù)雜等特點(diǎn),識(shí)別的難度也大幅增大。DMV action3D數(shù)據(jù)集對(duì)于研究真實(shí)環(huán)境下的人體行為具有較大的優(yōu)勢(shì),為服務(wù)機(jī)器人識(shí)別真實(shí)環(huán)境下的人體行為提供了一個(gè)較佳的資源。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社