![]() ![]() |
視覺特征表達(dá)的集成深度學(xué)習(xí)研究
本書針對不同性質(zhì)的視覺數(shù)據(jù)進(jìn)行特征表達(dá)和學(xué)習(xí)方法的論述,在不同的視覺任務(wù)上設(shè)計(jì)特征表達(dá)模型,在RGB視頻數(shù)據(jù)和人體骨架關(guān)鍵點(diǎn)視頻數(shù)據(jù)的特征提取和表達(dá)方面,闡述了協(xié)同時空注意力、多維特征激勵融合、多維動態(tài)拓?fù)鋵W(xué)習(xí)圖卷積等一系列新穎的特征提取和表達(dá)方法;基于圖像數(shù)據(jù)進(jìn)行視覺特征提取和表達(dá)方面,結(jié)合目標(biāo)檢測、顯著性目標(biāo)檢測、深度估計(jì)和語義分割等基于單個圖像信息的視覺任務(wù),闡述了一系列細(xì)節(jié)特征和語義特征增強(qiáng)和融合的方法,利用注意力指導(dǎo)模塊集成多尺度、跨維度特征,設(shè)計(jì)交互模塊以促進(jìn)上下文語義信息和空間信息的交互學(xué)習(xí),完成不同級別的圖像識別任務(wù);在集成多任務(wù)的特征表達(dá)學(xué)習(xí)方法方面,闡述了利用有限的訓(xùn)練數(shù)據(jù)學(xué)習(xí)通用視覺特征,同時結(jié)合生成對抗的訓(xùn)練學(xué)習(xí)方法,通過共享特征的學(xué)習(xí)和任務(wù)特定特征的學(xué)習(xí),實(shí)現(xiàn)多視覺任務(wù)平均性能的提升。
你還可能感興趣
我要評論
|