专利名称:一种基于图像目标特征和多层注意力机制的视觉问
答方法
专利类型:发明专利
发明人:曹丹阳,侯建峰,任旭,陈明珠,饶竣恺申请号:CN201910482831.X申请日:20190604公开号:CN110287814A公开日:20190927
摘要:本发明公开了一种基于图像目标特征和多层注意力机制的视觉问答方法,包括图像特征处理、问题模型处理和多层注意力机制;所述图像特征处理是经过卷积神经网络进行特征提取;所述图像特征处理需要先进行初始化,将图像特征的维度转换成与问题向量相同大小;所述问题模型处理使用了LSTM网络来处理问题语句;所述注意力机制将图像特征表示和问题特征表示联系在一起。本发明中使用目标检测算法提取到目标区域图像特征来替代全局图像特征在视觉问答任务中是有效果的,它提高了模型在评价指标上的表现,同时,使用多层注意力机制也在一定程度上提高了模型在评价指标上的分数。
申请人:北方工业大学
地址:100144 北京市石景山区晋元庄路5号
国籍:CN
代理机构:北京久维律师事务所
代理人:邢江峰
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容