非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 BS ISO/IEC 14496-2:2000 前三页,或者稍后再访问。
您也可以尝试购买此标准,
点击右侧 “立即购买” 按钮开始采购(由第三方提供)。
听觉推理模型具体为将视觉特征输入编码器进行编码,利用解码器解码出对应的听觉特征,通过在生成的听觉特征与真实的听觉特征之间增加L2范数约束来更新该模型参数,并实现视觉特征到听觉特征的准确映射。模型在MSR-VTT、MSVD数据集上取得了理想的效果。 2.视听模态的生成 视听模态是视频中的两个共生模态,包含相同和互补信息。利用共同信息可实现模态间的相互转换。同时,互补信息可作为先验去辅助相关工作。...
各个脑区如何整合不一致的信息?为了解答上述问题,研究人员以实验猕猴为对象,研究了其杏仁核及其周边脑区神经元对单一模态的视觉、听觉以及双模态的视听结合信息的反应特征。研究人员首先在核磁共振影像的引导下,将32通道的可调式电极阵列植入到猕猴杏仁核脑区附近。...
中科院成都生物所科研人员以锯腿原指树蛙(Kurixalus odontotarsus)为对象,通过音箱和显示屏给雌蛙呈现单模信号(声音或鸣囊视频)和视听多模信号(声音+鸣囊视频),验证噪音是否会干扰蛙类对声音、视觉或视-听多模信号的处理能力。结果表明,没有播放噪音时,雌蛙能够准确选择更有吸引力的单模信号(声音或视觉)或视听多模信号;而播放噪音时,雌蛙的这一选择偏好消失甚至逆转。...
该课题得到科技部、中国科学院和自然科学基金委的资助。 听觉皮层(黑色)和视觉皮层(橙色)对自然视听觉流的同时低频相位跟踪以及时间结构的实时分割;同时,视觉皮层和听觉皮层也有跨模态的相位调制来达到视听觉的实时融合...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号