【讲座主题】多模态分析
【讲座时间】2022年05月04日 下午:14:30-17:30
【讲座地点】保定校区 腾讯会议号:150 496 766
【主讲人】刘偲,教授、博导、北京航空航天大学
【主讲人简介】
刘偲,北航教授,博导。主持国家优秀青年科学基金。研究方向是跨模态多媒体智能分析以及经典计算机视觉任务。共发表了CCF A类论文60余篇。Google Scholar引用8000+次。获多媒体领域顶会ACM MM 2012最佳技术演示奖,ACM MM 2013、ACM MM 2021最佳论文奖,以及IJCAI 2021最佳视频奖。担任中国图象图形学学会理事、副秘书长。多次担任ICCV、CVPR、ECCV、ACM MM等顶级会议领域主席(AC)。担任IEEE TMM、IEEE TCSVT编委。
【报告内容简介】
报告主要介绍本人以下四方面的最新工作。1)人-物关系检测和分割。其中,人-物关系分割其中是新任务。 该任务旨在预测人体与周围实体之间的关系,人和实体均以像素级掩码的形式进行表达。2)图像视频分割,以及语言指导的图像视频分割。后者是指给定自然语言表达式和图像/视频,生成语言表达对应的实体的像素级掩码。3)主动感知:需要根据语言指令导航到远程对象并对其进行定位。4)人工智能+艺术:包括视频自动配乐,语言指导的图像美化以及细节保持的妆容迁移。