PRCV2021 第四届模式识别与计算机视觉学术会议

左旺孟教授
简介： 哈尔滨工业大学计算机学院教授、博士生导师。主要从事图像增强与复原、图像编辑与生成、物体检测与目标跟踪、图像与视频分类等方面的研究。在CVPR/ICCV/ECCV等顶级会议和T-PAMI、IJCV及IEEE Trans.等期刊上发表论文100余篇。曾任ICCV2019、CVPR2020/2021等CCF-A类会议领域主席，现任IEEE T-PAMI和T-IP等期刊编委。
报告题目：Learning Deep Image Restoration Network: From Full- and Self-supervision to Non-ideal supervision
摘要： 目前深度学习在图像复原中的成功往往依赖于大规模成对的训练数据。然而，全监督数据的获取往往十分困难，无监督和自监督学习因而成为更为可行的替代方法。因此，报告将首先介绍自监督图像去噪，基于深度上下文模型实现图像噪声估计模型和去噪模型的联合学习。在此基础上介绍图像去噪模型的无监督自适应，利用伪ISP和伪RawRGB噪声模型使得深度去噪网络能够自适应地调整应用于测试图像。最后，针对真实图像去噪、图像去模糊/超分辨等问题，虽然不能获得理想的监督信息，但往往能够获得替代的非理想监督信息，报告将以人脸正面化和Raw图ISP和超分为例，介绍了颜色不一致和空域未配准情况下深度网络的有效学习方法。

山世光教授
简介： 中科院计算所研究员、博导，中国科学院大学岗位教授，中科院智能信息处理重点实验室常务副主任。国家基金委优青，国家高层次人才特殊支持计划领军人才，腾讯科学探索奖获得者，国务院特殊津贴专家，CCF青年科学家奖获得者。研究领域为计算机视觉、模式识别、机器学习，在国内外刊物和学术会议上发表论文300余篇，其中CCF A类论文100余篇，论文被国内外同行引用23000余次。现/曾任IEEE TIP, CVIU, PRL, Neurocomputing, FCS等国际学术刊物的编委(AE)，曾任CVPR，ICCV，AAAI和IJCAI等十余次国际学术会议的Area Chair。研究成果获2015年度国家自然科学二等奖，2005年度国家科技进步二等奖。
报告题目：基于视觉的情感感知技术
摘要： 得益于深度卷积神经网络的复兴和发展，以人为中心的视觉感知计算，特别是人脸识别在过去10年取得了显著的进步。本报告将介绍“后人脸识别时代”，计算机视觉为测量或评估人类生理信号、心理状态和精神状况等情感感知任务带来的一些新机会，特别是基于视觉弱信号分析的生理与情感感知方法与技术。报告将重点介绍报告人团队在遥测PPG信号及心率估计、面部动作检测、视线估计等方面的最新研究进展，并讨论相关领域面临的挑战和未来发展趋势。

卢湖川教授
简介： 卢湖川教授，国家杰出青年基金获得者、科技部中青年创新领军人才，大连理工大学创新学院院长。研究方向为计算机视觉、机器学习、模式识别。发表顶级会议论文（CVPR/ICCV/ECCV）近100篇，Google Scholar引用2.5万余次，以第一完成人获得教育部自然科学二等奖2项。获得多项国际学术奖，包括CVPR2020 Best Paper Award Nominee, ICCV2011 Most Remembered Poster等。2017-2021年，在国际目标跟踪权威评测VOT竞赛中，其团队连续在多个赛道获得多个冠军。多次担任CVPR/ICCV/ECCV领域主席，目前担任IEEE Transaction on Cybernetics 和CSVT编委。
报告题目：高性能视觉跟踪算法
摘要： 视觉跟踪算法近年已取得突破性进展，但复杂现实环境中的各种场景变化和平台限制对跟踪算法提出了以“高精度、易迁移、低计算量”为导向的高性能要求。为此，我们从模板和搜索区域特征融合、通用尺度估计模块设计及嵌入式平台部署需求三方面，分别提出了Transformer融合模型、Alpha-Refine尺度估计模块和NAS跟踪网络搜索模型，显著提升了跟踪算法精度的同时降低了参数量和计算量。

杨易教授
简介： 浙江大学特聘教授，主要研究方向为人工智能，计算机视觉，多媒体大数据分析，自然语言处理和机器学习。在国际权威期刊和CCF-A类会议发表论文300余篇，Google Scholar 引用31000余次，H-index为91，在工程学和计算机科学两个领域同时入选科睿唯安全球高被引学者。入选2021年人工智能全球最具影响力学者榜单中经典AI、多媒体、计算机视觉、数据库四个领域，是同时在四个子领域进入全球影响力前一百的最具影响力学者之一（全球仅五人）。曾获教育部全国优秀博士论文，浙江省自然科学一等奖，澳大利亚研究理事会青年职业奖和澳大利亚计算机学会颠覆创新金奖，谷歌学者研究奖和AWS机器学习研究奖等十余次人工智能领域国际奖项。
报告题目：视频分析与多模态数据理解
摘要： 首先，本报告将讨论多场景视频分析面临的瓶颈，介绍首个大规模时序标注的多场景视频语义分割数据集，并展开分析时序上下文信息对分割效果的影响。本报告将展开讨论视频时序建模的方法，介绍提升模型效率的策略。其次，本报告将介绍基于点云数据的视频时序建模方法，着重讨论点云视频建模的难点与可行方案。最后，本报告将介绍视频与其他模态数据（如音频、文本等）联合训练的方法，并讨论多模态视频分析技术的应用前景。

王立威教授
简介： 北京大学教授，智能科学系副主任。从事机器学习研究。在机器学习国际权威期刊会议发表高水平论文100余篇。担任机器学习与计算机视觉顶级期刊IEEE TPAMI编委。多次担任国际机器学习旗舰会议NIPS与ICML领域主席。入选AI’s 10 to Watch（人工智能青年十杰），是该奖项自设立以来首位获此荣誉的中国学者。获得首届国家自然科学基金优秀青年基金。
报告题目：Towards Theoretical Understanding of Deep Learning
摘要： While deep learning achieves great success in many applications, there is still lack of theoretical understandings. In this talk I will present our recent works on the theories of the representation power, optimization and generalization of deep learning. I first show deep neural networks with bounded width are universal approximators. Then I will talk about the training of a deep neural network. Traditional wisdom says that training deep nets is a highly nonconvex optimization problem. However, empirically one can often find global minima simply using gradient descent. I show that if the deep net is sufficiently wide, then starting from a random initialization, gradient descent provably finds global optima with a linear convergence rate. Finally, I will talk about why overparameterized deep neural networks can have good generalization.

白翔教授
简介： 华中科技大学人工智能与自动化学院教授、国家防伪工程技术研究中心副主任。主要研究方向计算机视觉与模式识别、文档分析等。已在计算机视觉与模式识别领域一流国际期刊和会议如PAMI、CVPR等发表论文60余篇。由于在场景文字检测与识别取得的显著成绩，2019年在国际模式识别协会主办的国际文档分析与识别会议上获得IAPR/ICDAR Young Investigator Award (青年学者奖)。现任期刊IEEE TPAMI, Pattern Recognition, Frontier of Computer Science, 中国科学-信息科学、自动化学报编委。曾担任CVPR、AAAI、ICPR等人工智能主流国际会议的领域主席/资深技术程序委员或竞赛主席十余次，并获得AAAI-2019 Outstanding SPC Award。2014-2020连续7年入选Elsevier中国高被引学者榜，2020年入选IAPR Fellow。
报告题目：场景文本检测识别方法CRNN和DB-Net再思考
摘要： CRNN、DB-Net是场景文字检测与识别领域里被广泛使用的工作。本次报告将从全新视角解读两种算法，并且对文字识别未来发展趋势和潜在研究方向进行了预测。

特邀报告讲者