信息科学与技术学院6篇论文被国际顶级会议CVPR2018录用

近日,国际顶级会议CVPR 2018 发布任命了局,我校信息迷信与技巧学院有6篇论文入选,在海内高校中名列前茅。CVPR(IEEE Conference on Computer Vision and Pattern Recognition)即“国际盘算机视觉与模式辨认会议”,是由IEEE举行的盘算机视觉领域三大顶级国际会议之一,被中国盘算机学会(CCF)推荐为盘算机学科领域A类国际会议。与其余理工迷信科不同,在全国学科评价中,惟有“盘算机迷信与技巧”一级学科将CCF推荐的A类国际会议计入成果评价。CVPR有着严苛的任命标准,论文任命率普通在20%摆布。2018年总的投稿量达4000多篇,终极录取了900多篇,录取率不到23%。信息学院纪荣嵘教学团队率先于2015年完成厦门大学CVPR2015论文零的突破,在2015-2018年时期,信息学院师生(含纪荣嵘教学、丁兴号教学、李绍滋教学和李军教学团队)被CVPR任命的论文数分别共计为3篇、2篇、4篇和6篇,标记着信息迷信与技巧学院的研讨成果得到了国际同行的认可。此次,我校被CVPR2018任命的是如下这6篇论文。 智能迷信系2015届博士研讨生钟准作为第一作者,导师李绍滋教学作为通信作者,揭晓题为“Camera Style Adaptation for Person Re-identification”的论文。在多摄像机检索任务中,身份重辨认受到由不同摄像机招致的不同风格的图象干扰。之前的解决方式经由进程隐式地深造一个摄像机有关的描绘子空间。该论文显式地引入摄像机风格适应方式。该方式能够算作是一种数据扩充。有标签的训练样本的风格能够被转换到不同摄像机的风格,并和本来的样本形成扩充后的训练集。经由进程这个方式不但添加了数据集的差异性,也加入了必然的噪声。为了淘汰噪声,在深造进程加入样本平滑正则化。因为过度拟合, 原始的样本平滑正则化只能在很少的摄像机零碎里取得好了局。实验了局表白, 该论文提出的新方式在加入了样本平滑正则化后在一切摄像机零碎里都取患了一致的性能改进, 性能较着优于现有的其它方式。 智能迷信系2017级博士研讨生沈云航作为第一作者,导师纪荣嵘教学作为通信作者,揭晓题为“Generative Adversarial Learning towards Fast Weakly Supervised Detection”的论文。该论文提出一种面向快捷弱监视目的检测的天生对抗深造算法。近年来弱监视目的检测领域有着大量的工作。在没有人工标注包抄盒的情况下,现有的方式大多是多阶段流程,其中包括了候选区域提取阶段。这使得在线测试的速度比快捷有监视目的检测(如SSD、YOLO等)慢一个数量级。该论文经由进程一种别致的天生对抗深造算法来加速。在这进程中,天生器是一个单阶段的目的检测器,同时算法引入了一个署理器来开掘高质量的包抄盒。最后算法联合了结构类似失落和对抗失落来训练模子。实验了局表白该算法取患了优良的性能。 智能迷信系2016级博士研讨生陈福海作为第一作者,导师纪荣嵘教学作为通信作者,揭晓题为“GroupCap: Group-based Image Captioning with Structured Relevance and Diversity Constraints”的论文。该论文提出了一种基于组群图象结构化语义关系性分析的图象主动描绘方式(GroupCap),对图象间的语义相关性和差异性举行建模。具体而言,该论文起首哄骗深度卷积神经网络(CNN)提取图象的语义特性并哄骗提出的视觉解析模子构建语义关系结构树,而后在结构树基础上采取三联失落和分类失落对图象间语义关系性(相关性和差异性)举行建模,最后将关系性作为约束来疏导深度轮回神经网络天生文本。该方式别致且有效,很好解决了以后图象主动描绘方式对于天生了局精确度不高且判断性不强的缺点。 北京航空航天大学博士研讨生王晓迪作为第一作者,智能迷信系纪荣嵘教学作为通信作者,揭晓题为“Modulated Convolutional Networks”的论文,是王晓迪在厦门大学纪荣嵘教学实验室访问时期完成的工作。该论文提出一个新的调制卷积神经网络来改进基于二值卷积核的卷积神经网络的便携性。论文在端对端的框架里采取了一种把卷积核失落、核心失落和SoftMax失落联合起来的失落函数。算法起首运用调制卷积核来恢复二值卷积核,而后考虑类内紧凑来迫临卷机操作。实验了局表白,该模子能够淘汰32倍的存储空间,而且性能优于其它现有的二值化模子。更重要的是,该方式取患了和全精度模子Resnets、WideResnet类似的性能。该论文的代码会很快开源。 智能迷信系2017级年硕士研讨生丰一帆作为第一作者(导师为纪荣嵘教学),揭晓题为“GVCNN: Group-View Convolutional Neural Networks for 3D Shape Recognition”的论文。3D外形的辨认近几年颇受存眷,采取多视图卷积神经网络(MVCNN)已取患了目前最好的了局。然则运用深层特性的框架受到视图->特性的模式约束,尚未充分哄骗视图间的层次关系。该论文提出GVCNN包含繁多视图->组视图->特性的架构,采取层级关系模子猎取可辨别的外形描绘符。而后用一个分组模块盘算每个视图的可辨别度分数,再按照分数将每个视图分组,终极按照每个组的权重将组级别特性融合成外形级别的特性。对照实验表白咱们提出的GVCNN在3D辨认和检索两方面均显著优于现有的方式。 通信工程系博士后陈一平作为第一作者,李军教学作为第一通信作者,揭晓题为“LiDAR-Video Driving Dataset: Learning Driving Policies Effectively”的论文。该论文针对深造主动驾驶战略这一盘算机视觉领域中最具挑战的课题之一开展数据实验研讨。现有的研讨表白,未来主动驾驶的研讨和应用应该联合照相机、行车记录仪和激光雷达从语义上全面理解事实中的交通环境。然则,目前的方式限于经由进程大规模视频数据深造而缺少实验基准。该论文首次提出运用“激光雷达-视频”数据集,采取激光雷达猎取大规模点云数据,并经由进程仪表板摄像机来记录视频图象以及标准的驾驶行为。大量的实验表白,运用由激光雷达采集的点云数据中附加的深度信息能够帮助神经网络决定驾驶战略。该论文的一切数据、代码和模子都将在论文揭晓后公开。 (信息迷信与技巧学院) 责任编辑:黄伟彬