你在这里

视觉与人工智能

周三 2023年1月11日 11:15
视觉与人工智能 房间1
发言人: Sagie Benaim 标题: 迈向可控制的3D世界 文摘: 在新窗口中打开在html中pdf在新窗口中打开 ***联合视觉与机器学习研讨会***请注意特殊的日期和时间
生成式人工智能的最新突破使多种逼真的2D图像的可控生成成为可能,从而在艺术和设计等领域实现了变革性的应用。由于人类感知本质上是三维的,以可控的方式生成3D内容的能力可以解锁虚拟和增强现实、医疗保健、自动驾驶汽车、机器人等领域的众多应用,并具有广泛的影响。然而,我们还没有看到2D代游戏在3D领域取得同样的成功。在这次演讲中,我将概述在缩小这一差距的道路上面临的三个重要挑战。第一个挑战是以一种可控、富有表现力和紧凑的方式来表现3D世界。为此,我将描述一种以可分解和可解释的方式表示信号(如3D对象或场景)的新方法,该方法允许在可证明的保证下对信号施加约束。第二个挑战是从有限的二维观测中以可控的方式重塑三维世界。为此,我将描述一个框架,用于在3D场景中分解和操作对象,以及从新视图生成它们,仅给出2D训练数据。第三个挑战是为人类提供一个直观和灵活的界面,以可控的方式创建3D内容。为此,我将描述一种使用文本描述直观地对3D对象进行风格化的方法。 Lastly, I will conclude my talk with future directions on using controllable 3D generation for augmented reality, photorealistic simulations for applications such as autonomous vehicles, as well as enabling machines to better understand the world. Short bio: Sagie Benaim is a postdoctoral researcher at the Pioneer Center for AI, University of Copenhagen, advised by Prof. Serge Belongie. His research interests are in generative modeling, 3D content creation, few-shot learning, and representation learning. He received his PhD from the Computer Science department at Tel Aviv University, advised by Prof. Lior Wolf. Previously, he did his MSc at the University of Oxford and BSc at Imperial College London. During his PhD, he spent time as a research intern at Google.
周四 2023年1月12日 12:15
视觉与人工智能 房间1
发言人: 马克Sheinin 标题: 使视觉超越人类感知的计算成像 文摘: 在新窗口中打开在html中pdf在新窗口中打开
从微小的表面振动到非常快速发生的事件,世界上充满了人类无法感知的现象。同样,大多数计算机视觉系统主要基于“传统”相机,这些相机是为了模仿人眼的成像原理而设计的,因此对这些无处不在的现象同样视而不见。在这次演讲中,我将展示我们可以捕捉这些隐藏的现象,通过创造性地建立新颖的视觉系统,由常见的现成组件(即,相机和光学)与尖端算法相结合。具体来说,我将介绍三个使用计算成像来感知隐藏现象的项目。首先,我将介绍ACam——一种用于捕捉现代环境中无处不在的电灯的微小闪烁的相机。我将展示灯泡闪烁是一种强大的视觉提示,可以实现各种应用,如场景光源解混、反射分离和电网本身的远程分析。其次,我将描述衍射线成像(Diffraction Line Imaging),这是一种新的成像原理,利用衍射光学技术用1D(线)传感器捕获稀疏的2D场景。该方法的应用包括捕获快速运动(例如,快速流动液体中的演员和粒子)以及具有线照明和线传感的结构光3D扫描。最后,我将提出一种新方法,用于同时检测多个场景源的微小高频表面振动(高达63kHz),使用额定频率仅为130Hz的“慢速”传感器。应用包括捕捉由音频源(如扬声器、人声和乐器)引起的振动和定位振动源(如敲门声的位置)。 Bio: Mark Sheinin is a Post-doctoral Research Associate at Carnegie Mellon University's Robotic Institute at the Illumination and Imaging Laboratory. He received his Ph.D. in Electrical Engineering from the Technion - Israel Institute of Technology in 2019. His work has received the Best Student Paper Award at CVPR 2017 and the Best Paper Honorable Mention Award at CVPR 2022. He received the Porat Award for Outstanding Graduate Students, the Jacobs-Qualcomm Fellowship in 2017, and the Jacobs Distinguished Publication Award in 2018. His research interests include computational photography and computer vision.
周四 2023年1月26日 12:15
视觉与人工智能 房间1
发言人: Lihi Zelnik-Manor 标题: 数字化接触 文摘: 在新窗口中打开在html中pdf在新窗口中打开
想象一下,能够触摸虚拟物体,与电脑游戏进行物理交互,或者感觉位于地球其他地方的物品。这种触觉技术的应用范围将是多样和广泛的。有趣的是,虽然存在优秀的视觉和听觉反馈装置,但皮肤反馈装置仍处于初级阶段。在这次演讲中,我将简要介绍触觉反馈设备的世界以及它所带来的挑战。然后我将展示HUGO,这是一款以人为中心的设计设备,它可以触发我们皮肤中的机械感受器,从而让人们体验到“在野外”触摸数字化表面的感觉。这次谈话可能会给我们留下许多悬而未决的问题,需要研究来回答。Lihi Zelnik-Manor教授是以色列理工学院电气与计算机工程学院的正教授兼研究生院副院长。2018年至2021年,她担任阿里巴巴以色列研发中心的高级董事兼总经理。在此之前,她曾在CornellTech成立期间担任客座副教授,并在Caltech担任博士后学者。她的主要专业领域是计算机视觉,她在该领域进行研究并担任行业咨询角色。 Prof Zelnik-Manor has done extensive community contribution, serving as General Chair of CVPR'21 and ECCV'22, Program Chair of CVPR’16, Associate Editor at TPAMI, served multiple times as Area Chair at CVPR, ECCV and was on the award committee of ACCV'18, CVPR'19 and CVPR'22. Looking forward she will serve as Program Chair of ICCV'25.
周四 2023年2月9日 00:00
视觉与人工智能
发言人: 托马Michaeli 标题: 稍后通知 文摘: 在新窗口中打开在html中pdf在新窗口中打开
稍后通知
周四 2023年2月16日 00:00
视觉与人工智能
发言人: 加Chechik 标题: 稍后通知 文摘: 在新窗口中打开在html中pdf在新窗口中打开
稍后通知