你在这里

视觉与人工智能

周三 2023年1月11日 11:15

视觉与人工智能房间1

发言人: Sagie Benaim 标题: 迈向可控制的3D世界文摘: 在新窗口中打开在html中 pdf在新窗口中打开 ***联合视觉与机器学习研讨会***请注意特殊的日期和时间

生成式人工智能的最新突破使多种逼真的2D图像的可控生成成为可能，从而在艺术和设计等领域实现了变革性的应用。由于人类感知本质上是三维的，以可控的方式生成3D内容的能力可以解锁虚拟和增强现实、医疗保健、自动驾驶汽车、机器人等领域的众多应用，并具有广泛的影响。然而，我们还没有看到2D代游戏在3D领域取得同样的成功。在这次演讲中，我将概述在缩小这一差距的道路上面临的三个重要挑战。第一个挑战是以一种可控、富有表现力和紧凑的方式来表现3D世界。为此，我将描述一种以可分解和可解释的方式表示信号(如3D对象或场景)的新方法，该方法允许在可证明的保证下对信号施加约束。第二个挑战是从有限的二维观测中以可控的方式重塑三维世界。为此，我将描述一个框架，用于在3D场景中分解和操作对象，以及从新视图生成它们，仅给出2D训练数据。第三个挑战是为人类提供一个直观和灵活的界面，以可控的方式创建3D内容。为此，我将描述一种使用文本描述直观地对3D对象进行风格化的方法。 Lastly, I will conclude my talk with future directions on using controllable 3D generation for augmented reality, photorealistic simulations for applications such as autonomous vehicles, as well as enabling machines to better understand the world. Short bio: Sagie Benaim is a postdoctoral researcher at the Pioneer Center for AI, University of Copenhagen, advised by Prof. Serge Belongie. His research interests are in generative modeling, 3D content creation, few-shot learning, and representation learning. He received his PhD from the Computer Science department at Tel Aviv University, advised by Prof. Lior Wolf. Previously, he did his MSc at the University of Oxford and BSc at Imperial College London. During his PhD, he spent time as a research intern at Google.

周四 2023年1月12日 12:15

视觉与人工智能房间1

发言人: 马克Sheinin 标题: 使视觉超越人类感知的计算成像文摘: 在新窗口中打开在html中 pdf在新窗口中打开

从微小的表面振动到非常快速发生的事件，世界上充满了人类无法感知的现象。同样，大多数计算机视觉系统主要基于“传统”相机，这些相机是为了模仿人眼的成像原理而设计的，因此对这些无处不在的现象同样视而不见。在这次演讲中，我将展示我们可以捕捉这些隐藏的现象，通过创造性地建立新颖的视觉系统，由常见的现成组件(即，相机和光学)与尖端算法相结合。具体来说，我将介绍三个使用计算成像来感知隐藏现象的项目。首先，我将介绍ACam——一种用于捕捉现代环境中无处不在的电灯的微小闪烁的相机。我将展示灯泡闪烁是一种强大的视觉提示，可以实现各种应用，如场景光源解混、反射分离和电网本身的远程分析。其次，我将描述衍射线成像(Diffraction Line Imaging)，这是一种新的成像原理，利用衍射光学技术用1D(线)传感器捕获稀疏的2D场景。该方法的应用包括捕获快速运动(例如，快速流动液体中的演员和粒子)以及具有线照明和线传感的结构光3D扫描。最后，我将提出一种新方法，用于同时检测多个场景源的微小高频表面振动(高达63kHz)，使用额定频率仅为130Hz的“慢速”传感器。应用包括捕捉由音频源(如扬声器、人声和乐器)引起的振动和定位振动源(如敲门声的位置)。 Bio: Mark Sheinin is a Post-doctoral Research Associate at Carnegie Mellon University's Robotic Institute at the Illumination and Imaging Laboratory. He received his Ph.D. in Electrical Engineering from the Technion - Israel Institute of Technology in 2019. His work has received the Best Student Paper Award at CVPR 2017 and the Best Paper Honorable Mention Award at CVPR 2022. He received the Porat Award for Outstanding Graduate Students, the Jacobs-Qualcomm Fellowship in 2017, and the Jacobs Distinguished Publication Award in 2018. His research interests include computational photography and computer vision.

周四 2023年1月26日 12:15

视觉与人工智能房间1

发言人: Lihi Zelnik-Manor 标题: 数字化接触文摘: 在新窗口中打开在html中 pdf在新窗口中打开

周四 2023年2月9日 00:00

视觉与人工智能

发言人: 托马Michaeli 标题: 稍后通知文摘: 在新窗口中打开在html中 pdf在新窗口中打开

周四 2023年2月16日 00:00

视觉与人工智能

发言人: 加Chechik 标题: 稍后通知文摘: 在新窗口中打开在html中 pdf在新窗口中打开

精选讲座系列

视觉与人工智能

接触搜索

快速链接

魏兹曼科学研究所