首页 / 部分 / 新科学家 / 眼睛能看到的最远的地方——以及更远的地方

眼睛所能看到的一切——甚至更远

塔利·德克尔博士的算法正在教会计算机模仿人类的视觉系统

希伯来语

新科学家

日期: 2020年9月14日

我们的眼睛——以及其背后广泛的人类视觉系统——有一种非凡的能力,可以从二维信息中理解我们的三维世界。通过算法和基于计算机的分析二维图像的技术,用人工手段模仿这种能力是一个主要的挑战。这正是Tali Dekel博士的研究重点,他将于1月份加入计算机科学与应用数学系。

Dekel博士在获得博士后奖学金后来到魏茨曼,首先在麻省理工学院的计算机科学和人工智能实验室工作,随后在马萨诸塞州剑桥的谷歌担任了四年的高级研究科学家。

从二维图像中重建空间几何是视觉计算领域的基本挑战之一。在任何给定的时间内,必须从两个角度捕捉物体,这要求被摄对象或相机保持静止。当摄像机和物体都在运动时,如何解释三维场景一直是计算机视觉领域的一个基本障碍。

在谷歌,Dekel博士通过结合计算机视觉和深度学习的基础知识,为这一挑战开发了一种解决方案。

为了“教”计算机从2D图像中预测人体的物理尺寸,Dekel博士发现了一个令人惊讶的新数据来源:YouTube上成千上万的“人体模型挑战”视频——这是一种互联网视频趋势,人们模仿人体模型,在移动的摄像机拍摄下冻结在原地。因为实验对象是静止的,它可以准确地估计整个场景的几何形状,包括其中的人。

基于大量此类视频及其背后的几何图形,德克尔设计了一个基于深度学习的模型,该模型可以分析非平稳视频片段,并准确解释其中任何移动的人的几何图形。这项技术未来的潜在应用有很多——例如,从先进的计算机图形效果,增强现实,机器人和自动导航。

在提交给2019年计算机视觉和模式识别会议的5000多篇论文中,这是首屈一指的年度会议计算机视觉2019年6月在加州长滩举行的活动,该作品是获得荣誉奖的两项作品之一。

模仿动作

在另一个项目中,德克尔博士开发了运动雕塑系统(MoSculp),可以将人体运动的复杂3D运动可视化。例如,如果展示一段奥运赛跑运动员的视频,MoSculp就可以重现他或她在空间中移动时所追踪的3D路径,并渲染出3D模拟。它甚至可以在物理上打印一个赛跑者的三维雕塑。

麻省理工学院博物馆最近与德克尔博士合作,创建了一个新的展览,”在运动,它探讨的是运动。虽然由于新冠肺炎疫情,博物馆暂时关闭,但此次展览展示了她的视频雕塑项目的灵感,一旦博物馆恢复运营,将向公众开放。

这些只是德克尔博士在计算机视觉和图形学方面的深度学习项目的一个样本。她为许多模型做出了贡献,这些模型有助于推动技术进步,并极大地增强我们对世界的视觉和听觉感知。

“在深度学习的新时代,我们可以超越我们今天认为可能的事情,”德克尔博士说。“一个全新的研究问题可以被提出和解决。”

塔利·德克尔博士获得了电气工程学士学位和硕士学位以优等成绩毕业者他来自特拉维夫大学。在苏黎世联邦理工学院(瑞士联邦理工学院)的迪士尼研究实验室实习后,她于2015年回到特拉维夫大学完成电气工程和计算机视觉博士学位。她在罗斯柴尔德博士后奖学金和以色列国家促进女性科学博士后奖的支持下完成了博士后研究。

今年,她获得了阿隆杰出青年研究人员奖学金。2019年,Dekel博士是第一位获得著名的埃里克和希拉·萨姆森总理奖的女性。她于2013年获得特拉维夫大学Norman W. Rosenberg教授纪念奖,并于2009年获得特拉维夫大学电气工程学院优秀奖学金。2005年,她获得RAD数据通信有限公司奖学金。

她已婚,有三个孩子。