斯隆奖新晋得主宋舒然从视觉出发，建造机器人之眼

发布时间：2022-03-02 17:38:20 所属栏目：大数据来源：互联网

导读：「我一直希望家里有一个机器人，可以帮我洗衣服、做饭。」宋舒然谈道。而要实现这一设想，机器人视觉研究是不可缺少的一环。近年来，计算机视觉与机器人的「联姻」在人工智能领域如火如荼。单就自动驾驶来看，就有许多研究人员拥有计算机视觉的学科背景，

　　「我一直希望家里有一个机器人，可以帮我洗衣服、做饭。」

　　宋舒然谈道。而要实现这一设想，机器人视觉研究是不可缺少的一环。

　　近年来，计算机视觉与机器人的「联姻」在人工智能领域如火如荼。单就自动驾驶来看，就有许多研究人员拥有计算机视觉的学科背景，比如阿里达摩院自动驾驶实验室的前负责人王刚，中国RoboTaxi领先企业AutoX（安途）的创始人肖健雄等等。
　　

　　1、与机器人视觉的首次「邂逅」

　　不久前，2022年斯隆研究奖公布，计算机领域有四位华人女性科学家入选，宋舒然便是其中之一，名噪一时。

　　斯隆研究奖被誉为「诺贝尔风向标」，主要授予被认为在各自领域最有潜力的青年科学家，以往获得该荣誉的人工智能学者均非同凡响，如AI科技评论往期报道过的鬲融、马腾宇、方飞等等。宋舒然能成功当选，实力可见一斑。

　　但这并不是宋舒然第一次被「看见」。此前，她与团队已在多个国际机器人顶会上获得最佳论文奖，包括RSS 2019最佳系统论文奖、CoRL 2021最佳系统论文奖，以及2020年《IEEE Transactions on Robotics》最佳论文奖，是近年来「机器人视觉」赛道最知名的青年代表人物之一。

　　
　　回顾自己的研究经历，宋舒然对AI科技评论谈道，她第一次对机器人感兴趣，是在大一时上的第一门基础课上：

　　「那是我第一次接触到机器人。这门课没有教特别多的专业知识，就是一门动手操作的课，做一辆小车、最后让小车成功地跑起来，过程很简单，编程也很简单，但整个过程中有很多意想不到的惊喜，对我影响非常大。」

　　
　　作为一名土生土长的北京人，2008年奥运会加速了北京发展的国际化，年少的宋舒然对探索世界有着极高的热情。所以2009年她在高考前夕填写大学志愿时，除了北京大学的医学院，还报考了香港科技大学的计算机专业：

　　「我们那时候还是在高考前报志愿。一是报考香港的大学不占志愿名额，二是我当时就打算未来要出国走一走。相比直接就去英国、美国读书，香港是一个比较折中的选择。」

　　宋舒然自幼是一个擅长学习的学生，在重要的考试中总能发挥超常。出于对自我学习能力的自信，在报考大学志愿时，她也专门挑选了学习难度较高的专业。即使当时的编程基础几乎为零，在填写计算机为志愿专业时，她也没有任何犹豫。

　　也正是这股子无所畏惧的劲，让宋舒然在一个男性占大多数的领域中也能披襟斩棘、所向披靡。

　　2009年，宋舒然从北京南下，来到香港这座以国际化著称的城市。刚到港科大不久，她就明显地感觉到多元化的校园环境：

　　「高中时感觉周围的同学想要做的事情都差不多。到了香港后，发现大家想要实现的人生都很不一样。大家学不同的专业，有些人注重社交，有些人会提前规划职业发展，像我这样喜欢做研究的学生反而不多，所以我在本科时的科研机会也更多。」

　　大学期间，宋舒然有幸参加香港科技大学机器人社团（HKUST Robotics Team），还在2011年代表社团参加了一年一度的国际性机器人比赛——ABU Robocon。那一年，宋舒然与团队赢得了香港地区的选拔赛，代表香港去泰国参加决赛。

　　 2、请回答2015：突破3D视觉

　　2013年，宋舒然加入普林斯顿大学的计算机视觉与机器人实验室（计算机视觉领域的知名华人学者邓嘉也在共同领导该实验室）攻读博士，先后师从肖健雄（2016年离开普林斯顿去创业）与Thomas Funkhouser。据悉，Thomas Funkhouser每年均只招收1-2名博士生。

　　
　　读博期间，宋舒然的研究内容聚焦在计算机视觉。虽然本科时做过物体追踪项目，但宋舒然回忆，在刚开始读博时，她的视觉基础是相对薄弱的。

　　在导师的指导下，她延续本科时期的学习，先是研究3D物体检测与追踪。当时恰逢微软推出一个新的3D感知相机（Kinect 3D Camera Sensor-System），他们便思考是否能用这些新设备，将2D物体检测延伸到3D物体追踪。

　　
　　宋舒然对AI科技评论介绍，她第一次接触深度学习是在“3D ShapeNets: A Deep Representation for Volumetric Shapes”这篇工作中，经汤晓鸥与吴志荣的带领入门。当时，就读于香港中文大学的吴志荣到普林斯顿交换，宋舒然与他由此结识。

　　「那时候深度学习还没有那么火。2D视觉开始火起来，但把深度学习用于3D视觉的研究还几乎没有。我当时完全没有做过深度学习的研究，只是做过一些比较传统的2D识别与检测。因为志荣在汤晓鸥的组里做了很多深度学习的研究，所以我们就把他拉过来一起合作。」宋舒然回忆道。
　　
　　这是第一个成功通过深度学习方法将2.5D延伸到3D上的视觉工作。在此之前，深度学习多用在2D图像或自然语言处理上。「3D ShapeNets」首次展示了深度学习系统如何学习形状表征的过程，且通用性强，可以应用在多个不同的任务上，在计算机视觉领域产生了深远的影响。

　　对于宋舒然来说，这个工作既是她研究生涯中的一个里程碑，也是启发她在研究中采用「简单而高效」的方法论的起点：

　　「它很简单，但非常高效，唯一的限制是对算力的需求加大，因为数据的维度提升，计算量也会随之增长。此外，这是我第一次研究3D，我之后的许多工作都延续了这个项目的idea（观点），即用3D深度学习系统做形状表征。」

　　凭借在计算机视觉方向（尤其是数据驱动的3D场景理解）的一系列出色工作，宋舒然获得2015年Facebook博士生奖学金。她的工作登上普林斯顿研究校刊，还入选了「普林斯顿25岁以下创新25人」。

　　
　　3、从视觉到机器人

　　机器人对现实世界的感知准确率依赖于视觉中的3D语义场景完成技术。宋舒然在3D视觉上的研究突破奠定了她从事机器人视觉研究的基础。

　　从2016年提出「Deep Sliding Shapes」后，她就开始在研究视觉之余探索如何用3D视觉提高机器人推理周围环境的物体的能力。彼时，计算机视觉正越来越多地从分析单个静止图像转向理解视频和空间数据，对机器人的智能提升是一大利好。

（编辑：核心网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2022年制造业七大趋向	大数据转型方式首推数
孩子的工程思维计算思	重建通天塔 Meta策划建

斯隆奖新晋得主宋舒然 从视觉出发，建造机器人之眼

斯隆奖新晋得主宋舒然从视觉出发，建造机器人之眼