中国专业的国际教育交流服务机构
留学e网客服电话

当前位置:老首页 > 院校申请 > 美国留学 > 美国留学资讯

对美国computer vision reseach的独特看法

  如今美国大学CS专业有很多细小的研究方向。如computer vision,几十年前是没有这个单独的研究方向的,最接近的是AI这个方向。MIT的一些学生在做一个课程project的时候选了这么一个题:在图像中识别一些3维物体,这些3维物体都是rigid,但是视角和远近可能不同。本来大家觉得AI很难,但是这个问题应该不太难,结果越做越发现这个东西其实很难,即使是rigid物体,因为不同角度,不同位置你看到的样子都不同,可变性太大。 这个project从一开始的课程project,后来到整个暑假project,..., 后来到computer vision. 这个问题就是computer vision的核心问题object recognition. 就如同算法中NP问题可以互相转换并且本质一致 一样,AI ,learning, vision的问题也许也可以互相转化,就叫它 AI-complete 吧。这个说法我导师曾经提到过,我用一下。

  又一次和导师讨论,我说你把computer vision 的secrect 告诉我。导师说:

  1) observation

  要想解决vision问题首先要观察,问题在哪,哪里入手,现象背后是否有物理含义。如果提出一个方法是否可以分析解释的清楚。自己的方法是否可以和问题本质联系在一起。这个过程很重要,很多好paper都是有很妙的对某些问题的observation,而别人没有发现。

  2) assumption

  有一句话 you can not do inference without assumption. 世界上的事情可变性非常大,如果你假定什么事情都可能发生,参数可能服从于任何概率分布,那就什么也无法解。任何问题都有假设,假设是一个很基本的简化问题的方法。最典型的 假定某些参数服从 gaussin 分布。不要怕做假设,只要它有合理性。

  3) mathematical formulation

  接下来就是根据你的observation和assumption把问题formulate出来。这是你能否写成paper的关键。你要用数学语言把你想解的问题勾勒出来。fomulation的背后是你对问题的理解,也就是直接与observation相关。

  4) regularization

  并不是所有formulation都能work out的。比如你的fomulation有很多参数,overfitting,优化问题接踵而来。当你发现model参数太多时你需要regularize。这可以认为是对参数解空间的限制或者是prior。总之你要做一些理论上讲的通的事情使你的formulation可解。

  5) optimization

  最后一步就是优化问题,目标就是在整个框架下得到你的解。

  第一和第三步很重要,也是contribution之所在。我喜欢文章体现一个interesting的observation并很好的formulate它而解决问题的。如果optimization做的很elegant就更好了

  比较不喜欢在别人的observation框架下炒冷饭的文章,如果formulation也没有新意就更没意思了。

  回头看看,大部分vision都能用这个过程来演绎。如果你能体会并领悟每一步在做什么,为什么重要,那么你就入门了。

  (编辑:Ada)

英国留学签证攻略 

澳洲初高中留学攻略 

CCTV央视网牵手留学e... 

新西兰地图,新西兰大... 

英国G5精英大学Offer...