• 问答
  • 技术
  • 实践
  • 资源
学习了哪些知识,计算机视觉才算入门?精选
技术讨论
来源:Jinming Su


回答一:

1. 道

计算机视觉分很多方向,个人比较熟悉的是图像方面的,包括:图像分类、目标检测、图像分割、视频处理等,这些小的方面每一个也学要很长的一段时间去学习.

入门这个东西很难定义,如果只是对一个方向看一下,了解一点东西,有一点谈资的话不算入门,我认为入门至少代表你对这个领域的某些东西进行过处理实践才可以,所以我比较喜欢的一种学习新知识的方式就是:先找一个综述的书随便翻一翻,对目录有个印象就行,然后针对自己喜欢的部分,去查资料,做实例,看论文,一段时间后,自然就会有自己的理解了.

---------- 半年后更新

2. 术

需要哪些数学 编程 工具 等知识?

数学知识的话,大概基础的就是概率论、数理统计、矩阵论

编程基础的是python、matlab

工具上,现在一般是用框架,我常用caffe,还有一些其他常用的框架tensorflow、pytorch、mxnet等

入门的话,本科的数学知识基本就够了,然后开始看论文吧。基本现在搞计算机视觉(Computer Vision, CV)都是基于深度学习的。第一篇推荐alexnet,算是深度学习搞CV的开山之作,接着基本就是需要先把分类的看一看,现在的CV大多数任务都是基于分类任务的深度网络进行扩展的。

列一些个人感觉必看的论文(只写出名字,链接自己去找吧):

AlexNet

ZFNet

VGGNet

GoogLeNet

ResNet

SeNet

DenseNet

上述论文每一篇都精读,看一篇论文之后跑一下作者提供的source code,大概就对使用深度学习搞计算机视觉了解个大概了。

之后就是根据自己的兴趣,detection、tracking、semantic segmentation、visual Q\&A、image captioning等,自己去找相应的论文去看吧。

入手一个新的领域,先找那些著名的论文,精度10篇,基本就入门了。



回答二:

请将下面的网站的slides看完,辅助slides中提到的书的章节,应该可以入门了,1-2个月时间即可,我现在就在看,大四,有相应的数学和图像基础,有机器学习,深度学习基础(除了CS231n外不怎么涉及,CS231n本身就是讲cNNs在视觉方面的应用的,当然有一定基础可以更容易理解)。
以下课程都是斯坦福计算机视觉实验室的。
实验室主页:vision.stanford.edu/
CS 131 Computer Vision: Foundations and Applications:
vision.stanford.edu/tea
CS231A Computer Vision: from 3D reconstruction to recognition:
cvgl.stanford.edu/teach
CS231n: Convolutional Neural Networks for Visual Recognition
vision.stanford.edu/tea
以上三门课就可以入门了,当然还有很多其他高等级的课,可以去实验室主页看看。
资料不宜贪多,谢绝其他资料干扰,安心的把这些lectures看完。然后就可以上手做项目和看论文了。论文才是王道。


回答三:

十分赞同 方杰 的观点,从课入手,不要贪多。不知道其他人怎么样,入门的话,相较于看书,我个人是偏向于找个公开课看的。一本书从写到出版步骤复杂耗时长导致迭代比较慢,而课都是由最前沿的研究者实时更新的。而且相较于书,课上的slides或notes更突出重点且好理解。

方杰的回答提供的课程都比较老了,所以我在这里贴上CS231n2017Spring给的推荐课程。

其中相关的最新的CV课的传送门:

本科生入门课 CS131 2017 FALL

CS131 Computer Vision: Foundations and Applicationsvision.stanford.edu

进阶 CS231a 2018 Winter

CS231A: Computer Vision, From 3D Reconstruction to Recognitionweb.stanford.edu

当然还有更广为人知的基于神经网络的CS231n 2017 Spring

CS231n: Convolutional Neural Networks for Visual Recognitioncs231n.stanford.edu

推荐课程来源见下图。

v2-6c04dd743ec2120debd02279d5453e09_720w.jpg?source=1940ef5cv2-6c04dd743ec2120debd02279d5453e09_720w.jpg?source=1940ef5c

  • 1
  • 1
  • 2005
收藏
暂无评论
Find me
大咖

一个大的公司

  • 15,968

    关注
  • 262

    获赞
  • 54

    精选文章
近期动态
  • 哈工大深圳研究生院CV汪,请原谅我这一生放纵不羁爱CV~
文章专栏
  • Awsome-Github 资源列表