图像处理,计算机视觉与machine learning的区别与联系
来源:内容来自大话成像,谢谢。
随着科技进步的加速,新的技术出现并且成熟的速度明显地加快了,过去我们老说成像技术,信号处理,图像处理,后来又经常说计算机视觉,现在则铺天盖地都是 machine learning 。这些技术或多或少的在我们的身边出现,到底他们是什么,与我们目前的工作有哪些联系和区别?我们就先从输入,输出,工作方法三个角度来谈一谈图像处理,计算机视觉与 machine learning 的关系。
图像处理的输入输出都是图像,用信号处理的方法对图像进行滤波,去噪,边缘增强,色彩还原等处理。
计算机视觉的输入可以是图像,视频,或者是来自于视觉数据的量化信息。输出则是属性信息,比如大小,距离,颜色,数量,类别,形状等。所使用的方法既包含图像处理的技术方法,也包含其他的技术,可以说计算机视觉的技术外延更大。如果说图像处理主要是针对二维的图像,那么计算机视觉主要是针对三维的空间。
成像技术可以说主要是制作图像,图像处理主要是增强图像,到了计算机视觉,侧重点就主要是分析理解图像了。
Machine learning 则是一种可以应用在计算机视觉中帮助解决识别等问题的方法。所以在这个领域工作可以遇到的一种情况就是,工作在计算机视觉的公司,包含了这三个技术方向的工程师,因为没有好的成像和图像处理,也就没有好的计算机视觉的输入,没有 machine learning 的技术,计算机视觉会有很多难解的问题。
以一个产品开发为例说说这三者之间的联系。比如我们要开发一个水下监控相机,用来监控海边浴场附近的鲨鱼,既可以人工监测,也具有自动监测功能。自动监测一旦监测到出现鲨鱼,就会警告游泳的人赶紧离开。
首先做 camera 的工程师上场,做出一个在水下能清晰摄影的相机,图像处理工程师根据应用场景做图像的优化,比如去炫光,散射,处理 HDR ,做 tone mapping ,边缘增强,色彩处理等等。
然后做计算机视觉的工程师上场,做几何标定,运动检测,物体跟踪,计算游动物体的大小和速度。
如果大小和速度在一定的范围内,就认为是鲨鱼。
相机用了一段时间,发现一个问题,就是经常出现虚警,附近活动的潜水员经常会被认为是鲨鱼,因为潜水员的游速和大小与某种鲨鱼很近似,所以很容易被认为是鲨鱼。这时候就该 machine learnning 工程师上场了,他们把之前相机拍的所有视频拿来,把所有有鲨鱼的图像标定出来,输入到一个或者几个模型进行训练,教这个模型认识什么是鲨鱼,这个模型可以是 SVM , Neural Networks ,决策树等等。
最后用新采集的视频进行测试,把几个模型的识别率做比较。
可以看出 Deep CNN 完爆其他方法。
识别成功率只是一个方面,运行的速度也非常重要,所以要综合考虑到底用哪种模型。总而言之, machine learning 的方法是计算机视觉的一个重要补充。在这个例子里,它可以大幅减少虚警的情况。
从这个例子我们可以看出,图像处理和计算机视觉工程师基本的工作方法是有很多共性的, Machine learning 工程师可以完全不懂图像处理,他们主要研究的对象是模型。在笔者办公室里坐着这三个技术方向的工程师, machine learning 的工程师很多都是数学系毕业的。我咨询了一下从事这方面工作的同事 ,他给了下面的一些网上免费学习cv和ml的资料,感兴趣的朋友可以自学,大话成像公众号也会在将来多延伸一些计算机视觉和 machine learning 的文章与大家分享。
斯坦福大学的CV公开课
http://cs231n.stanford.edu/syllabus.html
https://www.youtube.com/watch?v=vT1JzLTH4G4&list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv
深度学习课程,通过测试还能拿到证书
https://www.deeplearning.ai/
今天是《半导体行业观察》为您分享的第1557期内容,欢迎关注。
R
eading
推荐阅读(点击文章标题,直接阅读)
关注微信公众号 半导体行业观察 ,后台回复关键词获取更多内容
回复 兆易创新 ,看与兆易创新公司相关的文章
回复 摩尔定律 ,看更多与摩尔定律相关的文章
回复 材料 ,看更多与半导体材料相关的文章
回复 面板 ,看更多面板行业的文章
回复 晶体管 ,看更多与晶体管相关的文章
回复 晶圆 ,看晶圆制造相关文章
回复 士兰微 ,看更多与士兰微公司相关的文章
回复 展会 ,看《2017最新半导体展会会议日历》
回复 投稿 ,看《如何成为“半导体行业观察”的一员 》
回复 搜索 ,还能轻松找到其他你感兴趣的文章!
点击阅读原文了解摩尔精英