四川广泰科技有限公司

从图像处理到计算机视觉

发表时间:2022-10-17 10:57

很多人可能并不知道图像处理和计算机视觉的区别与联系,在涉及具体的算法之前,我们要先对这些名词有一个基本的理解,这样有助于在后面的学习中建立一个清晰的脉络,分清楚不同技术的用途和类别。因此,本文的目的是阐述图像处理和计算机视觉的区别,帮助读者梳理清楚基本概念,建立一个更加抽象的认知。

图像处理



狭义定义:图像处理是对图像进行修改,比如说图像去噪、对比度增强、图像锐化和边缘检测等。图像处理的输入是图像,输出也是图像。
这种狭义的定义有一定的局限,比如说,在该定义下,计算一幅图像的平均灰度这样简单的任务也不算是图像处理。
需要注意的是,在后面的文章中,我们并不局限于狭义的图像处理,而是采用这种定义方式:图像处理是指输入和输出都是图像的处理,包括从图像中提取特征等。

图像处理与计算机视觉


相比于计算机视觉,图像处理处于更低级的水平,其主要是对图像进行处理并输出图像,而计算机视觉的目标是从输入的图像或者视频中获得高级理解,从而可以使用计算机来模拟人类的视觉,进而完成人类视觉可以完成的任务。相比之下,计算机视觉处在更高级的水平。
其实从图像处理到计算机视觉并没有特别清晰的边界,图像处理也是计算机视觉使用到的技术之一。为了得到更加清晰的边界,将图像处理到计算机视觉中的技术分为三个级别:低级处理、中级处理和高级处理。低级处理的输入和输出都是图像,如图像去噪、对比度增强、图像锐化。中级处理的输入是图像,输出是从图像中提取的特征,如边缘、轮廓检测,图像分割等。高级处理的输入是图像/视频,输出的是知识,如分类的结果。
尽管现在深度学习在计算机视觉上效果很好,但相比传统的图像处理方法,深度学习缺少可靠的解释,往往被人们当做一个黑盒模型;另外,深度学习本质上是通过数据驱动,需要大量的数据,让模型自己去学习卷积核等参数,不需要手动提取特征,所以降低了图像处理的门槛。然而,在很多深度学习的论文中,我们都能发现传统图像处理方法的影子,如连通域,滤波等操作。
现在网络结构层出不穷,然而计算机视觉的提升不在于搭建模型,而在于不断调优、改进过程中积累的经验。你得知道为什么要这样设计,如何去改进,这就需要你对图像处理有一个底层的理解。因此,即使在深度学习成为主流的今天,传统的图像处理方法也是必须了解和掌握的。此外,在有些应用中,传统方法仍然是主流。

图像处理与计算机视觉的区别如下表格:


应用

我们可以在具体应用中看出图像处理和计算机视觉的差别。

汽车领域的计算机视觉:

驾驶员分心是导致汽车事故的直接原因之一。计算机视觉可以帮助驾驶员保持清醒,并确定驾驶员是否过于疲惫而无法安全驾驶车辆。使用计算机视觉的程序可以通过分析驾驶员的眼睛状态或肢体的运动来持续检查驾驶员的状况。

图片

工厂中的计算机视觉:

计算机视觉在工厂中的应用有很多,包括对产品进行自动计数,规范装配过程等。另外,企业可以使用计算机视觉来执行诸如分析盖子和填充水平、检查产品组件以确保它们符合生产标准等任务。

图片

运动健身中的计算机视觉:

Sentio公司开发了一个运动解析程序,可以跟踪和分析足球运动员,让足球教练更全面地了解比赛的进行方式。计算机视觉和图像处理系统还用于提高篮球训练期间的投篮准确性(诺亚系统),并通过实时收集从划水频率到速度和转身时间的数据来帮助游泳者提高技术。

图片
图片

医学影像中的计算机视觉:

图像增强是一种在当代医疗保健中广泛使用的技术,用于提高图像质量及其可读性。通过使用这种技术来减少噪声和锐化细节,可以改善图像的视觉表现。该技术用于医学成像。此外,这种方法将客观和主观的增强结合到过程中。事实证明,许多医学成像技术,如 X 射线、CT 扫描和 MRI,都存在对比度太低的问题。因此,图像的整体质量会受到影响。这是图像增强必不可少的主要原因。

图片

共聚焦显微镜图像、眼底彩照、内窥镜图像处理前后对比