昆都伦门户网

首页 > 正文

深度学习怎么和计算机视觉扯上关系了?

www.tenimizer.com2019-09-22

计算机视觉是使用计算机和相关设备模拟生物视觉。它是人工智能领域的重要组成部分。其主要任务是通过处理捕获的图片或视频来获取相应场景的信息。

传统计算机视觉系统的主要目标是从图像中提取特征,包括边缘检测,角点检测和基于颜色的分割等子任务。传统的特征提取算法包括尺度不变特征变换匹配算法(SIFT),加速鲁棒特征算法(SURF)和二元鲁棒独立基本特征(BRIEF)。根据输入图像的类型和质量,不同的算法执行不同。最终,整个系统的准确性取决于提取特征的方法。

这种方法的主要问题是需要告诉系统在图像中寻找哪些特征。本质上,假设算法按照设计者的定义操作,并且提取的特征是人工设计的。在实现中,算法的不良性能可以通过微调来解决,但是这种改变需要手动完成并且针对特定应用进行硬编码,这对于实现高质量计算机视觉构成了主要障碍。

然而,深度学习的出现解决了这个问题。目前,深度学习系统在处理一些相关的子任务方面取得了重大进展。深度学习的最大区别在于它不再通过编程良好的算法搜索特定功能,而是在深度学习系统中训练神经网络。随着深度学习系统提供的增强的计算能力,计算机将能够识别并响应它所看到的一切,并且这已经取得了重大进展。在本文中,您将看到计算机视觉分析中的五种深度学习应用。

1,图像分类

图像分类是为图像分配标签的任务。当图像中有单个类并且在图像中清晰可见时,这非常有用。例如,照片将被分类为白天或夜晚。另外,在运输领域,可以使用图像分类来检测汽车是否在停车位,即停车位是否被占用。

2,图像分类与定位

具有定位的图像分类是更具挑战性的图像分类任务。这涉及为图像分配类标签并通过边界框显示图像中对象的位置,即在对象周围绘制一个框。

该过程是负责车辆识别的系统中的必要步骤。对于查看汽车图片的自动系统,当场景仅包含一辆汽车时,一旦确定了车辆的位置,系统就可以识别诸如品牌,型号和颜色的属性。当图片中有未知数量的对象时,此任务变得困难。在大多数照片中,特别是在公共场所,有许多可能性,例如不同的人,车辆,树木等,这成为目标检测问题。

3.目标检测

目标检测是研究包含多个对象的图像的重要领域。例如,用于机器人和自动驾驶汽车的计算机视觉系统面对非常复杂的图像。毫无疑问,定位和识别每个对象无疑将成为其自动化的关键部分。

4.图像重建

图像重建是重建图像的缺失或损坏部分的任务。此任务可以被视为照片过滤器或无需客观评估的转换。尽管确实可以确保图像的可见属性紧密匹配,但要求计算机在没有参考的情况下重新创建细节显然是不合理的。因此,图像重建系统具有显着的局限性,主要取决于有多少原始图像可用于学习。

用于图像重建的模型被称为像素递归神经网络。这是一个使用递归神经网络(RNN)来预测二维图像中像素不存在的系统。图像重建应用的示例是照片恢复或黑白电影。在自动驾驶车辆中,图像重建可用于观察小障碍物,例如车辆和被跟踪的行人之间的道路标志。

5.目标跟踪

计算机视觉的一个重要目标是能够识别随时间发生的事件。目标跟踪是一个示例,其目标是跟踪图像或视频中的特定对象。目标跟踪对于几乎任何包含多个图像的计算机视觉系统都很重要。例如,在足球训练中,每个运动员的时间序列位置信息可以通过目标跟踪获得,并且可以通过研究他的身体和战术特征来进行科学训练。

写在最后:

近年来,深度学习的发展不仅突破了许多困难的视觉问题,而且提高了图像识别水平,加速了计算机视觉领域相关技术的进步。相信随着深度学习模型的改进和计算能力的不断提高,自治系统可以继续稳步发展,真正的实现可以解释和反映他们所感知的内容。

参考链接:

MG真人视讯

热门浏览
热门排行榜
热门标签
日期归档