计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉。在本章中,您将详细了解这一点。

计算机视觉

计算机视觉是一门学科,根据场景中存在的结构的属性,研究如何从其2d图像重建,中断和理解3d场景。

计算机视觉层次结构

计算机视觉分为以下三个基本类别 -

  • 低级视觉 - 它包括用于特征提取的过程图像。
  • 中级视觉 - 包括物体识别和3D场景解释
  • 高级视觉 - 包括活动,意图和行为等场景的概念性描述。

计算机视觉与图像处理

图像处理研究图像到图像的变换。图像处理的输入和输出都是图像。

计算机视觉是从图像中构建对物理对象的明确,有意义的描述。计算机视觉的输出是对3D场景中的结构的描述或解释。

应用

计算机视觉在以下领域中得到应用 -

机器人

  • 本地化 - 自动确定机器人位置
  • 导航
  • 障碍避免
  • 装配(挂孔,焊接,喷漆)
  • 操纵(例如PUMA机器人操纵器)
  • 人机交互(HRI):与人交互和服务的智能机器人

医学

  • 分类和检测(例如病变或细胞分类和肿瘤检测)
  • 2D / 3D分割
  • 3D人体器官重建(MRI或超声)
  • 视觉引导机器人手术

安全

生物识别技术(虹膜,指纹,面部识别)

监视 - 检测某些可疑活动或行为

运输

自动驾驶汽车安全性,例如驾驶员警惕监控 工业自动化应用 工业检查(缺陷检测)部件条形码和包装标签阅读对象排序文件理解(例如OCR)

安装有用的包

对于使用Python的计算机视觉,您可以使用名为OpenCV(开源计算机视觉)的流行库。它是一个编程功能库,主要针对实时计算机视觉。它是用C 编写的,其主要接口是用C 编写的。您可以借助以下命令安装此软件包 -

pip install opencv_python-X.X-cp36-cp36m-winX.whl

这里X代表您机器上安装的Python版本以及您拥有的win32或64位。

如果您使用的是anaconda环境,请使用以下命令安装OpenCV -

conda install -c conda-forge opencv

阅读,写作和显示图像

大多数CV应用程序需要将图像作为输入并将图像作为输出生成。在本节中,您将学习如何借助OpenCV提供的功能读取和写入图像文件。

OpenCV函数用于读取,显示,写入图像文件

OpenCV为此提供以下功能 -

  • imread()函数 - 这是读取图像的函数。OpenCV imread()支持各种图像格式,如PNG,JPEG,JPG,TIFF等。
  • imshow()函数 - 这是在窗口中显示图像的功能。窗口自动适合图像大小。OpenCV imshow()支持各种图像格式,如PNG,JPEG,JPG,TIFF等。
  • imwrite()函数 - 这是写入图像的函数。OpenCV imwrite()支持各种图像格式,如PNG,JPEG,JPG,TIFF等。

示例

此示例显示了用于以一种格式读取图像的Python代码 - 在窗口中显示它并以其他格式写入相同的图像。考虑以下步骤 -

如图所示导入OpenCV包 -

import cv2

现在,要读取特定图像,请使用imread()函数 -

image = cv2.imread('image_flower.jpg')

要显示图像,请使用imshow()函数。您可以在其中查看图像的窗口名称为image_flower。

cv2.imshow('image_flower',image)cv2.destroyAllwindows()

现在,我们可以使用imwrite()函数将相同的图像写入另一种格式,例如.png -

cv2.imwrite('image_flower.png',image)

输出True表示图像已成功写入.png文件也位于同一文件夹中。

True

注意 - 函数destroyallWindows()只是破坏我们创建的所有窗口。

色彩空间转换

在OpenCV中,图像不是使用传统的RGB颜色存储的,而是以相反的顺序存储,即以BGR顺序存储。因此,读取图像时的默认颜色代码是BGR。所述cvtColor()中的图像从一个颜色代码转换为其他颜色转换功能。

考虑此示例将图像从BGR转换为灰度。

如图所示导入OpenCV包 -

import cv2

现在,要读取特定图像,请使用imread()函数 -

image = cv2.imread('image_flower.jpg')

现在,如果我们使用imshow()函数看到这个图像,那么我们可以看到这个图像在BGR中。

cv2.imshow('BGR_Penguins',image)

现在,使用cvtColor()函数将此图像转换为灰度。

image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)

边缘检测

人们在看到粗略的草图后,可以很容易地识别出许多物体类型和姿势。这就是边缘在人类生活以及计算机视觉应用中发挥重要作用的原因。OpenCV提供了一个非常简单有用的函数Canny()来检测边缘。

以下示例显示了边缘的清晰标识。

导入OpenCV包如图所示 -

import cv2import numpy as np

现在,要读取特定图像,请使用imread()函数。

image = cv2.imread('Penguins.jpg')

现在,使用Canny()函数检测已读取图像的边缘。

cv2.imwrite(‘edges_Penguins.jpg',cv2.Canny(image,200,300))

现在,要显示带边的图像,请使用imshow()函数。

cv2.imshow(‘edges', cv2.imread(‘‘edges_Penguins.jpg'))

这个Python程序将使用边缘检测创建一个名为edges_penguins.jpg的图像。

人脸检测

人脸检测是计算机视觉的迷人应用之一,使其更加真实和未来。OpenCV具有执行面部检测的内置工具。我们将使用Haar级联分类器进行人脸检测。

哈尔Cascade数据

我们需要数据来使用Haar级联分类器。您可以在我们的OpenCV包中找到这些数据。安装OpenCv后,您可以看到文件夹名称haarcascades。不同的应用程序会有.xml文件。现在,将它们全部复制以供不同使用,然后粘贴到当前项目下的新文件夹中。

以下是使用Haar Cascade检测Amitabh Bachan面部的Python代码,如下图所示 -

如图所示导入OpenCV包 -

import cv2
import numpy as np

现在,使用HaarCascadeClassifier检测面部 -

face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')

现在,要读取特定图像,请使用imread()函数 -

img = cv2.imread('AB.jpg')

现在,将其转换为灰度,因为它会接受灰色图像 -

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

现在,使用face_detection.detectMultiScale,执行实际的面部检测

faces = face_detection.detectMultiScale(gray, 1.3, 5)

现在,在整个脸部周围画一个矩形 -

for (x,y,w,h) in faces:
   img = cv2.rectangle(img,(x,y),(x w, y h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)

这个Python程序将使用面部检测创建一个名为Face_AB.jpg的图像,如图所示

眼睛检测

眼睛检测是计算机视觉的另一个迷人应用,它使其更加真实和未来。OpenCV有一个内置的工具来执行眼睛检测。我们将使用Haar级联分类器进行眼睛检测。

以下示例给出了使用Haar Cascade检测Amitabh Bachan面部的Python代码,如下图所示 -

导入OpenCV包如图所示 -

import cv2import numpy as np

现在,使用HaarCascadeClassifier检测面部 -

eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')

现在,要读取特定图像,请使用imread()函数

img = cv2.imread('AB_Eye.jpg')

现在,将其转换为灰度,因为它会接受灰色图像 -

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

现在借助eye_cascade.detectMultiScale,执行实际的人脸检测

eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)

现在,在整个脸部周围画一个矩形 -

for (ex,ey,ew,eh) in eyes:
   img = cv2.rectangle(img,(ex,ey),(ex ew, ey eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)

这个Python程序将创建一个名为Eye_AB.jpg的图像,其中带有眼睛检测,如图所示 -

以上就是AI与Python计算机视觉教程的详细内容,更多关于AI Python计算机视觉的资料请关注Devmax其它相关文章!

AI与Python计算机视觉教程的更多相关文章

  1. iOS – 开始iOS教程 – 变量之前的下划线?

    这是正确的还是我做错了什么?

  2. XCode 3.2 Ruby和Python模板

    在xcode3.2下,我的ObjectiveCPython/Ruby项目仍然可以打开更新和编译,但是你无法创建新项目.鉴于xcode3.2中缺少ruby和python的所有痕迹(即创建项目并添加新的ruby/python文件),是否有一种简单的方法可以再次安装模板?我发现了一些关于将它们复制到某个文件夹的信息,但我似乎无法让它工作,我怀疑文件夹的位置已经改变为3.2.解决方法3.2中的应用程序模板

  3. Swift开发快速上手系列教程目录-陆续完善,由浅入深

    Swift开发教程一.Swift基础Swift教程01-使用switfc终端命令编译运行swift程序Swift教程02-抓住下一个浪潮之巅Swift教程03-playground剖析swift语言Swift教程04-定义声明变量重要原则Swift教程05-基本数据类型(一)整型浮点型Swift教程06-基本数据类型(二)Bool布尔类型对比Java-boolean,Objc-BOOLSwift教

  4. Swift基本使用-函数和闭包(三)

    声明函数和其他脚本语言有相似的地方,比较明显的地方是声明函数的关键字swift也出现了Python中的组元,可以通过一个组元返回多个值。传递可变参数,函数以数组的形式获取参数swift中函数可以嵌套,被嵌套的函数可以访问外部函数的变量。可以通过函数的潜逃来重构过长或者太复杂的函数。

  5. Swift2.0不深入只浅出入门教程-01-The Basic

    本套视频教程是Swift2.0的入门教程,如果你看过其他的教程,可以不看这套教程,录制这套教程的目的,一个是为了自学,一个是为之后自己的另一套教程打基础。本期教程主要介绍Swift语言的一些基础知识。由于CSDN学院的课程审核还没有通过,所以暂时就放到了百度网盘。

  6. Swift教程-视频拍摄教程

    在此教程中,我们将拍摄一段保存到手机相册的视频。教程运行在iOS8.4和Xcode6.4下。打开Xcode并创建一个newSingleViewApplication,项目名称为IOS8SwiftTakeVideoPlayerTutorial,接着填上你的OrganizationName和OrganizationIdentifier,选择Swift语言,在设备一栏只选择iPhone。ImagePickerController的数据可以是Camera或Movie两种类型。视频的maximum长度设置为10秒。

  7. 10 个Python中Pip的使用技巧分享

    众所周知,pip 可以安装、更新、卸载 Python 的第三方库,非常方便。本文小编为大家总结了Python中Pip的使用技巧,需要的可以参考一下

  8. Swift、Go、Julia与R能否挑战 Python 的王者地位

    本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请发送邮件至dio@foxmail.com举报,一经查实,本站将立刻删除。

  9. 详解 SiriKit - SiriKit 教程Part 2

    此文章是SiriKit教程系列的第二篇,建议先去阅读第一篇。处理SiriKit请求为了让集成的Siri更有用,可以使用INSendMessageIntentHandling协议的回调方法增加信息内容。协议有以下可选方法:只要实现这些方法,就可以给SiriKit提供更多信息,例如接收者、内容、小组名字、服务名字或者发送者。后面会详细说明区别,现在先介绍如何使用Siri提供的数据。Siri传入的intent对象包含文字版的消息内容。现在当我们尝试发送消息时,SiriKit就明白必须要提供内容值。

  10. swift 学习资源 - Swift 语言指南

    对于精选项目及文章,可直接访问《Swift项目精选》和《Swift文章精选》。对于Swift开源及跨平台开发的同学,可以关注swift.org教程文章开源项目推荐网站苹果官方Swift:Swift概述、博客以及开发资源。swift.org:开源后独立出来的Swift开源社区。ksm/SwiftInFlux:作者将AppleDeveloperForums上有关Swift特性、缺陷及变更讨论分类汇总并更新到GitHub,具有很好的可读性。从中可以一窥Swift缺陷及未来潜在地变化。近期第一时间出了三本Swif

随机推荐

  1. 10 个Python中Pip的使用技巧分享

    众所周知,pip 可以安装、更新、卸载 Python 的第三方库,非常方便。本文小编为大家总结了Python中Pip的使用技巧,需要的可以参考一下

  2. python数学建模之三大模型与十大常用算法详情

    这篇文章主要介绍了python数学建模之三大模型与十大常用算法详情,文章围绕主题展开详细的内容介绍,具有一定的参考价值,感想取得小伙伴可以参考一下

  3. Python爬取奶茶店数据分析哪家最好喝以及性价比

    这篇文章主要介绍了用Python告诉你奶茶哪家最好喝性价比最高,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧

  4. 使用pyinstaller打包.exe文件的详细教程

    PyInstaller是一个跨平台的Python应用打包工具,能够把 Python 脚本及其所在的 Python 解释器打包成可执行文件,下面这篇文章主要给大家介绍了关于使用pyinstaller打包.exe文件的相关资料,需要的朋友可以参考下

  5. 基于Python实现射击小游戏的制作

    这篇文章主要介绍了如何利用Python制作一个自己专属的第一人称射击小游戏,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起动手试一试

  6. Python list append方法之给列表追加元素

    这篇文章主要介绍了Python list append方法如何给列表追加元素,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

  7. Pytest+Request+Allure+Jenkins实现接口自动化

    这篇文章介绍了Pytest+Request+Allure+Jenkins实现接口自动化的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

  8. 利用python实现简单的情感分析实例教程

    商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地,下面这篇文章主要给大家介绍了关于利用python实现简单的情感分析的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

  9. 利用Python上传日志并监控告警的方法详解

    这篇文章将详细为大家介绍如何通过阿里云日志服务搭建一套通过Python上传日志、配置日志告警的监控服务,感兴趣的小伙伴可以了解一下

  10. Pycharm中运行程序在Python console中执行,不是直接Run问题

    这篇文章主要介绍了Pycharm中运行程序在Python console中执行,不是直接Run问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

返回
顶部