计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉。 在本章中,我们将详细地学习。
计算机视觉是一门学科,根据场景中存在的结构特性,研究如何从 2D 图像重构,中断和理解 3D 场景。
计算机视觉层次结构
计算机视觉分为以下三个基本类别 -
图像处理将图像转换为图像。 图像处理的输入和输出都是图像。
计算机视觉是从其图像中构建对物理对象的明确而有意义的描述。 计算机视觉的输出是 3D 场景中结构的描述或解释。
应用 计算机视觉在以下领域中应用 -
对于使用 Python 的计算机视觉,您可以使用名为 OpenCV(开源计算机视觉)的流行库。 它是一个主要针对实时计算机视觉的编程功能库。 它用 C++ 编写,其主要接口是 C++。 可以借助以下命令来安装此软件包 -
pip install opencv_python-X.X-cp36-cp36m-winX.whl
这里X代表示机器上安装的Python版本,以及所拥有的 win32 或 64 位版本。
如果您使用的是 anaconda 环境,请使用以下命令安装 OpenCV -
conda install -c conda-forge opencv