公司建网站多,北京ui培训机构排行,阿里云域名备案网站建设方案,住建局官网查询入口相机模型
相机模型是计算机视觉中的重要内容#xff0c;用于描述真实相机如何将三维世界投影到二维图像平面。以下从多个角度介绍常见的相机模型。
针孔相机模型
针孔相机模型是最简单的相机模型#xff0c;用数学公式描述从三维世界到二维图像平面的映射关系。核心公式如…相机模型
相机模型是计算机视觉中的重要内容用于描述真实相机如何将三维世界投影到二维图像平面。以下从多个角度介绍常见的相机模型。
针孔相机模型
针孔相机模型是最简单的相机模型用数学公式描述从三维世界到二维图像平面的映射关系。核心公式如下 s [ u v 1 ] K [ R t ] [ X Y Z 1 ] s\begin{bmatrix}u\\v\\1\end{bmatrix}\mathbf{K}\begin{bmatrix}\mathbf{R}\mathbf{t}\end{bmatrix}\begin{bmatrix}X\\Y\\Z\\1\end{bmatrix} s uv1 K[Rt] XYZ1
参数解释 (X,Y,Z) 是世界坐标系中的三维点。(u,v) 是图像坐标系中的像素坐标。R∈SO(3) 和 描述相机的旋转和平移即相机位姿。K 是相机的内参矩阵包含焦距和主点坐标。s 是尺度因子表示物体在相机坐标系中的深度。 优点 精确描述了相机的透视投影特性。 局限性 忽略了真实相机中的畸变现象。
畸变模型
真实相机镜头存在一定的畸变常见畸变包括
径向畸变由镜头曲率引起导致直线变成弯曲。表达公式 p d p u ( 1 k 1 r 2 k 2 r 4 k 3 r 6 ) \mathbf{p}_d\mathbf{p}_u(1k_1r^2k_2r^4k_3r^6) pdpu(1k1r2k2r4k3r6) 其中 是未畸变点 p u \mathbf{p}_u pu到光轴的距离。切向畸变由于镜头与成像平面不完全平行引起。 表达公式 x d x u [ 2 p 1 x u y u p 2 ( r 2 2 x u 2 ) ] x_dx_u[2p_1x_uy_up_2(r^22x_u^2)] xdxu[2p1xuyup2(r22xu2)] y d y u [ p 1 ( r 2 2 y u 2 ) 2 p 2 x u y u ] y_dy_u[p_1(r^22y_u^2)2p_2x_uy_u] ydyu[p1(r22yu2)2p2xuyu] 通过校正畸变可以将畸变的图像点恢复到针孔相机模型中。
双目相机模型
双目相机系统由两个相机组成用于通过视差恢复三维点的深度信息。
几何关系 两个相机之间的相对位置和姿态由旋转矩阵 深度计算 Z f ⋅ b d Z\frac{f\cdot b}{d} Zdf⋅b 其中 是3D点的深度。 是相机焦距。 是基线长度两个相机的距离。 是视差两个相机对应点的像素差。
双目相机常用于三维场景重建。
RGB-D相机模型
RGB-D相机结合了传统的RGB图像和深度信息直接提供每个像素的深度值 。
深度值与3D点的计算 [ X Y Z ] Z ⋅ K − 1 [ u v 1 ] \begin{bmatrix}X\\Y\\Z\end{bmatrix}Z\cdot\mathbf{K}^{-1}\begin{bmatrix}u\\v\\1\end{bmatrix} XYZ Z⋅K−1 uv1 其中 (,) 是像素坐标 是相机内参。优点 能直接获取场景深度避免了双目相机的匹配误差。 常见设备 Kinect、Realsense、Lidar等。
图像
图像的基本定义
图像是对真实场景的二维采样由像素组成每个像素存储场景的亮度或颜色信息。图像的基本形式 灰度图像每个像素存储亮度值。彩色图像每个像素存储RGB三个通道的颜色值。
图像坐标系
像素坐标系以像素点为单位左上角为原点坐标为 (,)。图像坐标系以图像中心为原点单位为像素。
计算机中的图像
图像的存储
在计算机中图像以矩阵的形式存储 I [ I ( 0 , 0 ) I ( 0 , 1 ) ⋯ I ( 0 , n ) I ( 1 , 0 ) I ( 1 , 1 ) ⋯ I ( 1 , n ) ⋮ ⋮ ⋱ ⋮ I ( m , 0 ) I ( m , 1 ) ⋯ I ( m , n ) ] \mathbf{I}\begin{bmatrix}I(0,0)I(0,1)\cdotsI(0,n)\\I(1,0)I(1,1)\cdotsI(1,n)\\\vdots\vdots\ddots\vdots\\I(m,0)I(m,1)\cdotsI(m,n)\end{bmatrix} I I(0,0)I(1,0)⋮I(m,0)I(0,1)I(1,1)⋮I(m,1)⋯⋯⋱⋯I(0,n)I(1,n)⋮I(m,n)
每个 (,) 表示像素的亮度或颜色值。
图像的处理
图像处理包括滤波、边缘检测、特征提取等。在视觉SLAM中图像处理是特征点提取和匹配的基础。
3D视觉
双目视觉
双目视觉通过两个相机的配合计算场景的深度信息。核心原理 使用极线约束和视差进行三角测量。 双目视觉的应用 3D场景重建。目标检测与深度估计。
RGB-D视觉
RGB-D视觉直接提供深度信息常用于室内场景的三维建模。优势 数据采集速度快。深度信息精确无需匹配。 缺点 深度传感器对光线和环境敏感。
总结
相机与图像是计算机视觉的核心组成部分。从针孔相机模型到RGB-D相机模型从二维图像的表示到三维视觉的场景重建都离不开对相机模型的理解与应用。结合这些模型可以实现从图像到三维世界的感知与表达为计算机视觉和SLAM任务奠定了理论基础。