这是用户在 2025-6-30 2:46 为
https://www.wolai.com/qgQXf2q2Ce6RnJbsZqB9qo
保存的双语快照页面,由
沉浸式翻译
提供双语支持。
了解如何保存?
网络可能有一点问题,请重新加载
重新加载
IPMV-2022
15
HW--StereoCamera
Summary
Lecture14_IPMV_with_Deep_Learning
Lecture13_Sfm_and_SLAM
Lecture12_Motion_光流
Lecture11_Stereo_Matching
Lecture10_Interest_Points
Lecture9_Edges_&_Lines
Lecture8_Image_Pyramid_图像金字塔
Lecture7_Image_Filtering
Lecture6_Epipolar_Geometry_(II)_对极几何
Lecture5_Epipolar_Geometry_(I)_对极几何
Lecture4_Camera_Calibration
Lecture3_Perspective_Transformation
Lecture2_Human_Visual_Perception,Cameras_&_Images
未搜索到相应页面
IPMV-2022
Lecture6_Epipolar_Geometry_(II)_对极几何
Lecture6_对极几何(II)
演示模式
搜索
评论
前往我的空间
Lecture6_Epipolar_Geometry_(II)_对极几何
Lecture6_对极几何(II)
author:Yi Yang & Zhengpu Wang
author:杨毅 & 王正谱
update : 2022/04/22 16:42
更新日期:2022/04/22 16:42
线索
这里写主要线索
1
2
3
4
5
6
笔记
这里是主要的笔记内容
author:Yi Yang & Zhengpu Wang
作者:杨毅 & 王正谱
1Preliminaries
1 前置知识
Lecture6 的预备知识基本上是 Lecture3、4、5
的知识。可以去复习一下。
2 Triangulation 三角化
2 三角化
2.1
三角化引入
计算机视觉中的三角化(三角测量),指的是
确定三维空间中的一个点的位置
,通过把其
投影
到两个或两个以上的图像上的过程。
为了处理这个问题,有必要知道摄像机投影函数从三维到二维的参数,在最简单的例子是用
相机矩阵
表示。
那么,我们需要什么呢?答案:
R
,
t
,
p
L
,
p
R
,
K
L
,
K
R
2.2
三角化推导
在
Lecture 3 我们了解了透视变换矩阵(perspective
transformation matrix)
变换矩阵)
P
L
=
K
L
[
I
,
0
]
∈
R
3
×
4
P
R
=
K
R
[
R
,
t
]
∈
R
3
×
4
了解如何使用数学公式
不再提示
这里,
I
是单位矩阵,
P
L
目的是将左相机对齐世界坐标系,
P
R
是左相机和右相机的变换关系。
理想情况下,
p
L
×
(
P
L
p
C
)
=
0
p
R
×
(
P
R
p
C
)
=
0
了解如何使用数学公式
不再提示
写成反对称矩阵的形式,
0
1
−
v
L
−
1
0
u
L
v
L
−
u
L
0
P
L
1
p
C
P
L
2
p
C
P
L
3
p
C
=
0
了解如何使用数学公式
不再提示
where
P
L
k
代表
P
L
的第
k
行。
上式继续改写成方程组形式
⎩
⎨
⎧
v
L
(
P
L
3
p
C
)
−
(
P
L
2
p
C
)
=
0
u
L
(
P
L
3
p
C
)
−
(
P
L
1
p
C
)
=
0
u
L
(
P
L
2
p
C
)
−
v
L
(
P
L
1
p
C
)
=
0
了解如何使用数学公式
不再提示
发现第
2
行乘以 v_L ,减去第
1
行乘以
u_L,就得到第三行。所以上面矩阵的秩为
2.也说明上面三个等式,只有
2
个是线性独立的,第三个可以用其他两个等式表示。
所以把上式写为,
{
u
L
(
P
L
3
p
C
)
−
(
P
L
1
p
C
)
=
0
v
L
(
P
L
3
p
C
)
−
(
P
L
2
p
C
)
=
0
了解如何使用数学公式
不再提示
写为矩阵形式
[
u
L
P
L
3
v
L
P
L
3
−
P
L
1
−
P
L
2
]
p
C
=
0
了解如何使用数学公式
不再提示
类似地,
[
u
R
P
R
3
v
R
P
R
3
−
P
R
1
−
P
R
2
]
p
C
=
0
了解如何使用数学公式
不再提示
因此,我们得到,
u
L
P
L
3
v
L
P
L
3
u
R
P
R
3
v
R
P
R
3
−
P
L
1
−
P
L
2
−
P
R
1
−
P
R
2
p
C
=
0
了解如何使用数学公式
不再提示
重新表示为,
A
p
C
=
0
了解如何使用数学公式
不再提示
可以使用
SVD(奇异值分解)来解这个方程。为什么?
给定
A
x
=
0
,把问题转化为
E
=
∣
∣
A
x
∣
∣
2
2
=
(
A
x
)
T
A
x
=
(
U
∑
V
T
x
)
T
U
∑
V
T
x
=
x
T
V
∑
T
U
T
U
∑
V
T
x
=
x
T
V
∑
T
∑
V
T
x
=
∣∣
∑
V
T
x
∣
∣
2
2
,
s
.
t
.∣∣
x
∣
∣
2
2
=
1
了解如何使用数学公式
不再提示
注意转置和
U
是单位正交阵,
U
T
U
=
I
定义
y
=
V
T
x
由于
∣∣
x
∣
∣
2
2
=
1
,所以
∣∣
y
∣
∣
2
2
=
1
为何?
V
是一个单位正交阵,模为
1.(换个角度,
V
的作用只是旋转,让
x
在一个球面上旋转,所以模还是
1)
因此,
E
=
∣∣
∑
y
∣
∣
2
2
=
σ
1
2
y
1
2
+
σ
2
2
y
2
2
+
...
+
σ
n
2
y
n
2
,
s
.
t
.∣∣
y
∣
∣
2
2
=
1
因为
σ
1
≥
σ
2
≥
...
≥
σ
n
≥
0
, 当
y
=
[
0
,
0
,,,,
1
]
T
时,
E
就可以取到最小值
σ
n
.
所以
x
=
V
y
=
[
v
1
,
v
2
,
...
,
v
n
]
[
0
0
.
.
.
1
]
=
v
n
2.3
三维重建效果图
3 Stereopsis 立体视觉
三维场景几何重建是利用一对同步摄像机的左右图像之间对应的像素对来完成的,也就是说
三维重建的任务,就是研究
如何关联两个相机的图像平面。
对于没有标定的立体视觉设备,寻找图像的对应点计算量非常大。而如果立体视觉设备被标定了,那么搜索过程就大大简化了,变成
沿着对极线的一维搜寻
过程。
判断同步精度可以同时拍手机秒表测试,看误差有多少。
所以使用双目相机,要注意两件事
左右相机要
同步
到手之后先做
标定
如图,黑色的对极平面
π
L
,
π
R
、对极线是未标定状态(原始出厂设置),而红色的对极平面、对极线是标定之后的,两个平面
π
L
‘
,
π
R
‘
在同一个平面上,且对极线在同一条直线上,对极线真正成为图像的一行。
3.1
双目相机校正步骤
1
1
旋转左相机平面,和右相机平面对齐。by
R
2
旋转左右相机平面(by
R
rec
t
)使得图像平面和向量
t
平行,也就是垂直于光轴
3
调整左右图像标度,by 给两个相机设定一样的内参矩阵
R
rec
t
=
e
1
T
e
2
T
e
3
T
了解如何使用数学公式
不再提示
这里
e
1
=
∣∣
t
∣
∣
2
t
,
e
2
=
∣∣
[
0
,
0
,
1
]
T
×
t
∣
∣
2
[
0
,
0
,
1
]
T
×
t
,
an
d
e
3
=
e
1
×
e
2
这里怎么
理解这个
R
rec
t
比较重要
(36 封私信 / 75 条消息) 线性变换的矩阵为什么要强调在这组基下? - 知乎 (zhihu.com)
用
R
rec
t
去左乘原来的坐标系,就是让原来的坐标系旋转。
横着看,每一行就是新坐标的
x,y,z
轴,由原来坐标系
x,y,z
轴线性组合而成,每一行就是线性组合的系数。比如第一行
e
1
是
[
1
,
0
,
0
]
,就意味着
x
′
=
1
x
+
0
y
+
0
z
,这里的字母都指向量。
看
这一页理解
,动手写一写就明白了。豁然开朗很爽。
所以回过头来看,e1
就是新坐标系的
x
轴方向就是 t
的方向,e2
是世界坐标系的
z
轴
z
W
=
[
0
,
0
,
1
]
和
t
叉乘,就得到方向向下的新
y
轴,然后新
x
轴和新
y
轴叉积就是新
z
轴,这里的
z
轴实际上就是
z
W
=
[
0
,
0
,
1
]
)
2022/05/17 update:这里每一行和每一列的理解要看旋转矩阵和坐标向量具体的定义形式。
3.2
校正好的系统
校正好的系统特点有
3
个,
1
左右图像就像是被
一对平行的、拥有相同内参矩阵
的相机拍的,
2
每一对
对极线共线且平行于水平图像轴
t
3
因此,寻找对应点就简化成了
一维搜索问题
校正好的系统如下图所示
可以看到,两个平面的对极线在同样的高度。
这样的系统可以被看作特殊的对极几何系统,
左右相机互相完全平行
x
L
C
和
x
R
C
轴是共线的。
o
L
C
和
o
R
C
是左右相机的光心。
立体视觉设备的
基线
T
c
,被定义为
o
L
C
和
o
R
C
之间的距离。可以理解为
瞳距
。
左右相机的内参矩阵给定为,
K
L
=
K
L
=
K
=
f
0
0
0
f
0
u
o
v
o
1
了解如何使用数学公式
不再提示
3.3
校正的数学推导
p
W
=
[
x
W
,
y
W
,
z
W
]
T
是世界坐标系里的一个
3
维的点,投影在左右相机坐标系里坐标分别为
p
L
C
=
[
x
L
C
,
y
L
C
,
z
L
C
]
T
,
p
R
C
=
[
x
R
C
,
y
R
C
,
z
R
C
]
T
我们认为左右相机是完全一样的(在一个经过良好校正的立体视觉系统),
s
x
和
s
y
简单设成
1
,
f
x
=
f
y
=
f
p
W
在对极平面
Π
L
、
Π
R
的投影点;
p
L
=
[
x
L
.
y
L
,
f
]
T
,
p
R
=
[
x
R
.
y
R
,
f
]
T
世界坐标系的原点
o
W
,是线段
L
的中点,
L
=
t
o
L
C
+
(
1
−
t
)
o
R
C
∣
t
∈
[
0
,
1
]
z
W
轴和相机光轴平行,和对极平面
Π
L
、
Π
R
垂直。
因此,一个
WCS
的任意点
p
W
可以转换成
p
L
C
和
p
R
C
通过:
p
L
C
=
I
p
W
+
t
L
,
p
R
C
=
I
p
W
+
t
R
,
了解如何使用数学公式
不再提示
w
h
ere
,
t
L
=
[
2
T
c
,
0
,
0
]
T
,
t
R
=
[
−
2
T
c
,
0
,
0
]
T
利用
WCS
和
IPCS
的转换关系,我们得到
x
L
=
f
z
W
x
W
+
T
c
/2
,
x
R
=
f
z
W
x
W
−
T
c
/2
,
y
L
=
f
z
W
y
W
y
R
=
f
z
W
y
W
了解如何使用数学公式
不再提示
再利用
CCS
和
PCS
的关系,把上式代入得
p
L
=
[
u
L
v
L
]
=
f
z
W
x
W
+
T
c
/2
+
u
o
f
z
W
y
W
+
v
o
,
p
R
=
[
u
R
v
R
]
=
f
z
W
x
W
−
T
c
/2
+
u
o
f
z
W
y
W
+
v
o
了解如何使用数学公式
不再提示
1
忘了的同学去看一下
Lecture3
的
我们现在得到了两个等式,
视差
d(disparity)和深度
z
W
的关系写为:
d
=
u
L
−
u
R
=
f
z
W
T
c
了解如何使用数学公式
不再提示
1
由于双目“瞳距”
T
c
是固定的,所以视差
d
和
z
W
成反比
。和生活经验一致。不信你试试看,分别睁一只眼闭一只眼,看近处物体的移动幅度是不是比远处的大。甚至远处的视差
d
为零,因为
z
W
趋于无穷大。
因此,
视差估计
可以看做由两个任务组成:
1
找到
对应点(对)
,在两个图像的同一行
2
产生两个
视差图像
,如下图所示
R.Fan : CV
可以做出很酷炫的
demo
效果
总结
这里写总结
重要内容总结
1
2
3
p
L
=
[
u
L
v
L
]
=
f
z
W
x
W
+
T
c
/2
+
u
o
f
z
W
y
W
+
v
o
了解如何使用数学公式
不再提示
标题目录
线索
笔记
1Preliminaries
1 前置知识
2 Triangulation 三角化
2 三角化
2.1
三角化引入
2.2
三角化推导
2.3
三维重建效果图
3 Stereopsis 立体视觉
3.1
双目相机校正步骤
3.2
校正好的系统
3.3
校正的数学推导
总结
本页内容由用户通过 wolai 发布,并不代表 wolai 立场,如有违规侵权,请
投诉/举报
或提交
侵权通知
创建子空间
可以利用子空间来整理页面、权限和成员
头像与名称
简介
子空间类型
公开空间
添加子空间成员
了解子空间
创建子空间