您现在的位置:首页 > 知识库 > 计算机与软件 >计算机科学丛书 计算机视觉
计算机科学丛书 计算机视觉

计算机科学丛书 计算机视觉

资料大小: 50.01 MB
文档格式: PDF文档
资料语言: 简体中文
资料类别: 计算机与软件
更新日期: 2020-04-22
下载说明:
推荐信息: 视觉   丛书   计算机   计算机科学

本地下载(30点)  备用下载(30点)

内容简介
计算机科学丛书 计算机视觉
出版时间:2005
丛编项: 计算机科学丛书
内容简介
  本书系统地介绍了计算机视觉方面的基础知识,详细讨论了从图像自动抽取重要信息的相关理论,内容包括最近出现的研究成果。本书取材新颖精炼,重点突出,以解决实际问题为目的。前11章讨论的是2D情况;第12章到第15章从2D情况扩展到3D情况;第16章介绍了利用计算机视觉技术的实际应用系统。书中的大量实例及习题,贴近生活,面向应用,富有情趣。本书适合作为高等院校计算机及相关专业的高年级本科生和研究和的教材,也可供相关技术人员参考。长期以来,科学家与科幻作家一直梦想着人类能够制造出智能机器,而这种智能机器首先要能够对视觉信息进行理解。本书详细讨论了从图像自动抽取重要信息和理论和技术,把利用计算机视觉技术把利用计算机视觉技术解决问题的重要研究内容汇集到一起。随着计算机技术的最新发展,计算机图像已经成为一种经济灵活的技术手段,并已渗透到各行各业。图像计算不再只属于科学研究领域,甚至成为人们的业余爱好。本书适合作为高等院校计算机及相关专业的高年级本科生和研究和的教材,也可供相关技术人员参考。本书英文版被美国华盛顿大学等高等院校采用为教材。本书特点:●除了传统内容外,增加了图像数据库,虚拟现实和增强现实方面的内容;●介绍了两个运用计算机视觉技术的实际系统;●应用面涉及工业、医学、地产、多媒体及计算机绘图;●内含大量习题和编程项目,以及大量极具说服力的图片;●书中提供大量相关网站,包括额外图像档案文件,图像处理代码和幻灯片等。
目录
第1章 绪论 1
1.1 机器视觉 1
1.2 应用问题 2
1.2.1 数字图像 2
1.2.2 查询图像数据库 3
1.2.3 检查交叉支撑杆上的螺孔 3
1.2.4 诊断人脑内部 5
1.2.5 处理扫描的文本页面 6
1.2.6 解释积雪覆盖 6
1.2.7 理解零件场景 7
1.3 图像运算 8
1.3.1 邻域运算 8
1.3.2 整幅图像增强 9
1.3.3 多幅图像运算 9
1.3.4 图像特征计算 10
1.3.5 抽取非图像表示 10
1.4 面临的问题 11
1.5 计算机和应用软件 11
1.6 相关领域 12
1.7 内容安排 12
1.8 参考文献 12
1.9 附加习题 14
第2章 图像生成与图像表示 17
2.1 光线感测 17
2.2 成像设备 18
2.2.1 CCD摄像机 18
2.2.2 图像形成 19
2.2.3 视频摄像机 20
2.2.4 人眼 21
2.3 数字图像中的问题* 21
2.3.1 几何畸变 21
2.3.2 散射 21
2.3.3 光晕 21
2.3.4 CCD差异 22
2.3.5 削波与逆变 22
2.3.6 彩色畸变 22
2.3.7 量化效应 22
2.4 图像函数与数字图像 22
2.4.1 图像类型 22
2.4.2 图像量化与空间度量 24
2.5 数字图像格式* 27
2.5.1 图像文件头 28
2.5.2 图像数据 28
2.5.3 数据压缩 28
2.5.4 常用图像格式 28
2.5.5 游程编码二值图像 28
2.5.6 PGM格式 28
2.5.7 GIF格式 29
2.5.8 TIFF格式 30
2.5.9 JPEG格式 30
2.5.10 PostScript格式 30
2.5.11 MPEG格式 30
2.5.12 图像格式比较 31
2.6 成像影响因素 31
2.7 从二维图像到三维结构 32
2.8 5种参考坐标系 33
2.8.1 像素坐标系I 33
2.8.2 物体坐标系O 34
2.8.3 摄像机坐标系C 34
2.8.4 实际图像坐标系F 34
2.8.5 世界坐标系W 34
2.9 其他类型的传感器* 34
2.9.1 测微密度计 34
2.9.2 彩色图像和多谱图像 35
2.9.3 X射线 35
2.9.4 磁共振成像 36
2.9.5 距离扫描仪和深度图像 36
2.10 参考文献 38
第3章 二值图像分析 39
3.1 像素与邻域 39
3.2 图像模板运算 40
3.3 目标计数 41
3.4 连通成分标记 42
3.4.1 递归标记算法 43
3.4.2 逐行标记算法 45
3.5 二值图像形态学 49
3.5.1 结构元 49
3.5.2 基本运算 49
3.5.3 二值形态学的应用 51
3.5.4 条件膨胀 54
3.6 区域特征 54
3.7 区域邻接图 61
3.8 灰度级图像阈值化 62
3.8.1 直方图阈值选择 62
3.8.2 自动阈值处理:Otsu方法* 63
3.9 参考文献 66
第4章 模式识别 69
4.1 模式识别问题 69
4.2 分类模型 70
4.2.1 类别 70
4.2.2 传感器/变换器 70
4.2.3 特征抽取算子 70
4.2.4 分类器 70
4.2.5 分类系统的建立 70
4.2.6 系统错误估计 71
4.2.7 误报和漏报 72
4.3 查准率与查全率 72
4.4 特征表示 73
4.5 特征向量表示 74
4.6 分类器的实现 75
4.6.1 最近均值分类 75
4.6.2 最近邻分类 76
4.7 结构方法 77
4.8 混淆矩阵 79
4.9 决策树 79
4.10 贝叶斯决策 83
4.11 多维数据决策 87
4.12 机器学习 88
4.13 人工神经网络* 88
4.13.1 感知器模型 88
4.13.2 多层前向网络 91
4.14 参考文献 94
第5章 图像滤波与增强 95
5.1 图像处理 95
5.1.1 改善图像质量 95
5.1.2 检测低层特征 95
5.2 灰度级映射 96
5.3 去除小图像区域 99
5.3.1 去除盐椒噪声 99
5.3.2 去除小成分 100
5.4 图像平滑 100
5.5 中值滤波 102
5.6 差分模板边缘检测 104
5.6.1 1D信号差分 104
5.6.2 2D图像差分算子 107
5.7 高斯滤波与LOG边缘检测 111
5.7.1 LOG边缘检测 112
5.7.2 人类视觉的边缘检测 114
5.7.3 马尔-海尔德斯理论 115
5.8 Canny边缘检测 116
5.9 匹配滤波模板* 117
5.9.1 向量空间 117
5.9.2 利用正交基 119
5.9.3 柯西-施瓦茨不等式 120
5.9.4 m×n图像的向量空间 120
5.9.5 2×2邻域的Robert基 120
5.9.6 3×3邻域的Frei-Chen基 121
5.10 卷积和交叉相关* 124
5.10.1 模板运算定义 124
5.10.2 卷积运算 125
5.10.3 并行计算 128
5.11 正弦波空间频率分析* 128
5.11.1 傅里叶基 128
5.11.2 2D图像函数 131
5.11.3 离散傅里叶变换 132
5.11.4 带通滤波器 134
5.11.5 傅里叶变换讨论 135
5.11.6 卷积定理* 135
5.12 总结和讨论 136
5.13 参考文献 137
第6章 颜色与明暗分析 139
6.1 颜色物理学 139
6.1.1 感测被照射物体 140
6.1.2 其他因素 141
6.1.3 感受器的敏感性 141
6.2 RGB三基色 142
6.3 其他基色系统 143
6.3.1 CMY减色系统 143
6.3.2 HSI系统 144
6.3.3 电视信号的YIQ与YUV系统 146
6.3.4 基于颜色的分类 147
6.4 颜色直方图 147
6.5 颜色分割 149
6.6 明暗分析 150
6.6.1 来自单一光源的照射 151
6.6.2 漫反射 151
6.6.3 镜面反射 152
6.6.4 随距离增大而变暗 153
6.6.5 复杂因素 154
6.6.6 phong明暗模型* 154
6.6.7 基于明暗的人类感知 155
6.7 相关话题* 155
6.7.1 颜色应用 155
6.7.2 人类的色感机制 155
6.7.3 多谱图像 156
6.7.4 主题图像 156
6.8 参考文献 156
第 7章 纹理分析 159
7.1 纹理、纹理素和统计 159
7.2 基于纹理素的描述 160
7.3 定量纹理测度 161
7.3.1 边缘密度和方向 161
7.3.2 局部二值分解 162
7.3.3 共生矩阵和特征 162
7.3.4 Laws纹理能量测度 164
7.3.5 自相关和功率谱 166
7.4 纹理分割 166
7.5 参考文献 167
第8章 基于内容的图像检索 169
8.1 图像数据库实例 169
8.2 图像数据库查询 170
8.3 示例查询 171
8.4 图像距离度量 171
8.4.1 颜色相似性度量 172
8.4.2 纹理相似性度量 174
8.4.3 形状相似性度量 175
8.4.4 目标检测及空间关系度量 179
8.5 数据库组织 182
8.5.1 标准索引 182
8.5.2 空间索引 184
8.5.3 基于内容的多距离测度图像索引 184
8.6 参考文献 185
第9章 二维运动分析 187
9.1 运动现象及应用 187
9.2 图像相减 188
9.3 计算运动向量 189
9.3.1 Decathlete游戏 190
9.3.2 点对应 191
9.3.3 MPEG视频压缩 194
9.3.4 图像流计算* 195
9.3.5 图像流方程* 195
9.3.6 利用传播约束求解图像流* 197
9.4 计算运动点路径 197
9.5 检测视频中的显著变化 202
9.5.1 视频序列分割 203
9.5.2 忽略摄影特效 205
9.5.3 存储视频子序列 205
9.6 参考文献 205
第10章 图像分割 207
10.1 区域分割 207
10.1.1 聚类方法 208
10.1.2 区域增长 214
10.2 区域表示 215
10.2.1 覆盖图 215
10.2.2 标记图像 216
10.2.3 边界编码 216
10.2.4 四叉树 217
10.2.5 特征表 217
10.3 轮廓分割 218
10.3.1 区域边界跟踪 218
10.3.2 Canny边缘检测和连接 220
10.3.3 相邻连贯的边缘生成曲线 223
10.3.4 用霍夫变换检测直线和圆弧 225
10.4 线段拟合模型 231
10.5 识别更高层结构 235
10.5.1 条带检测 235
10.5.2 角点检测 236
10.6 运动一致性分割 237
10.6.1 时空边界 237
10.6.2 运动轨迹聚类 237
10.7 参考文献 239
第11章 2D匹配 241
11.1 2D数据配准 241
11.2 点的表示 242
11.2.1 参考坐标系 242
11.2.2 齐次坐标 243
11.3 仿射映射函数 243
11.3.1 缩放 243
11.3.2 旋转 244
11.3.3 正交和标准正交变换* 245
11.3.4 平移 245
11.3.5 旋转、缩放和平移 245
11.3.6 仿射变形实例 246
11.3.7 目标识别与定位实例 247
11.3.8 一般仿射变换* 249
11.4 最佳2D仿射变换* 250
11.5 仿射映射法2D目标识别 251
11.5.1 局部特征焦点法 252
11.5.2 位姿聚类 254
11.5.3 几何散列 256
11.6 相关匹配法2D目标识别 259
11.6.1 解释树 260
11.6.2 离散松弛 262
11.6.3 连续松弛* 264
11.6.4 相关距离匹配 266
11.6.5 相关索引 269
11.7 非线性变形 269
11.7.1 径向畸变矫正 271
11.7.2 多项式映射 272
11.8 总结 272
11.9 参考文献 272
第12章 2D图像中的3D信息 275
12.1 本征图像 275
12.2 线条图标记 278
12.3 2D图像中的3D线索 283
12.4 其他3D现象 286
12.4.1 从X恢复形状 286
12.4.2 消隐点 289
12.4.3 根据焦距变化求深度 289
12.4.4 运动现象 290
12.4.5 边界和虚拟线 290
12.4.6 非偶然对齐 290
12.5 透视成像模型 291
12.6 通过立体视觉求深度 293
12.7 薄透镜方程* 297
12.8 总结性讨论 300
12.9 参考文献 300
第13章 3D感知与目标位姿计算 303
13.1 一般体视结构 303
13.2 3D仿射变换 304
13.2.1 坐标系 305
13.2.2 平移 306
13.2.3 缩放 306
13.2.4 旋转 306
13.2.5 任意旋转 308
13.2.6 基于变换的比对 309
13.3 摄像机模型 311
13.3.1 透视变换矩阵 311
13.3.2 正投影与弱透视投影 314
13.3.3 基于多摄像机的3D点计算 315
13.4 最佳仿射标定矩阵 317
13.4.1 标定物 317
13.4.2 最小二乘问题 317
13.4.3 仿射方法讨论 321
13.5 使用结构光 322
13.6 简单的位姿估计过程 323
13.7 改进的摄像机标定法* 327
13.7.1 摄像机内部参数 327
13.7.2 摄像机外部参数 328
13.7.3 标定举例 331
13.8 位姿估计* 334
13.8.1 2D-3D点对应求位姿 334
13.8.2 约束线性最优化 335
13.8.3 计算变换Tr={R,T} 336
13.8.4 位姿验证和位姿最优化 337
13.9 3D目标重建 338
13.9.1 数据获取 338
13.9.2 视图配准 340
13.9.3 表面重建 341
13.9.4 空间切割算法 341
13.10 从明暗恢复形状 343
13.10.1 光度立体 345
13.10.2 结合空间约束 346
13.11 从运动恢复结构 346
13.12 参考文献 348
第14章 3D模型和匹配 351
14.1 模型表示 351
14.1.1 3D网格模型 351
14.1.2 表面-边-顶点模型 352
14.1.3 广义圆柱体模型 353
14.1.4 八叉树 354
14.1.5 超二次曲面模型 355
14.2 实际3D模型与视类模型 356
14.3 物理学模型和可变形模型 357
14.3.1 蛇形活动轮廓模型 357
14.3.2 3D气球模型 360
14.3.3 建立心脏跳动模型 361
14.4 3D目标识别范例 361
14.4.1 几何模型比对匹配 362
14.4.2 关系模型匹配 367
14.4.3 功能模型匹配 372
14.4.4 基于外观的识别 374
14.5 参考文献 379
第15章 虚拟现实 383
15.1 虚拟现实系统的特征 383
15.2 虚拟现实的应用 384
15.2.1 建筑漫游 384
15.2.2 飞行仿真 384
15.2.3 解剖组织的交互式分割 384
15.3 增强现实 385
15.4 遥操作 386
15.5 虚拟现实设备 388
15.5.1 头戴式显示器 389
15.5.2 虚拟灵巧手术 390
15.5.3 立体显示设备 390
15.6 虚拟现实感知设备 391
15.6.1 视觉 391
15.6.2 听觉 391
15.6.3 位姿 391
15.6.4 触觉 391
15.6.5 运动觉 391
15.7 简单3D模型绘制 392
15.8 实际图像和合成图像融合 393
15.9 人机交互与心理问题 395
15.10 参考文献 395
第16章 案例研究 397
16.1 Veggie Vision系统 397
16.1.1 应用场合和要求 397
16.1.2 系统设计 398
16.1.3 识别过程 398
16.1.4 详细分析 399
16.1.5 性能分析 400
16.2 基于虹膜的身份识别 401
16.2.1 对识别系统的要求 401
16.2.2 系统设计 402
16.2.3 系统性能 404
16.3 参考文献 405
索引 407