计算机类教材 > 智能科学与技术

计算机视觉应用开发

书号:9787113299354 套系名称:普通高等教育“十四五”人工智能系列教材

作者:张云佐 出版日期:2023-04-01

定价:45.00 页码 / 开本:无 /16

策划编辑:侯伟 王春霞 责任编辑:王春霞 包宁

适用专业:计算机类 适用层次:高等教育

最新印刷时间:

资源下载
教学课件 教学素材(暂无)
习题答案(暂无) 教学案例(暂无)
教学设计(暂无) 教学视频(暂无)
内容简介 前言 目录 作者介绍 图书特色
  • 全书共 10 章,包含绪论、Python 语法基础、数据分析、数字图像处理、机器学习、深度学习、
    
    图像分类、目标检测、语义分割、图像生成等内容。
    
    本书内容层层递进,先从 Python、数据分析、图像处理等基础内容讲起,进而对机器学习和
    
    深度学习进行详细阐述,最后介绍如何使用深度学习方法解决各个计算机视觉任务。本书强调理
    
    论联系实际,着重讲述如何利用 Python 的 OpenCV、Pytorch 等包来解决计算机视觉任务,提供大
    
    量编程实例供读者使用。
  • 计算机视觉(Computer Vision,CV)是一门研究如何用计算机来实现人类视觉功能
    
    的学科。从常用的人脸识别、美颜相机、拍照识物等应用,到正在蓬勃发展的无人驾驶、
    
    远程医疗和虚拟现实(Virtual Reality,VR)等技术,都属于这一领域,该领域的不断发
    
    展离不开人工智能(Artificial Intelligence,AI)的助力。其中,深度学习算法给计算机视
    
    觉的分类及检测等各方面的准确度带来了跨越式的提升,从而给计算机视觉的商业应用和
    
    产业化奠定了基础。故想要开发高效可用的计算机视觉应用,就需要对计算机视觉理论和
    
    其人工智能基础有所掌握。
    
    本书融合人工智能和计算机视觉两方面内容,层层递进、由浅入深。该书首先对作为
    
    基础的 Python 语言、数据分析和图像处理进行讲述,然后,逐步深入到机器学习和深度
    
    学习的领域中,最后介绍深度学习下的计算机视觉方法。本书编者有多年本科和研究生教
    
    学经验,通过深入浅出的语言、浅显易懂的图例来展开内容的讲解,尽量避开复杂的数学
    
    推导,让读者在轻松愉悦的阅读中掌握相关知识。此外,本书引用大量编程实例,采用多
    
    个 Python 第三方库,帮助读者更好地理解和掌握计算机视觉实践应用。由此可以看出,
    
    本书是一本全面系统、通俗易懂的计算机视觉图书,适宜作为初学者的入门学习教材。本
    
    书章节设置如下:
    
    第 1 章介绍人工智能和计算机视觉的概念和发展历史,让读者对这本书的两大主题有
    
    一些初步了解,从而较为清晰地把握整本书的知识框架。
    
    第 2 章对 Python 的基础语法和环境搭建进行讲解。Python 既是人工智能领域应用最
    
    广的语言,又是本书整体采用的编程语言,故放在开始进行讲述。
    
    第 3 章讲述如何通过 NumPy、Pandas 和 matplotlib 等包进行数据分析,涉及数据预
    
    处理、数据分析和数据可视化等内容。
    
    第 4 章介绍数字图像的基础概念和基本处理方法,结合 OpenCV 编程,让读者对传统
    
    图像处理有基本认识,为后续计算机视觉的学习打下基础。
    
    以上四章,是本书偏基础的部分,帮助读者掌握必要的前提知识,为后续人工智能和
    
    计算机视觉的学习做准备。
    
    第 5 章对线性回归、SVM、决策树等经典机器学习进行讲述,并使用 scikit-learn 包
    
    进行编程实践,让读者明白其原理,掌握其流程。
    
    第 6 章的主题为深度学习,重点讲述 BP 神经网络的正向和反向传播过程,该章内容
    
    是机器学习的进一步延伸。
    
    以上两章主要讲述机器学习、深度学习算法,属于人工智能主题。而以下四章则属于
    
    计算机视觉主题,将讲述各个计算机视觉任务及其对应方法,尤其是深度学习在计算机视
    
    觉任务上的应用,值得读者重点把握。
    
    第 7 章的重点放在卷积神经网络上,其在图像分类任务上表现优异。本章对卷积神经
    
    网络的结构、经典网络框架和未来发展方向进行讲述。
    
    第 8 章的主题为目标检测,内容涉及传统目标检测算法,二阶段目标检测算法和一阶
    
    段目标检测算法,包含经典的 YOLO 系列网络。
    
    第 9 章的主题为语义分割,主要讲述 FCN、U-net、SegNet 和 Deeplab 等经典框架。
    
    第 10 章的主题为图像生成,常见的图像生成方式有变分自编码器 VAE、生成对抗网
    
    络 GAN,本章将对其进行细致介绍。
    
    上述是本书的主体框架,几乎每章都提供代码供读者学习。本书涵盖了人工智能和计
    
    算机视觉领域的典型算法与应用,是作者多年来工作经验的总结,也是项目组不断开展图
    
    像、视频处理研究的成果积累。研究生张天、武存宇、郑宇鑫、刘亚猛、朱鹏飞、康伟丽
    
    等参与了该书稿的撰写与整理工作,在此表示衷心的感谢!
    
    由于计算机视觉算法发展很快,加之编者水平有限,书中不足与疏漏之处在所难免,
    
    恳请读者批评指正,并提出宝贵意见,以便进一步完善。
    
    编者
    
    2023 年 1 月
  • 第1章 绪 论 1
    1.1人工智能1
    1.1.1人工智能的定义1
    1.1.2人工智能的发展历程 3
    1.1.3人工智能的应用与未来4
    1.2计算机视觉.5
    1.2.1计算机视觉的定义5
    1.2.2与交叉学科的关系 6
    1.2.3计算机视觉的发展历程7
    1.2.4计算机视觉的主要任务及其应用9
    小 结  11
    习 题  11
    第2章 Python语法基础12
    2.1 Python介绍 .13
    2.1.1 Python简介 13
    2.1.2 Python环境搭建14
    2.2基础语法与对象类型 .20
    2.2.1基础语法 20
    2.2.2基本对象类型 21
    2.3运算符29
    2.3.1算术运算符29
    2.3.2比较运算符29
    2.3.3赋值运算符30
    2.3.4逻辑运算符31
    2.4控制语句.31
    2.4.1 if条件语句31
    2.4.2 for循环语句32
    2.4.3 while循环语句33
    2.5函 数 34
    2.5.1函数的定义34
    2.5.2参数的传递35
    2.5.3参数的调用方式 36
    2.5.4匿名函数 37
    2.6类和对象 37
    2.7模 块40
    小 结 41
    习 题 41
    第3章 数据分析42
    3.1数据分析介绍43
    3.1.1数据收集43
    3.1.2数据预处理 43
    3.1.3数据分析44
    3.1.4数据展示/数据可视化44
    3.1.5数据应用 44
    3.2 NumPy44
    3.2.1 NumPy的介绍与安装44
    3.2.2 ndarray 45
    3.2.3常用函数46
    3.3 Pandas 50
    3.3.1 Pandas的介绍与安装50
    3.3.2 DataFrame 50
    3.3.3 Series52
    3.3.4 Pandas常见统计函数 53
    3.4 matplotlib 54
    3.4.1 matplotlib介绍与安装54
    3.4.2 matplotlib常用功能54
    3.5项目实战:有关心脏病的数据分析57
    3.5.1项目介绍 57
    3.5.2数据统计与分析57
    3.5.3数据可视化 58
    3.5.4结 论 63
    小 结 63
    习 题 .63
    第4章 数字图像处理 64
    4.1图像及视觉基础65
    4.1.1数字图像概述 65
    4.1.2色彩空间67
    4.1.3图像的文件格式68
    4.2基础图像处理方法69
    4.2.1基本运算69
    4.2.2图像变换72
    4.2.3图像增强 81
    4.2.4形态学操作87
    4.3边缘检测 90
    4.3.1 Sobel算子91
    4.3.2 Laplacian算子 91
    4.3.3 Canny算子 92
    4.4项目实战:疲劳驾驶检测 94
    4.4.1项目介绍94
    4.4.2实现流程94
    4.4.3结果展示 96
    小 结96
    习 题 97
    第5章 机器学习 98
    5.1机器学习介绍99
    5.1.1机器学习常用术语99
    5.1.2机器学习发展历史 99
    5.2模型的评估 100
    5.2.1数据集划分100
    5.2.2性能度量100
    5.3线性模型102
    5.3.1线性回归102
    5.3.2逻辑回归102
    5.4决策树算法103
    5.4.1基本流程103
    5.4.2划分原则 104
    5.4.3剪 枝 105
    5.5贝叶斯分类算法106
    5.5.1贝叶斯定理106
    5.5.2贝叶斯算法107
    5.6聚 类 108
    5.6.1聚类介绍 108
    5.6.2聚类的分类108
    5.6.3 K-means聚类 109
    5.7项目实战:出行决策109
    5.7.1项目介绍109
    5.7.2实现流程  110
    5.7.3结果展示 114
    5.8项目实战:鸢尾花聚类  114
    5.8.1项目介绍114
    5.8.2实现流程  115
    5.8.3结果展示116
    小 结  116
    习 题 117
    第6章 深度学习 118
    6.1神经网络119
    6.1.1神经元  119
    6.1.2感知机 119
    6.2 BP神经网络120
    6.2.1学习过程 121
    6.2.2激活函数123
    6.2.3损失函数 126
    6.2.4 BP算法实例分析127
    6.3模型训练128
    6.3.1模型训练过程 128
    6.3.2过拟合和欠拟合128
    6.3.3优化策略 129
    6.4项目实战:BP神经网络手写 数字识别 132
    6.4.1项目介绍 132
    6.4.2实现流程133
    6.4.3结果展示 136
    小 结136
    习 题 137
    第7章 图像分类 138
    7.1图像分类介绍139
    7.1.1 ILSVRC139
    7.1.2常用数据集 139
    7.1.3评价指标 140
    7.2全连接网络缺陷140
    7.3卷积神经网络原理 141
    7.4卷积神经网络组件 142
    7.4.1卷积层142
    7.4.2激活函数 144
    7.4.3池化层 144
    7.5经典卷积神经网络结构145
    7.5.1经典网络模型145
    7.5.2网络模型对比153
    7.6项目实战:CIFAR10图像分类154
    7.6.1项目介绍154
    7.6.2实现流程 154
    7.6.3结果展示157
    7.7项目实战:猫狗大战 159
    7.7.1项目介绍 159
    7.7.2实现流程.159
    7.7.3结果展示162
    小 结 164
    习 题164
    第8章 目标检测  165
    8.1目标检测介绍166
    8.1.1基本原理 166
    8.1.2基本概念167
    8.1.3评价指标168
    8.1.4常用数据集171
    8.2目标检测方法 173
    8.2.1传统检测方法173
    8.2.2深度学习检测方法174
    8.3目标检测二阶段算法 174
    8.3.1 R-CNN174
    8.3.2 SPP-Net175
    8.3.3 Fast R-CNN176
    8.3.4 Faster R-CNN 177
    8.3.5 R-FCN178
    8.4目标检测一阶段算法179
    8.4.1 YOLO系列 179
    8.4.2 SSD系列181
    8.4.3 RetinaNet182
    8.5项目实战:车辆行人检测182
    8.5.1项目介绍182
    8.5.2实现流程 183
    8.5.3结果展示187
    小 结188
    习 题188
    第9章 语义分割189
    9.1语义分割介绍190
    9.1.1基本原理190
    9.1.2常用数据集 190
    9.1.3评价指标192
    9.2经典语义分割网络193
    9.2.1 FCN 193
    9.2.2 U-Net195
    9.2.3 SegNet 195
    9.2.4 PSPNet196
    9.2.5 DeepLab 196
    9.3项目实战:医学影像分割197
    9.3.1项目介绍 197
    9.3.2实现流程 198
    9.3.3结果展示 199
    9.4项目实战:物体语义分割200
    9.4.1项目介绍.200
    9.4.2实现流程.200
    9.4.3结果展示204
    小 结205
    习 题 205
    第10章图像生成206
    10.1图像生成介绍207
    10.1.1基本原理 207
    10.1.2评价指标207
    10.2判别模型与生成模型 208
    10.2.1决策函数和条件概率分布208
    10.2.2判别方法和生成方法208
    10.3自编码器 209
    10.3.1自编码器原理 209
    10.3.2常用自编码器模型 210
    10.3.3变分自编码器 211
    10.4生成对抗网络 213
    10.4.1生成对抗网络思想 213
    10.4.2生成对抗网络原理214
    10.4.3经典生成对抗网络215
    10.5项目实战:FashionMNIST图像生成217
    10.5.1项目介绍217
    10.5.2实现流程217
    10.5.3结果展示 220
    10.6项目实战:动漫人脸生成220
    10.6.1项目介绍 220
    10.6.2实现流程 220
    10.6.3结果展示 226
    小 结 226
    习 题.226
    参考文献 227
    
  • 张云佐,石家庄铁道大学副教授、博士生导师、留美学者、校青年科技拔尖人才、优秀青年科学基金获得者、CCF高级会员、CCF YOCSEF委员、河北省科技特派员、计算机科学与技术系副主任。长期致力于计算机视觉、人工智能、大数据等领域的基础理论研究与工程技术研发,先后主持国家自然科学基金、河北省自然科学基金、河北省教育厅科研基金等9项项目、参与国家自然科学基金重点项目、面上项目、公安部警用装备研发项目以及国防基础预研等10多项项目的研究。在IEEE TCSVT、APIN、OE、EL、MTAP、物理学报、光子学报、北京理工大学学报等国内外权威期刊上发表论文30余篇,授权国家发明专利18项、实用新型专利7项、获批计算机软件著作权46项,发明专利转让120万元,专利技术被用于智慧社区视频监控系统构建和高铁隧道漏缆卡具故障检测中。出版专著4部、编写教材2本。依托上述成果,项目组在智慧城市建设、高铁隧道安全检测、工业缺陷检测、遥感探测、医学影像分析、教育教学、公共安全维护等方面进行了许多跨领域和开拓性的研究。 主讲《数字图像处理》、《操作系统》、《人工智能基础》等课程,主持“十三五”、“十四五”等多项教学改革项目。
  • 本书配有丰富的微课资源。