教育资源数字化平台

计算机类教材 > 智能科学与技术

深度学习技术与应用

书号：9787113265793 套系名称：普通高等院校计算机教育“十三五”规划教材

作者：郑晓东出版日期：2020-11-01

定价：48.00 页码 / 开本：276 /16

策划编辑：汪敏责任编辑：汪敏包宁

适用专业：计算机教材适用层次：高职高专

最新印刷时间：2023-02-17

在线阅读

资源下载

教学课件教学素材(暂无)

习题答案(暂无) 教学案例(暂无)

教学设计(暂无) 教学视频(暂无)

内容简介前言目录作者介绍图书特色

本书分为“基础篇”与“应用篇”两部分，共16章。“基础篇”从人工智能背景、机器学习与深度学习的发展开始介绍，通俗易懂地讲解深度学习的相关术语与算法，详细介绍了多种操作系统中实验环境的安装部署。“应用篇”从简单的视觉入门基础MNIST手写数字识别、CIFAR-10照片图像物体识别等入手，到复杂的多层感知器预测泰坦尼克号上旅客的生存概率、自然语言处理与情感分析等，每章都围绕着实例详细讲解，加深对知识点的掌握。
本书是为“深度学习”课程编写的教材，适合作为高等院校相关专业的教材或教学参考书，也可作为机构培训的辅导书。

前  言
对于人工智能、机器学习、深度学习的初学者而言，相关的专业术语名词、数学公式、各类算法等比较难以理解。本书通过通俗易懂的生活实例介绍这些概念，从而帮助学习者快速掌握深度学习入门知识，并能将知识应用于实战中。
一、起源
本书受厦门理工学院资助，属厦门理工学院教材建设基金资助项目的校企共建教材，编写过程中结合双方特长，相互协作完成书中的各个章节与实验模型。本书首先介绍人工智能背景、机器学习的发展过程以及深度学习日益流行的关键因素。然后通俗易懂地介绍了机器学习中常见的相关术语、深度学习的专业名词，详细介绍了深度学习的实验环境以及在各种平台上的搭建方法。最后由浅入深、从零开始学习深度学习。
二、结构
本书共分16章，第1章综述了人工智能、机器学习、深度学习的发展背景；第2章介绍机器学习基础术语；第3章和第4章详细介绍了实验环境与神经网络基础入门；第5~16章分别介绍了多层感知机的搭建、手写字识别、图像识别、信息预测、自然语言处理、人脸识别、面部情绪识别与面部关键点检测的应用实例。
三、使用
本书在教学实践中建议学时为64学时，第1章绪论与第2章机器学习基础术语建议4学时，第3~13章以及第16章建议每章各4学时，第14 章人脸检测器的使用和第15章基于深度学习的面部情绪识别算法建议12学时。
本书中涉及的所有实验模型都是基于Python 3.6语言与jupyter notebook开发环境开发的。
本书中所有函数集与数据集都可以从网盘中获取，并且提供了完整的开发环境与“应用篇”中的所有实例的vmware虚拟机（虚拟机用户：tunm，密码：123456），既便于教学,又便于自学。
下载地址：https://pan.baidu.com/s/1MPdfblb6L_UyqxQmZwl1og 
提取码：snld
 

四、致谢
本书由郑晓东任主编，由朱薇、严靖宇、肖伟东任副主编。朱薇、严靖宇、肖伟东负责拟定编写大纲，组织协调并定稿；李燕婷、宁庆斌参与编写。在本书的编写过程中得到了厦门理工学院、厦门鑫微思科技有限公司的大力支持和帮助，同时也特别感谢学院领导与许多老师所提出的宝贵意见和建议，在此表示衷心的感谢。
由于编者水平有限，书中疏漏与不足之处在所难免，恳请读者批评指正。

编  者  
2020年6月

目  录


第一部分  基  础  篇
第1章　 绪论 2
1.1  人工智能 3
1.2  机器学习 4
1.3  浅层学习和深度学习 5
第2章　 机器学习基础术语 7
2.1  机器学习相关术语 7
2.2  学习模型评估 11
2.3  深度学习基础知识 13
2.3.1  线性回归 13
2.3.2  神经元 17
2.3.3  人工神经网络 19
2.3.3  卷积神经网络 22
小结 24
第3章　 实验环境安装部署 25
3.1  下载说明 25
3.2  Anaconda的安装 25
3.3  PyCharm的安装 35
3.4　虚拟机部署安装 39
小结 41
第4章　 神经网络入门 42
4.1  常见深度学习框架介绍 42
4.2  TensorFlow Playground 43
4.3  Keras神经网络的核心组件 48
4.4  TensorFlow实现神经网络 54
小结 59

第二部分  应  用  篇
第5章　 牛刀小试——深度学习与计算机视觉入门基础 61
5.1  创建环境和安装依赖 61
5.1.1  创建虚拟环境 61
5.1.2  安装依赖 61
5.2  构建项目 62
5.3  数据操作——Numpy 63
5.3.1  多维数组的创建 63
5.3.2  多维数组的基本运算和操作方法 64
5.3.3  多维数组索引 66
5.4  线性回归 67
5.4.1  线性回归基本问题 67
5.4.2  线性回归从零开始实现 67
5.4.3  损失函数 70
小结 72
第6章　 初试Keras与多层感知机的搭建 73
6.1  构建项目 73
6.2  MNIST数据集下载和预处理 73
6.2.1  导入相关模块和下载数据 73
6.2.2  数据预处理 74
6.3  首次尝试搭建多层感知机进行训练 77
6.3.1  搭建模型 77
6.3.2  神经网络训练 78
6.4  增加隐藏层改进模型 81
6.4.1  建模型 81
6.4.2  神经网络训练 81
6.5  对训练结果进行评估 83
6.5.1  使用测试集评估模型准确率 83
6.5.2  使用模型将测试集进行预测 84
6.5.3  建立误差矩阵 85
小结 86
第7章　 搭建多层感知机识别手写字符集 87
7.1  构建项目 87
7.2  搭建带有隐藏层的多层感知机模型 87
7.3  误差说明与过拟合问题 90
7.3.1  训练误差与泛化误差 90
7.3.2  过拟合问题 91
7.4  处理模型过拟合问题 91
7.4.1  增加隐藏层神经元查看过拟合情况 91
7.4.2  加入Dropout功能来处理过拟合问题 93
7.4.3  建立两个隐藏层的多层感知机模型 94
7.5  保存模型 96
7.5.1  将模型结构保存为json格式 96
7.5.2  保存模型权重 99
小结 99
第8章　 初识卷积神经网络——Fashion MNIST 100
8.1  卷积神经网络简介 100
8.1.1  多层感知机和卷积神经网络 100
8.1.2  卷积神经网络 100
8.2  LeNet-5网络模型 101
8.3  Fashion MNIST 102
8.3.1  服装分类的数据集 102
8.3.2  数据集的下载与使用 102
8.3.3  了解Fashion MNIST数据集 103
8.4  进行Fashion MNIST数据集识别 104
8.4.1  初始处理数据 104
8.4.2  搭建LeNet-5与训练模型 105
8.4.3  训练过程与评估模型 106
8.4.4  卷积输出可视化 107
8.5  改进LeNet-5实现Fashion MNIST数据集识别 109
8.5.1  初始处理数据 109
8.5.2  搭建模型与训练 110
8.5.3  训练过程与评估模型 112
8.5.4  测试集预测 113
8.5.5  保存模型与网络结构 115
8.6  使用自然测试集进行预测 115
8.6.1  图片预处理 115
8.6.2  预测结果 117
小结 117
第9章　 CIFAR-10图像识别 118
9.1  准备工作 118
9.2  CIFAR-10数据集下载与分析 120
9.2.1  CIFAR-10数据的下载 121
9.2.2  查看训练数据 122
9.3  处理数据集与训练模型 122
9.3.1  处理数据集 122
9.3.2  模型的搭建 123
9.3.3  模型的训练 125
9.3.4  测试训练结果 126
9.4  提升模型的准确率 130
小结 132
第10章　 图像分类——Kaggle猫狗大战 133
10.1  准备工作 133
10.2  数据集的处理 134
10.2.1  数据集下载与存放 134
10.2.2  数据文件处理 134
10.2.3  读取和预处理数据集 138
10.3  构建神经网络模型 138
10.3.1  搭建简单的模型进行训练与评估 139
10.3.2  利用数据扩充解决过拟合问题 141
小结 146
第11章　 多输出神经网络实现CAPTCHA验证码识别 147
11.1  准备工作 147
11.2  数据集的处理 147
11.2.1  CAPTCHA验证码 148
11.2.2  构建CAPTCHA验证码生成器 148
11.3  深度神经网络模型 153
11.3.1  搭建深度卷积神经网络模型 153
11.3.2  训练模型 157
11.4  模型评估与预测 160
11.4.1  评估模型准确率 160
11.4.2  生成数据集预测 162
小结 163
第12章　 Keras搭建模型预测泰坦尼克号游客信息 164
12.1  项目构建 164
12.2  数据预处理 165
12.2.1  使用DataFrame分析数据和数据预处理 165
12.2.2  使用Numpy进行数据预处理 171
12.3  采用多层感知机模型进行预测 173
12.3.1  模型建立 173
12.3.2  开始训练 175
12.3.3  模型评估 176
12.3.4  构建自由数据进行预测 176
小结 177
第13章　 自然语言处理—IMDb网络电影数据集分析 178
13.1  IMDb数据库 178
13.2  Keras自然语言处理 179
13.2.1  建立Token 179
13.2.2  转换 179
13.2.3  截长补短 179
13.2.4  数字列表转成向量列表 180
13.3  构建项目 180
13.3.1  创建项目文件 180
13.3.2  下载IMDb数据集 180
13.4  IMDb数据集预处理 181
13.4.1  读取数据 181
13.4.2  建立Token 181
13.4.3  格式化数据操作 183
13.5  建立模型 184
13.5.1  建立多层感知机进行预测 184
13.5.2  尝试加大文字处理的规模 188
13.5.3  使用循环神经网络模型进行模型建立和预测 192
13.5.4  使用LSTM方法进行模型建立和预测 196
13.6  随机预测影评 199
小结 201
第14章　 人脸检测器的使用 202
14.1  准备工作 202
14.2  测试数据集 203
14.2.1  数据下载与安放 203
14.2.2  数据的读取和可视化 203
14.3  使用haar分类器进行人脸检测 206
14.3.1  安放Haar模型文件 206
14.3.2  使用haarcascade进行人脸检测实验 207
14.3.3  多张人脸检测实验 209
14.3.4  使用haarcascades存在的问题和局限性 215
14.4  使用MTCNN进行人脸检测 218
14.4.1  MTCNN简单介绍 218
14.4.2  MTCNN人脸检测器下载与安装 218
14.4.3  使用MTCNN人脸检测器进行实验 219
14.4.4  多张人脸进行预测 220
14.4.5  复杂场景检测 222
14.4.6  昏暗场景检测 223
14.4.7  大型合照测试 224
14.4.8  损坏或遮挡的图像检测 225
14.4.9  对person1000进行随机检测 226
小结 227
第15章　 基于深度学习的面部情绪识别算法 228
15.1  准备工作 228
15.2  Fer2013人脸表情数据处理 228
15.2.1  数据集拆解与划分 229
15.2.2  将数据转换为图片和标签形式 230
15.3  情绪分类器训练 232
15.4  使用MTCNN人脸检测模块 237
15.4.1  预测模型 239
15.4.2  测试模型 242
小结 243
第16章　 人脸面部关键点检测 244
16.1  准备工作 244
16.2  数据集预处理 245
16.2.1  对数据集进行预处理 245
16.2.2  分析数据集 246
16.3  搭建简单的神经网络进行预测 249
16.3.1  搭建模型 249
16.3.2  训练模型 250
16.3.3  测试模型 251
16.3.4  保存模型 252
16.4  搭建更加精确的卷积神经网络模型进行预测 252
16.4.1  定义数据扩充方法 252
16.4.2  建立模型 253
16.4.3  开始训练 256
16.4.4  训练过程评估 256
16.4.5  对模型进行预测 257
16.5  自定义测试集预测 260
16.6  搭配人脸检测器使用模型 263
小结 265
参考文献 266

```
郑晓东，厦门理工学院
```

本书分为“基础篇”与“应用篇”两部分，共16章。“基础篇”从人工智能背景、机器学习与深度学习的发展开始介绍，通俗易懂地讲解深度学习的相关术语与算法，详细介绍了多种操作系统中实验环境的安装部署。“应用篇”从简单的视觉入门基础MNIST手写数字识别、CIFAR-10照片图像物体识别等入手，到复杂的多层感知器预测泰坦尼克号上旅客的生存概率、自然语言处理与情感分析等，每章都围绕着实例详细讲解，加深对知识点的掌握。
　　本书是为“深度学习”课程编写的教材，适合作为高等院校相关专业的教材或教学参考书，也可作为机构培训的辅导书。