计算机类教材 > 智能科学与技术
深度学习技术与应用
书号:9787113265793 套系名称:普通高等院校计算机教育“十三五”规划教材
作者:郑晓东 出版日期:2020-11-01
定价:48.00 页码 / 开本:276 /16
策划编辑:汪敏 责任编辑:汪敏 包宁
适用专业:计算机教材 适用层次:高职高专
最新印刷时间:2023-02-17
资源下载
教学课件
教学素材(暂无)
习题答案(暂无)
教学案例(暂无)
教学设计(暂无)
教学视频(暂无)
内容简介
前言
目录
作者介绍
图书特色
本书分为“基础篇”与“应用篇”两部分,共16章。“基础篇”从人工智能背景、机器学习与深度学习的发展开始介绍,通俗易懂地讲解深度学习的相关术语与算法,详细介绍了多种操作系统中实验环境的安装部署。“应用篇”从简单的视觉入门基础MNIST手写数字识别、CIFAR-10照片图像物体识别等入手,到复杂的多层感知器预测泰坦尼克号上旅客的生存概率、自然语言处理与情感分析等,每章都围绕着实例详细讲解,加深对知识点的掌握。 本书是为“深度学习”课程编写的教材,适合作为高等院校相关专业的教材或教学参考书,也可作为机构培训的辅导书。
前 言 对于人工智能、机器学习、深度学习的初学者而言,相关的专业术语名词、数学公式、各类算法等比较难以理解。本书通过通俗易懂的生活实例介绍这些概念,从而帮助学习者快速掌握深度学习入门知识,并能将知识应用于实战中。 一、起源 本书受厦门理工学院资助,属厦门理工学院教材建设基金资助项目的校企共建教材,编写过程中结合双方特长,相互协作完成书中的各个章节与实验模型。本书首先介绍人工智能背景、机器学习的发展过程以及深度学习日益流行的关键因素。然后通俗易懂地介绍了机器学习中常见的相关术语、深度学习的专业名词,详细介绍了深度学习的实验环境以及在各种平台上的搭建方法。最后由浅入深、从零开始学习深度学习。 二、结构 本书共分16章,第1章综述了人工智能、机器学习、深度学习的发展背景;第2章介绍机器学习基础术语;第3章和第4章详细介绍了实验环境与神经网络基础入门;第5~16章分别介绍了多层感知机的搭建、手写字识别、图像识别、信息预测、自然语言处理、人脸识别、面部情绪识别与面部关键点检测的应用实例。 三、使用 本书在教学实践中建议学时为64学时,第1章绪论与第2章机器学习基础术语建议4学时,第3~13章以及第16章建议每章各4学时,第14 章人脸检测器的使用和第15章基于深度学习的面部情绪识别算法建议12学时。 本书中涉及的所有实验模型都是基于Python 3.6语言与jupyter notebook开发环境开发的。 本书中所有函数集与数据集都可以从网盘中获取,并且提供了完整的开发环境与“应用篇”中的所有实例的vmware虚拟机(虚拟机用户:tunm,密码:123456),既便于教学,又便于自学。 下载地址:https://pan.baidu.com/s/1MPdfblb6L_UyqxQmZwl1og 提取码:snld 四、致谢 本书由郑晓东任主编,由朱薇、严靖宇、肖伟东任副主编。朱薇、严靖宇、肖伟东负责拟定编写大纲,组织协调并定稿;李燕婷、宁庆斌参与编写。在本书的编写过程中得到了厦门理工学院、厦门鑫微思科技有限公司的大力支持和帮助,同时也特别感谢学院领导与许多老师所提出的宝贵意见和建议,在此表示衷心的感谢。 由于编者水平有限,书中疏漏与不足之处在所难免,恳请读者批评指正。 编 者 2020年6月
目 录 第一部分 基 础 篇 第1章 绪论 2 1.1 人工智能 3 1.2 机器学习 4 1.3 浅层学习和深度学习 5 第2章 机器学习基础术语 7 2.1 机器学习相关术语 7 2.2 学习模型评估 11 2.3 深度学习基础知识 13 2.3.1 线性回归 13 2.3.2 神经元 17 2.3.3 人工神经网络 19 2.3.3 卷积神经网络 22 小结 24 第3章 实验环境安装部署 25 3.1 下载说明 25 3.2 Anaconda的安装 25 3.3 PyCharm的安装 35 3.4 虚拟机部署安装 39 小结 41 第4章 神经网络入门 42 4.1 常见深度学习框架介绍 42 4.2 TensorFlow Playground 43 4.3 Keras神经网络的核心组件 48 4.4 TensorFlow实现神经网络 54 小结 59 第二部分 应 用 篇 第5章 牛刀小试——深度学习与计算机视觉入门基础 61 5.1 创建环境和安装依赖 61 5.1.1 创建虚拟环境 61 5.1.2 安装依赖 61 5.2 构建项目 62 5.3 数据操作——Numpy 63 5.3.1 多维数组的创建 63 5.3.2 多维数组的基本运算和操作方法 64 5.3.3 多维数组索引 66 5.4 线性回归 67 5.4.1 线性回归基本问题 67 5.4.2 线性回归从零开始实现 67 5.4.3 损失函数 70 小结 72 第6章 初试Keras与多层感知机的搭建 73 6.1 构建项目 73 6.2 MNIST数据集下载和预处理 73 6.2.1 导入相关模块和下载数据 73 6.2.2 数据预处理 74 6.3 首次尝试搭建多层感知机进行训练 77 6.3.1 搭建模型 77 6.3.2 神经网络训练 78 6.4 增加隐藏层改进模型 81 6.4.1 建模型 81 6.4.2 神经网络训练 81 6.5 对训练结果进行评估 83 6.5.1 使用测试集评估模型准确率 83 6.5.2 使用模型将测试集进行预测 84 6.5.3 建立误差矩阵 85 小结 86 第7章 搭建多层感知机识别手写字符集 87 7.1 构建项目 87 7.2 搭建带有隐藏层的多层感知机模型 87 7.3 误差说明与过拟合问题 90 7.3.1 训练误差与泛化误差 90 7.3.2 过拟合问题 91 7.4 处理模型过拟合问题 91 7.4.1 增加隐藏层神经元查看过拟合情况 91 7.4.2 加入Dropout功能来处理过拟合问题 93 7.4.3 建立两个隐藏层的多层感知机模型 94 7.5 保存模型 96 7.5.1 将模型结构保存为json格式 96 7.5.2 保存模型权重 99 小结 99 第8章 初识卷积神经网络——Fashion MNIST 100 8.1 卷积神经网络简介 100 8.1.1 多层感知机和卷积神经网络 100 8.1.2 卷积神经网络 100 8.2 LeNet-5网络模型 101 8.3 Fashion MNIST 102 8.3.1 服装分类的数据集 102 8.3.2 数据集的下载与使用 102 8.3.3 了解Fashion MNIST数据集 103 8.4 进行Fashion MNIST数据集识别 104 8.4.1 初始处理数据 104 8.4.2 搭建LeNet-5与训练模型 105 8.4.3 训练过程与评估模型 106 8.4.4 卷积输出可视化 107 8.5 改进LeNet-5实现Fashion MNIST数据集识别 109 8.5.1 初始处理数据 109 8.5.2 搭建模型与训练 110 8.5.3 训练过程与评估模型 112 8.5.4 测试集预测 113 8.5.5 保存模型与网络结构 115 8.6 使用自然测试集进行预测 115 8.6.1 图片预处理 115 8.6.2 预测结果 117 小结 117 第9章 CIFAR-10图像识别 118 9.1 准备工作 118 9.2 CIFAR-10数据集下载与分析 120 9.2.1 CIFAR-10数据的下载 121 9.2.2 查看训练数据 122 9.3 处理数据集与训练模型 122 9.3.1 处理数据集 122 9.3.2 模型的搭建 123 9.3.3 模型的训练 125 9.3.4 测试训练结果 126 9.4 提升模型的准确率 130 小结 132 第10章 图像分类——Kaggle猫狗大战 133 10.1 准备工作 133 10.2 数据集的处理 134 10.2.1 数据集下载与存放 134 10.2.2 数据文件处理 134 10.2.3 读取和预处理数据集 138 10.3 构建神经网络模型 138 10.3.1 搭建简单的模型进行训练与评估 139 10.3.2 利用数据扩充解决过拟合问题 141 小结 146 第11章 多输出神经网络实现CAPTCHA验证码识别 147 11.1 准备工作 147 11.2 数据集的处理 147 11.2.1 CAPTCHA验证码 148 11.2.2 构建CAPTCHA验证码生成器 148 11.3 深度神经网络模型 153 11.3.1 搭建深度卷积神经网络模型 153 11.3.2 训练模型 157 11.4 模型评估与预测 160 11.4.1 评估模型准确率 160 11.4.2 生成数据集预测 162 小结 163 第12章 Keras搭建模型预测泰坦尼克号游客信息 164 12.1 项目构建 164 12.2 数据预处理 165 12.2.1 使用DataFrame分析数据和数据预处理 165 12.2.2 使用Numpy进行数据预处理 171 12.3 采用多层感知机模型进行预测 173 12.3.1 模型建立 173 12.3.2 开始训练 175 12.3.3 模型评估 176 12.3.4 构建自由数据进行预测 176 小结 177 第13章 自然语言处理—IMDb网络电影数据集分析 178 13.1 IMDb数据库 178 13.2 Keras自然语言处理 179 13.2.1 建立Token 179 13.2.2 转换 179 13.2.3 截长补短 179 13.2.4 数字列表转成向量列表 180 13.3 构建项目 180 13.3.1 创建项目文件 180 13.3.2 下载IMDb数据集 180 13.4 IMDb数据集预处理 181 13.4.1 读取数据 181 13.4.2 建立Token 181 13.4.3 格式化数据操作 183 13.5 建立模型 184 13.5.1 建立多层感知机进行预测 184 13.5.2 尝试加大文字处理的规模 188 13.5.3 使用循环神经网络模型进行模型建立和预测 192 13.5.4 使用LSTM方法进行模型建立和预测 196 13.6 随机预测影评 199 小结 201 第14章 人脸检测器的使用 202 14.1 准备工作 202 14.2 测试数据集 203 14.2.1 数据下载与安放 203 14.2.2 数据的读取和可视化 203 14.3 使用haar分类器进行人脸检测 206 14.3.1 安放Haar模型文件 206 14.3.2 使用haarcascade进行人脸检测实验 207 14.3.3 多张人脸检测实验 209 14.3.4 使用haarcascades存在的问题和局限性 215 14.4 使用MTCNN进行人脸检测 218 14.4.1 MTCNN简单介绍 218 14.4.2 MTCNN人脸检测器下载与安装 218 14.4.3 使用MTCNN人脸检测器进行实验 219 14.4.4 多张人脸进行预测 220 14.4.5 复杂场景检测 222 14.4.6 昏暗场景检测 223 14.4.7 大型合照测试 224 14.4.8 损坏或遮挡的图像检测 225 14.4.9 对person1000进行随机检测 226 小结 227 第15章 基于深度学习的面部情绪识别算法 228 15.1 准备工作 228 15.2 Fer2013人脸表情数据处理 228 15.2.1 数据集拆解与划分 229 15.2.2 将数据转换为图片和标签形式 230 15.3 情绪分类器训练 232 15.4 使用MTCNN人脸检测模块 237 15.4.1 预测模型 239 15.4.2 测试模型 242 小结 243 第16章 人脸面部关键点检测 244 16.1 准备工作 244 16.2 数据集预处理 245 16.2.1 对数据集进行预处理 245 16.2.2 分析数据集 246 16.3 搭建简单的神经网络进行预测 249 16.3.1 搭建模型 249 16.3.2 训练模型 250 16.3.3 测试模型 251 16.3.4 保存模型 252 16.4 搭建更加精确的卷积神经网络模型进行预测 252 16.4.1 定义数据扩充方法 252 16.4.2 建立模型 253 16.4.3 开始训练 256 16.4.4 训练过程评估 256 16.4.5 对模型进行预测 257 16.5 自定义测试集预测 260 16.6 搭配人脸检测器使用模型 263 小结 265 参考文献 266
郑晓东,厦门理工学院
本书分为“基础篇”与“应用篇”两部分,共16章。“基础篇”从人工智能背景、机器学习与深度学习的发展开始介绍,通俗易懂地讲解深度学习的相关术语与算法,详细介绍了多种操作系统中实验环境的安装部署。“应用篇”从简单的视觉入门基础MNIST手写数字识别、CIFAR-10照片图像物体识别等入手,到复杂的多层感知器预测泰坦尼克号上旅客的生存概率、自然语言处理与情感分析等,每章都围绕着实例详细讲解,加深对知识点的掌握。 本书是为“深度学习”课程编写的教材,适合作为高等院校相关专业的教材或教学参考书,也可作为机构培训的辅导书。