高等教育 > 计算机类

Python大数据分析

书号:9787113191825 套系名称:新形态一体化应用型人才培养“十四五”系列教材

作者:吴道君 沈阳 陈素霞 出版日期:2024-02-01

定价:49.80 页码 / 开本: /16

策划编辑:韩从付 责任编辑:刘丽丽 包宁

适用专业:计算机类 适用层次:高等教育

最新印刷时间:2024-02-01

资源下载
教学课件 教学素材
习题答案 教学案例(暂无)
教学设计 教学视频(暂无)
内容简介 前言 目录 作者介绍 图书特色
  • 本书为新形态一体化应用型人才培养“十四五”系列教材之一,全面讲解Python数据分析的相关知识和技术,内容包括Python数据分析概述、NumPy数值计算、Matplotlib数据可视化、Pandas数据分析、数据预处理、Sklearn机器学习。本书以培养学生编程能力和数据分析能力为目标,注重技术应用能力的培养。
    
    本书内容充实、结构合理、实用性强,具有明显的应用能力培养特色。学完本书后,读者可具备数据分析的基本能力。
    
    本书适合作为普通高等院校人工智能、数据科学与大数据以及计算机相关专业课程的教材,也可以作为相关从业人员的技术参考书。
    
    ?
  •        数据的价值越来越被公众认可和推崇,而数据分析的作用就是通过一定的方法找出数据的价值。
           近年来,随着大数据技术和人工智能技术的发展,Python已经成为数据科学领域最为重要的语言和工具。Python是一种面向对象、解释型的计算机程序设计语言,其语法简洁清晰、成熟稳定。
           Python最重要的特点是具有丰富和强大的库,例如在数据分析领域的NumPy、Matplotlib、Pandas和Sklean等,这些库基本上包含了数据分析的所有方面,为数据分       析提供了强大的功能支持。有了这些数据分析库,就可以非常容易地对数据进行分析,不再需要从基础做起,从而大大降低了数据分析的难度和复杂度。
           本书主要讲解使用Python以及Python的库进行数据分析的技术,全书共分为六章,主要内容如下:
           第1章Python数据分析概述,主要讲解数据分析的相关概念及其应用、Python在数据分析领域的优势、Python数据分析的第三方类库、Python数据分析环境库的安装、JupyterNotebook工具的基本使用。
           第2章NumPy数值计算,主要讲解NumPy数组的概念,NumPy数组的创建方法、属性和数据类型,常用数组操作方法的使用,数组的切片和索引方法,数组的各类运算方法和使用,NumPy的线性代数运算函数,数组的存取操作方法。
           第3章Matplotlib数据可视化,主要讲解线形图的绘制,线形图的线的颜色、线型、坐标点、线宽设置;散点图、柱状图、条形图、饼图、直方图、箱线图的绘制;图例、坐标网格、坐标系、样式的设置,样式、RC设置和文本注解;子图的绘制、子图坐标系的设置、图形嵌套;三维图形的绘制。
           第4章Pandas数据分析,主要讲解Pandas的数据结构,常用的DataFrame数据结构;DataFrame的基本功能,DataFrame的行操作与列操作;Pandas操作外部数据的方法,读取CVS、数据库数据的方法;DataFrame的重建索引、更换索引和层次化索引的使用;Series、DataFrame的数据运算,函数应用与映射、排序、迭代方法;描述性统计函数,协方差、相关性等的计算方法;分组与聚合的概念、分组聚合的方法使用;透视表、交叉表的方法。
           第5章数据预处理,主要讲解数据清洗的概念和方法,重复值、缺失值和异常值的检测与处理;DataFrame对象的合并连接与重塑方法;数据变换的种类、常用的数据变换方法。
           第6章Sklearn机器学习,主要讲解机器学习的有关概念,Sklearn数据集,Sklearn数据预处理,降维、回归、聚类和分类算法,模型的选择、训练、预测和评估等。
    本书配有完善的教学资源,包括教学课件、电子教案、教学大纲、教学计划、实验参考、习题答案等,需要者可在中国铁道出版社教育资源数字化平台(http://www.tdpress.com/51eds)中下载。
           本书由广东岭南职业技术学院吴道君、广州工程技术职业学院沈阳、河南轻工职业学院陈素霞任主编,河南理工大学马永强,广东岭南职业技术学院陈睿、李福芬,天津职业技术师范大学李照业,广西民族师范学院朱家荣任副主编,河南轻工职业学院朱慧泉、河南理工大学李嘉琪、郑州商学院任俊军、天津职业技术师范大学任灵平、河南牧业经济学院武书彦参与编写。全书由安阳工学院王庆喜主审。在本书的编写过程中,得到了名师课堂的大力支持,在此表示衷心感谢。
    
           由于时间仓促,编者水平有限,书中难免存在疏漏和不足之处,敬请读者批评指正。
    
    ?
  • 第1章Python数据分析概述1
    1.1数据分析的概念、流程和应用1
    1.1.1数据分析的概念1
    1.1.2数据分析的流程2
    1.1.3数据分析的应用2
    1.2数据分析工具3
    1.2.1常用工具4
    1.2.2Python数据分析4
    1.3Python数据分析环境5
    小结15
    习题15
    实验16
    第2章NumPy数值计算21
    2.1NumPy多维数组21
    2.1.1数组创建21
    2.1.2数组对象属性28
    2.1.3数组数据类型29
    2.2数组操作30
    2.2.1修改数组形状30
    2.2.2翻转数组32
    2.2.3连接数组33
    2.2.4分割数组34
    2.2.5数组元素添加与删除36
    2.3数组索引与切片38
    2.3.1数组索引38
    2.3.2数组切片39
    2.3.3布尔型索引40
    2.3.4花式索引41
    2.4数组的运算42
    2.4.1数组和标量间的运算42
    2.4.2广播42
    2.4.3算术函数43
    2.4.4集合运算46
    2.4.5统计运算48
    2.4.6排序49
    2.4.7搜索51
    2.5线性代数.52
    2.5.1数组相乘52
    2.5.2矩阵行列式53
    2.5.3逆矩阵53
    2.5.4线性方程组53
    2.5.5特征值和特征向量54
    2.6数组的存取54
    2.7视图和副本55
    2.8随机漫步56
    小结57
    习题57
    实验59
    第3章Matplotlib数据可视化63
    3.1折线图63
    3.1.1折线图函数概述63
    3.1.2折线图绘制示例65
    3.2图表属性设置.66
    3.2.1图表属性概述66
    3.2.2图例和rc设置67
    3.2.3坐标网格设置68
    3.2.4坐标系设置69
    3.2.5文本注解70
    3.3其他图形72
    3.3.1散点图72
    3.3.2垂直柱形图73
    3.3.3水平柱形图75
    3.3.4饼图77
    3.3.5直方图78
    3.3.6箱线图81
    3.4子图84
    3.4.1创建子图84
    3.4.2子图坐标系设置87
    3.4.3图形嵌套88
    3.5绘制三维图形.90
    3.5.1三维曲线图90
    3.5.2三维散点图91
    3.5.3曲面图92
    3.5.4等高线93
    小结96
    习题96
    实验97
    第4章Pandas数据分析.99
    4.1Pandas数据结构.99
    4.2DataFrame基本功能105
    4.3读取外部数据.107
    4.3.1CSV文件107
    4.3.2Sqlite数据库111
    4.3.3读取外部数据-拓展112
    4.4数据帧的列操作和行操作112
    4.4.1列操作112
    4.4.2行操作113
    4.5高级索引.116
    4.5.1重建索引116
    4.5.2更换索引118
    4.5.3层次化索引120
    4.6Pandas数据运算.121
    4.6.1算术运算121
    4.6.2函数应用与映射运算122
    4.6.3排序124
    4.6.4迭代125
    4.6.5唯一值与值计数128
    4.7统计函数129
    4.7.1描述性统计129
    4.7.2变化率132
    4.7.3协方差133
    4.7.4相关性133
    4.7.5数据排名134
    4.8分组与聚合135
    4.8.1分组135
    4.8.2聚合137
    4.9透视表与交叉表140
    4.9.1透视表140
    4.9.2交叉表141
    小结143
    习题143
    实验143
    第5章数据预处理148
    5.1数据清洗.148
    5.1.1重复值148
    5.1.2缺失值149
    5.1.3异常值155
    5.2合并连接与重塑.156
    5.2.1merge合并156
    5.2.2concat合并159
    5.2.3combine_first合并.161
    5.2.4数据重塑162
    5.3数据变换.164
    5.3.1虚拟变量164
    5.3.2函数变换164
    5.3.3连续属性离散化165
    5.3.4规范化167
    5.3.5随机采样168
    小结170
    习题170
    实验171
    第6章Sklearn机器学习177
    6.1术语177
    6.2Sklearn179
    6.2.1Sklearn数据集180
    6.2.2Sklearn常用算法186
    6.2.3数据预处理190
    6.2.4数据集拆分192
    6.2.5模型评估193
    6.2.6Sklearn常用方法194
    6.2.7模型的保存和载入194
    6.3降维.194
    6.3.1PCA(主成分分析).194
    6.3.2LDA(线性评价分析).196
    6.4回归197
    6.4.1线性回归198
    Python大数据分析
    III6.4.2逻辑回归.199
    6.4.3回归决策树200
    6.5分类.202
    6.5.1朴素贝叶斯分类202
    6.5.2分类决策树204
    6.5.3SVM(支持向量机)204
    6.5.4神经网络205
    6.5.5k-近邻算法206
    6.6聚类207
    6.6.1K-means算法208
    6.6.2DBSCAN209
    小结210
    习题210
    实验211
    ?
  • 吴道君,广东岭南职业技术学院讲师、高级软件工程师,承担编程基础C++、软件工程、J2EE编程开发、.NET开发等多门课程的教学任务。2011年12月指导学生参加第二届“国信蓝点杯”全国软件专业人才设计与开发大赛并获得个人赛全国总决赛“二等奖”,2013年在广东省首届信息技术类专业带头人“说专业”竞赛中获得“二等奖”。发表论文数篇,主编教材多部。
    
    ?
    沈阳,任职于广州工程技术职业学院,信息系统项目管理师(高级),研究方向:大数据技术、移动互联网软件开发,主授课程:Python大数据应用及实训、Web前端技术、 Android软件项目开发,发表多篇SCI、EI和中文核心论文。
    
    
    陈素霞,博士(美国乔治福克斯大学),河南轻工职业学院教师,副教授,专业方向为计算机应用专业,河南省学术技术带头人,参与多部教材编写工作,参与多项教科研项目并获奖。
    
    ?
  • ①教学资源丰富,如教学视频、教学大纲、课件、案例源代码、习题、答案等。
    ②新形态教材,书中附有教学视频的二维码。
    ③依据国家教学要求,融入思政元素。
    ④注重实践操作,设置大量例题及贴近现实的案例。
    
    ?