计算机类教材 > 大数据

HBase分布式数据库技术与应用

书号:9787113276638 套系名称:高等职业教育校企合作系列教材·大数据技术与应用专业

作者:姚晓峰 章伟 曾庆玲 出版日期:2021-03-01

定价:35.00 页码 / 开本:184 /16

策划编辑:翟玉峰 责任编辑:翟玉峰

适用专业:计算机教材 适用层次:高职高专

最新印刷时间:2022-02-23

资源下载
教学课件 教学素材
习题答案(暂无) 教学案例(暂无)
教学设计(暂无) 教学视频(暂无)
内容简介 前言 目录 作者介绍 图书特色
  • 本书采用模块化的编写思路,系统介绍了HBase的架构、安装环境以及实战应用。全书共分6个单元和(19个任务),每个单元通过学习目标与学习情境引出本单元的教学核心内容,明确教学任务。每个任务的编写分为任务目标、知识学习和任务实施3个环节,使学生在学习过程中逐步达到理论和实践相统一的目的。全书采用Java语言操作HBase,要求学生有一定的Java编程基础。
    本书适合作为高等职业院校大数据技术与应用专业的基础核心教材,也可作为计算机相关专业大数据选修课程的教材,以及HBase基础入门培训班的参考用书。
  • 一、缘起
    HBase 作为非关系型数据库的代表,为什么能在关系型数据库如日中天的时期悄然兴
    起呢?从系统架构的角度来说,传统企业级应用都是比较看重数据完整性和数据安全性
    的,而互联网应用则更加看重系统性能以及伸缩性。HBase 就是一个面向列存储的分布
    式存储系统,它的优点在于可以实现高性能的并发读/ 写操作,同时HBase 还会对数据进
    行透明的切分,这样就使得存储本身具有了水平伸缩性。
    作为Apache 旗下的一种Hadoop 数据库,HBase 是高性能、高可靠性、分布式、面向
    列、可伸缩的、随机访问的存储和检索数据的平台。利用HBase 技术可在廉价的PC 服务
    器上搭建大规模的存储化集群,可以对大数据进行高性能的实时读写,同时保证数据的
    原子性。
    2006 年,谷歌的技术人员发表了BigTable 文章,提出了“分布式的数据库”的概念。
    2007 年,Powerset 公司研发了HBase,它是在Hadoop 中成立的。2008 年,Hadoop 成为
    Apache 的顶级项目,而HBase 是Hadoop 的子项目,并与2008 年至2009 年期间,推出了
    HBase 0.18.1、HBase 0.19.0、HBase 0.20.0 版本,性能逐渐提升。2010 年前后,HBase
    研发者打破一直依赖的Hadoop 版本号,版本号从0.20.x 跳到0.89.x,并将0.89.x 作为第
    一个单独的开发版本。
    二、结构
    本书采用模块化的编写思路,系统介绍HBase 的架构、安装环境以及实战应用,共分
    为6 个单元(19 个任务)。
    每个单元通过学习目标引出本单元的教学核心内容,明确教学任务。每个任务的编写
    分为任务目标、知识学习和任务实施3 个环节。
    任务目标:简述任务目标,提高学生学习兴趣。
    知识学习:详细讲解知识点,为学生实践打下坚实的基础。
    任务实施:通过系列实例实践,边学边做;通过任务综合应用所学知识,提高学生系
    统地运用知识的能力;在任务实施的基础上通过“学、仿、做”达到理论与实践的统一、
    知识内化的教学目的。
    单元最后进行单元小结和课后习题,进而加强学生对于本单元的知识巩固,并且进一
    步明确本单元的教学重点和教学难点。
    三、特点
    本书以“知识学习+ 任务驱动+ 任务实施”为主线进行编写,首先介绍了HBase 分布
    式数据库的架构以及各组件的作用,然后从实践入手介绍HBase 环境安装和HBase 技术
    的实战应用。本书具有如下特点:
    ? 采用“知识学习+ 任务驱动”的编写模式。每个任务首先明确所要处理的问题,然后带着问题学习相关知识,在掌握基础知识的基础上,利用任务驱动的模式让学生完成实际应用,
    从而有效地完成理论与实践的统一。此模式可以让学生领悟到从问题导入到理论准备再到问题
    求解的过程,从而更深刻地学习每个知识点。
    ? 内容精简优化。本书以HBase 入门与培训为导向对教学内容进行精简和精心设计,并以
    “实用性和容易上手”为主旨,主要讲解HBase的基础知识,涵盖HBase安装环境搭建、HBase
    的架构以及HBaseShell 的使用。重点针对HBase 的实战应用,涵盖HBase 客户端API、HBase
    Admin API、HBase与MapReduce以及HBase预分区四大核心模块。
    ? 针对性和实用性强。本书是HBase 入门的最佳选择,适合作为高等职业教育大数据技术
    与应用专业的基础核心教材,也可作为计算机相关专业大数据选修课程的教材。全书采用“任
    务驱动”的模式进行讲解,使学生在学习过程中逐步达到理论和实践相统一的目的。全书采用
    Java语言操作HBase,要求学生有一定的Java编程基础。
    ? 学习资源推荐。为方便学生更好地完成HBase 的学习,从而更有效地提高学生的学习积
    极性和学习效果。本书配套有资源包、运行脚本、教学课件等,可登录http://www.1daoyun.com
    下载。
    四、使用
    本书的参考学时为64 学时,建议采用理论实践一体化教学模式。教学单元与学时安排
    如下:
    表1 教学单元与课时安排
    序 号单 元 名 称学 时 安 排
    1 HBase 简介4
    2 HBase 基本操作12
    3 HBase 客户端API 16
    4 HBase Admin API 8
    5 HBase 与MapReduce 12
    6 HBase 预分区12
    学时总计64
    五、致谢
    本书由姚晓峰、章伟、曾庆玲任主编,包莹莹、武利秀、王华君任副主编,并联合江
    苏一道云科技发展有限公司共同编写而成。其中,姚晓峰、章伟负责整个教材的框架设
    计,以及单元1 和单元6 的编写,包莹莹负责单元2 和单元3 的编写,王华君、武利秀负
    责单元4 和单元5 的编写;曾庆玲负责整个教材内容方面的审核和提供建设性意见。
    在本书编写过程中,虽然编者已尽可能做到更好,但由于搭建环境的复杂性,书中
    疏漏和不妥之处在所难免,殷切希望广大读者批评指正。同时,恳请读者一旦发现错误,
    于百忙之中及时与编者联系(E-mail: djyxf@163.com),以便尽快更正,编者将不胜感激。
    编 者
    2020 年9 月
    
  • 单元1 HBase 简介.............................1
    学习目标.............................................1
    任务1.1 安装环境搭建 ...................1
    任务1.2 理解HBase 架构 ............12
    单元小结...........................................17
    课后习题...........................................17
    单元2 HBase 基本操作................18
    学习目标...........................................18
    任务2.1 使用HBase Shell 命令 ...18
    任务2.2 综合案例实训 .................48
    单元小结...........................................55
    课后练习...........................................55
    单元3 HBase 客户端API..........56
    学习目标...........................................56
    任务3.1 使用HBase 的客户端API ...56
    任务3.2 操作数据的CRUD .........70
    任务3.3 批量操作 .......................102
    任务3.4 Scan 扫描 ......................106
    任务3.5 综合案例实训 ...............117
    单元小结.........................................124
    课后练习.........................................124
    单元4 HBase Admin API.....125
    学习目标.........................................125
    任务4.1 学习HBase Admin API ...125
    任务4.2 HBase 的表API 操作 ...127
    任务4.3 综合案例实训 ...............140
    单元小结.........................................142
    课后练习.........................................142
    单元5 HBase 与MapReduce....144
    学习目标.........................................144
    任务5.1 探究使用MapReduce
    的原因 ...........................144
    任务5.2 MapReduce 快速入门 ...147
    任务5.3 编写自己的MapReduce ...153
    单元小结.........................................160
    课后练习.........................................160
    单元6 HBase 预分区...................161
    学习目标.........................................161
    任务6.1 HBase Shell 手动指定
    预分区 ...........................162
    任务6.2 HBase Shell 使用算法
    指定预分区 ...................165
    任务6.3 Java API 创建预分区 ....167
    任务6.4 预分区rowkey 设计
    技巧 ..............................169
    单元小结.........................................176
    课后练习.........................................176
  • 姚晓峰,无锡学院
  • (1)采用“知识学习+任务驱动”的编写模式
    (2)内容精简优化
    (3)针对性和实用性强
    (4)学习资源推荐