本书以任务为导向,较为全面地介绍Hadoop大数据技术及其生态系统组件Hive、HBase的相关知识。全书共8章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce入门编程、MapReduce进阶编程、Hive数据仓库、HBase分布式数据库,以及一个项目案例(电影网站用户影评分析)。本书的第2~7章包含实训与课后习题,读者可通过练习和操作实践,巩固所学的内容。 本书可用于“1 X”证书制度试点工作中的大数据应用开发(Python)职业技能等级证书(中级)的教学和培训,也可以作为高校大数据技术相关专业的教材和大数据技术爱好者的自学用书。