本书作为《大数据导论》(ISBN 9787302500704)的配套实训教材,旨在帮助读者夯实基础知识,还原企业真实业务,提升实操能力。本书从大数据开发所需要的基础编程知识出发,首先阐述 Linux 开发环境中常用的命令。接着介绍数据清洗工具 Kettle 的基础操作以及常见的数据可视化效果,如饼图、柱状图、折线图、平行坐标图等。*后通过数据清洗、数据可视化、数据挖掘等热门大数据技术在环境、金融、电商等行业的具体应用,给读者提供真实的大数据体验情景。 本书提供了丰富的项目实训案例,结合实际情况进行真实的行业数据研究,从而培养实用型人才的专业项目能力。本书既可作为培养应用型人才的课程教材,也可作为相关开发人员的自学教材和参考手册。