您好,欢迎光临有路网!
实战Hadoop大数据处理
QQ咨询:
有路璐璐:

实战Hadoop大数据处理

  • 作者:曾刚
  • 出版社:清华大学出版社
  • ISBN:9787302411444
  • 出版日期:2015年11月01日
  • 页数:266
  • 定价:¥39.00
  • 分享领佣金
    手机购买
    城市
    店铺名称
    店主联系方式
    店铺售价
    库存
    店铺得分/总交易量
    发布时间
    操作

    新书比价

    网站名称
    书名
    售价
    优惠
    操作

    图书详情

    • 出版社
    • ISBN
      9787302411444
    • 作者
    • 页数
      266
    • 出版时间
      2015年11月01日
    • 定价
      ¥39.00
    • 所属分类
    内容提要
    《实战Hadoop大数据处理》以“大数据”为起点,较详细地介绍了Hadoop的相关知识。全书共分为9章,介绍了大数据的基本理论、Hadopp生态系统、Hadoop的安装、HDFS分布式文件系统、MapReduce的原理及开发、HBase数据库、Hive数据仓库、Sqoop数据转换工具,*后结合实际介绍了大数据在智能交通和情报分析中的应用。《实战Hadoop大数据处理》力求用浅显的语言、生动的案例、详细的操作步骤向广大读者介绍Hadoop;力求深入浅出,把复杂的理论与实际案例相结合,用平实的语言把深奥的原理简单化;力求图文并茂,通过适当的图表把零乱的知识点有序地展现在读者面前;力求紧跟时代步伐,尽量结合较新版本的软件阐述大数据处理的相关知识。
    目录
    第1章大数据概述
    1.1大数据简介
    1.1.1大数据的概念与特点
    1.1.2大数据研究的背景
    1.1.3大数据的应用示例
    1.1.4大数据研究的意义
    1.2大数据处理技术简介
    1.2.1大数据的关键技术
    1.2.2大数据处理模式及其系统
    1.3大数据带来的挑战
    1.4大数据的研究与发展方向
    第2章Hadoop简介
    2.1Hadoop项目起源
    2.2Hadoop的由来
    2.3Hadoop核心组件及相关项目简介
    2.4Hadoop的版本衍化
    2.5Hadoop的发展趋势
    第3章Hadoop的安装
    3.1安装Ubuntu Server
    3.1.1VMware网络适配器的连接模式
    3.1.2“仅主机模式”网络的设置
    3.1.3安装Ubuntu Server
    3.1.4远程管理Ubuntu Server
    3.1.5安装JDK
    3.1.6克隆其他虚拟机
    3.1.7配置hosts文件
    3.2配置SSH公钥认证
    3.2.1为什么要公钥认证
    3.2.2公钥认证的工作原理
    3.2.3SSH客户端的安装
    3.2.4SSH配置
    3.2.5配置SecureCRT公钥登录Linux服务器
    3.3安装配置Hadoop
    3.3.1单机安装
    3.3.2伪分布模式的安装
    3.3.3分布式安装
    3.3.4Hadoop管理员常用命令
    3.4双NameNode分布式安装Hadoop 2.2.0
    3.4.1安装配置Zookeeper集群
    3.4.2安装Hadoop 2.2.0
    第4章HDFS文件系统
    4.1互联网时代对存储系统的新要求
    4.2HDFS系统的特点
    4.3HDFS文件系统
    4.3.1HDFS系统组成
    4.3.2HDFS文件数据的存储组织
    4.3.3元数据及其备份机制
    4.3.4数据块备份
    4.3.5数据的读取过程
    4.3.6数据的写入过程
    4.4 HDFS Shell命令
    4.5 API访问HDFS
    4.5.1编译Hadoop的Eclipse插件
    4.5.2在Eclipse中安装Hadoop插件
    4.5.3Hadoop URL读取数据
    4.5.4FileSystem类
    4.5.5取得HDFS的元信息
    4.6HDFS的高可用性
    4.6.1元数据的备份
    4.6.2使用SecondaryName进行备份
    4.6.3BackupNode备份
    4.6.4Hadoop 2.X中HDFS的高可用性实现原理
    4.6.5Federation机制
    4.7HDFS中小文件存储问题
    4.7.1文件归档技术
    4.7.2SequenceFile格式
    4.7.3CombineFileInputFormat
    第5章MapReduce原理及开发
    5.1初识MapReduce
    5.1.1**WordCount
    5.1.2自己编写WordCount
    5.1.3WordCount处理过程
    5.2MapReduce 工作原理
    5.2.1MapReduce数据处理过程
    5.2.2MapReduce框架组成
    5.2.3MapReduce运行原理
    5.3 Shuffle和Sort
    5.3.1Map端的Shuffle
    5.3.2Reduce端Shuffle
    5.3.3Shuffle过程优化
    5.4任务的执行
    5.4.1推测执行
    5.4.2任务JVM重用
    5.4.3跳过坏的记录
    5.4.4任务执行的信息
    5.5故障处理
    5.5.1任务失败
    5.5.2TaskTracker失败
    5.5.3JobTracker失败
    5.5.4任务失败重试的处理方法
    5.6作业调度
    5.6.1先进先出(FIFO)调度器
    5.6.2能力调度器
    5.6.3公平调度器
    5.7MapReduce编程接口
    5.7.1InputFormat——输入格式类
    5.7.2FileInputFormat——文件输入格式类
    5.7.3InputSplit——数据分块类
    5.7.4RecordReader——记录读取类
    5.7.5Mapper类
    5.7.6Reducer类
    5.7.7OutputFormat——输出格式类
    5.7.8FileOutputFormat类——文件输出格式类
    5.7.9RecordWriter类——记录输出类
    5.8MapReduce应用开发
    5.8.1计数类应用
    5.8.2去重计数类应用
    5.8.3简单排序类应用
    5.8.4倒排索引类应用
    5.8.5二次排序类应用
    第6章HBase数据库
    6.1HBase介绍
    6.1.1互联网时代对数据库的要求
    6.1.2HBase的特点
    6.2HBase架构与原理
    6.2.1系统的架构及组成
    6.2.2HBase逻辑视图
    6.2.3HBase的物理模型
    6.2.4元数据表
    6.3安装HBase
    6.3.1单机模式安装
    6.3.2伪分布模式安装
    6.3.3分布式安装
    6.4HBase Shell操作
    6.4.1基本Shell命令
    6.4.2DDL操作
    6.4.3DML操作
    6.4.4HBase Shell脚本
    6.5基于API使用HBase
    6.5.1API简介
    6.5.2表操作示例
    6.5.3数据操作示例
    6.5.4Filter的应用与示例
    6.6MapReduce操作HBase数据
    6.6.1HBase MapReduce汇总到文件
    6.6.2HBase MapReduce汇总到HBase
    6.7 HBase优化
    6.7.1JVM GC优化
    6.7.2HBase参数调优
    6.7.3表设计优化
    6.7.4读优化
    6.7.5写优化
    ……
    第7章Hive数据仓库
    第8章数据整合
    第9章典型应用案例介绍
    参考文献

    与描述相符

    100

    北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 台湾 香港 澳门 海外