您好,欢迎光临有路网!
深入浅出R语言数据分析
QQ咨询:
有路璐璐:

深入浅出R语言数据分析

  • 作者:米霖
  • 出版社:清华大学出版社
  • ISBN:9787302543886
  • 出版日期:2020年09月01日
  • 页数:0
  • 定价:¥69.00
  • 分享领佣金
    手机购买
    城市
    店铺名称
    店主联系方式
    店铺售价
    库存
    店铺得分/总交易量
    发布时间
    操作

    新书比价

    网站名称
    书名
    售价
    优惠
    操作

    图书详情

    内容提要
    本书首先介绍数据分析的方法论,然后介绍数据分析的相关模型方法,并进一步通过数据分析案例,讲解数据分析的思维、方法及模型实现过程。本书**介绍R语言在数据分析方面的应用,让读者能够快速地使用R语言进行数据分析、构建模型。 本书分为17章,内容包括:使用R语言获取数据、数据分析中的数据处理与数据探索、生存分析、主成分分析、多维缩放、线性回归模型、逻辑回归模型、聚类模型、关联规则、随机森林、支持向量机、神经网络、文本挖掘、社交网络分析,以及关于R语言数据分析的两个延伸内容:H2O机器学习和R语言爬虫。 本书内容通俗易懂,案例丰富,实用性强,特别适合R语言的入门读者和进阶读者阅读,也适合数据分析人员、数据挖掘人员等其他数据科学从业者。另外,本书也适用于统计学、计算机、机器学习、数学等相关专业的本科生、研究生使用。
    目录
    第1章 数据分析项目的流程 1.1 数据分析项目中的角色·····1 1.2 数据分析项目的阶段········2 1.2.1 制定目标··················3 1.2.2 收集数据··············3 1.2.3 数据处理和分析············4 1.2.4 构建模型··········7 1.2.5 评估模型··········8 1.2.6 展示结果·········9 1.2.7 部署与维护模型···········10 1.3 总结··················10 第2章 数据的读取 2.1 RData数据 ·················11 2.2 readr**读取数据 ·········13 2.3 读取Excel数据 ········16 2.4 读取SPSS、SAS、STATA数据 ·······17 2.5 R语言操作数据库 ·······19 2.6 总结·····················23 第3章 数 据 探 索 3.1 缺失值的识别与处理···········24 3.1.1 缺失值的识别与描述性统计····25 3.1.2 缺失值的可视化展示················26 3.1.3 缺失值的处理方法····················28 3.2 异常值············33 3.3 dlookr数据处理包 ···············38 3.3.1 所有变量的一般性诊断····38 3.3.2 数值型变量的诊断········��···39 3.3.3 分类变量的诊断····39 3.3.4 异常值的诊断········40 3.3.5 创建诊断报告········41 3.3.6 数据处理················42 3.3.7 缺失值处理············43 3.3.8 异常值处理············44 3.3.9 数据转换················46 3.3.10 数据分箱··············49 3.3.11 创建数据转换报告··········52 3.4 数据相关性··················53 3.5 自动化创建数据探索报告·····57 3.6 总结··········60 第4 章生存分析 4.1 生存分析的基本内容·········61 4.2 使用R 语言进行生存分析·······64 4.3 非参数模型······66 4.3.1 使用Kaplan-Meier 方法拟合数据 ··········66 4.3.2 Kaplan-Meier 方法的可视化 ······68 4.4 半参数模型生存分析方法·······70 4.4.1 构建Cox 模型···········70 4.4.2 检查假设·············71 4.4.3 Coxph 模型可视化········73 4.4.4 预测··················74 4.4.5 分层·············75 4.5 参数模型···················77 4.6 随机生存森林模型···80 4.7 总结·············82 第5 章主成分分析 5.1 概述······························83 5.1.1 维度相关的问题···············83 5.1.2 检测多重共线性···············84 5.1.3 方差膨胀因子···················84 5.2 主成分分析详解··········85 5.2.1 主成分分析的定义···········85 5.2.2 主成分分析的简单原理···86 5.2.3 主成分分析的算法···········87 5.3 使用R 语言进行主成分分析·············88 5.3.1 主成分分析的实现···89 5.3.2 主成分分析案例·······91 5.4 总结········96 第6 章多维缩放 6.1 MDS 的工作原理·······97 6.3 MDS 的优点·················105 6.2 在R 语言中实现MDS··98 6.4 总结··········106 第7 章线性回归模型 7.1 线性回归模型概述··············107 7.2 在R 语言中实现回归模型········108 7.2.1 图形分析·············109 7.2.2 建立线性模型·····114 7.2.3 回归模型的图形诊断······119 7.2.4 预测模型··························122 7.2.5 抽样方法··························124 7.3 总结··········126 第8 章逻辑回归模型 8.1 逻辑回归的原理········127 8.2 在R 语言中实现逻辑回归模型·······128 8.2.1 数据探索·····················129 8.2.2 构建逻辑回归模型·····131 8.2.3 逻辑回归预测·············133 8.2.4 逻辑回归模型评估·····133 8.3 总结···············136 第9 章聚类模型 9.1 概述·····················137 9.1.1 聚类算法···················137 9.1.2 K均值聚类的原理··138 9.2 在R 语言中实现聚类模型········139 9.2.1 K均值聚类······140 9.2.2 层次聚类··········143 9.2.3 Medoids 聚类(PAM) ········144 9.3 总结·········146 第10 章关联规则 10.1 关联规则概述············147 10.2 关联规则的基本概念··········148 10.3 在R 语言中实现关联规划·······148 10.3.1 训练模型···········151 10.3.2 模型的评估········153 10.3.3 提升关联规则的效果····154 10.3.4 关联规则的可视化········155 10.4 总结············158 第11 章随机森林 11.1 随机森林的基本概念·······159 11.3 总结·······167 11.2 在R 语言中实现随机森林 ····161 第12 章支持向量机 12.1 概述······168 12.3 总结······179 12.2 在R 语言中实现支持向量机·········171 第13 章神经网络 13.2.2 评估模型效果··············187 13.1 概述·················180 13.2 在R 语言中实现神经网络·············182 13.3 总结·························192 13.2.1 构建神经网络模型······185 第14 章文本挖掘 14.1 概述············193 14.2 text2vec 背景及其基本原理 ···········194 14.3 DTM 与TFIDF 的原理和实现·······194 14.3.1 DTM 和TFIDF 的原理·····194 14.3.2 DTM 的实现··············196 14.3.3 TFIDF 的实现·········199 14.4 情感分析············199 14.5 LDA 主题模型及其实现 ·········206 14.6 构建自动问答系统·············208 14.7 总结·········211 第15 章社交网络分析 15.1 社交网络概述·········212 15.2 igraph 简介 ············213 15.2.1 准备工作················214 15.2.2 图的指标计算··········215 15.3 社交网络的常见结构····217 15.4 社交网络分析算法····220 15.4.1 Girvan-Newman ········ 221 15.4.2 基于传播标签的社区检测··········· 223 15.4.3 基于贪婪优化模块的社区检测··········· 224 15.4.4 自旋转玻璃社群················ 224 15.5 微博社交群体分析······· 225 15.5.1 自旋转玻璃社群··············· 226 15.5.2 社群检测············ 228 15.6 总结·········· 229 第16 章 H2O 机器学习 16.1 H2O 机器学习平台······ 230 16.2 在R 语言中使用H2O ·· 231 16.2.1 H2O 的安装··········· 231 16.2.2 案例应用··············· 231 16.2.3 H2O 常用API ······· 234 16.2.4 模型的通用参数···· 235 16.2.5 参数调整··········· 235 16.3 H2O Flow·············· 238 16.3.1 H2O Flow 的安装·············· 238 16.3.2 H2O Flow 的基本使用方法······ 239 16.4 总结··········· 244 第17 章 R 语言爬虫 17.1 快速爬取网页数据···· 245 17.2 rvest 简介····· 247 17.2.1 rvest API················· 248 17.2.2 rvest API 详解············· 249 17.3 爬取BOSS 直聘数据··· 250 17.4 模拟登录······················· 254

    与描述相符

    100

    北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 台湾 香港 澳门 海外