第1篇掌握数据达人的思维 第1章定义问题3 1.1数据达人应该掌握的问题4 1.2了解数据项目失败的原因10 1.3解决重要的问题14 本章小结15 第2章何为数据16 2.1数据与信息17 2.2数据类型19 2.3数据的收集与组织方式20 2.4基本汇总统计23 本章小结24 第3章统计学思维25 3.1学会质疑26 3.2无处不在的随机波动29 3.3概率与统计34 本章小结41像数据达人一样思考和沟通目录第2篇掌握数据达人的语言 第4章质询数据45 4.1你会怎么做?47 4.2数据的来源是什么?53 4.3数据是否具有代表性?56 4.4是否缺少某些数据?57 4.5数据集的大小59 本章小结60 第5章探索数据61 5.1探索性数据分析62 5.2培养探索心态64 5.3数据是否能解答问题?65 5.4你是否能从数据中发现某些相关性?71 5.5你是否从数据中发现了新的机会?76 本章小结77 第6章检查概率78 6.1猜概率: 笔记本电脑是否感染病毒79 6.2游戏规则80 6.3概率思想实验87 6.4谨慎做出独立性假设90 6.5一切概率都是条件概率92 6.6保证概率数字有意义96 本章小结99 第7章质疑统计100 7.1统计推断的简短讨论101 7.2统计推断的过程108 7.3用于质疑统计结果的问题109 本章小结118 第3篇理解数据科学家的工具箱 第8章寻找未知分组121 8.1无监督学习123 8.2数据降维123 8.3主成分分析法(PCA)126 8.4聚类131 8.5k均值聚类133 本章小结137 第9章理解回归模型139 9.1监督学习140 9.2线性回归能做些什么142 9.3线性回归带给我们什么146 9.4线性回归的隐患149 9.5其他回归模型155 本章小结156 第10章理解分类模型157 10.1分类模型介绍158 10.2逻辑回归160 10.3决策树165 10.4集成方法169 10.5谨防陷阱172 10.6准确性的误解174 本章小结178第11章理解文本分析179 11.1文本分析的期望180 11.2文本如何变成数字182 11.3主题建模192 11.4文本分类194 11.5实际处理文本分析的细节200 本章小结203 第12章解析深度学习概念204 12.1神经网络206 12.2深度学习的应用213 12.3深度学习的实践223 12.4人工智能与你227 本章小结230 第4篇确 保 成 功 第13章注意陷阱235 13.1数据中的偏差和怪象236 13.2陷阱大清单242 本章小结247 第14章知人善任248 14.1沟通中断的7个场景249 14.2数据个性255 本章小结257 第15章未完待续259术语表263