您好,欢迎光临有路网!
商战数据挖掘 你需要了解的数据科学与分析思维
QQ咨询:
有路璐璐:

商战数据挖掘 你需要了解的数据科学与分析思维

  • 作者:[美] 福斯特·普罗沃斯特(Foster Provost) 郭鹏程 管晨
  • 出版社:人民邮电出版社
  • ISBN:9787115522337
  • 出版日期:2019年12月01日
  • 页数:278
  • 定价:¥89.00
  • 猜你也喜欢

    分享领佣金
    手机购买
    城市
    店铺名称
    店主联系方式
    店铺售价
    库存
    店铺得分/总交易量
    发布时间
    操作

    新书比价

    网站名称
    书名
    售价
    优惠
    操作

    图书详情

    内容提要
    数据挖掘是现代企业从数据中提取有用信息、获取竞争优势的重要方法。针对数据科学的这一商业应用,本书进行了深入解读,不仅详细介绍了数据挖掘的环节、常用分析技术和基本模型,还提供了数据科学解决方案的提案示例和评估指南。同时,为了便于读者理解,本书不仅分析了大量商业示例,在业务情景下阐释数据挖掘的基本概念和原理,还使用大量图表辅助解释数学细节。因此,读者无需专业数学背景即可阅读本书。
    目录
    目录
    赞誉 xiii
    前言 xv
    第 1 章 绪论:数据分析式思维 1
    1.1 数据机遇无处不在 1
    1.2 案例:飓风 Frances 2
    1.3 案例:预测用户流失 3
    1.4 数据科学、数据工程和数据驱动型决策 4
    1.5 数据处理和“大数据” 6
    1.6 从大数据 1.0 到大数据 2.0 6
    1.7 数据与数据科学能力:一种战略性资产 7
    1.8 数据分析式思维 9
    1.9 关于本书 10
    1.10 重新审视数据挖掘和数据科学 11
    1.11 数据科学:一门新兴的实验性学科 12
    1.12 小结 12
    第 2 章 商业问题及其数据科学解决方案 14
    2.1 从商业问题到数据挖掘任务 14
    2.2 有监督方法与无监督方法 17
    2.3 数据挖掘及其结果 18
    2.4 数据挖掘流程 19
    2.4.1 业务理解环节 20
    2.4.2 数据理解环节 21
    2.4.3 数据准备环节 22
    2.4.4 建模环节 22
    2.4.5 评估环节 23
    2.4.6 部署环节 24
    2.5 管理数据科学团队的含义 25
    2.6 其他分析技巧与技术 26
    2.6.1 统计 26
    2.6.2 数据库查询 27
    2.6.3 数据仓库 28
    2.6.4 回归分析 28
    2.6.5 机器学习与数据挖掘 28
    2.6.6 运用以上技术解决商业问题 29
    2.7 小结 30
    第 3 章 预测建模导论:从相关性到有监督的划分 31
    3.1 建模、归纳与预测 32
    3.2 有监督的划分 35
    3.2.1 选取富信息属性 36
    3.2.2 示例:基于信息增益进行属性选择 42
    3.2.3 使用树形结构模型进行有监督的划分 46
    3.3 划分的可视化 52
    3.4 把树视作规则组 53
    3.5 概率估计 54
    3.6 示例:用树型归纳解决用户流失问题 56
    3.7 小结 59
    第 4 章 用模型拟合数据 61
    4.1 根据数学函数分类 62
    4.1.1 线性判别函数 64
    4.1.2 目标函数的*优化 66
    4.1.3 示例:基于数据挖掘线性判别式 67
    4.1.4 用线性判别函数对实例进行评分和排序 68
    4.1.5 支持向量机简介 69
    4.2 通过数学函数进行回归 71
    4.3 类概率估计和逻辑“回归” 73
    4.4 示例:对比逻辑回归和树型归纳 77
    4.5 非线性方程、支持向量机和神经网络 81
    4.6 小结 83
    第 5 章 避免过拟合 84
    5.1 泛化能力 84
    5.2 过拟合 85
    5.3 过拟合检验 86
    5.3.1 保留数据和拟合图 86
    5.3.2 树型归纳的过拟合问题 88
    5.3.3 数值函数的过拟合问题 89
    5.4 示例:线性函数的过拟合 90
    5.5 * 示例:过拟合为何有害 95
    5.6 从保���评估到交叉验证 96
    5.7 用户流失数据集回顾 99
    5.8 学习曲线 100
    5.9 避免过拟合与控制复杂度 101
    5.9.1 树型归纳中的过拟合规避 102
    5.9.2 避免过拟合的一般方法 102
    5.9.3 * 参数优化中的过拟合规避 104
    5.10 小结 106
    第 6 章 相似性、近邻和簇 107
    6.1 相似性和距离 108
    6.2 *近邻推理 109
    6.2.1 示例:威士忌分析 110
    6.2.2 用*近邻来进行预测建模 111
    6.2.3 近邻的数量及其影响 113
    6.2.4 几何解释、过拟合和复杂度控制 115
    6.2.5 *近邻方法的问题 118
    6.3 与相似性和*近邻相关的一些重要技术细节 119
    6.3.1 混合属性 119
    6.3.2 * 其他距离函数 120
    6.3.3 * 组合函数:计算近邻的评分 122
    6.4 聚类 124
    6.4.1 示例:威士忌分析回顾 124
    6.4.2 层次聚类 125
    6.4.3 *近邻回顾:根据形心的聚类 128
    6.4.4 示例:对商业新闻报道进行聚类 132
    6.4.5 理解聚类结果 135
    6.4.6 * 用有监督学习产生簇描述 136
    6.5 退一步:解决业务问题与数据探索 139
    6.6 小结 140
    第 7 章 决策分析思维(一):如何评估一个模型 142
    7.1 对分类器的评估 143
    7.1.1 简单准确率的问题 143
    7.1.2 混淆矩阵 144
    7.1.3 样本类别不均衡的问题 144
    7.1.4 成本收益不均衡的问题 147
    7.2 分类问题的推广 147
    7.3 一个重要的分析框架:期望值 148
    7.3.1 用期望值规范分类器的使用 148
    7.3.2 用期望值规范分类器的评估 149
    7.4 评估、基线性能以及对数据投资的意义 155
    7.5 小结 157
    第 8 章 模型性能的可视化 159
    8.1 排序,而不是分类 159
    8.2 利润曲线 161
    8.3 ROC 图像和曲线 163
    8.4 ROC 曲线下面积 168
    8.5 累积响应曲线和提升曲线 168
    8.6 示例:用户流失模型的性能分析 171
    8.7 小结 177
    第 9 章 证据和概率 179
    9.1 示例:向线上目标用户投放广告 179
    9.2 根据概率合并证据 181
    9.2.1 联合概率与独立性 181
    9.2.2 贝叶斯法则 182
    9.3 将贝叶斯法则应用到数据科学中 183
    9.3.1 条件独立和朴素贝叶斯 184
    9.3.2 朴素贝叶斯的优劣势 186
    9.4 证据“提升度”的模型 187
    9.5 示例:Facebook“点赞”的证据提升度 188
    9.6 小结 190
    第 10 章 文本的表示和挖掘 191
    10.1 为什么文本很重要 192
    10.2 为什么文本很难处理 192
    10.3 表示法 193
    10.3.1 词袋模型 193
    10.3.2 词频 193
    10.3.3 度量稀疏度:逆文档频率 195
    10.3.4 TFIDF 196
    10.4 示例:爵士音乐家 197
    10.5 *IDF 和熵的关系 200
    10.6 词袋模型之外的方法 202
    10.6.1 n-grams 序列 202
    10.6.2 命名实体提取 202
    10.6.3 主题模型 203
    10.7 示例:通过挖掘新闻报道预测股价变动 204
    10.7.1 任务 204
    10.7.2 数据 205
    10.7.3 数据处理 207
    10.7.4 结果 208
    10.8 小结 211
    第 11 章 决策分析思维(二):面向分析工程 212
    11.1 为慈善机构寻找*佳捐赠人 213
    11.1.1 期望值框架:分解商业问题,重组解决方案 213
    11.1.2 简短的题外话:选择性偏差 214
    11.2 更复杂的用户流失示例回顾 215
    11.2.1 期望值框架:构建更复杂的商业问题 215
    11.2.2 评估激励的影响 216
    11.2.3 从期望值分解到数据科学解决方案 217
    11.3 小结 219
    第 12 章 其他数据科学任务与技术 220
    12.1 共现和关联:寻找匹配项 221
    12.1.1 度量意外:提升度和杠杆率 221
    12.1.2 示例:啤酒和彩票 222
    12.1.3 Facebook 点赞的关联 223
    12.2 用户画像:寻找典型行为 225
    12.3 链路预测和社交** 229
    12.4 数据约简、潜在信息和电影** 230
    12.5 偏差、方差和集成方法 233
    12.6 数据驱动的因果解释和一个病毒式营销示例 235
    12.7 小结 236
    第 13 章 数据科学和经营战略 237
    13.1 数据分析式思维,**版 237
    13.2 用数据科学取得竞争优势 238
    13.3 用数据科学保持竞争优势 239
    13.3.1 令人敬畏的历史优势 240
    13.3.2 ****的知识产权 240
    13.3.3 ****的无形抵押资产 240
    13.3.4 **的数据科学家 241
    13.3.5 **的数据科学管理 242
    13.4 吸引和培养数据科学家及其团队 243
    13.5 检验数据科学案例分析 244
    13.6 做好准备,接受来源各异的创意 245
    13.7 做好准备,评估数据科学项目提案 245
    13.7.1 数据挖掘提案示例 246
    13.7.2 Big Red 提案中的缺陷 246
    13.8 企业的数据科学成熟度 247
    第 14 章 总结 250
    14.1 数据科学的基本概念 250
    14.1.1 将基本概念应用于新问题:挖掘移动设备数据 252
    14.1.2 改变对商业问题解决方案的思考方式 253
    14.2 数据做不到的:圈中人回顾 254
    14.3 隐私、道德和挖掘个人数据 256
    14.4 数据科学是否还有更多内容 257
    14.5 *后一例:从众包到云包 257
    14.6 *后的话 258
    附录 A 提案评估指南 259
    附录 B 另一个提案示例 262
    参考文献 265
    术语表 273
    关于作者 278
    编辑推荐语
    数据科学领域元老级学者倾力打造,SAP全球副总裁**
    畅销九个**和地区,被20余所大学作为教科书
    数据科学商业应用的入门指南,现代企业科学经营手册

    不同于其他讲述数据科学的书,本书从非数据科学人员,也就是管理者、投资者甚至工程师等人员的角度,阐述了数据科学这一新兴行业的基本原理和基础理念,而这正是本书的惊艳之处。

    在现代社会中,数据即商业,它是提升生产力、促进创新和获取用户洞见的基础,数据思维和分析方法可谓是新时代的商战孙子兵法,只有善用数据者才能在这个数据驱动的环境中获得竞争优势。本书通过大量真实的商业问题案例,介绍数据科学的基本原理和各种数据挖掘技术,阐释如何从数据中提取出有用信息,进而用数据科学方法解决商业问题,做出精准的决策。

    与描述相符

    100

    北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 台湾 香港 澳门 海外