第1 篇 从业务和问题出发的可视化体系 第1 章 我的故事:业务分析需要可视化 2 1.1 生活/工作面前,我们都一样 . 2 1.2 带着问题启程 6 第2 章 奠基:业务可视化分析的价值 . 7 2.1 古往今来,分析的**目的是辅助决策 7 2.2 决策:获得信息、做出判断 10 2.3 简单可视化:帮助领导更快地获得信息 11 2.4 交互可视化:可视化是假设验证的工具 14 2.5 **可视化:分布、相关性分析与结构化分析 16 2.6 Tableau:敏捷BI 助力决策分析 18 第3 章 地平线:问题分析的方法与数据基础 . 20 3.1 问题的结构化分析与“字段分类” 21 3.2 分析的动态过程:聚合是本质 23 3.2.1 Excel 数据透视表:拖曳即聚合 23 3.2.2 SQL 的聚合查询:窗口式查询 24 3.2.3 Tableau VizQL 可视化聚合查询 . 26 3.3 行级别明细数据是聚合的起点,是分析的原料 27 3.3.1 数据表中包含的数据常识:数据类型与分类 . 27 3.3.2 理解数据表行级别的业务逻辑及其性 . 34 3.3.3 聚合度是以数据表行级别为基准点的、衡量问题层次高低的尺度 . 37 3.4 直接聚合:基于行级别的直接聚合类型 40 3.4.1 描述规模:总和、平均值、计数 . 40 3.4.2 描述数据的波动程度:方差和标准差 . 41 3.4.3 关注个体、走向分布:百分位函数及值、小值、中位数 . 44 3.5 从数据到问题的关键:“第三字段分类” 47 3.5.1 第三字段分类:行级别计算与聚合计算 . 47 3.5.2 理解聚合计算中的典型代表:“比值聚合” . 49 3.6 间接聚合:基于视图聚合的二次聚合 50 3.6.1 “复杂问题”的两个方向特征 . 50 3.6.2 基于直接聚合的二次聚合:大数据的OLAP 分析 51 3.7 从问题分析视角看数据分析的发展阶段 57 3.7.1 小数据时代的多角度明细展示 . 57 3.7.2 数据统计时代的聚合汇总 57 3.7.3 大数据时代的结构化分析 58 第4 章 启程:可视化构建方法与扩展路径 60 4.1 从聚合到图形:第二字段分类与图形构成要素 60 4.1.1 可视化坐标空间:坐标系与坐标轴 . 62 4.1.2 “第二字段分类”与坐标轴. 63 4.1.3 可视化视觉模式与图形类型. 70 4.1.4 可视化的意义描述 74 4.2 7 种主要的问题类型及其主要图形 . 75 4.2.1 传统三大图及其局限性 76 4.2.2 文本表:侧重度量指标的高密度展现 . 78 4.2.3 分布分析的三大典型图形 78 4.2.4 相关性:散点图与双轴折线图 . 82 4.2.5 地理位置可视化 83 4.3 从基本问题类型到复杂图形的延伸方法综述 85 4.3.1 从问题分析到图形增强分析的完整路径 . 85 4.3.2 基于行列的空间扩展:分区与矩阵 . 86 4.3.3 基于标记的增强分析:分层绘制方法 . 89 4.3.4 基于坐标轴的扩展:双轴、同步与多轴的合并处理 . 96 4.3.5 基于参考线的扩展:增加视图聚合的二次聚合 . 97 第2 篇 问题的7 种基本类型与可视化方法 第5 章 从问题��图形的可视化逻辑 . 102 5.1 从问题到图形的启蒙与进化 102 5.1.1 《用图表说话》中的三步走方法 . 102 5.1.2 “问题的字段解析方法”与基本问题类型 . 103 5.2 可视化图形分类方法与可视化过程 105 5.2.1 FT 可视化词典 . 105 5.2.2 Data Points 中的数据可视化过程 107 5.2.3 Abela 的“图形**”逻辑 108 5.2.4 面向IT 的Echarts 分类与Tableau . 109 第6 章 排序与对比(部分与部分) . 111 6.1 基本条形图与多个离散维度条形图 111 6.1.1 并排条形图(side-by-side bar):离散字段并排构成分区 . 112 6.1.2 条形图矩阵:离散字段交叉构成矩阵 . 113 6.1.3 矩阵实例:日历矩阵条形图. 114 6.1.4 堆叠条形图:你喜欢喝什么咖啡 . 116 6.1.5 比例条形图:把堆叠条形图转化为占比分析 . 118 6.2 包含多个度量坐标轴的条形图 119 6.2.1 字段重要性递减的多种布局方式 . 119 6.2.2 考虑字段关系的双轴布局方式 . 120 6.2.3 并排条形图:多个值度量字段的对比 . 122 6.2.4 重叠条形图:多个值度量字段的包含关系 . 124 6.3 字段类型和属性对可视化的影响 125 6.3.1 字段类型和属性对颜色的影响 . 125 6.3.2 “值”与比值:字段属性对标记选择的影响 . 127 6.4 坐标轴的调整与组合 128 6.4.1 默认零点:除非必要,谨慎更改 . 129 6.4.2 坐标轴“倒序”:有些数据越大越差 . 129 6.4.3 值刻度与百分位刻度 130 6.4.4 从“等距坐标轴”到“不等距坐标轴” . 131 6.4.5 棒棒糖图:虚拟双轴 132 6.5 以条形图为底色的进阶与**图形 133 6.5.1 靶心图:在排序基础上增加对比关系 . 133 6.5.2 “进度条”:展示单一对比关系的条形图变种 . 135 6.5.3 结构化分析实例:条形图的“**化” . 138 第7 章 时间序列与序列相关性 140 7.1 时间序列的构成 140 7.2 折线图的多种延伸形式 141 7.2.1 时间的层次与连续/离散属性 . 141 7.2.2 并排折线图和矩阵折线图 143 7.2.4 多维度折线图、堆叠面积图、百分比堆叠面积图 . 144 7.2.3 包含时序的柱状图与结构化分析 . 147 7.3 包含多个度量的时间序列 149 7.3.1 时间序列中的双轴与柱状图. 149 7.3.2 双轴的改变:柱状图与折线图的结合 . 150 7.3.3 基于公共基准的多轴合并 151 7.4 时间序列与条形图的结合:甘特图及其变种 152 7.4.1 标准甘特图:沿着连续日期延伸 . 152 7.4.2 股票蜡烛图:两个甘特图的重叠 . 154 7.4.3 跨度图:“伪装的甘特图样式” . 155 7.4.4 阶梯图:以阶梯方式表达“跨度” . 157 7.5 日期的**转化:日期与相对日期 159 7.5.1 原理:何为和相对时间轴 . 159 7.5.2 “公共基准”案例:产品在不同时间段的业绩对比 . 160 7.5.3 “公共基准”案例:客户复购分析 . 163 7.6 时序分析中度量的处理与**图形 166 7.6.1 聚合度量的累计汇总处理 166 7.6.2 值与同比双轴图:同比或环比的比率 . 167 7.6.3 排序图:值转化为相对排序 . 168 7.6.4 **案例:地平线图——借助**计算处理度量 . 170 7.7 坡面图:次序字段的前后变化 174 7.8 在趋势中增加对比关系:双折线增加阴影区 175 第8 章 占比(部分与总体占比) . 179 8.1 占比问题类型与饼图 179 8.2 树状图:占比与层次关系 181 8.3 初级:饼图作为辅助图形查看结构 184 8.4 中级:结合计算自定义分组及其占比 186 8.4.1 行级别分组:使用组和行级别计算自定义分组 . 186 8.4.2 特定层次的分组:使用集和**计算动态分组 . 187 8.5 中级:使用多种方法展示类别的占比 189 8.5.1 方法一:使用“隐藏”功能分析单一类别占比 . 189 8.5.2 方法二:使用“行级别计算”分析单一类别占比 . 190 8.5.3 方法三:使用“筛选和**计算”分析单一类别占比 . 191 8.6 **图形:环形图、旭日图、南丁格尔玫瑰图 192 8.6.1 环形图:简单的双层次结构 . 192 8.6.2 旭日图:双层占比 193 8.6.3 南丁格尔玫瑰图及个人建议. 194 第9 章 文本表及其延伸形式 196 9.1 文本表的关键场景:聚合与“总分结构” 196 9.2 交叉表的优势与**场景 198 9.3 让交叉表更实用:增加可视化修饰的方法 200 9.3.1 典型交叉表的样式与说明 200 9.3.2 简易法:基于度量名称的颜色修饰 . 201 9.3.3 简易法:基于单一度量的突出显示表 . 203 9.3.4 **法:基于坐标轴和标记的“文本自定义” . 204 9.3.5 **法:使用自定义字段逻辑控制形状或其他 . 208 9.4 让简单丰富起来:善用工具提示与仪表板互动 209 9.5 文字云与气泡图:不常使用和不**的图形 211 9.6 总结:用好“三图一表”,展开业务面纱 212 第10 章 大数据的关键:超越个体、走向分布 . 214 10.1 从个体分析到分布分析 214 10.2 直方图:分布分析图 215 10.2.1 简单直方图:使用数据桶(bin)在数据表行级别创建直方图 216 10.2.2 **直方图:使用**聚合计算和数据桶生成直方图区间 . 217 10.2.3 基于RFM 模型的客户分布分析 219 10.3 箱线图:离散分布与异常发现 221 10.4 帕累托图:特殊的头部集中分布 222 10.4.1 横轴百分位处理:将离散维度序列转化为连续百分位坐标轴 . 224 10.4.2 纵轴累计百分比处理:连续度量的百分位转化 . 224 10.4.3 空间分类处理:帕累托图的颜色分类和互动筛选 . 225 10.5 自定义分布分析:参考线与参考分布模型 227 10.5.1 使用多条“百分比”参考线构建区间 . 228 10.5.2 自定义百分位分布区间 229 10.5.3 分位数分布区间 230 10.5.4 标准差分布与“质量控制图”和“六西格玛区间” . 230 第11 章 超越经验,走向探索:广义相关性分析 . 234 11.1 散点图与参考分区:波士顿矩阵 234 11.2 中级:散点图矩阵和“散点图松散化” 237 11.3 **:用皮尔逊系数生成相关值矩阵 241 11.4 层次关系:多个维度字段之间的结构关系. 244 11.5 次序字段的流向分析:漏斗图和桑基图 247 11.5.1 漏斗图(上):基于次序字段的变化 . 247 11.5.2 漏斗图(下):基于度量值的变化 . 250 11.5.3 桑基图:多阶段的流向变化(简要) . 252 11.6 瀑布图:多个数值的依赖关系 253 11.7 雷达图:多角度的综合关系 256 11.8 相关性或因果关系:基于空间的流行病学案例 . 259 第12 章 特殊的分布:地理空间分析 . 264 12.1 地理空间和地理图层 264 12.2 点图与热力图:地理