第1章 数据分析基础 1 1.1 什么是数据分析 2 1.2 数据分析的应用 2 1.3 数据分析方法 2 1.3.1 对比分析法 3 1.3.2 同比分析法 3 1.3.3 环比分析法 4 1.3.4 80/20法则 4 1.3.5 回归分析法 4 1.3.6 聚类分析法 5 1.3.7 时间序列分析法 5 1.4 数据分析工具 6 1.5 数据分析流程 7 1.5.1 明确目的 7 1.5.2 获取数据 8 1.5.3 数据处理 9 1.5.4 数据分析 10 1.5.5 验证结果 10 1.5.6 数据展现 10 1.5.7 数据应用 10 1.6 Python数据分析常用模块 10 1.6.1 数值计算模块 10 1.6.2 数据处理模块 10 1.6.3 数据可视化模块 11 1.6.4 机器学习模块 11 小结 11 习题 11 第2章 NumPy模块实现 数值计算 12 2.1 初识NumPy模块 13 2.1.1 NumPy的诞生 13 2.1.2 NumPy的安装 13 2.1.3 NumPy的数据类型 14 2.1.4 数组对象ndarray 15 2.1.5 数据类型对象dtype 16 2.2 NumPy模块中数组的基本操作 16 2.2.1 内置的数组创建方法 16 2.2.2 生成随机数 19 2.2.3 切片和索引 20 2.2.4 修改数组形状 21 2.2.5 组合数组 22 2.2.6 数组分割 24 2.3 NumPy模块中函数的应用 25 2.3.1 数学函数 26 2.3.2 算术函数 27 2.3.3 统计函数 27 2.3.4 矩阵函数 30 2.4 广播机制 31 小结 32 习题 32 第3章 pandas模块实现统计 分析 33 3.1 安装pandas模块 34 3.2 pandas数据结构 35 3.2.1 Series对象 35 3.2.2 DataFrame对象 37 3.3 读、写数据 38 3.3.1 读、写文本文件 38 3.3.2 读、写Excel文件 40 3.3.3 读、写数据库数据 41 3.4 数据操作 44 3.4.1 数据的增、删、改、查 44 3.4.2 NaN数据处理 47 3.4.3 时间数据的处理 50 3.5 数据的分组与聚合 52 3.5.1 分组数据 52 3.5.2 聚合数据 54 3.6 数据的预处理 56 3.6.1 合并数据 56 3.6.2 去除重复数据 60 小结 62 习题 62 第4章 Matplotlib模块实现 数据可视化 63 4.1 基本用法 64 4.1.1 安装 Matplotlib 64 4.1.2 pyplot子模块的绘图流程 65 4.1.3 pyplot子模块的常用语法 65 4.2 绘制常用图表 66 4.2.1 绘制条形图 66 4.2.2 绘制折线图 69 4.2.3 绘制散点图 70 4.2.4 绘制饼图 71 4.2.5 绘制箱形图 73 4.2.6 多面板图表 75 4.3 3D绘图 78 4.3.1 3D线图 78 4.3.2 3D曲面图 79 4.3.3 3D条形图 81 小结 82 习题 82 第5章 客户价值分析 83 5.1 背景 84 5.2 系统设计 84 5.2.1 系统功能结构 84 5.2.2 系统业务流程 84 5.2.3 系统预览 84 5.3 系统开发** 86 5.3.1 开发环境及工具 86 5.3.2 项目文件结构 86 5.4 分析方法 87 5.4.1 RFM模型 87 5.4.2 聚类分析 87 5.4.3 k-means聚类算法 88 5.5 技术准备 88 5.5.1 sklearn模块 89 5.5.2 k-means聚类 89 5.5.3 pandas模块 90 5.6 用Python实现客户价值分析 90 5.6.1 数据抽取 90 5.6.2 数据探索分析 90 5.6.3 数据处理 91 5.6.4 客户聚类 92 5.6.5 客户价值分析 94 小结 94 习题 94 第6章 销售收入分析与预测 95 6.1 背景 96 6.2 系统设计 96 6.2.1 系统功能结构 96 6.2.2 系统业务流程 96 6.2.3 系统预览 97 6.3 系统开发** 97 6.3.1 开发环境及工具 97 6.3.2 项目文件结构 97 6.4 分析方法 97 6.4.1 线性回归 97 6.4.2 *小二乘法 98 6.5 线性回归模型 100 6.6 Excel日期数据处理 101 6.6.1 按日期筛选数据 101 6.6.2 按日期显示数据 101 6.6.3 按日期统计数据 102 6.7 分析与预测 102 6.7.1 数据处理 103 6.7.2 日期数据统计并显示 103 6.7.3 根据历史销售数据 绘制拟合图 103 6.7.4 预测销售收入 104 小结 105 习题 105 第7章 二手房数据分析 预测系统 106 7.1 需求分析 107 7.2 系统设计 107 7.2.1 系统功能结构 107 7.2.2 系统业务流程 107 7.2.3 系统预览 107 7.3 系统开发** 111 7.3.1 开发环境及工具 111 7.3.2 文件夹组织结构 111 7.4 技术准备 111 7.4.1 sklearn库概述 111 7.4.2 加载datasets子模块中的 数据集 111 7.4.3 支持向量回归函数 114 7.5 图表工具模块 115 7.5.1 绘制饼图 115 7.5.2 绘制折线图 116 7.5.3 绘制条形图 117 7.6 二手房数据分析 118 7.6.1 清洗数据 118 7.6.2 各区二手房均价分析 119 7.6.3 各区房子数量比例 120 7.6.4 全市二手房装修程度分析 121 7.6.5 热门户型均价分析 122 7.6.6 二手房售价预测 123 小结 126 习题 126 第8章 智能停车场运营 分析系统 127 8.1 需求分析 128 8.2 系统设计 128 8.2.1 系统功能结构 128 8.2.2 系统业务流程 128 8.2.3 系统预览 128 8.3 系统开发** 132 8.3.1 开发环境及工具 132 8.3.2 文件夹组织结构 132 8.4 技术准备 133 8.4.1 初识Pygame 133 8.4.2 Pygame的基本应用 133 8.4.3 时间模块 136 8.4.4 日期时间模块 138 8.5 智能停车场数据分析 141 8.5.1 停车时间数据分布图 141 8.5.2 停车高峰时间所占比例 143 8.5.3 每周繁忙统计 145 8.5.4 月收入分析 147 8.5.5 每日接待车辆统计 149 8.5.6 车位使用率 150 小结 152 习题 152 第9章 影视作品分析 153 9.1 需求分析 154 9.2 系统设计 154 9.2.1 系统功能结构 154 9.2.2 系统业务流程 154 9.2.3 系统预览 155 9.3 系统开发** 156 9.3.1 开发环境及工具 156 9.3.2 文件夹组织结构 156 9.4 技术准备 157 9.4.1 使用jieba模块进行分词 157 9.4.2 使用wordcloud库实现 词云图 159 9.5 主窗体设计 162 9.5.1 实现主窗体 162 9.5.2 查看部分的隐藏与显示 163 9.5.3 下拉列表处理 164 9.6 数据分析与处理 166 9.6.1 获取数据 166 9.6.2 生成全国热力图文件 167 9.6.3 生成主要城市评论数及平均 分文件 168 9.6.4 生成词云图 168 9.7 单击查看显示内容 169 9.7.1 创建显示HTML页面的窗体 169 9.7.2 创建显示图片的窗体 170 9.7.3 绑定查询按钮单击事件 171 小结 172 习题 172 第10章 看店宝 173 10.1 需求分析 174 10.2 系统设计 175 10.2.1 系统功能结构 175 10.2.2 系统业务流程 175 10.2.3 系统预览 175 10.3 系统开发** 179 10.3.1 开发环境及工具 179 10.3.2 文件夹组织结构 179 10.4 技术准备 180 10.4.1 使用Python操作数据库 180 10.4.2 JSON模块的应用 181 10.5 主窗体的UI设计 182 10.5.1 对主窗体进行可视化设计 182 10.5.2 将可视化窗体转换为.py 文件 184 10.5.3 设置窗体及控件背景 184 10.5.4 创建窗体控制文件 185 10.5.5 主窗体预览效果 185 10.6 设计数据库表结构 186 10.7 初始数据的爬取 187 10.7.1 爬取排行信息 187 10.7.2 爬取价格信息 190 10.7.3 爬取评价信息 191 10.7.4 定义数据库操作文件 194 10.8 图表分析数据 197 10.8.1 饼图展示评价信息 197 10.8.2 分析出版社所占比例的 条形图 198 10.8.3 折线图分析价格走势 199 10.8.4 Top10数据展示 200 10.9 商品排行展示 203 10.9.1 **商品排行榜 203 10.9.2 热门商品展示 205 10.10 关注商品 207 10.10.1 分析关注商品的预警信息 207 10.10.2 **商品的关注与取消 208 10.11 商品营销预警 214 10.11.1 商品中、差评预警 214 10.11.2 商品价格变化预警 216 10.12 关注商品图表分析 218 10.12.1 关注商品评价分析饼图 218 10.12.2 关注商品出版社占有比例 220 10.13 其他功能 222 小结 224 习题 224