您好,欢迎光临有路网!
数据仓库与数据挖掘
QQ咨询:
有路璐璐:

数据仓库与数据挖掘

  • 作者:廖开际
  • 出版社:北京大学出版社
  • ISBN:9787301143131
  • 出版日期:2008年11月01日
  • 页数:251
  • 定价:¥28.00
  • 分享领佣金
    手机购买
    城市
    店铺名称
    店主联系方式
    店铺售价
    库存
    店铺得分/总交易量
    发布时间
    操作

    新书比价

    网站名称
    书名
    售价
    优惠
    操作

    图书详情

    内容提要
    本书比较系统地介绍数据仓库与数据挖掘的理论体系和应用。本书总的指导思想是在掌握基本知识和基本理论的基础上,强调实际应用能力的培养。全书力求深入浅出,通过通俗的语言及案例分析,介绍数据仓库及数据挖掘的基本概念及相关理论与方法。从数据仓库的定义、结构、设计、构建方法及联机分析处理应用等方面对数据仓库进行较为详细的介绍;从数据挖掘的定义、数据预处理、数据挖掘中的常用算法等方面对数据挖掘的基本知识和算法等理论进行介绍。本书强调数据仓库和数据挖掘工具的应用,**介绍SQL Server 2005数据仓库和数据挖掘工具的应用。附录A详细介绍一个简易的数据挖掘工具——Weka,该工具可作为读者学习数据挖掘时的实验工具。
    本书可作为普通高等学校电子商务、信息管理、计算机应用及其他相关专业的本科教材,也可作为经贸、管理类专业的研究生教材,以及各类管理人员的培训与自学用书。
    文章节选
    第1章 企业数据资源管理
    1.2 数据资源管理的意义
    数据资源管理的意义可从以下3个方面来理解。
    (1)从信息系统的发展过程来看,对数据资源进行有效的管理是信息系统进入成熟阶段的重要标志。
    (2)数据资源管理是解决企业内部由于数据重复而导致的各种问题的根本途径。
    (3)数据资源是企业取得竞争优势的关键。
    1.2.1 信息系统进入成熟阶段的重要标志
    企业的信息系统的成长过程��为5个阶段:初级、普及、整理、集成、成熟。
    在初级阶段,计算机刚进入企业,只作为办公设备使用,应用非常少,通常用来完成一些报表统计工作,甚至大多数时候被当做打字机使用。随着企业对计算机应用认识的深入,人们体会到计算机应用的价值,开始学习、使用和维护计算机。
    在普及阶段,计算机应用在一些部门见到成效,从*初的一些应用部门向其他部门蔓延,大量的人工数据处理转向计算机处理,人们对计算机的热情增加,需求增长。
    在整理阶段,由于人们对计算机信息处理需求的增长,造成财务支出的大幅度上涨,企业领导不得不对之进行控制,注重采用成本/效益去分析应用开发。并针对各项已开发的应用项目之间的不协调和数据冗余等问题进行统一规划。这一阶段的效益可能比第二阶段还要低。
    在集成阶段,企业高层领导意识到信息战略的重要,信息成为企业的重要资源,企业的信息化建设也真正进入到数据处理阶段。在这一阶段中,工作的**是对数据资源进行管理和控制,包括数据的质量控制、数据的有效利用和数据价值的提升。企业开始选定统一的数据库平台、数据管理体系和信息管理平台,以统一数据的管理和使用,各部门、各系统基本实现资源整合、信息共享。
    在成熟阶段,信息系统已经可以满足企业各个层次的需求,从简单的事务处理到支持**管理的决策。工作的**是建立以数据资源为基础的系统计划和战略计划,将信息系统作为取得竞争优势的有力手段。
    ……
    目录
    第1章 企业数据资源管理
    1.1 数据资源的概念
    1.1.1 企业资源
    1.1.2 数据资源
    1.1.3 数据资源管理及其发展历程
    1.2 数据资源管理的意义
    1.2.1 信息系统进入成熟阶段的重要标志
    1.2.2 解决企业内部数据不一致问题的根本途径
    1.2.3 数据资源的管理和应用是取得竞争优势的关键
    1.3 信息资源管理的相关技术
    1.3.1 数据资源管理的技术框架
    1.3.2 技术框架中的构成要素
    1.3.3 技术框架中各部分的关联
    1.4 企业通过数据仓库与数据挖掘获得竞争优势
    本章小结
    思考与练习
    第2章 数据仓库的概念与结构
    2.1 数据仓库的概念
    2.1.1 数据仓库的定义
    2.1.2 数据仓库的特征
    2.1.3 数据集市
    2.2 数据仓库系统
    2.2.1 数据源
    2.2.2 数据仓库管理层
    2.2.3 数据仓库工具集
    2.3 数据仓库中的数据组织
    2.3.1 粒度的概念
    2.3.2 面向主题的数据组织
    2.3.3 数据分割
    2.3.4 元数据的管理
    本章小结
    思考与练习
    第3章 数据仓库的设计与开发
    3.1 数据仓库的开发过程及特点
    3.1.1 数据仓库开发的生命周期
    3.1.2 数据仓库开发的特点
    3.1.3 数据仓库设计的主要内容
    3.2 数据模型设计
    3.2.1 概念模型设计
    3.2.2 逻辑模型设计
    3.2.3 物理模型设计
    3.3 数据仓库的粒度设计
    3.3.1 设计步骤
    3.3.2 设计原则
    3.4 创建数据仓库的基本步骤
    3.4.1 建立运营环境文档
    3.4.2 选择数据仓库的实现技术
    3.4.3 设计数据仓库模型
    3.4.4 创建数据准备区
    3.4.5 创建数据仓库数据库
    3.4.6 从操作型系统中抽取数据
    3.4.7 清理和转换数据
    3.4.8 将数据装入数据仓库数据库
    3.4.9 准备显示信息
    3.4.10 将数据分发到数据集市
    本章小结
    思考与练习
    第4章 联机分析处理
    4.1 OLAP的基本概念
    4.1.1 OLAP的发展背景
    4.1.2 联机分析处理是数据仓库系统的一个应用
    4.2 OLAP与多维分析
    4.2.1 OLAP的一些基本概念
    4.2.2 理解数据立方
    4.2.3 OLAP的基本分析操作
    4.3 OLAP的分类
    4.3.1 ROLAP
    4.3.2 MOLAP
    4.3.3 HOLAP
    4.4 OLAP的特性与不足
    4.4.1 OLAP的特性
    4.4.2 OLAP的不足
    4.5 SQL Servei 2005统一维度模型
    4.5.1 结构
    4.5.2 优点
    本章小结
    思考与练习
    第5章 数据挖掘概述
    5.1 数据挖掘技术的由来
    5.1.1 信息爆炸但知识贫乏
    5.1.2 支持数据挖掘技术的基础
    5.1.3 从商业数据到商业信息的进化
    5.1.4 数据挖掘逐渐演变的过程
    5.2 数据挖掘的定义
    5.2.1 技术角度的定义
    5.2.2 商业角度的定义
    5.2.3 数据挖掘与传统分析方法的区别
    5.2.4 数据挖掘和数据仓库
    5.2.5 数据挖掘和OLAP
    5.2.6 数据挖掘、机器学习和统计
    5.3 数据挖掘发现的知识类型
    5.3.1 广义知识
    5.3.2 关联知识
    5.3.3 分类知识
    5.3.4 预测知识
    5.3.5 偏差知识
    5.4 数据挖掘流程
    5.4.1 知识发现过程
    5.4.2 数据挖掘对象
    5.4.3 数据挖掘任务
    5.4.4 数据挖掘分类
    5.4.5 数据预处理
    5.5 数据挖掘的方法和技术
    5.5.1 信息论方法
    5.5.2 集合论方法
    5.5.3 神经网络方法
    5.5.4 遗传算法
    5.5.5 模糊数学
    5.5.6 公式发现
    5.5.7 可视化技术
    5.5.8 知识表示
    本章小结
    思考与练习
    第6章 数据预处理
    6.1 数据预处理的目的及方法
    6.1.1 原始数据中存在的问题
    6.1.2 数据预处理的常用方法
    6.2 数据清理
    6.2.1 处理空缺值
    6.2.2 噪声数据的处理
    6.3 数据集成
    6.3.1 模式匹配
    6.3.2 数据冗余
    6.3.3 数据冲突
    6.4 数据变换
    6.5 数据归约
    6.5.1 数据立方体聚集
    6.5.2 维归约
    6.5.3 数据压缩
    6.5.4 数值归约
    6.5.5 离散化和概念分层
    本章小结
    思考与练习
    第7章 数据挖掘中的常用算法
    7.1 Apriori算法
    7.1.1 基本原理
    7.1.2 Apriori算法的基本思想与分析
    7.1.3 从频繁项集产生关联规则
    7.2 决策树算法
    7.2.1 信息论的基本原理
    7.2.2 ID3算法
    7.2.3 树剪枝
    7.2.4 由决策树提取分类规则
    7.3 神经网络算法
    7.3.1 神经网络的基本原理
    7.3.2 反向传播模型
    7.3.3 定义神经网络拓扑结构
    7.3.4 神经网络的工作过程
    7.4 聚类分析
    7.4.1 聚类分析的概念
    7.4.2 聚类分析中的数据类型
    7.4.3 几种主要的聚类分析方法
    7.4.4 K means聚类分析算法
    本章小结
    思考与练习
    第8章 SQL Server数据仓库与数据挖掘工具及其应用
    8.1 SQL Server 2005的功能构架
    8.2 SQL Server数据仓库设计与数据挖掘准备
    8.2.1 SQL Server数据仓库创建思路
    8.2.2 SQL Server数据挖掘过程
    8.2.3 案例数据准备
    8.3 SQL Server集成服务
    8.3.1 SQL Server集成服务的作用
    8.3.2 控制流
    8.3.3 数据流
    8.3.4 设计和使用ETL
    8.4 SQL Server分析服务
    8.4.1 创建Analysis Services项目
    8.4.2 定义数据源
    8.4.3 定义数据源视图
    8.4.4 用Analysis Services创建维与多维数据集
    8.4.5 部署Analysis Services项目
    8.5 SQL Server中的数据挖掘工具与应用
    8.6 SQL Server报表服务
    8.6.1 创建报表
    8.6.2 使用报表
    本章小结
    思考与练习
    附录A 一个简易的数据挖掘工具——Weka
    参考文献
    编辑推荐语
    丛书特点:
    1.突出创造能力和创新意识。关注专业背景,拓宽理论基础、强调计算机应用与网络技术应用技能和专业知识,着眼于增强教学内容的实际和应用性。
    2.符合各学校专业课程设置要求。以高等教育的培养目标为依据,注重教材的科学性、实用性和通用性,准确定位教材在人才培养过程中的地位和作用,满足各院校教学需求。
    3.面向就业,突出应用。作者多为在电子商务与信息管理专业教学方面具有丰富经验的一线教师和研究人员,准确把握就业市场动向,注重培养学生实际操作能力。
    4.合理选材和编排。传统内容与现代内容合理融合,补充了大量新知识、新技术和新成果;遵循*新准则或规范,根据教学内容、学时、教学大纲的要求,突出**和难点。
    5.侧重案例教学。对大量当前*新典型案例进行分析讲解,理论联系实际,通俗易懂。
    本书共分为8章和1个附录。第1章介绍企业数据资源管理,旨在说明数据仓库与数据挖掘是企业数据资源管理的**阶段,也是必然趋势。同时也介绍了数据仓库与数据挖掘能为企业做什么。第2章介绍数据仓库的概念与结构,读者在学完本章后可以明白什么是数据仓库,数据仓库是怎样构成的。第3章介绍数据仓库的设计与开发,在学完本章后,读者可以根据需求设计自己的数据仓库,并逐步地建立自己的数据仓库(或数据集市)。第4章介绍数据仓库的一个重要应用——联机分析处理,读者可以理解多维数据分析的方法。第5章介绍数据挖掘概述,在学完本章后,读者应能明白数据挖掘能做什么,有些什么方法。第6章介绍数据挖掘中的一个重要的也是工作量*大的一个环节——数据预处理,在学完本章后,读者应明白为什么要进行预处理,预处理的各种方法,并学会怎样进行数据的预处理。第7章介绍数据挖掘中的常用算法,读者可以理解这些算法的基本思想,掌握典型算法的应用。第8章结合一个实际案例介绍SQL Server 2005数据仓库与数据挖掘工具及其应用。建议读者在本章学习的基础上,自己深入钻研SQL Server 2005的数据仓库与数据挖掘工具。本书适合作为非计算机专业的教材及自学读物。

    与描述相符

    100

    北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 台湾 香港 澳门 海外