本书中文版分为基础篇和进阶篇,深入探讨了数据挖掘的各个方面,从基础知识到复杂的数据类型及其应用,涉及数据挖掘的各种问题领域。它超越了传统上对数据挖掘问题的关注,引入了**数据类型,例如文本、时间序列、离散序列、空间数据、图数据和社交网络数据。到目前为止,还没有一本书以如此全面和综合的方式探讨所有这些主题。 基础篇(包括原书的第1-13章)详细介绍了针对数据挖掘的四个主要问题(聚类、分类、关联模式挖掘和异常分析)的各种解决方法、用于文本数据领域的特定挖掘方法,以及对于数据流的挖掘应用。 进阶篇(包括原书的第14-20章)主要讨论了用于不同数据领域(例如时序数据、序列数据、空间数据、图数据)的特定挖掘方法,以及重要的数据挖掘应用(例如Web数据挖掘、排名、**、社交网络分析和隐私保护)。 本书在直观解释和数学细节上取得了很好的平衡,既包含研究人员需要的数学公式,又以简单直观的方式呈现出来,方便学生和从业人员(包括数学背景有限的人)阅读。本书包括大量插图、示例和练习,并把**放在语义可解释的示例上,特别适合作为**数据挖掘课程的教材。