您好,欢迎光临有路网!
复杂数据质量控制技术
QQ咨询:
有路璐璐:

复杂数据质量控制技术

  • 作者:曹建军 郑奇斌 刘艺 翁年凤
  • 出版社:清华大学出版社
  • ISBN:9787302623342
  • 出版日期:2023年09月01日
  • 页数:0
  • 定价:¥168.00
  • 分享领佣金
    手机购买
    城市
    店铺名称
    店主联系方式
    店铺售价
    库存
    店铺得分/总交易量
    发布时间
    操作

    新书比价

    网站名称
    书名
    售价
    优惠
    操作

    图书详情

    内容提要
    复杂性是大数据区别于小数据的本质特性,也是当前大数据质量控制与数据治理面临的核心挑战。本书围绕大数据的复杂性开展研究,旨在探索当前数据资源建设与利用过程中面临的挑战和技术难题,促进数据价值的充分释放。 全书分为6部分,共24章。第1部分概述(第1、2章),综述所研究数据控制技术的基本概念和任务定位,以及国内外的研究进展; 第2部分实体分辨技术(第3~13章),研究了高维数据实体分辨、名称分辨、XML数据实体分辨和跨模态数据实体分辨等; 第3部分真值发现技术(第14~18章),研究了单真值发现、多真值发现、文本数据真值发现,以及基于多蚁群优化和基于深度神经网络的真值发现等; 第4部分基于数据依赖的数据质量控制技术(第19~21章),研究了数据录入辅助预测与推理方法、不一致数据检测与修**法,以及有限先验知识下的全局数据质量评估; 第5部分系统与平台(第22、23章),介绍了数据质量控制系统,以及数据治理平台的设计与实现; 第6部分结束语(第24章),归纳总结了当前面临的风险和挑战。 本书务实求新,系统性强,易读性和可操作性好,既可作为数据质量控制与数据治理领域的进阶用书,又可作为数据资源
    目录
    第1部分 概述 第1章 绪论 第2章 国内外研究进展 第2部分 实体分辨技术 第3章 高维数据特征选择的多目标蚊群算法 第4章 高维数据体特征选择稳定性研究 第5章 高维数据���体分辨多分类器方法 第6章 高维不平衡数据实体分辨集成学习方法 第7章 基于增强相似度数据 空间转换的机构别名挖掘 第8章 基于多重集增强相似度数据空间转换的机构别名挖掘 第9章 基于合作作者和隶属机构信息的姓名消岐 第10章 面向XML数据实体分辨的树相似度 第11章 基于语义空间结构的多模态数据表征 第12章 基于语义结构一致性的跨模态相似度度量 第13章 考虑“相似性漂移”的多模态匹配 第3部分 真值发现技术 第14章 基于数据源质量属性评估的单真值发现 第15章 基于多蚊群同步优化的多真值发现 第16章 基于深度神经网络嵌入的结构化数据真值发现 第17章 基于蚊群优化的文本数据真值发现 第18章 基于图卷积神经网络的文本数据真值发现 第4部分 基于数据依赖的数据质量控制技术 第19章 数据录入辅助预测与推理方法研究 第20章 不一致数据演策与修**法研究 第21章 有限先验知识下的全局数据质量评估 第5部分 系统与平台 第22章 数据质量控制系统 第23章 数据治理平台 第6部分 结束语 第24章 被忽视的挑战和风险 附录 项目资助

    与描述相符

    100

    北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 台湾 香港 澳门 海外