数据科学伦理是关于人们在进行数据科学方面的行为的道德规范。到目前为止,数据科学主要应用于企业和社会并产生了积极成果。 然而,就像任何技术一样,数据科学也带来了一些负面后果:隐私侵犯的增加,对敏感群体的数据驱动的歧视以及使用不可解释的复杂模型做出决策。 没有哪个数据科学家和业务经理是天生不道德的,只是他们没有接受过培训来考虑他们在工作中的伦理问题——本书旨在填补这个越来越重要的空白和解释不同的概念和技术,帮助读者理解从k-匿名和差别隐私到同态加密和零知识证明等技术已可以解决隐私侵犯问题,消除敏感群体歧视和提供各种可解释的人工智能。 现实生活中的警世故事进一步说明了数据科学伦理的重要性和潜在影响,包括种族主义机器人的故事、搜索审查和人脸识别等。本书中穿插着结构化的练习,提供假设的场景和伦理困境,带读者一起思考如何平衡伦理问题和数据的效用。