【新书推荐】数据仓库与数据挖掘(第三版)
创始人
2026-04-04 10:34:25
0

讲解数据仓库和数据挖掘技术的基本原理和应用方法。

内容简介

作者:陈志泊、王春玲、韩慧、王建新、孙俏、聂耿青

丛书名:21世纪高等学校计算机类专业核心课程系列教材

定价:69元

出版日期:2026.02.01

《数据仓库与数据挖掘》主要介绍数据仓库和数据挖掘技术的基本原理和应用方法。全书共分为12章,主要内容包括数据仓库的概念与体系结构、数据仓库的数据存储与处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。

《数据仓库与数据挖掘》既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,书中都使用Microsoft SQL Server 2019进行了操作实现。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。

《数据仓库与数据挖掘》每章均配有习题,习题丰富,可以帮助读者进一步掌握和巩固所学知识。此外,本书提供多媒体教学课件和习题参考答案,读者可到清华大学出版社网站下载。

本书特色

(1)可读性强,文字叙述深入浅出,易读易用,即使是初学者,阅读起来也比较容易。

(2)概念清晰,条理清楚,内容取舍合理。

(3)强调基础,重视实例。各章节都以经典算法为主,介绍其主要思想和基本原理,并且给出恰当和丰富的实例。

(4)实例和课后习题实用、丰富,通过练习,读者可以对各个知识点从不同角度进行训练,掌握和巩固所学知识。

(5)教学资源丰富,本书提供多媒体教学课件和习题参考答案,方便教学。对于上述资源,读者可到清华大学出版社网站下载。

(6)对于数据仓库的组建方法和多数章节中的数据挖掘算法,本书都使用Microsoft SQL Server 2019进行了操作实现,这种做法与市场主流开发工具和技术同步,有利于读者走向社会。

本书各章节之间衔接自然,同时各章节又有一定的独立性,读者可按教材的自然顺序学习,也可以根据实际情况挑选需要的章节学习。

读者对象

本书可作为高等学校计算机及相关专业本科生、研究生“数据仓库和数据挖掘”课程的教材,也可供相关领域的广大科技工作者和高校师生参考。

目录

第1章 数据仓库的概念与体系结构

1.1数据仓库的概念、特点与组成

1.1.1数据仓库的特点

1.1.2数据仓库的组成

1.2数据挖掘的概念与方法

1.2.1数据挖掘的分析方法

1.2.2数据仓库与数据挖掘的关系

1.3数据仓库的技术、方法与产品

1.3.1 OLAP技术

1.3.2数据仓库实施的关键环节和技术

1.3.3数据仓库实施方法论

1.3.4常用的数据仓库产品

1.4数据仓库系统的体系结构

1.4.1独立的数据仓库体系结构

1.4.2基于独立数据集市的数据仓库体系结构

1.4.3基于依赖型数据集市和操作型数据存储的数据仓库体系结构

1.4.4基于逻辑型数据集市和实时数据仓库的体系结构

1.5数据仓库的产生、发展与未来

1.5.1数据仓库的产生

1.5.2数据仓库的发展

1.5.3数据仓库的未来

1.5.4新一代数据仓库技术

1.6小结

1.7习题

第2章 数据仓库的数据存储与处理

2.1数据仓库的数据结构

2.2数据仓库的数据特征

2.2.1状态数据与事件数据

2.2.2当前数据与周期数据

2.2.3元数据

2.3数据仓库的数据ETL过程

2.3.1 ETL的目标

2.3.2 ETL过程描述

2.3.3数据抽取

2.3.4数据清洗

2.3.5数据转换

2.3.6数据加载和索引

2.4多维数据模型

2.4.1多维数据模型及其相关概念

2.4.2多维数据模型的实现

2.4.3多维建模技术

2.4.4星形模式举例

2.5小结

2.6习题

第3章 数据仓库系统的设计与开发

3.1数据仓库系统的设计与开发概述

3.1.1建立数据仓库系统的步骤

3.1.2数据仓库系统的生命周期

3.1.3数据仓库系统的开发方法论

3.1.4数据仓库数据库的设计步骤

3.2基于SQL Server 2019的数据仓库数据库设计

3.2.1分析组织的业务状况及数据源结构

3.2.2组织需求调研,收集分析需求

3.2.3采用信息包图法设计数据仓库的概念模型

3.2.4利用星形图设计数据仓库的逻辑模型

3.2.5数据仓库的物理模型设计

3.3使用SQL Server 2019建立多维数据模型

3.3.1 SQL Server 2019示例数据仓库环境的配置与使用

3.3.2基于SQL Server 2019示例数据库建立多维数据模型

3.4小结

3.5习题

第4章 关联规则

4.1概述

4.2引例

4.3经典算法

4.3.1 Apriori算法

4.3.2 FPgrowth算法

4.4相关研究与应用

4.4.1分类

4.4.2 SQL Server 2019中的关联规则应用

4.5小结

4.6习题

第5章 数据分类

5.1引例

5.2分类问题概述

5.2.1分类的过程

5.2.2分类的评价准则

5.3决策树

5.3.1决策树的基本概念

5.3.2决策树算法ID3

5.3.3 ID3算法应用举例

5.3.4决策树算法C4.5

5.3.5 SQL Server 2019中的决策树应用

5.3.6决策树剪枝

5.4支持向量机

5.5近邻分类方法

5.5.1最近邻分类方法

5.5.2 k近邻分类方法

5.5.3近邻分类方法应用举例

5.6小结

5.7习题

第6章 数据聚类

6.1引例

6.2聚类分析概述

6.3聚类分析中相似度的计算方法

6.3.1连续型属性的相似度计算方法

6.3.2二值离散型属性的相似度计算方法

6.3.3多值离散型属性的相似度计算方法

6.3.4混合类型属性的相似度计算方法

6.4 K-means聚类算法

6.4.1 K-means聚类算法的基本概念

6.4.2 SQL Server 2019中的K-means应用

6.5层次聚类方法

6.5.1层次聚类方法的基本概念

6.5.2层次聚类方法应用举例

6.6小结

6.7习题

第7章 贝叶斯网络

7.1引例

7.2贝叶斯概率基础

7.2.1先验概率、后验概率和条件概率

7.2.2条件概率公式

7.2.3全概率公式

7.2.4贝叶斯公式

7.3贝叶斯网络概述

7.3.1贝叶斯网络的组成和结构

7.3.2贝叶斯网络的优越性

7.3.3贝叶斯网络的三个主要议题

7.4贝叶斯网络的预测、诊断和训练算法

7.4.1概率和条件概率数据

7.4.2贝叶斯网络的预测算法

7.4.3贝叶斯网络的诊断算法

7.4.4贝叶斯网络预测和诊断的综合算法

7.4.5贝叶斯网络的建立和训练算法

7.5 SQL Server 2019中的贝叶斯网络应用

7.6小结

7.7习题

第8章 粗糙集

8.1引例

8.2分类与知识

8.2.1等价关系和等价类

8.2.2分类

8.3粗糙集概述

8.3.1分类的运算

8.3.2分类的表达能力

8.3.3上近似集和下近似集

8.3.4正域、负域和边界

8.3.5粗糙集应用举例

8.3.6粗糙集的性质

8.4辨识知识的简化

8.4.1集合近似度的度量

8.4.2分类近似的度量

8.4.3等价关系的可省略、独立和核

8.4.4等价关系简化举例

8.4.5知识的相对简化

8.4.6知识的相对简化举例

8.5决策规则简化

8.5.1知识依赖性的度量

8.5.2简化决策规则

8.5.3可辨识矩阵

8.6小结

8.7习题

第9章 神经网络

9.1引例

9.2人工神经网络

9.2.1人工神经网络概述

9.2.2神经元模型

9.2.3网络结构

9.3 BP算法

9.3.1网络结构和数据示例

9.3.2有序导数

9.3.3计算误差信号对参数的有序导数

9.3.4梯度下降

9.3.5 BP算法描述

9.4 SQL Server 2019中的神经网络应用

9.5小结

9.6习题

第10章 遗传算法

10.1遗传算法概述

10.2相关概念

10.3基本步骤

10.3.1概述

10.3.2引例

10.4算法设计

10.4.1编码方式

10.4.2种群规模

10.4.3适应度函数

10.4.4遗传算子

10.4.5终止条件

10.5相关研究与应用

10.6小结

10.7习题

第11章 统计分析

11.1线性回归模型

11.1.1线性回归模型的参数估计

11.1.2线性回归方程的判定系数

11.1.3线性回归方程的检验

11.1.4统计软件中的线性回归分析

11.1.5 SQL Server 2019中的线性回归应用

11.2 Logistic回归模型

11.2.1 Logistic回归模型的参数估计

11.2.2统计软件中Logistic回归的结果分析

11.2.3 SQL Server 2019中的Logistic回归应用

11.3时间序列模型

11.3.1 ARIMA模型

11.3.2建立ARIMA模型的步骤

11.3.3使用统计软件估计ARIMA模型

11.3.4 SQL Server 2019中的时间序列分析

11.4小结

11.5习题

第12章 文本和Web挖掘

12.1引例

12.2文本挖掘

12.2.1文本信息检索概述

12.2.2基于关键字的关联分析

12.2.3文档自动聚类

12.2.4自动文档分类

12.2.5自动摘要

12.3 Web挖掘

12.3.1 Web内容挖掘

12.3.2 Web结构挖掘

12.3.3 Web使用挖掘

12.4小结

12.5习题

参考文献

样章试读

购书链接

相关内容

热门资讯

无证销售电子烟 快递成了便捷... 无证销售电子烟快递成了便捷渠道没有资质就擅自销售烟草,快递公司未履行收寄验视义务,让非法经营者钻了空...
“AI复活”明星可能涉及多种法... “AI复活”明星引发的风暴仍在继续,目前已有不少家属相继发声。如乔任梁父亲表示,这种行为侵犯了儿子的...
人工智能时代的艺术教育如何创新... 中新网北京5月16日电 (记者 应妮)面对AI时代,艺术教育该如何应对?日前在京举行的“新趋势 新挑...
第三届“三渔”文化节·政策上门... 5月12日上午,龙王塘渔港“红帆之家”锣鼓喧天,第三届“三渔”文化节拉开帷幕。活动由龙王塘街道党工委...
艺术典范“人民的瑰宝”艺术奖推... 文化兴则国运兴,文化强则民族强。在波澜壮阔的时代进程中,总有一批德艺双馨的艺术家,以匠心传承文脉,以...
如何选择适配废旧木料处理的木工... 随着国内循环经济的推进,木材回收利用行业的规模逐年扩大,废旧木方、建筑模板、废弃木托盘等木料的回收再...
“无尽宇宙——科学与艺术融合作... ↑ 5月22日,参观者在一幅名为《混沌坍缩之粒子碰撞》的作品前驻足观看。 5月22日,由上海天文馆...
魔都看展丨迎来三岁的UPPAC... 浦东城市规划和公共艺术中心(UPPAC)迎来开馆三周年,“发声·发生·发升”主题系列活动于5月22日...
“面向AI时代的媒介史论丛”新... “ 三次重大的人类社会转型和认知革命,都与媒介的整体性革命息息相关。所以,人类的历史说到底,不过是媒...
内蒙古兴安盟:老厂区变身城市艺... 5月18日,游客在阿尔山·泰康艺术中心艺术空间休闲。 位于内蒙古自治区兴安盟阿尔山市的阿尔山·泰康艺...