第1章 数据挖掘和商业智能
1.1 数据挖掘的兴起
1.1.1 数据丰富与知识匮乏
1.1.2 从数据到知识
1.1.3 数据挖掘产生
1.1.4 数据挖掘解决的商业问题
1.2 什么是商业智能
1.2.1 企业决策实现过程的信息需求
1.2.2 企业信息化系统中的商业智能
1.2.3 商业智能的体系结构
1.3 数据挖掘和商业智能工具
1.3.1 商业智能工具的选择
1.3.2 SQL Server 2008的商业智能构架
1.4 数据挖掘应用案例
【本章小结】
【练习题】
第2章 数据仓库
2.1 数据仓库的概念
2.1.1 从传统数据库到数据仓库
2.1.2 数据仓库的定义与基本特性
2.2 数据仓库的体系结构
2.2.1 数据仓库的物理结构
2.2.2 数据仓库的系统结构
2.2.3 数据仓库的数据模型
2.3 元数据
2.3.1 元数据的定义
2.3.2 元数据的分类及作用
2.4 数据集市
2.4.1 两种数据集市结构
2.4.2 数据集市与数据仓库的差别
2.4.3 关于数据集市的误区
2.5 数据仓库设计与实施
2.5.1 自上而下还是自下而上的设计方法
2.5.2 数据仓库的设计步骤
2.5.3 数据仓库的实施
2.5.4 数据仓库的使用和维护
2.6 Microsoft数据仓库(DW)和商业智能(BI)工具
2.7 数据仓库设计案例
2.7.1 业务数据库AdventureWorks
2.7.2 业务数据分析
2.7.3 项目需求分析
2.7.4 构建数据仓库
【本章小结】
【练习题】
第3章 数据预处理
3.1 数据预处理的重要性
3.2 数据清洗
3.2.1 遗漏数据处理
3.2.2 噪声数据处理
3.2.3 不一致数据处理
3.3 数据集成与转换
3.3.1 数据集成处理
3.3.2 数据转换处理
3.4 数据消减
3.4.1 数据立方合计
3.4.2 维数消减
3.4.3 数据块消减
3.5 离散化和概念层次树生成
3.5.1 数值概念层次树生成
3.5.2 类别概念层次树生成
3.6 使用SSIS对数据进行ETL操作
3.6.1 SSIS的主要功能
3.6.2 SSIS的体系结构
3.6.3 SSIS包主要对象
3.6.4 创建并运行一个简单的包
【本章小结】
【思考题】
第4章 多维数据分析
4.1 多维数据分析基础
4.2 多维数据分析方法
4.3 多维数据的存储方式
4.3.1 三种存储方式
4.3.2 三种存储方式的比较
4.4 多维表达式(MDX)
4.4.1 MDX中的重要概念
4.4.2 MDX基本语法
4.4.3 MDX与SQL的区别
4.4.4 MDX核心函数
4.5 使用SQL Servet Analysis Services(SSAS)构建维度和多维数据集
4.5.1 SSAS的体系结构
4.5.2 SSAS的统一维度模型(UDM)
4.5.3 SSAS示例
4.6 使用Excel数据透视图浏览多维数据集
【本章小结】
【思考题】
第5章 用Microsoft SSRS处理智能报表
5.1 SSRS商业智能报表
5.1.1 商业智能报表与商业智能
5.1.2 SSRS的结构
5.1.3 SSRS报表的3种状态
5.2 使用SSRS创建报表
5.2.1 创建一个简单报表项目
5.2.2 增强基本报表的功能
5.2.3 发布报表
【本章小结】
第6章 数据挖掘技术
6.1 数据挖掘的任务
6.1.1 分类
6.1.2 回归
6.1.3 时间序列分析
6.1.4 预测
6.1.5 聚类
6.1.6 关联规则
6.1.7 序列分析
6.1.8 偏差检测
6.2 数据挖掘的对象
6.3 数据挖掘系统的分类
6.4 数据挖掘项目的生命周期
6.4.1 商业理解
6.4.2 数据准备
6.4.3 模型构建
6.4.4 模型评估
6.4.5 应用集成和实施
6.5 数据挖掘面临的挑战及发展
6.5.1 数据挖掘面临的挑战
6.S.2 数据挖掘的发展趋势
【本章小结】
【思考题】
第7章 关联挖掘
7.1 关联规则挖掘
7.1.1 购物分析:关联挖掘
7.1.2 基本概念
7.1.3 关联规则挖掘分类
7.2 单维布尔关联规则挖掘
7.2.1 Apriori算法
7.2.2 关联规则的生成
7.3 挖掘多层级关联规则
7.3.1 挖掘多层次关联规则
7.3.2 挖掘多层次关联规则方法
7.3.3 多层次关联规则的冗余
7.4 多维关联规则的挖掘
7.4.1 多维关联规则
7.4.2 利用静态离散挖掘多维关联规则
7.5 关联挖掘中的相关分析
7.5.1 无意义强关联规则示例
7.5.2 从关联分析到相关分析
7.6 利用Microsoft SSAS进行关联挖掘
7.6.1 Microsoft关联规则模型简介
7.6.2 关联规则数据挖掘示例
【本章小结】
【思考题】
第8章 分类与预测
8.1 分类与预测基本知识
8.2 有关分类和预测的几个问题
8.3 基于决策树的分类
8.3.1 决策树生成算法
8.3.2 属性选择方法
8.3.3 树枝修剪
8.3.4 决策树分类规则获取
8.3.5 级别决策树方法的改进
8.3.6 数据仓库技术与决策树归纳的结合
8.4 贝叶斯分类方法
8.4.1 贝叶斯定理
8.4.2 基本贝叶斯分类方法
8.5 神经网络分类方法
8.5.1 多层前馈神经网络
8.5.2 神经网络结构
8.5.3 后传方法
8.5.4 后传方法和可理解性
8.6 分类器准确性
8.6.1 分类器准确性估计
8.7 预测方法
8.7.1 线性与多变量回归
8.7.2 非线性回归
8.7.3 其它回归模型
8.8 Microsoft贝叶斯算法
8.8.1 贝叶斯算法的参数
8.8.2 使用贝叶斯模型
8.8.3 浏览贝叶斯模型
8.9. Microsoft决策树算法
8.10 Microsoft神经网络算法
【本章小结】
【思考题】
第9章 聚类分析
9.1 聚类分析概念
9.2 聚类分析中的数据类型
9.2.1 间隔数值属性
9.2.2 二值属性
9.2.3 符号、顺序和比例数值属性
9.2.4 混合类型属性
9.3 主要聚类方法
9.4 划分方法
9.4.1 传统划分方法
9.4.2 大数据库的划分方法
9.5 层次方法
9.5.1 两种基本层次聚类方法
9.6 基于密度方法
9.6.1 基于密度方法:DBSCAN
9.7 异常数据分析
9.7.1 基于统计的异常检测方法
9.7.2 基于距离的异常检测方法
9.7.3 基于偏差的异常检查方法
9.8 Microsoft聚类算法
【本章小结】
【思考题】
第10章 时序数据和序列数据挖掘
10.1 时间序列模型
10.2 Microsoft的时序算法
10.2.1 自动回归
10.2.2 自动回归树
10.2.3 数据中的季节性处理
10.2.4 使用预测函数预测值
10.3 Microsoft时序算法示例
10.4 Microsoft的序列模式挖掘
10.4.1 Microsoft序列聚类算法
10.4.2 序列聚类挖掘示例
【本章小结】
【思考题】
第11章 基于多维数据集的数据挖掘
11.1 OLAP和数据挖掘之间的关系
11.2 构建OLAP挖掘模型
【本章小结】
· · · · · · (
收起)
评分
☆☆☆☆☆
个人觉得是很好的一本教材。从非专业人士的角度来看,作者耐心的梳理了全流程,并拆分为几个章节。理论+实例,较为详实的讲解了数据挖掘前中后的要点。前1/3没有基础的人还是可以看一看的,从中间开始涉及到数理逻辑和DT相关的内容多一些,建议手边备数理统计相关的书做释疑。
评分
☆☆☆☆☆
个人觉得是很好的一本教材。从非专业人士的角度来看,作者耐心的梳理了全流程,并拆分为几个章节。理论+实例,较为详实的讲解了数据挖掘前中后的要点。前1/3没有基础的人还是可以看一看的,从中间开始涉及到数理逻辑和DT相关的内容多一些,建议手边备数理统计相关的书做释疑。
评分
☆☆☆☆☆
个人觉得是很好的一本教材。从非专业人士的角度来看,作者耐心的梳理了全流程,并拆分为几个章节。理论+实例,较为详实的讲解了数据挖掘前中后的要点。前1/3没有基础的人还是可以看一看的,从中间开始涉及到数理逻辑和DT相关的内容多一些,建议手边备数理统计相关的书做释疑。
评分
☆☆☆☆☆
个人觉得是很好的一本教材。从非专业人士的角度来看,作者耐心的梳理了全流程,并拆分为几个章节。理论+实例,较为详实的讲解了数据挖掘前中后的要点。前1/3没有基础的人还是可以看一看的,从中间开始涉及到数理逻辑和DT相关的内容多一些,建议手边备数理统计相关的书做释疑。
评分
☆☆☆☆☆
个人觉得是很好的一本教材。从非专业人士的角度来看,作者耐心的梳理了全流程,并拆分为几个章节。理论+实例,较为详实的讲解了数据挖掘前中后的要点。前1/3没有基础的人还是可以看一看的,从中间开始涉及到数理逻辑和DT相关的内容多一些,建议手边备数理统计相关的书做释疑。