《大数据分析数据科学套用场景与实践精髓》是2008年出版的图书,作者是Bart Baesens(巴特·贝森斯)。
基本介绍
- 书名:大数据分析数据科学套用场景与实践精髓
- 作者:【英】Bart Baesens(巴特·贝森斯)
- ISBN:978-7-115-40745-0
- 页数:232页
- 定价:59元
- 出版时间:2008年
- 开本:小16
内容简介
《大数据分析 数据科学套用场景与实践精髓》是一本讨论大数据理论及套用实践的专着,从讨论理论界的前沿观点开始,之后转向讨论这些理论在日常商业活动中的实践套用。
《大数据分析 数据科学套用场景与实践精髓》首先介绍了大数据分析的业务套用场景、分析建模过程和主要任务,以及模型商用的关键点;接着讲述了数据收集、抽样和预处理的实施要点;之后系统性地讨论了各种模型技术及其套用,包括预测分析、描述分析、生存分析、社交网路分析等。在完成了这些理论知识和模型技术方法铺垫之后,就进入到实践套用部分,包括把分析活动转化为生产力的关键事项,以及各种套用实例。《大数据分析 数据科学套用场景与实践精髓》帮助读者系统地梳理了各类模型方法的技术要点和套用要点,包括线性回归、Logistic回归、决策树、聚类、关联规则、序列规则、神经网路、支持向量机、套袋算法、Boosting算法、随机森林算法、生存分析等;本书还介绍了大量的套用实例,如信用风险建模、欺诈检测、行销回响提升模型、客户流失预测、自动推荐、网页分析、社交媒体分析,以及业务流程分析等。因此,对于从事大数据分析相关工作的人士来说,本书是一本难得的实务指南;对于高等院校相关专业的师生来说,本书是一本非常好的课外阅读材料,特别是书中关于如何把分析变成生产力的章节部分,相信一定能给他们很多的启发和思考。
图书目录
目录
1 第1章 大数据及其分析
1.1 大数据的业务套用场景
1.2 基本的专业术语
1.3 分析过程模型
1.4 分析建模活动中的任务及角色
1.5 分析技术
1.6 分析模型的要求
1.7 本章参考文献
13 第2章 数据採集、抽样和预处理
2.1 数据源的类型
2.2 数据抽样
2.3 数据类型
2.4 数据可视化及探索性统计分析
2.5 缺失值的处理
2.6 异常值检测及处理
2.7 数据标準化
2.8 粗分类(Categorization)处理
2.9 WOE值的计算
2.10 变数的选择
2.11 细分
2.12 本章参考文献
35 第3章 预测分析
3.1 定义目标变数
3.2 线性回归
3.3 Logistic回归
3.4 决策树
3.5 神经网路
3.6 支持向量机
3.7 集成算法
3.7.1 套袋算法(Bagging)
3.7.2 Boosting方法
3.7.3 随机森林
3.8 多类分类技术
3.8.1 多类Logistic回归
3.8.2 多类决策树
3.8.3 多类神经网路
3.8.4 多类支持向量机
3.9 预测模型的评估
3.9.1 数据集的分割
3.9.2 分类模型的性能评估
3.9.3 回归模型的性能评估
3.10 本章参考文献
89 第4章 描述性分析
4.1 关联规则
4.1.1 基本概念及假设
4.1.2 支持度和置信度
4.1.3 关联规则的挖掘
4.1.4 提升度的度量
4.1.5 关联规则的后处理
4.1.6 关联规则的扩展
4.1.7 关联规则的套用
4.2 序列规则
4.3 细分技术
4.3.1 分层聚类
4.3.2 K-Means聚类
4.3.3 自组织映射图(SOM)
4.3.4 聚类解决方案的套用及解释
4.4 本章参考文献
107 第5章 生存分析
5.1 生存分析的基本概念和函式
5.2 卡普兰·梅尔分析
5.3 参数法生存分析
5.4 比例风险回归模型
5.5 生存分析模型的扩展
5.6 生存分析模型的评估
5.7 本章参考文献
123 第6章 社交网路分析
6.1 社交网路的定义
6.2 社交网路的度量
6.3 社交网路学习
6.4 关係近邻分类器
6.5 机率关係近邻分类器
6.6 关係逻辑回归
6.7 共同模式推断
6.8 自中心网路(EGO NETS)
6.9 偶图/二分图
6.10 本章参考文献
137 第7章 从分析到生产力
7.1 模型的后验测试
7.1.1 分类模型的后验测试
7.1.2 回归模型的后验测试
7.1.3 聚类模型的后验测试
7.1.4 设计后验测试方案
7.2 参照管理
7.3 数据质量
7.4 软体工具
7.5 隐私保护
7.6 模型设计相关文档
7.7 公司治理
7.8 本章参考文献
167 第8章 实践与案例
8.1 信用风险建模
8.2 欺诈检测
8.3 净回响提升建模
8.4 流失预测
8.4.1 流失预测模型
8.4.2 流失预测流程
8.5 推荐系统
8.5.1 协同过滤推荐
8.5.2 基于内容的推荐
8.5.3 基于人口统计信息的推荐
8.5.4 基于知识的推荐
8.5.5 组合推荐
8.5.6 推荐系统的评价
8.5.7 案例介绍
8.6 网页分析
8.6.1 网页数据收集
8.6.2 Web KPI指标
8.6.3 从Web KPI到行动洞察力
8.6.4 导航分析
8.6.5 搜寻引擎行销分析
8.6.6 A/B测试和多变数测试
8.7 社会化媒体分析
8.7.1 社交网站:B2B广告工具
8.7.2 情感分析
8.7.3 网路分析
8.8 业务流程分析
8.8.1 流程智慧型
8.8.2 流程挖掘和分析
8.8.3 形成闭环:全流程的整合数据分析
8.9 本章参考文献
231 译者后记