注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络数据库SPSS Modeler+Weka数据挖掘从入门到实战

SPSS Modeler+Weka数据挖掘从入门到实战

SPSS Modeler+Weka数据挖掘从入门到实战

定 价:¥69.00

作 者: 暂缺
出版社: 电子工业出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787121319112 出版时间: 2019-06-01 包装: 平装
开本: 16 页数: 284 字数:  

内容简介

  本书是一本面向商业数据挖掘建模分析人员的教材,从具体的商业数据分析案例入手,帮助读者掌握数据挖掘的目的、方法、工具与分析步骤。本书所采用的分析工具为目前颇受好评的IBM SPSS Modeler及开源软件Weka。IBM SPSS Modeler有很好的用户接口,也有不错的分析功能,但缺乏比较前沿的分析模块,以及很难与现有的信息系统结合,而Weka恰能弥补其缺憾。同时,这两个软件都不需要编程,适合初学者。本书具体内容由四位活跃在数据挖掘教学和项目开发一线的人员完成,内容侧重软件的实际操作。力图将复杂的技术以浅显的方式进行解释,尽量避免涉及过多的数学内容。

作者简介

  李御玺,国立台湾大学资讯工程博士,其研究领域专注于数据仓库、数据挖掘、与文本挖掘。近年来有项目合作的公司包括台新国际商业银行、台湾新光商业银行、台湾联邦商业银行、远东国际商业银行、第YI银行、中国中信银行、美商大都会人寿保险公司、新光人寿保险公司、赫莲娜(HR)化妆品公司、特力和乐(HOLA)、中华航空公司、中国东方航空公司、福特六和(Ford)汽车公司等。李博士在其相关研究领域已发表超过260篇以上的研究论文。他同时也是国科会与教育部多个相关研究计划的主持人。 唐绍祖,CDA数据分析师教研团队成员,CDA深圳地区教研负责人。经管之家栏目《老司机带你上高速——玩转SPSS》系列原创者。长期从事CDA数据分析就业班的教研辅导工作,擅长使用Excel、Power BI、MySQL、SPSS以及SPSS Modeler进行数据分析与数据可视化工作,同时熟练掌握SAS、R和Python等数据分析工具。 马伯,哈尔滨工业大学数字影视媒体技术学士。现就职于经管之家CDA数据分析研究院,从事互联网、电子商务方向数据分析与数据挖掘的研究与CDA数据分析师的教学工作,研究方向为文本挖掘、电商推荐系统开发、潜在价值客户挖掘,互联网大数据挖掘等。 曾珂,华中师范大学管理科学工程硕士,现为某互联网金融公司数据产品经理,4年数据分析、数据挖掘相关项目与工作经验,曾经担任华为、国家电网等企业内训课程讲师。以企业客户画像、金融风险建模、客户价值预测、数据可视化为主要研究方向。

图书目录

第1 篇 理论篇

第1 章 数据挖掘简介 ................................................................................... 1

1.1 数据挖掘的起源、定义及目标 ....................................................................................... 2

1.2 数据挖掘的发展历程 ....................................................................................................... 2

1.3 SPSS Modeler 和Weka 基础操作 .................................................................................... 4

1.3.1 SPSS Modeler 软件简介 ....................................................................................... 4

1.3.2 建立一个SPSS Modeler 项目 .............................................................................. 5

1.3.3 Weka 软件环境简介 ............................................................................................. 8

1.3.4 Weka 简单操作实例 ............................................................................................. 9


第2 章 数据挖掘方法论 .............................................................................. 15

2.1 数据挖掘方法论 ............................................................................................................. 16

2.1.1 CRISP-DM .......................................................................................................... 16

2.1.2 SEMMA .............................................................................................................. 16

2.2 数据库中的知识挖掘步骤 ............................................................................................. 17

2.2.1 字段选择 ............................................................................................................. 17

2.2.2 数据清洗 ............................................................................................................. 18

2.2.3 字段扩充 ............................................................................................................. 18

2.2.4 数据编码 ............................................................................................................. 19

2.2.5 数据挖掘 ............................................................................................................. 20

2.2.6 结果呈现 ............................................................................................................. 21

2.3 案例:运用SPSS Modeler 和Weka 做客户的信用风险评分模型 ............................. 22

2.3.1 案例说明 ............................................................................................................. 22

2.3.2 案例实操 ............................................................................................................. 23

2.3.3 运用SPSS Modeler 进行初步的数据挖掘 ........................................................ 28

2.3.4 运用Weka 进行数据汇入 .................................................................................. 34

2.3.5 Weka 自有数据存储格式arff 简介 ................................................................... 36


第3 章 基本的数据挖掘技术 ...................................................................... 38

3.1 描述性统计 ..................................................................................................................... 39

3.1.1 案例:通过数据判断客户是否需要新增电话线路 ......................................... 39

3.1.2 案例:运用描述性统计分析杂志社的客户特征 ............................................. 40

3.2 可视化技术 ..................................................................................................................... 42

3.3 KNN 原理及实例 ........................................................................................................... 44

3.3.1 KNN(K 最近邻)算法 ..................................................................................... 44

3.3.2 使用KNN 算法计算距离 .................................................................................. 45

3.3.3 案例:使用KNN 算法向用户推荐电影 ........................................................... 49

3.4 案例:运用Weka 的KNN 算法对诊断结果进行预测 ..................................................... 52

3.4.1 案例说明 ............................................................................................................. 52

3.4.2 运用Weka 中的IBk 模型进行预测 .................................................................. 53

3.5 案例:运用SPSS Mo


本目录推荐