京公网安备 11010802034615号
经营许可证编号:京B2-20210330
《ibm spss modeler数据与文本挖掘实战》_数据分析师书籍推荐
《ibm spss modeler数据与文本挖掘实战》
图书简介:
本书主要包括两部分内容:在数据挖掘部分,重点介绍了各种数据挖掘方法的基本原理及应用,包括回归分析、时间序列分析、因子分析、决策树分析、判别分析、聚类分析、人工神经网络、贝叶斯网络以及社交网络分析等;在文本挖掘部分,重点介绍了文本挖掘的节点,以及具体的实现过程。每一章都详细介绍了数据和文本挖掘的基本原理和分析过程,同时在实例中也介绍了SPSS Modeler中大部分节点的使用方法及应用步骤。
本书与同类书籍相比,安排了较多的实例,使读者能够边学边练,在短时间内就可以有一个较大的提高,方便读者熟悉SPSS Modeler的基本操作,并通过系统的案例使读者掌握应用技巧。
本书对于高校理工学科、经济金融学科及数量分析方面的学生,以及数据挖掘和分析方面的研究人员和从业人员等,具有很强的可读性、可操作性与可使用性,尤其适合商业销售、经济管理、社会研究和人文教育等行业的相关人员阅读。
目录
第1部分数据挖掘篇
第1章数据挖掘概述 3
1.1什么是数据挖掘 3
1.1.1数据挖掘的定义 4
1.1.2数据挖掘的发展阶段 5
1.2与传统技术的比较 8
1.2.3数据挖掘和OLAP 9
1.2.4数据挖掘和Web挖掘 10
1.3常用的数据挖掘软件 11
1.3.1SAS EM 12
1.3.2SPSS Modeler 13
1.3.3Intelligent Miner 13
1.4应用实例:目标客户分析 15
1.4.1研究方法 15
1.4.2数据分析 15
1.4.3研究结论 26
第2章SPSS Modeler软件概述 27
2.1软件简介 27
2.1.1软件发展 28
2.1.2软件界面 30
2.1.3软件特点 35
2.1.4软件功能 37
2.1.5软件算法 39
2.1.6高级功能 41
2.1.7软件安装 42
2.2行业应用 50
2.2.1通信行业 50
2.2.2ZF行业 52
2.2.3金融行业 53
2.2.4制造行业 54
2.2.5医药行业 56
2.2.6教育科研 56
2.2.7市场调研 57
2.2.8连锁零售 57
2.3数据挖掘流程 58
2.3.1业务理解 58
2.3.2数据理解 59
2.3.3数据准备 60
2.3.4建立模型 61
2.3.5评估模型 61
2.3.6应用模型 62
2.4应用实例:药物效果研究 62
2.4.1研究方法 63
2.4.2数据分析 63
2.4.3研究结论 69
第3章SPSS Modeler基础操作 70
3.1数据输入 70
3.1.1数据库 71
3.1.2可变文件 73
3.1.3固定文件 75
3.1.4SAS文件 76
3.1.5Statistics文件 77
3.1.6Excel文件 77
3.2数据流操作 78
3.2.1生成数据流 78
3.2.2添加和删除节点 79
3.2.3连接数据流 79
3.2.4修改连接节点 80
3.2.5执行数据流 81
3.3图形制作 82
3.3.1散点图 82
3.3.2直方图 84
3.3.3网络图 85
3.3.4评估图 87
3.4应用实例:产品销售预测 88
3.4.1研究方法 88
3.4.2数据分析 88
3.4.3研究结论 99
第4章回归分析 100
4.1回归分析模型概述 100
4.1.1模型定义 101
4.1.2模型应用 102
4.1.3建模步骤 103
4.1.4注意事项 103
4.2应用实例:客户流失因素分析 104
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27