网站首页  英汉词典  古诗文  美食菜谱  电子书下载

请输入您要查询的图书:

 

书名 数据挖掘与R语言(原书第2版)/数据科学与工程技术丛书
分类
作者 (葡)路易斯·托尔戈
出版社 机械工业出版社
下载 抱歉,不提供下载,请购买正版图书。
简介
目录

推荐序

中文版序

译者序

前言

致谢

第1章 简介

 1.1 如何阅读本书

 1.2 重现性

第一部分 R与数据挖掘简介

 第2章 R简介

2.1 R起步

2.2 与R控制台的简单交互

2.3 R对象和变量

2.4 R函数

2.5 向量

2.6 向量化

2.7 因子

2.8 生成序列

2.9 数据子集

2.10 矩阵和数组

2.11 列表

2.12 数据框

2.13 数据框的扩展

2.14 对象、类和方法

2.15 管理R会话

 第3章 数据挖掘简介

3.1 数据挖掘鸟瞰图

3.2 数据收集和业务理解

 3.2.1 数据和数据集

 3.2.2 导入数据到

3.3 数据预处理

 3.3.1 数据清洗

 3.3.2 变换变量

 3.3.3 生成变量

 3.3.4 降维

3.4 建模

 3.4.1 探索性数据分析

 3.4.2 使用关联规则的依赖建模

 3.4.3 聚类

 3.4.4 异常检测

 3.4.5 预测分析

3.5 评估

 3.5.1 Holdout和随机子抽样

 3.5.2 交叉验证

 3.5.3 Bootstrap估计

 3.5.4 推荐程序

3.6 报告和部署

 3.6.1 通过动态文档进行报告

 3.6.2 通过Web应用程序进行部署

第二部分 数据挖掘案例研究

 第4章 预测海藻数量

4.1 问题描述与目标

4.2 数据说明

4.3 加载数据到

4.4 数据可视化和总结

4.5 数据缺失

 4.5.1 将缺失部分剔除

 4.5.2 尝试找到缺失值最有可能的赋值

 4.5.3 通过变量的相关关系填补缺失值

 4.5.4 通过探索类似个案填补缺失值

4.6 获取预测模型

 4.6.1 多元线性回归

 4.6.2 回归树

4.7 模型评价和选择

4.8 预测7种海藻的频率

4.9 小结

 第5章 预测股票市场收益

5.1 问题描述与目标

5.2 可用的数据

 5.2.1 从CSV文件读取数据

 5.2.2 从网站上获取数据

5.3 定义预测任务

 5.3.1 预测什么

 5.3.2 预测变量是什么

 5.3.3 预测任务

 5.3.4 模型评价准则

5.4 预测模型

 5.4.1 如何应用训练集数据来建模

 5.4.2 建模工具

5.5 从预测到实践

 5.5.1 如何应用预测模型

 5.5.2 与交易相关的评价准则

 5.5.3 模型集成:仿真交易

5.6 模型评价和选择

 5.6.1 蒙特卡罗估计

 5.6.2 实验比较

 5.6.3 结果分析

5.7 交易系统

 5.7.1 评估最终测试数据

 5.7.2 在线交易系统

5.8 小结

 第6章 侦测欺诈交易

6.1 问题描述与目标

6.2 可用的数据

 6.2.1 加载数据到

 6.2.2 探索数据集

 6.2.3 数据问题

6.3 定义数据挖掘任务

 6.3.1 问题的不同解决方法

 6.3.2 评价准则

 6.3.3 实验方法

6.4 计算离群值的排序

 6.4.1 无监督方法

 6.4.2 有监督方法

 6.4.3 半监督方法

6.5 小结

 第7章 微阵列样本分类

7.1 问题描述与目标

 7.1.1 微阵列实验背景简介

 7.1.2 数据集

7.2 可用的数据

7.3 基因(特征)选择

 7.3.1 基于分布特征的简单过滤方法

 7.3.2 ANOVA过滤

 7.3.3 使用随机森林进行过滤

 7.3.4 使用特征聚类的组合进行过滤

7.4 遗传学异常的预测

 7.4.1 定义预测任务

 7.4.2 模型评价标准

 7.4.3 实验过程

 7.4.4 建模技术

 7.4.5 模型比较

7.5 小结

参考文献

主题索引

数据挖掘术语索引

R函数索引

内容推荐

路易斯·托尔戈著的《数据挖掘与R语言(原书第2版)》面向初学者,通过实践案例讲解如何用R进行数据挖掘。全书包括两部分,第一部分介绍R和数据挖掘的基础知识,第二部分为案例研究,通过预测海藻数量、预测股票市场收益、侦测欺诈交易以及微阵列样本分类四个案例培养构建解决方案的能力,掌握工具的使用技巧。

本书适合作为高校学生或业界新手了解R和数据挖掘的入门读本,其中的代码和数据均可免费下载。

编辑推荐

数据挖掘改变了众多公司和大型机构与客户沟通的方式,同时也改变了他们管理复杂过程的方式。现在大量的数据被很好地用于预测行为模式和未知结果。从软件方面而言,R以其强大的功能和诱人的价格(免费)改变了分析领域的蓝图。

路易斯·托尔戈著的《数据挖掘与R语言(原书第2版)》的目的就是把读者快速引入这两个领域。结合书中的具体案例,读者可以在实际背景中进行学习,这样就不会在繁杂的统计理论或者计算机科学基础概念中不知所终。本书全部应用免费的工具——R(用于分析)和MySQL(用于数据库操作),提供了丰富的动手学习的体验。若能安装这些工具并应用它们来详细分析书中的案例,你一定会收获满满。

随便看

 

Fahrenheit英汉词典电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 frnht.com All Rights Reserved
更新时间:2025/11/23 4:19:27