《文本挖掘(基于R语言的整洁工具)》(美)茱莉亚·斯拉格//戴维·罗宾逊机械工业出版社豆瓣PDF电子书网盘迅雷下载在线免费阅读-Fahrenheit英汉词典

书名

文本挖掘(基于R语言的整洁工具)

分类

作者

(美)茱莉亚·斯拉格//戴维·罗宾逊

出版社

机械工业出版社

下载

抱歉，不提供下载，请购买正版图书。

简介

编辑推荐

茱莉亚·斯拉格、戴维·罗宾逊著的《文本挖掘(基于R语言的整洁工具)》介绍了如何使用tidytext包以及其他基于R语言的tidy工具来进行文本挖掘。tidytext包提供的函数相对简单，但如何使用这个包则很重要。因此，本书还提供了真实的、极具吸引力的文本挖掘案例。

本书重点介绍实际软件实例和数据展示，几乎没有公式，但是有大量的代码。

内容推荐

当前很多数据都是非结构化的大规模文本，这给分析和可视化带来了挑战。茱莉亚·斯拉格、戴维·罗宾逊著的《文本挖掘(基于R语言的整洁工具)》使用实用的tidytext软件包来介绍文本挖掘技术，该包是由Julia Silge和David Robinson共同开发的R软件包（类似于ggplot2和dplyr软件包），开发时采用了整洁原则。本书将会介绍如何利用tidytext以及其他整洁工具使文本分析变得更容易、更有效。

本书展示如何将文本转换为数据框，然后提取和可视化文本的特征；并介绍如何将自然语言处理（NLP）融入有效的工作流程中；实用的代码示例和数据分析将帮助你了解文学作品、新闻和社交媒体中的有用信息。

前言

第1章整洁文本格式

比较整洁文本结构与其他数据结构

unnest_tokens函数

整理Jane Austen的作品

gutenbergr包

词频

总结

第2章基于整洁数据的情感分析

情感数据集

内连接的情感分析

比较三个情感词典

最常见的正面单词和负面单词

Wordclouds模块

除单词外的其他文本单元

总结

第3章分析词和文件频率：tf-idf

Jane Austen小说中的词项频率

Zipf定律

bind_tf_idf函数

物理学语料库

总结

第4章词之间的关系：n-gram及相关性

n-gram词条化

用widyr包对单词对计数并计算相关性

总结

第5章非整洁格式转换

使文档-词项矩阵整洁

将整洁文本数据转换为矩阵

总结

第6章主题建模

LDA

示例：博大的图书馆馆藏

LDA方法的替代实现

总结

第7章案例研究：Twitter归档文件比较

单词使用情况的比较

单词使用情况的变化

收藏和转发

总结

第8章案例研究：NASA元数据挖掘

NASA如何组织数据

共现单词与相关单词

计算描述字段的tf-idf

总结

第9章案例研究：分析Usenet文本

预处理

新闻组中的单词

情感分析

总结

参考文献

随便看

Fahrenheit英汉词典电子书栏目提供海量电子书在线免费阅读及下载。

书名	文本挖掘(基于R语言的整洁工具)
分类
作者	(美)茱莉亚·斯拉格//戴维·罗宾逊
出版社	机械工业出版社
下载	抱歉，不提供下载，请购买正版图书。
简介	编辑推荐茱莉亚·斯拉格、戴维·罗宾逊著的《文本挖掘(基于R语言的整洁工具)》介绍了如何使用tidytext包以及其他基于R语言的tidy工具来进行文本挖掘。tidytext包提供的函数相对简单，但如何使用这个包则很重要。因此，本书还提供了真实的、极具吸引力的文本挖掘案例。本书重点介绍实际软件实例和数据展示，几乎没有公式，但是有大量的代码。内容推荐当前很多数据都是非结构化的大规模文本，这给分析和可视化带来了挑战。茱莉亚·斯拉格、戴维·罗宾逊著的《文本挖掘(基于R语言的整洁工具)》使用实用的tidytext软件包来介绍文本挖掘技术，该包是由Julia Silge和David Robinson共同开发的R软件包（类似于ggplot2和dplyr软件包），开发时采用了整洁原则。本书将会介绍如何利用tidytext以及其他整洁工具使文本分析变得更容易、更有效。本书展示如何将文本转换为数据框，然后提取和可视化文本的特征；并介绍如何将自然语言处理（NLP）融入有效的工作流程中；实用的代码示例和数据分析将帮助你了解文学作品、新闻和社交媒体中的有用信息。目录前言第1章整洁文本格式比较整洁文本结构与其他数据结构 unnest_tokens函数整理Jane Austen的作品 gutenbergr包词频总结第2章基于整洁数据的情感分析情感数据集内连接的情感分析比较三个情感词典最常见的正面单词和负面单词 Wordclouds模块除单词外的其他文本单元总结第3章分析词和文件频率：tf-idf Jane Austen小说中的词项频率 Zipf定律 bind_tf_idf函数物理学语料库总结第4章词之间的关系：n-gram及相关性 n-gram词条化用widyr包对单词对计数并计算相关性总结第5章非整洁格式转换使文档-词项矩阵整洁将整洁文本数据转换为矩阵总结第6章主题建模 LDA 示例：博大的图书馆馆藏 LDA方法的替代实现总结第7章案例研究：Twitter归档文件比较单词使用情况的比较单词使用情况的变化收藏和转发总结第8章案例研究：NASA元数据挖掘 NASA如何组织数据共现单词与相关单词计算描述字段的tf-idf 总结第9章案例研究：分析Usenet文本预处理新闻组中的单词情感分析总结参考文献
随便看	RomaxDesigner入门详解与实例楼宇自动化技术与应用(第2版普通高等教育智能建筑规划教材) 机械工程测试技术(普通高等教育十二五规划教材) 道路工程制图(附光盘第2版高等职业教育规划教材) 路由与交换实用技术(高等院校规划教材)/计算机系列 MATLAB\Simulink机电一体化应用(普通高等教育机械类专业规划教材) 数控机床装调维修工(中级中等职业教育改革发展示范学校规划教材) 机械制图(机械类专业适用第2版普通高等教育十二五规划教材) 图解汽车底盘维修快速入门/上岗轻松学智能电网名词解释无线传感器网络及其在物流中的应用/电气信息工程丛书佳能数码单反摄影从新手到高手(精华速学版) 尼康数码单反摄影从新手到高手(精华速学版) CATIA V5R20曲面设计教程(附光盘)/CATIA V5工程应用精解丛书做最得力的副职(副职工作的26个技巧) FBI读心术(美国联邦密探的读心密码漫画珍藏版) AutoCAD快速自学宝典(附光盘2013中文版)/宝典书系国际商务(环境与运作原书第13版)/经济教材译丛 FBI攻心术(拥有像FBI那样强大的攻心战术漫画珍藏版) 教育心理学(幼儿园适用2013超值版全国教师资格认定考试培训指定教材) 要么品质要么死拉美经商必备(文化习俗与礼仪)/浙江外国语学院拉丁美洲研究所拉美研究译丛模具设计与加工速查手册(第2版)(精) 果蔬雕刻入门/上岗之路国产汽车电控元件位置与电路图大全(2009-2011款上)/国产汽车电控元件位置与电路图大全系列丛书忧什么什么讥的成语忧什么什么身的成语忧什么什么远的成语忧什么什么酲的成语忧什么什么醉的成语忧什么什么集的成语忧什么伤什么的成语忧什么余什么的成语忧什么危什么的成语忧什么哀什么的成语忧什么奉什么的成语忧什么如什么的成语忧什么忘什么的成语忧什么忡什么的成语忧什么忧什么的成语送张参及第还家（唐·钱起）送张参戎镇秦川（明·徐熥）送张参政考绩之京（明·李昌祺）送张参明经举兼向泾州觐省（唐·孟浩然）送张又新除温州（唐·赵嘏）送张及三人赴举（宋·张咏）送张及之任谷城（宋·张咏）送张叔亨侍御巡按云南二首（明·程敏政）送张叔亨御史按云南（明·王鏊）送张叔介（宋·曾丰）送张叔夏游金陵（宋末元初·仇远）送张叔展北归（宋·梅尧臣）送张叔方湘潭州税务大使（元·黄玠）送张叔显尹博白（明·黄佐）送张叔毅北归（宋·强至）蒜香红薯叶醉蟹包瓜肉糜嵌鲫鱼辣煸鸭块蒜蓉西兰花自制美味零食猪肉脯草莓巧克力蛋糕卷【青椒洋葱干豆腐】青椒炒三丁缓解疲劳豆浆---葡萄干豆浆南瓜双桃馒头清淡营养—清蒸鲳鱼玉米炖排骨滋阴补气豆浆---莲子红枣豆浆馋嘴小吃---五香栗子