微信扫一扫联系客服

微信扫描二维码

进入报告厅H5

关注报告厅公众号

217

电子书-用R语言进行文本挖掘:一种整洁的方法(英)

# 计算机 # 计算机科学 # 数据处理 大小:7.40M | 页数:184 | 上架时间:2022-01-31 | 语言:英文

电子书-用R语言进行文本挖掘:一种整洁的方法(英).pdf

电子书-用R语言进行文本挖掘:一种整洁的方法(英).pdf

试看10页

类型: 电子书

上传者: 二一

出版日期: 2022-01-31

摘要:

Much of the data available today is unstructured and text-heavy, making it challenging for analysts to apply their usual data wrangling and visualization tools. With this practical book, you’ll explore text-mining techniques with tidytext, a package that authors Julia Silge and David Robinson developed using the tidy principles behind R packages like ggraph and dplyr. You’ll learn how tidytext and other tidy tools in R can make text analysis easier and more effective.

The authors demonstrate how treating text as data frames enables you to manipulate, summarize, and visualize characteristics of text. You’ll also learn how to integrate natural language processing (NLP) into effective workflows. Practical code examples and data explorations will help you generate real insights from literature, news, and social media.

  • Learn how to apply the tidy text format to NLP
  • Use sentiment analysis to mine the emotional content of text
  • Identify a document’s most important terms with frequency measurements
  • Explore relationships and connections between words with the ggraph and widyr packages
  • Convert back and forth between R’s tidy and non-tidy text formats
  • Use topic modeling to classify document collections into natural groups

  • Examine case studies that compare Twitter archives, dig into NASA metadata, and analyze thousands of Usenet messages
  • 今天的许多数据都是非结构化的,而且是大量的文本,这使得分析师在应用他们通常的数据处理和可视化工具时面临挑战。通过这本实用的书,你将利用tidytext探索文本挖掘技术,这是作者Julia Silge和David Robinson利用ggraph和dplyr等R包背后的整洁原则开发的一个包。你将学习tidytext和R中的其他tidy工具如何使文本分析更容易和更有效。

    • 作者演示了如何将文本作为数据框架来处理,使你能够操作、总结和可视化文本的特征。你还将学习如何将自然语言处理(NLP)纳入有效的工作流程。实用的代码示例和数据探索将帮助你从文献、新闻和社交媒体中产生真正的洞察力。

    • 学习如何将整齐的文本格式应用于NLP
    • 使用情感分析来挖掘文本的情感内容
    • 用频率测量法识别文件中最重要的术语
    • 用ggraph和widyr软件包探索词语之间的关系和联系
    • 在R的整洁和非整洁文本格式之间来回转换
    • 使用主题建模将文件集分类为自然组
    • 检查比较Twitter档案的案例研究,挖掘NASA元数据,并分析成千上万的Usenet信息
    展开>> 收起<<

    请登录,再发表你的看法

    登录/注册

    二一

    相关文库

    更多

    浏览量

    (153)

    下载

    (2)

    收藏

    分享

    购买

    5积分

    0积分

    原价5积分

    VIP

    *

    投诉主题:

    • 下载 下架函

    *

    描述:

    *

    图片:

    上传图片

    上传图片

    最多上传2张图片

    提示

    取消 确定

    提示

    取消 确定

    提示

    取消 确定

    积分充值

    选择充值金额:

    30积分

    6.00元

    90积分

    18.00元

    150+8积分

    30.00元

    340+20积分

    68.00元

    640+50积分

    128.00元

    990+70积分

    198.00元

    1640+140积分

    328.00元

    微信支付

    余额支付

    积分充值

    填写信息

    姓名*

    邮箱*

    姓名*

    邮箱*

    注:填写完信息后,该报告便可下载

    选择下载内容

    全选

    取消全选

    已选 1