瑞客论坛

 找回密码
 立即注册
查看: 1106|回复: 1

【进阶】炼数成金 R七种武器之文本挖掘包tm 3课

[复制链接]

金币2988  第540名

236

主题

7

回帖

3292

积分

论坛元老

Rank: 8Rank: 8

威望
152
贡献
152
热心值
0
金币
2988
注册时间
2020-8-31
发表于 2019-3-27 00:07 | 显示全部楼层 |阅读模式
课程介绍:

自然语言处理与文本挖掘是机器学习当前最神秘,也是最具难度,在搜索引擎,语音识别,情感分析,大批量文档处理,机器翻译,自动应答等各个领域有着前程无可限量的应用。可以试想一台能理解自然语言,并且和人类能用语言纯熟交流的机器,那还能叫机器么?

文本挖掘(Text Mining)是数据挖掘的一个分支,挖掘对象通常是非结构化的文本数据,常见的文本挖掘对象包括网页所产生的BBS留言、博客、微博、新闻跟贴与转贴等。此外,拥有大型呼叫中心或邮件系统的企业,call center或mail积攒下来的大量语言记录也可以通过文本挖掘获得更大价值。很多统计软件都提供了文本挖掘的功能,比如常见的数据分析软件SAS、SPSS等,以及一些语言如Python、Java,侧重点有所不同。在R语言环境下,有众多的扩展包可以解决文本挖掘问题,本门课程将对这些扩展包作详细讲解。
   
课程目录:

第1课 自然语言处理与文本挖掘概述,既有技术和难点,应用前景,学习线路图
第2课 R的文本挖掘包tm,基本操作介绍
第3课 其它处理文本的扩展包,与tm包结合使用的应用案例

收获预期:

熟练地使用R进行文本分析处理工作

游客,如果您要查看本帖隐藏内容请回复

回复

使用道具 举报

金币1325  第1278名

2

主题

768

回帖

2389

积分

禁止发言

威望
0
贡献
1
热心值
0
金币
1325
注册时间
2019-4-19
发表于 2019-7-20 21:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|瑞客论坛 |网站地图

GMT+8, 2024-11-22 04:29

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表