金牌会员
- 威望
- 26
- 贡献
- 68
- 热心值
- 0
- 金币
- 2162
- 注册时间
- 2020-8-31
|
课程大纲
第一周:自然语言分析利器——Python入门
第二周:自然语言分析工具包——NLTK入门。编程实战:NLTK包的安装与常用方法介绍
第三周:语料库的获取与词频分析。编程实战:词条频率分布图的绘制
第四周:原始文本资料的读取与处理。编程实战:使用正则表达式实现英文分词
第五周:中文分词的算法与实现。编程实战:结巴分词器的使用
第六周:词条分类与词条属性。编程实战:中英文词性标注
第七周:文本挖掘之文本分类器。编程实战:新闻类别分类
第八周:文本挖掘之文本聚类。编程实战:百度词条聚类分析
第九周:文本信息提取。编程实战:结构化数据提取系统
第十周:句子语法分析。编程实战:自动语法树构建系统
第十一周:让计算机读懂我们——文本语义分析实现。编程实现:智能问答系统
第十二周:语言数据管理。编程实践:语料库的设计与创建
|
|