人工智能与数据挖掘2017年最新炼数成金文本挖掘与自然语言处理附讲义 12周(分词 贝叶斯网 crf)
目录
第1课 自然语言处理与文本挖掘概述。强大的系统后面都有一个强大的语料库。形式语言,机器诗人是怎样炼成的?
第2课 自动机及其应用,文稿自动校正,歧义消除
第3课 语言模型,平滑方法。应用案例:语音识别,分词消岐
第4课 概率图模型,生成式模型与判别式模型,贝叶斯网,马尔科夫链,隐马尔科夫模型HMM,应用案例:语音识别与分词
第5课 马尔科夫网,最大熵模型,条件随机场CRF,实现HMM和CRF的软件。应用案例:使用最大熵消除歧义,使用CRF进行标注
第6课 汉语分词专题。世界上最难的语言名不虚传
第7课 命名实体识别,词性标注,从文本里挖出最重要的内容
第8课 句法分析,找出句子的重点
第9课 语义分析与篇章分析,让机器象语言学家那样思考
第10课 文本分类,情感分析。应用案例:互联网自动门户,评论倾向性分析
第11课 信息检索系统,搜索引擎原理,问答系统,应用案例:客服机器人是怎么造出来的?
第12课 文本深度挖掘:自动文摘与信息抽取
第13课 机器翻译与语音识别技术介绍。IBM Watson系统的认知智慧。
|