论坛元老
- 威望
- 0
- 贡献
- 52
- 热心值
- 0
- 金币
- 5297
- 注册时间
- 2020-8-31
|
课程目录
01-概述、运行方式、连接Hadoop、分析Nutch脚本.mp4
02-nutch-default.xml配置项、常用命令.mp4
03-详解Nutch的存储文件夹data、crawldb&segments&linkdb命令.mp4
04-深入分析Nutch的抓取周期、3大merge和3大read命令阐释、反转链接、解析页面.mp4
05-域统计、webgraph.mp4
06-注入分值、轻量级抓取.mp4
07-indexchecker、安装配置Solr、运行Solr并提交索引、使用Luke工具查看索引、给Solr配置分词器mmseg4j.mp4
08-指定Luke工具的分词器、运行Solr并提交索引.mp4
09-安装Windows上的Nutch运行环境Cygwin、运行Nutch.mp4
10-Hadoop单机本地模式、Hadoop单机伪分布式模式、执行Nutch的crawl命令.mp4
11-配置Cygwin支持无密码SSH登录、Windows上的Hadoop单机伪分布式、执行wordcount命令.mp4
12-Hadoop多机完全分布式模式.mp4
13-改变机器负载、SecondaryNameNode、启用回收站.mp4
14-动态增加DataNode节点和TaskTracker节点.mp4
15-限制Hadoop节点连接、动态删除DataNode节点和TaskTracker节点.mp4
16-运行基准测试.mp4
17-配置服务端、配置客户端、访问页面、集成Hadoop.mp4
18-压缩数据、以不同压缩方法注入URL、Hadoop配置Snappy压缩.mp4
19-Ganglia以组播或单播方式监控同一个网段中的多个集群、Ganglia监控不同网段中的多个集群.mp4
20-Ganglia以单播方式监控跨多个网段的单一集群、配置Hadoop集群使用单播地址、扩展集群让其节点分别位于3个不同网段、配置host138.mp4
|
|