TA的每日心情 | 开心 2024-9-19 21:14 |
---|
签到天数: 757 天 [LV.10]以坛为家III
管理员
- 积分
- 1312455
|
资源详情
课程目录01-概述、运行方式、连接Hadoop、分析Nutch脚本.mp402-nutch-default.xml配置项、常用命令.mp403-详解Nutch的存储文件夹data、crawldb&segments&linkdb命令.mp404-深入分析Nutch的抓取周期、3大merge和3大read命令阐释、反转链接、解析页面.mp405-域统计、webgraph.mp406-注入分值、轻量级抓取.mp407-indexchecker、安装配置Solr、运行Solr并提交索引、使用Luke工具查看索引、给Solr配置分词器mmseg4j.mp408-指定Luke工具的分词器、运行Solr并提交索引.mp409-安装Windows上的Nutch运行环境Cygwin、运行Nutch.mp410-Hadoop单机本地模式、Hadoop单机伪分布式模式、执行Nutch的crawl命令.mp411-配置Cygwin支持无密码SSH登录、Windows上的Hadoop单机伪分布式、执行wordcount命令.mp412-Hadoop多机完全分布式模式.mp413-改变机器负载、SecondaryNameNode、启用回收站.mp414-动态增加DataNode节点和TaskTracker节点.mp415-限制Hadoop节点连接、动态删除DataNode节点和TaskTracker节点.mp416-运行基准测试.mp417-配置服务端、配置客户端、访问页面、集成Hadoop.mp418-压缩数据、以不同压缩方法注入URL、Hadoop配置Snappy压缩.mp419-Ganglia以组播或单播方式监控同一个网段中的多个集群、Ganglia监控不同网段中的多个集群.mp420-Ganglia以单播方式监控跨多个网段的单一集群、配置Hadoop集群使用单播地址、扩展集群让其节点分别位于3个不同网段、配置host138.mp4
|
|