网站点击流是网站分析的主要来源。视频包含系统架构,功能介绍,搭建,hdfs系统,日志清洗,hive使用,配置,ETL实现等知识点。
开始学习网站点击流是网站分析的主要来源。视频包含系统架构,功能介绍,搭建,hdfs系统,日志清洗,hive使用,配置,ETL实现等知识点。
开始学习01-项目的架构,功能介绍
24:0402-点击流日志环境-伪分布式的搭建
14:1303-点击流日志环境-hdfs系统
28:5304-点击流日志环境-分布式的hdfs系统
28:1001-shell脚本操作hdfs
11:3602-点击流日志算法-mapreduce初体验
12:1203-mapreduce实现日志清洗
50:3504-mapreduce的原理分析
10:3101-项目的ETL-Hive的使用
26:4302-hive的重要概念讲解
36:4103-日志采集-flume的初体验
21:1904-利用flume将数据写入hdfs上
11:5005-小结复习加强
24:3301-工作流控制项目-azkaban的配置
20:4502-使用azkaban工作流执行调度
41:4503-sqoop的安装使用
08:2304-sqoop导出数据至mysql
18:2701-项目总结1_点击流模型MR实现
41:3802-项目总结2_工作流调度MR,HIVE
42:2503-项目总结3_ETL实现
48:24
评论发表成功
确定