Hadoop是一个能够对大量数据进行离线分布式处理的软件框架,hadoop集群中的数据存储在hdfs中,hdfs中的节点分为namenode和DataNode,namenode保存元数据信息,datanode保存文件内容.运算时利用mapreduce对数据进行处理.
开始学习Hadoop是一个能够对大量数据进行离线分布式处理的软件框架,hadoop集群中的数据存储在hdfs中,hdfs中的节点分为namenode和DataNode,namenode保存元数据信息,datanode保存文件内容.运算时利用mapreduce对数据进行处理.
开始学习01-hadoop系统功能和结构功能介绍
45:5802-secureCRT和FileZilla的使用介绍
26:4903-hadoop集群安装过程
47:2804-hadoop配置总结
13:1505-hadoop集群数据观察
34:0406-向hadoop集群提交任务演示
28:4501-spark介绍和集群搭建
41:2602-intellij上编写程序并提交集群
33:1203-spark shell编写wordcount
31:10
评论发表成功
确定