Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark 用 Scala 语言实现,它将 Scala 用作其应用程序框架, Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。本章主要学习scala语法基础、spark集群搭建和其上的应用开发。
开始学习Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark 用 Scala 语言实现,它将 Scala 用作其应用程序框架, Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。本章主要学习scala语法基础、spark集群搭建和其上的应用开发。
开始学习01-scala介绍及环境安装
28:3802-数值类型
27:2403-if和match
32:4004-块表达式和循环
26:1505-方法和函数(一)
33:1606-方法和函数(二)
31:4007- 数组
24:3308- list
24:2909- map
26:3210-Set
21:1311-元组
18:1212-wordcount练习
36:2901-spark介绍和集群搭建
41:2602-intellij上编写程序并提交集群
33:1203-spark shell编写wordcount
31:1004- rdd概念介绍
29:4505-RDD和算子
27:4206-rdd算子简单应用(一)
29:1307-rdd算子简单应用(二)
22:2508-高级算子(一)
31:0509-高级算子(二)
32:1510-判断位置_背景讲述
12:0511-统计家庭住址和工作地点(一)
33:1912-统计家庭住址和工作地点(二)
16:0213-统计网站访问排名前三的网页
35:3314-网站前三名独立文件-自定义分区
36:5615-自定义排序
14:0216-ip归属地查询(一)
32:0817-ip归属地查询(二)
28:1918-统计结果写入mysql数据库
36:5019-从传统数据库中读数据
21:3820-Spark Streaming概述
41:0921-实时wordcount编写(1)
17:1122-实时wordcount编写(2)
13:4823-实时单词统计-累加实现
21:3324-kafka集群之zookpper集群搭建
19:1325-kafka集群搭建及演示
30:0526-从kafka中实时处理数据编程
25:1027-spark sql了解
32:0328-dataframe操作的两种方式
18:1729-spark sql编程
34:53
评论发表成功
确定