学分高考 web前端

科普Spark，什么是Spark？

发布时间: 2022-05-17 18:39:02

Spark是UC Berkeley AMP lab所开源的类HadoopMapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出和结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。

科普Spark，什么是Spark？

一、’什么是 Spark

Spark 是基于内存计算大数据分析引擎，提高了在大数据环境下数据处理的实时性。Spark 仅仅只涉及到数据的计算，没有涉及到数据的存储。

二、Spark HA 高可用部署

*Spark HA 解决 Master 单点故障的两种方案：

1.基于文件系统的单点恢复(主要用于开发或测试环境)

2.基于 zookeeper 的 Standby Masters(用于生产模式)

*基于 zookeeper 的 Spark HA 高可用集群部署

(1)im spark-env.sh

注释掉 export SPARK_MASTER_HOST=hdp-node-01

(2)在 spark-env.sh 添加 SPARK_DAEMON_JAVA_OPTS，内容如下：

spark.deploy.recoveryMode：

恢复模式（Master 重新启动的模式）有三种：

(1)ZooKeeper

(2) FileSystem

(3)NONE

spark.deploy.zookeeper.url：ZooKeeper 的 Server 地址

spark.deploy.zookeeper.dir：保存集群元数据信息的文件、目录。包括 Worker，Driver 和 Application。

注意：

在普通模式下启动 spark 集群，只需要在主机上面执行 start-all.sh 就可以了。在高可用模式下启动 spark 集群，先需要在任意一台节点上启动 start-all.sh命令。然后在另外一台节点上单独启动 master。命令 start-master.sh。

三、Spark-Shell

读取本地文件

1.运行 spark-shell --master local[N](N 表线程数)

2.编写 scala 代码

sc.textFile("file：///root///words.txt")

.flatMap(_.split(" ")).map((_，1)).reduceByKey(_+_).collect

读取 HDFS 上数据

1.整合 spark 和 HDFS，修改配置文件 spark-env.sh

export HADOOP_CONF_DIR=/opt/bigdata/hadoop-2.6.4/etc/hadoop

2.启动 hdfs，然后重启 spark 集群

3.向 hdfs 上传个文件

4.在 spark shell 中用 scala 语言编写 spark 程序指定具体的 master 地址

1.执行启动命令：

spark-shell

--master spark：//hdp-node-01：7077

--executor-memory 1g

--total-executor-cores 2

若没指定 master 地址则默认本地模式

2.编写 scala 代码

以上就是“科普Spark，什么是Spark”的全部内容，大家都了解了吗？

温馨提示：

本文【科普Spark，什么是Spark？】由作者教培参考提供。该文观点仅代表作者本人，学分高考系信息发布平台，仅提供信息存储空间服务，若存在侵权问题，请及时联系管理员或作者进行删除。

上一篇: 女孩子做前端是青春饭吗？适合web开发吗？

下一篇: 学大数据可以从事什么职业？大数据岗位有哪些？

相关阅读

教培参考

教育培训行业知识型媒体

相关I T

长沙芙蓉区推荐的web前端线下

济南济阳区推荐的web前端线下培

青岛市南区推荐的web前端线下培

青岛李沧区推荐的web前端线下培

武汉新洲区推荐的web前端线下培

上海浦东新区推荐的web前端线下

广州从化区推荐的web前端线下培

深圳龙岗区推荐的web前端线下培

天津东丽区推荐的web前端线下培

天津宝坻区推荐的web前端线下培

教育资讯

1

县域普通高中振兴有哪些重点举措

2

教育部等六部门联合印发《县域普

3

广西2025年高考录取工作结束顺

4

西藏征集志愿第10号公告

5

黑龙江2025年高考录取工作结束

6

6月7日，2025年全国高考正式拉开

7

倒计时96天！2025年全国高考统考

8

2025年陕西省高考综合改革适应性

9

湖南2025年高考报名将于2024年10

10

2024年全国各省高考人数统计一览

互动交流

微信扫码关注公众号

获取更多考试热门资料

我们采用的作品包括内容和图片部分来源于网络用户投稿，我们不确定投稿用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的权利，请联系我站将及时删除。

内容侵权、违法和不良信息举报

Copyright @ 2024 学分高考 All Rights Reserved 版权所有. 湘ICP备17021685号