大数据 -- Spark

 2023-09-16 阅读 17 评论 0

摘要:Spark体系架构 zhuangzai Spark体系架构包括如下三个主要组件: 数据存储API管理框架什么是大数据概念、接下来让我们详细了解一下这些组件。 数据存储: Spark用HDFS文件系统存储数据。它可用于存储任何兼容于Hadoop的数据源,包括HDFS,HBaseÿ

Spark体系架构

zhuangzai

 

Spark体系架构包括如下三个主要组件:

  • 数据存储
  • API
  • 管理框架

什么是大数据概念、接下来让我们详细了解一下这些组件。

数据存储:

Spark用HDFS文件系统存储数据。它可用于存储任何兼容于Hadoop的数据源,包括HDFS,HBase,Cassandra等。

API

大数据分析、利用API,应用开发者可以用标准的API接口创建基于Spark的应用。Spark提供Scala,Java和Python三种程序设计语言的API。

下面是三种语言Spark API的网站链接。

  • Scala API
  • Java
  • Python

资源管理:

Spark既可以部署在一个单独的服务器也可以部署在像Mesos或YARN这样的分布式计算框架之上。

大数据mapreduce。下图2展示了Spark体系架构模型中的各个组件。

图2 Spark体系架构

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/2/69263.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息