一、hadoop框架
hadoop是目前世界上应用最广泛的大数据工具。hadoop具有高容错率,且其硬件价格低,可以使用普通pc服务器(个人理解:普通pc服务器的具体形式包括个人计算机等)构成大数据集群。
hadoop的map和reduce函数(map和reduce函数是大数据主要编程模型)的计算模式简洁,且开发人员可以通过多种编程语言编写map和reduce函数。hadoop的生态圈(个人理解:此处的生态圈指可以使用hadoop的开发工具集合)包含大量算法和组件。
hadoop的数据吞吐量超过其他大数据计算框架,但速度稍慢于其他大数据计算框架。
二、storm框架
storm框架采用的是流计算框架(根据网络资料理解:流计算框架可处理实时且持续进入流计算框架数据的计算),也可被称为实时大数据处理框架,在数据处理延时(根据网络资料理解:数据处理延迟的原因是存储或检索数据包需要时间)方面具有较大优势。
但storm框架只能进行数据处理,不能进行数据存储,因此,storm框架需借助hadoop框架的hdfs(分布式文件系统)存储数据。
storm框架由twitter(推特)开发,为开源框架,并托管于github(根据百度百科:github是一个面向开源及私有软件项目的托管平台),storm框架可被免费使用。storm框架支持的编程语言包括:java、ruby、python。
三、spark框架
spark框架包含实时流处理工具,spark框架没有存储数据功能。spark框架可以与hadoop框架集成,代替hadoop框架的map和reduce函数;也可以将spark框架单独部署集群(根据网络资料理解:部署集群的含义是在集群内的所有电脑或服务器中安装同一应用),但需要借助hdfs等分布式存储系统存储数据。
spark框架是基于内存的框架,因此,spark框架的运算速度快,其速度约为hadoop框架的100倍。
四、flink框架
(1)与spark框架相同,flink框架也是基于内存的实时计算框架。
(2)flink框架的数据处理速度快于spark框架的数据处理速度。flink框架支持毫秒级的流计算,spark框架支持秒级的流计算。
(3)相比于spark框架,flink框架与hadoop框架具有更好的兼容性。
(4)flink框架支持api(根据百度百科理解:api一般指应用程序编程接口,可将此处接口理解为服务的传递者。api可使开发人员访问其他系统对外提供的功能接口或服务,且开发人员无需访问该功能接口或服务的源代码或理解该功能接口或服务的内部工作机制细节)接口数量与spark框架支持api接口数量相近(此句由网络资料总结),但flink框架对sql的支持相较于spark框架对sql的支持较差。
图片来源:网络资料
(5)因为flink框架较新,使用flink框架的开发人员较少,所以flink框架的社区活跃度低于spark框架,即有关spark框架的问题更容易得到解答。
五、yarn架构
yarn架构属于hadoop2.0的分支。如图一所示,yarn架构处于hdfs和mapreduce之间。
图一,图片来源:学堂在线《大数据导论》
yarn架构主要由resourcemanager、nodemanager、applicationmaster(根据网络资料:applicationmaster负责与resourcemanager协商资源,并与nodemanager协同来执行和监控container) 、container(根据网络资料:container可被理解为单个节点ram、cpu、磁盘的集合)组件构成。
yarn架构的结构是master/slave结构(master的中文含义是主人,slave的中文含义是奴隶,master/slave结构即为主从结构)。如图二所示,resourcemanager是master,即主节点;nodemanager是slave,即从节点。
图二,图片来源:学堂在线《大数据导论》
京东方国内首个创新中心在重庆两江新区竣工
OPPOR11s评测 比预想中更愉悦的使用体验
迫近“端到端”的TD-LTE产业链
便携式产品中模拟开关的选择要注意的问题
喜视的AI人脸识别访客4G无线门禁一体机
大数据计算框架简介
NVIDIA Texture Tools Exporter如何加速Texture Tools 3.0压缩器技术
基于DSP TMS320DM642芯片实现运动控制卡的设计
世界首架纯电动飞机首次试飞任务成功完成
中软国际AIGC模型工厂、场景案例及“昇腾云+混合云一体机”方案成功发布
1月单月销量创历史新高,电动车需求趋势明显向好
5G时代,万物互联成为产业发展趋势
疫情已被证明是云应用和扩展的加速器,将继续推动云计算发展
红米将全产品线布局,雷军劝说两年卢伟冰终加入
照明光源的频闪是怎么回事
LG将展示最新一代可卷式超高清OLED显示屏
计算机系统对数值类型的编码、运算、转换原理介绍4
掌握可穿戴设备超长续航的秘密
LED产业如何高质量发展
为什么物联网离不开边缘计算