Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)和(Google MapReduce的开源实现)为核心的
Hadoop为用户提供了系统底层细节透明的分布式基础架构。HDFS的高容错性、高伸缩性等优点允许用户将Hadoop部署在低廉(low-cost)的硬件上,形成分布式系统;
MapReduce分布式编程模型允许用户在不了解分布式系统底层细节的情况下并发并行应用程序。所以用户可以利用集群的Hadoop轻松地组织计算机资源,
从而搭建自己的分布式计算平台,并且可以充分利用集群的计算和存储能力,完成海量数据的处理。
Hadoop是一个开源框架,可编写和运行分布式应用处理大规模数据。分布式计算是一个宽泛并且不断变化的领域。
方便:Hadoop运行在由一般商用机器构成的大型集群上,或者云计算服务上,比如EC2。
健壮:Hadoop致力于在一般商用硬件上运行,其架构假设硬件会频繁失效,Hadoop可以从容地处理大多数此类故障。
可扩展:Hadoop通过增加集群节点,可以线性地扩展以处理更大的数据集。
简单:Hadoop允许用户快速编写高效的并行代码。
Hadoop框架的核心是HDFS和MapReduce。其中 HDFS 是分布式文件系统,MapReduce 是分布式数据处理模型和执行环境。掌握了这两部分,也就掌握了Hadoop最核心的东西。
课程目录
课时1Hadoop起源介绍.mp4
课时2Hadoop生态圈介绍.mp4
课时3Hadoop基本组件介绍.mp4
课时4Hadoop组成框架介绍.mp4
课时5Hadoop安装.mp4
课时6Eclipse环境搭建.mp4
课时7HDFS组件及备份机制介绍以及读写文件流程介绍.mp4
课时8Shell命令介绍.mp4
课时9HDFS Java API介绍(一).mp4
搜资源%全网资源0一网打尽www.souziyuan.top
课时10HDFS Java API介绍(二).mp4
课时11HDFS新特性介绍.mp4
课时12YARN组件介绍以及YARN框架上job执行流程介绍.mp4
课时13MR编程模型总体介绍.mp4
课时14Shuffle阶段Map端执行流程介绍.mp4
课时15Shuffle阶段Reduce端执行流程介绍.mp4
课时16WordCount案例总体介绍.mp4
课时17MapReduce中数据类型介绍.mp4
课时18MR中自定义数据类型编写.mp4
登录后下载查看内容:点击我登录本站提供的资源,都来自网络,版权争议与本站无关,所有内容及软件的文章仅限用于学习和研究目的。不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,我们不保证内容的长久可用性,通过使用本站内容随之而来的风险与本站无关,您必须在下载后的24个小时之内,从您的电脑/手机中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。侵删请致信邮箱souziyuan@outlook.com
共有 0 条评论