hadoop(分布式系统基础架构) v2.7.1官方版

授权方式：免费软件
软件类型：国外软件
软件语言：简体中文
软件大小：2 KB
推荐星级：
软件厂商：Home Page
更新时间：2015-09-08 14:46
网友评论：0 条
运行环境：WinXP, Win2003, Vista, Win7, Win8
好评：88.68%

坏评：11.32%

gx developer 8.86中文版支持win7277 MB/简体中文/免费软件
AdAppMgrIPC.dll118 KB/简体中文/免费软件
altium designer 2016 v16.1.17 320 bytes/简体中文/免费软件
SIEMENS STEP 7 v5.6 官方版2.23 GB/简体中文/免费软件
ArcGIS Desktop 10.3.1中文版附974 MB/简体中文/免费软件
ollydbg 64位(反汇编调试工具) v2.10 MB/简体中文/免费软件

软件介绍
相关文章
猜你喜欢
网友评论
下载地址

hadoop是一款的分布式系统基础架构，该应用由Apache基金会开发，相信大家都使用过apache，如果你是真正的开发者对hadoop也许并不陌生。它以一种可靠、高效、可伸缩的方式进行数据处理，有着超强的兼容性和数据库处理能力，用户可以在不了解分布式底层细节的情况下，开发分布式程序,充分利用集群的威力进行高速运算和存储。

功能特点：

HDFS有着高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。
HDFS放宽了（relax）POSIX的要求（requirements）这样可以流的形式访问（streaming access）文件系统中的数据。
高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。
⒉高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以千计的节点中。
⒊高效性。Hadoop能够在节点之间动态地移动数据，并保证各个节点的动态平衡，因此处理速度非常快。
⒋高容错性。Hadoop能够自动保存数据的多个副本，并且能够自动将失败的任务重新分配。
Hadoop带有用 Java 语言编写的框架，因此运行在 Linux 生产平台上是非常理想的。Hadoop 上的应用程序也可以使用其他语言编写，比如 C++。

开源实现：

Hadoop是项目的总称。主要是由HDFS和MapReduce组成。
HDFS是Google File System（GFS）的开源实现。
MapReduce是Google MapReduce的开源实现。
这个分布式框架很有创造性，而且有极大的扩展性，使得Google在系统吞吐量上有很大的竞争力。因此Apache基金会用Java实现了一个开源版本，支持Fedora、Ubuntu等Linux平台。雅虎和硅谷风险投资公司Benchmark Capital 联合成立一家名为Hortonworks的新公司，接管被广泛应用的数据分析软件Hadoop的开发工作。
Hadoop实现了HDFS文件系统和MapRecue。用户只要继承MapReduceBase，提供分别实现Map和Reduce的两个类，并注册Job即可自动分布式运行。
至今为止是2.4.1，稳定版本是1.2.1 和 yarn 的 2.4.0。
HDFS把节点分成两类：NameNode和DataNode。NameNode是唯一的，程序与之通信，然后从DataNode上存取文件。这些操作是透明的，与普通的文件系统API没有区别。
MapReduce则是JobTracker节点为主，分配工作以及负责和用户程序通信。
HDFS和MapReduce实现是完全分离的，并不是没有HDFS就不能MapReduce运算。
Hadoop也跟其他云计算项目有共同点和目标：实现海量数据的计算。而进行海量计算需要一个稳定的，安全的数据容器，才有了Hadoop分布式文件系统（HDFS，Hadoop Distributed File System）。
HDFS通信部分使用org.apache.hadoop.ipc，可以很快使用RPC.Server.start()构造一个节点，具体业务功能还需自己实现。针对HDFS的业务则为数据流的读写，NameNode/DataNode的通信等。
MapReduce主要在org.apache.hadoop.mapred，实现提供的接口类，并完成节点通信（可以不是hadoop通信接口），就能进行MapReduce运算。

hadoop 文件是怎么存储的：

1、存储文件的时候需要指定存储的路径，这个路径是HDFS的路径。而不是哪个节点的某个目录。比如./hadoop fs -put localfile hdfspat
一般操作的当前路径是/user/hadoop比如执行./hadoop fs -ls .实际上就相当于./hadoop fs -ls /user/hadoop
2、HDFS本身就是一个文件系统，在使用的时候其实不用关心具体的文件是存储在哪个节点上的。如果需要查询可以通过页面来查看，也可以通过API来实现查询。

下载hadoop(分布式系统基础架构) v2.7.1官方版