Loading...
本篇文章将阐述Hadoop的一些基本概念,并解释MapReduce的局限,从而引出Spark的核心思想。Hadoop当初作为一种大数据技术横空出世,经过多...
1、HDFS分布式存储hdfs架构图 namenode:统一管理文件的元数据信息 fsImage:存储了文件的基本信息,如文件路径,文件副...
Mapreduce原理:分而治之,一个大任务分成多个子任务(map),并行执行之后,合并结果(reduce)。eg:做统计的时候,把统计的文件拆分,然后分...