关于Apache Spark设计和实现的笔记

关于Apache Spark设计和实现的笔记,本文主要讨论 Apache Spark 的设计与实现,重点关注其设计思想、运行原理、实现架构及性能调优,附带讨论与 Hadoop MapReduce 在设计与实现上的区别。

相关的项目 - 更多比较

Popular
244 2.8k 743

A Apache Arrow是一个跨平台的数据层来加快大数据分析项目的运行速度。 专为加速大数据而设计的柱状内存分析层。 它包含一组对平面和分层数据的规范内存表示以及用于结构操作的多个语言绑定。 它还提供IPC和公共算法实现。
 
10.0 10.0
  1小时前

M 中文 Linear Algebra (线性代数) 笔记
 
3.0 0.8
  9天前

GitHub - apache/tinkerpop: Mirror of Apache TinkerPop
 
2.8000000000000003 10.0
  前天