分类目录:大数据

MapReduce性能优化

检测系统瓶颈 性能调优 创建一项基线,用来评估系统的首次运行性能(即集群默认配置) 分析Hadoop计数器,修改,调整配置,并重新执行任务,与基线进行比较 重复执行第2步,直到最高效率 识别资源瓶颈 内存瓶颈 当发现节点…

《Presto技术内幕》(4)

生成查询执行计划(下) 执行计划的生成 执行计划节点 执行计划树中的节点分为以下几种类型 AggregationNode 用于聚合操作的节点,在执行计划优化前所有的聚合节点都是单点聚合,优化后拆分为为其他两种 FINAL…