hyalone的个人博客分享 http://blog.sciencenet.cn/u/hyalone

博文

mapreduce计算范式与推拉技术

已有 2616 次阅读 2014-11-2 20:55 |个人分类:计算机|系统分类:科研笔记|关键词:学者| mapreduce, 计算范式, 推拉数据

mapreduce计算模式深入人心,不过在使用中还是有点遗憾。shuffling后的结果多次复用好像不方便。

计算范式可以考虑做如下扩展:


1、增加shuffling后的mapper,可以对数据进行转换,这样可以利用本地保存数据做转换,避免大集群上的join操作;

2、增加pusher,shuffling后数据转换后,可以多次消费,前面宝贵的mapper、shuffling成果不需头做。


在shuffling前的处理适合用拉数据,shuffling后的处理适合用推数据,但内部实现不必强制。mapper也可以包含一对多、多对一的可能。



https://m.sciencenet.cn/blog-867801-840598.html

上一篇:机器的组织管理结构
下一篇:两个时期间差异对比的度量

1 刘桂锋

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-19 06:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部