中国综合性科技类核心期刊(北大核心)

中国科学引文数据库来源期刊(CSCD)

美国《化学文摘》(CA)收录

美国《数学评论》(MR)收录

俄罗斯《文摘杂志》收录

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于Map/Reduce的分布式数据排序算法分析

余晟隽 宫学庆 祝君 钱卫宁

余晟隽, 宫学庆, 祝君, 钱卫宁. 基于Map/Reduce的分布式数据排序算法分析[J]. 华东师范大学学报(自然科学版), 2016, (5): 121-130. doi: 10.3969/j.issn.1000-5641.2016.05.014
引用本文: 余晟隽, 宫学庆, 祝君, 钱卫宁. 基于Map/Reduce的分布式数据排序算法分析[J]. 华东师范大学学报(自然科学版), 2016, (5): 121-130. doi: 10.3969/j.issn.1000-5641.2016.05.014
YU Sheng-jun, GONG Xue-qing, ZHU jun, QIAN Wei-ning. Sorting algorithm analysis of distributed data based on Map/Reduce[J]. Journal of East China Normal University (Natural Sciences), 2016, (5): 121-130. doi: 10.3969/j.issn.1000-5641.2016.05.014
Citation: YU Sheng-jun, GONG Xue-qing, ZHU jun, QIAN Wei-ning. Sorting algorithm analysis of distributed data based on Map/Reduce[J]. Journal of East China Normal University (Natural Sciences), 2016, (5): 121-130. doi: 10.3969/j.issn.1000-5641.2016.05.014

基于Map/Reduce的分布式数据排序算法分析

doi: 10.3969/j.issn.1000-5641.2016.05.014
基金项目: 

国家自然科学基金(61332006); 国家 863 计划项目(2015AA015307)

详细信息
    通讯作者:

    余晟隽, 男, 硕士研究生, 研究方向为分布式数据库. E-mail: sjyu@obase.com.cn.

Sorting algorithm analysis of distributed data based on Map/Reduce

  • 摘要: 为了解决大规模数据的存储与计算, 近年来分布式系统得到了大量的应用. 如何在分布式系统中对大规模数据集进行排序是影响许多应用性能的基础问题, 其中不仅涉及每个节点上排序算法的选择, 更重要的是设计协调各节点的分布式算法. 本文总结了分布式系统中常用的分布式排序算法, 对每种算法的执行流程、代价模型和适用场景进行了分析, 并通过实验对分析结果进行了验证. 本文的工作可以帮助开发人员选择和优化分布式环境下大规模数据排序的算法.
  • [1]

    [ 1 ] KNUTH D E. The Art of Computer Programming: Sorting and Searching [M]. 2nd ed. Indianapolis: Addison-Wesley Professional, 1998.
    [ 2 ] BORTHAKUR D. The hadoop distributed file system: Architecture and design [J]. Hadoop Project Website, 2007, 11: 1-10.
    [ 3 ] DEAN J, GHEMAWAT S. MapReduce: Simplified data processing on large clusters [J]. Communications of the ACM, 2008, 51(1): 107-113.
    [ 4 ] CHRIS NYBERG, MEHUL SHAH. Sort Benchmark Home Page [EB/OL]. (2015) [2016-04-20]. http://sortbenchmark.org/.
    [ 5 ] BORTHAKUR D, GRAY J, SARMA J S, et al. Apache Hadoop goes realtime at Facebook [C]//Proceedings of the 2011 ACM SIGMOD International Conference on Management of Data. ACM, 2011: 1071-1080.
    [ 6 ] MANE S B, SAWANT Y, KAZI S, et al. Real time sentiment analysis of twitter data using hadoop [J]. International Journal of Computer Science and Information Technolo, 2014, 5(3): 3098-3100.
    [ 7 ] O’MALLEY O, MURTHY A C. Winning a 60 second dash with a yellow elephant [J]. Proceedings of Sort Benchmark, 2009, 1810(9): 1-9.
    [ 8 ] WANG J, WU Y, CAI H, et al. Fuxi Sort [EB/OL]. (2015) [2016-04-20]. http://sortbenchmark.org/Fux-iSort2015.pdf.
    [ 9 ] GRIFFITHS N. Nmon performance: A free tool to analyze AIX and Linux performance [EB/OL]. (2003-11-04)[2016-04-20]. http://www.ibm.com/developerworks/aix/library/au-analyze aix/.

  • 加载中
计量
  • 文章访问数:  333
  • HTML全文浏览量:  17
  • PDF下载量:  618
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-06-27
  • 刊出日期:  2016-09-25

目录

    /

    返回文章
    返回