中国综合性科技类核心期刊(北大核心)

中国科学引文数据库来源期刊(CSCD)

美国《化学文摘》(CA)收录

美国《数学评论》(MR)收录

俄罗斯《文摘杂志》收录

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

分布式内存数据库系统的容错管理

赵镇辉 黄承晟 周敏奇 周傲英

赵镇辉, 黄承晟, 周敏奇, 周傲英. 分布式内存数据库系统的容错管理[J]. 华东师范大学学报(自然科学版), 2016, (5): 27-35. doi: 10.3969/j.issn.1000-5641.2016.05.004
引用本文: 赵镇辉, 黄承晟, 周敏奇, 周傲英. 分布式内存数据库系统的容错管理[J]. 华东师范大学学报(自然科学版), 2016, (5): 27-35. doi: 10.3969/j.issn.1000-5641.2016.05.004
ZHAO Zhen-hui, HUANG Cheng-shen, ZHOU Min-qi, ZHOU Ao-ying. Fault-tolerance in distributed in-memory database systems[J]. Journal of East China Normal University (Natural Sciences), 2016, (5): 27-35. doi: 10.3969/j.issn.1000-5641.2016.05.004
Citation: ZHAO Zhen-hui, HUANG Cheng-shen, ZHOU Min-qi, ZHOU Ao-ying. Fault-tolerance in distributed in-memory database systems[J]. Journal of East China Normal University (Natural Sciences), 2016, (5): 27-35. doi: 10.3969/j.issn.1000-5641.2016.05.004

分布式内存数据库系统的容错管理

doi: 10.3969/j.issn.1000-5641.2016.05.004
基金项目: 

国家自然科学基金重点项目(61332006); 上海市基金(13ZR1413200)

详细信息
    通讯作者:

    周敏奇, 男, 教授, 研究方向为对等计算、云计算、分布式数据管理和内存数据管理系统. E-mail: mgzhou@sei.ecnu.edu.cn.

Fault-tolerance in distributed in-memory database systems

  • 摘要: 在大数据背景下, 分布式系统被企业广泛部署和应用, 随着分布式系统节点规模的扩大, 系统故障的概率也将随之增加, 在分布式系统中引入容错机制, 对提升分布式系统可用性、可靠性、可恢复性至关重要. CLAIMS系统是面向金融领域的对实时数据进行实时分析的内存数据库系统------在数据不断注入系统时, 提供近实时的查询、分析任务. 本文主要探讨CLAIMS系统中容错机制. 依据租约机制, 实现系统中异常节点的快速发现及标记(即Fail-fast). 在标记异常节点之后, 实现对受影响分析任务的重启(即Fail-over); 对异常节点全局内存状态的恢复(即Fail-back). 实验结果表明, 本文所提算法能够较好地实现CLAIMS系统的容错特性.
  • [1]

    [ 1 ] TANENBAUM A S, STEEN M V. Distributed systems principles and paradigms[J]. Acm, 2002, 87(3): 65-73.
    [ 2 ] COULOURIS G, DOLLIMORE J, KINDBERG T, et al. Distributed Systems: Concepts and Design. [M]. 5th ed. New Jersey: Addison-Wesley, 2012: 37-76.
    [ 3 ] 王立. 分布式内存数据库系统的查询处理与优化[D]. 上海: 华东师范大学, 2015.
    [ 4 ] GRAY C, CHERITON D. Leases: An efficient fault-tolerant mechaism for distributed file cache consistency[J]. Acm Sigops Operating Systems Review, 1989, 23(5): 202-210.
    [ 5 ] CHAROUSSET D, HIESGEN R, SCHMIDT T C. CAF-the C++ actor framework for scalable and resource-efficient applications[C]. New York: ACM, 2014: 15-28.
    [ 6 ] CASTRO M, LISKOV B. Practical byzantine fault tolerance and proactive recovery[J]. Acm Transactions on Computer Systems, 2002, 20(4): 398-461.
    [ 7 ] BORTHAKUR D. The hadoop distributed file system: Architecture and design[J]. Hadoop Project Website, 2007, 11(11): 1-10.
    [ 8 ] 关国栋, 滕飞, 杨燕. 基于心跳超时机制的Hadoop实时容错技术[J]. 计算机应用, 2015, 35(10): 2784-2788.
    [ 9 ] ZAHARIA M, CHOWDHURY M, DAS T, et al. Resilient distributed datasets: A fault-tolerant abstraction for in-memory cluster computing[C]//Proceedings of the 9th USENIX conference on Networked Systems Design and Implementation. Berkeley: USENIX Association, 2012: 141-146.
    [10] 林春. 分布式内存数据库的恢复[J]. 航空计算技术, 2003, 33(2): 90-92.

  • 加载中
计量
  • 文章访问数:  313
  • HTML全文浏览量:  7
  • PDF下载量:  446
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-06-27
  • 刊出日期:  2016-09-25

目录

    /

    返回文章
    返回