中国综合性科技类核心期刊(北大核心)

中国科学引文数据库来源期刊(CSCD)

美国《化学文摘》(CA)收录

美国《数学评论》(MR)收录

俄罗斯《文摘杂志》收录

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于LSM Tree的分布式索引实现

隆飞 翁海星 高明 张召

隆飞, 翁海星, 高明, 张召. 基于LSM Tree的分布式索引实现[J]. 华东师范大学学报(自然科学版), 2016, (5): 36-44. doi: 10.3969/j.issn.1000-5641.2016.05.005
引用本文: 隆飞, 翁海星, 高明, 张召. 基于LSM Tree的分布式索引实现[J]. 华东师范大学学报(自然科学版), 2016, (5): 36-44. doi: 10.3969/j.issn.1000-5641.2016.05.005
LONG Fei, WENG Hai-xing, GAO Ming, ZHANG Zhao. Distributed secondary index based on LSM Tree[J]. Journal of East China Normal University (Natural Sciences), 2016, (5): 36-44. doi: 10.3969/j.issn.1000-5641.2016.05.005
Citation: LONG Fei, WENG Hai-xing, GAO Ming, ZHANG Zhao. Distributed secondary index based on LSM Tree[J]. Journal of East China Normal University (Natural Sciences), 2016, (5): 36-44. doi: 10.3969/j.issn.1000-5641.2016.05.005

基于LSM Tree的分布式索引实现

doi: 10.3969/j.issn.1000-5641.2016.05.005
基金项目: 

国家 863 计划项目(2015AA015307); 国家自然科学基金(U1401256, 61402180, 61402177); CCF-腾讯联合研究基金(AGR20150114); 上海市自然科学研究基金(14ZR1412600)

Distributed secondary index based on LSM Tree

  • 摘要: 近年来 Log-Structured-Merge(LSM) Tree 在 NoSQL 系统中得到了广泛地应用. 主要是因为 LSM Tree 架构提出了延迟更新和批量写入的算法, 将随机写转换为批量写, 减少了磁盘臂的移动开销, 从而大大地提升了数据库的写入性能. 然而, 读性能却也因此受到影响. LSM Tree 和 B Tree 之间的本质区别使得 NoSQL 系统不适宜直接引用 B Tree 作为辅助索引结构. 本文实现了 LSM Tree 下的一种分布式辅助索引结构, 提出针对这种读写分离架构的索引批量加载策略, 并对 LSM Tree 的查询计划树进行了缓冲优化, 避免了重复的查询解析, 使得索引读的性能得到了相应的提升.
  • [1]

    [1] APACHE ORG. Apache HBase[EB/OL]. [2016-07-07]. https://hbase.apache.org/.
    [2] LAKSHMAN A, MALIK P. Cassandra: A decentralized structured storage system[J]. ACM SIGOPS Operating Systems Review, 2010, 44(2): 35-40.
    [3] O’NEIL P, CHENG E, GAWLICK D, et al. The log-structured merge-tree (LSM-tree)[J]. Acta Informatica, 1996, 33(4): 351-385.
    [4] HUAWEI. Secondary index in HBase[EB/OL]. [2016-07-07]. https://github.com/Huawei-Hadoop/hindex.
    [5] CORBETT J C, DEAN J, EPSTEIN M, ET A L. Spanner: Google’s globally distributed database[J]. ACM Transactions on Computer Systems (TOCS), 2013, 31(3): 8.
    [6] CHEN G, VO H T, WU S, et al. A framework for supporting DBMS-like indexes in the cloud[J]. Proceedings of The Vldb Endowment, 2011, 4(11): 702-713.
    [7] 翁海星, 宫学庆, 朱燕超,等. 集群环境下分布式索引的实现[J]. 计算机应用,2016, 36(1): 1-7.
    [8] CHANG F, DEAN J, GHEMAWAT S, et al. Bigtable: A distributed storage system for structured data[J]. ACM Transactions on Computer Systems, 2008, 26(2): 4.
    [9] TAN W, TATA S, TANG Y, et al. Diff-index: differentiated index in distributed log-structured data stores[C]. Extending Database Technology, 2014: 700-711.
    [10] 阳振坤. OceanBase~关系数据库架构[J]. 华东师范大学学报(自然科学版), 2014(5): 141-148.
    [11] 孟必平, 王腾蛟, 李红燕, 等. 分片位图索引:一种适用于云数据管理的辅助索引机制[J]. 计算机学报, 2012, 35(11):2306-2316.
    [12] 黄贵, 庄明强. OceanBase分布式存储引擎[J]. 华东师范大学学报(自然科学版),2014 (5): 164-172.
    [13] ALIBABA INC. OceanBase[Z/OL].[2016-07-07]. https://github.com/alibaba/oceanbase/tree/master/oceanbase 0.4.
    [14] 杨传辉.大规模分布式存储系统: 原理解析与架构实战[M].北京:机械工业出版社, 2013.
    [15] COOPER B F, SILBERSTEIN A, TAM E, et al. Benchmarking cloud serving systems with YCSB[C]// Proceedings of the 1st ACM Symposium on Cloud Computing. ACM, 2010: 143-154.

  • 加载中
计量
  • 文章访问数:  376
  • HTML全文浏览量:  18
  • PDF下载量:  900
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-06-27
  • 刊出日期:  2016-09-25

目录

    /

    返回文章
    返回