STSdb,强纯C#开源NoSQL和虚拟文件系统

2022-06-21 00:00:00 索引 支持 线程 性能 瀑布

回顾

几个月前写了一篇文章,关于 C#写的NoSQL开源项目/系统(系列),看过该文章的同学,估计会对.NET能实现高效的NoSQL是有信心的。几个月过去了,有了新进展。

 

STSdb是什么

再来说明一下STSdb是什么:STSdb是C#写的开源嵌入式数据库和虚拟文件系统,支持实时索引,性能是同类产品的几倍到几十倍,访问官方网站。

 

特性

  • 支持几十亿级别的数据存取
  • 支持TB级别文件大小
  • 并行架构,在服务器上性能爆快
  • 实时索引
  • 内置压缩
  • 内置自动序列化
  • 无数据碎片
  • 快速随机插入
  • 支持任意数据类型
  • 支持稀疏分散的文件(byte[])
  • 纯C#,支持mono

 

为什么?

数据库的共同点

 

每个数据库都有一个共同点,就是受限于索引结构,因此每当改进了索引数据结构,性能也随之大增。

 

性能瓶颈

 

在数据库系统中,每当对数据进行索引,数据的逻辑位置会被映射到物理设备,这个映射严重依赖设备的寻址时间。

 

解决办法

当遇到性能瓶颈时:

 

办法就是,不对每个操作都进行一次寻址,而是每次寻址都做多个操作。

 

 

解决方案-WATERFALLTREE™ (瀑布树)

STSdb 4.0突破性地发现并实现了Waterfall-tree (瀑布树)树结构。Waterfall-tree是注册商标,并且拥有专利。与传统的B+树类似,但B+树是同步操作,而瀑布树是分组异步操作。

现有的解决方案有一个共同的缺点:当索引随机主键的时候,I/O性能不高(退化严重)。

而STSdb4.0的瀑布树带了来前所未有的性能提升。

下图直观地展示了瀑布树的原理:

 

 

 

性能比较

 

数据库存储设计
Amazon Dynamo DBZero-Hop Distributed Hash Table
CassandraMemtable / SSTable
Couch DBAppend-only B-tree
Db4objectsB-tree
Google Big TableSSTable (log-structured storage)
H baseMemtable / SSTable on HDFS
Level DBLSM-tree
MemcachedMemory caching
Mongo DBB-tree
Oracle Berkeley DBB+-tree
PerstB-tree/T-tree/R-tree/Patricia trie/KD-tree
RedisIn-memory only with background snapshots
ScalarisIn-memory only
Tokyo CabinetHash or B-tree

相关文章