2 个版本
使用旧的 Rust 2015
0.1.1 | 2017年5月4日 |
---|---|
0.1.0 | 2016年11月1日 |
#698 在 压缩 中
1,195 每月下载量
用于 18 个 crate(直接使用10个)
27KB
369 行
TFS 已被 RedoxFS 替换,并且不再维护,TFS 的大多数功能已集成到 RedoxFS 中
TFS:下一代文件系统
TFS 是一个模块化、快速且功能丰富的下一代文件系统,采用现代技术以实现高性能、高空间效率和高度可伸缩性。
由于 ZFS 的单体设计导致实现缓慢,因此 TFS 是为了满足 Redox OS 现代文件系统的需求而创建的,作为 ZFS 的替代品。
TFS 受 ZFS 灵感的启发,但同时也旨在模块化且易于实现。
TFS 与 terminalcloud 的同名文件系统无关。
尽管许多组件已经完成,但 TFS 本身尚未准备好使用。
设计目标
TFS 的设计考虑以下目标
- 并发
TFS 包含非常少的锁,并力求尽可能适用于多线程系统。它使用多个真正的并发结构来管理数据,并通过核心数线性扩展。 这可能是 TFS 的最重要特性。
- 异步
TFS 是异步的:操作可以独立发生;对磁盘的写和读不需要阻塞。
- 全盘压缩
TFS 是第一个通过我们称为 RACC(随机访问集群压缩)的方案实现完整全盘压缩的文件系统。这意味着每个集群都进行压缩,只会稍微影响性能。估计您可以获得 60-120% 的更多可用空间。
- 修订历史
TFS 存储每个文件的修订历史,而不增加额外开销。这意味着您可以将任何文件恢复到早期版本,自动备份系统,而不需要从复制中产生额外开销。
- 数据完整性
TFS 与 ZFS 一样,存储文件的完整校验和(不仅仅是元数据),并且在父块中完成。这意味着在读取时几乎可以检测到所有数据损坏。
- 写时复制语义
类似于Btrfs和ZFS,TFS使用CoW语义,这意味着集群永远不会被直接覆盖,而是复制到新的集群并写入。
- O(1)递归复制
与其他一些文件系统一样,TFS可以在常数时间内进行递归复制,但有一个独特的附加功能:即使在发生变异后,TFS也不会复制。如何做到这一点?它对文件的各个部分分别进行维护,这样只需复制更新的部分。
- 保证原子性
系统永远不会进入不一致的状态(除非有硬件故障),这意味着意外断电永远不会损坏系统。
- 改进的缓存
TFS在缓存磁盘以提高磁盘访问速度方面投入了大量精力。它使用机器学习来学习模式并预测未来的使用,以减少缓存未命中次数。TFS还压缩内存缓存,减少了所需的内存量。
- 更好的文件监控
CoW非常适合高性能、可扩展的文件监控,但不幸的是,只有少数文件系统采用了这种技术。TFS就是其中之一。
- 全部内存安全
TFS只使用用Rust编写的组件。因此,只有在标记为unsafe的代码中才可能发生内存不安全,这会经过额外的仔细检查。
- 全面测试
TFS旨在全面测试。这通过立即揭示大量错误类别,提供了相对强大的正确性保证。
- SSD友好
TFS通过重新定位已死亡扇区来避免SSD的写入限制。
- 改进的垃圾回收
TFS使用Bloom过滤器进行高效且快速的垃圾回收。TFS允许文件系统垃圾回收器在后台运行,而不会阻塞文件系统的其余部分。
常见问题解答
为什么您将SPECK作为默认加密算法?
- SPECK是一种相对较新的加密算法,但已经经历了许多(无效的)密码分析,因此相对安全。它具有真正良好的性能和简单的实现。可移植性是TFS设计的一个重要组成部分,真正可移植的AES实现且没有侧信道攻击比许多人想象的要难(尤其是,大多数可移植实现中都有SubBytes的问题)。SPECK没有这个问题,因此可以以最小的努力安全地实现可移植性。
TFS和ZFS有多相似?
- 实际上并不相似。它们共享许多基本思想,但除此之外,它们基本上是无关的。但是,ZFS的设计在很大程度上影响了TFS。
TFS仅限于Redox吗?
- 不是,它从未打算仅限于Redox。
整盘压缩是如何工作的?
- 据我所知,整盘压缩是TFS独有的。它通过将尽可能多的“页面”(虚拟数据块)收集到“集群”(分配单元)中来实现。通过这样做,可以通过简单地解压缩相应的集群来读取页面。
为什么ZMicro这么慢?它会影响TFS的性能吗?
- ZMicro之所以如此慢,是因为它在位级别上工作,以牺牲性能为代价获得出色的压缩比率。这种令人难以置信的慢速性能通过减少写入次数来补偿。事实上,超过50%的带有ZMicro的分配只会写入一个扇区,而不是3个。其次,无论您的磁盘有多快,它都不会接近ZMicro的性能,因为磁盘操作本质上很慢,从长远来看,压缩性能实际上并不重要。
可扩展哈希或B+树?
- 都不是。TFS使用树和哈希表的组合:嵌套哈希表,这是一种哈希树的形式。其想法是,而不是重新分配,在桶中创建一个新的子表。
设计资源
我写了一些关于TFS设计的文章。
- SeaHash: 解释 - 这描述了为TFS设计的默认校验和算法。
- 随机访问压缩算法 - 本文章介绍了用于随机访问压缩的算法。
- 三进制预测余码 - 该方法的使用与创建一个优秀的自适应(无头)熵压缩器有关。
- LZ4的工作原理 - 这篇描述了LZ4压缩算法的工作原理。
- 嵌套哈希表的冲突解决 - 这篇描述了我们用于目录结构的嵌套哈希表方法。
- 原子哈希表 - 这篇描述了并发、内存中的哈希表/键值存储。
规范
完整的规范可以在 specification.tex
中找到,要渲染它请安装 texlive
或其他带有XeTeX的发行版,并运行
xelatex --shell-escape specification.tex
然后打开名为 specification.pdf
的文件
lib.rs
:
LZ4压缩的纯Rust实现。
有关算法的详细说明请见 此处。
依赖项
~210KB