2 个版本 (1 个稳定版)
使用旧的 Rust 2015
1.0.0 | 2017年2月17日 |
---|---|
0.1.0 | 2017年2月16日 |
1319 在 编码 中
6KB
161 行(不含注释)
TFS 已被 RedoxFS 取代,不再维护,TFS 的许多功能已集成到 RedoxFS 中
TFS:下一代文件系统
TFS 是一个模块化、快速且功能丰富的下一代文件系统,采用现代技术实现高性能、高空间效率和高度可伸缩性。
由于 ZFS 的单体设计导致实现缓慢,TFS 是出于对 Redox OS 现代文件系统需求而创建的,作为 ZFS 的替代品。
TFS 受 ZFS 思想的启发,同时旨在模块化且易于实现。
TFS 与 terminalcloud 的同名文件系统无关。
虽然许多组件已完成,但 TFS 本身尚未准备就绪。
设计目标
TFS 的设计考虑以下目标
- 并发
TFS 锁定很少,旨在尽可能适合多线程系统。它使用多个真正的并发结构来管理数据,并通过核心数量线性扩展。 这也许是 TFS 最重要的特性。
- 异步
TFS 是异步的:操作可以独立发生;磁盘的读写不必阻塞。
- 全盘压缩
TFS 是第一个采用我们称之为 RACC(随机访问簇压缩)方案进行完整全盘压缩的文件系统。这意味着每个簇都进行压缩,只会略微影响性能。估计可以获得 60-120% 的更多可用空间。
- 修订历史
TFS 存储每个文件的修订历史,而不增加额外的开销。这意味着您可以恢复任何文件的早期版本,自动备份系统而无需额外的复制开销。
- 数据完整性
与 ZFS 一样,TFS 存储文件的完整校验和(而不仅仅是元数据),并且在父块中执行此操作。这意味着在读取时几乎可以检测到所有数据损坏。
- 写时复制语义
与Btrfs和ZFS类似,TFS使用CoW(Copy-on-Write)语义,这意味着永远不会直接覆盖集群,而是将其复制并写入一个新的集群。
- O(1)递归复制
与其他一些文件系统一样,TFS可以在常数时间内进行递归复制,但有一个独特的补充:TFS在发生变异后不会进行复制。如何?它单独维护文件的各个段,这样只需要复制更新的段。
- 保证原子性
系统永远不会进入不一致的状态(除非硬件故障),这意味着意外断电永远不会损坏系统。
- 改进的缓存
TFS在缓存磁盘以加快磁盘访问方面投入了大量精力。它使用机器学习来学习模式并预测未来的使用,以减少缓存未命中次数。TFS还压缩内存缓存,减少了所需的内存量。
- 更好的文件监控
CoW非常适合高性能、可扩展的文件监控,但遗憾的是,只有少数文件系统采用了这一特性。TFS就是其中之一。
- 所有内存安全
TFS仅使用用Rust编写的组件。因此,只有在标记为unsafe的代码中才可能出现内存不安全,这些代码会进行额外的仔细检查。
- 全面测试覆盖
TFS旨在在测试方面实现全面覆盖。这通过立即揭示大量错误类别,提供了相对较强的正确性保证。
- SSD友好
TFS通过重新定位已死亡扇区来避免SSD的写入限制。
- 改进的垃圾收集
TFS使用Bloom过滤器进行高效且快速的垃圾收集。TFS允许文件系统垃圾收集器在后台运行,而不会阻塞文件系统的其余部分。
常见问题解答
为什么您使用SPECK作为默认加密算法?
- SPECK是一种相对较新的加密算法,但已经经历了很多(无效的)密码分析,因此相对安全。它具有非常好的性能和简单的实现。可移植性是TFS设计的重要部分,真正可移植且没有侧通道攻击的AES实现比许多人想象的要困难得多(特别是,大多数可移植实现中存在SubBytes的问题)。SPECK没有这个问题,因此可以以最小的努力安全地实现可移植性。
TFS和ZFS有多相似?
- 实际上并不相似。它们共享许多基本思想,但除此之外,它们基本上没有联系。但ZFS的设计在很大程度上影响了TFS。
TFS是仅限Redox的吗?
- 不是的,它从未打算仅限于Redox。
整个磁盘压缩是如何工作的?
- 据我所知,整个磁盘压缩是TFS独有的。它通过将尽可能多的“页面”(虚拟数据块)收集到一个“集群”(分配单元)中来实现。通过这样做,可以通过简单地解压缩相应的集群来读取页面。
为什么ZMicro这么慢?它会影响到TFS的性能吗?
- ZMicro之所以如此慢,是因为它在位级别上工作,以牺牲性能为代价提供了优秀的压缩比。这种可怕的低性能通过减少写入次数得到了补偿。事实上,超过50%的ZMicro分配将仅写入一个扇区,而相比之下,3个扇区。其次,无论你的磁盘有多快,它都无法接近ZMicro的性能,因为磁盘操作本质上是缓慢的,而且从整体来看,压缩性能真的不重要。
可扩展哈希或B+树?
- 都不是。TFS使用树和哈希表的组合:嵌套哈希表,这是一种哈希树的形式。其思想是在桶中创建一个新的子表,而不是重新分配。
关于设计的资源
我已撰写多篇关于TFS设计的文章。
- SeaHash: Explained - 这描述了为TFS设计的默认校验和算法。
- 关于随机访问压缩 - 本文描述了用于随机访问压缩的算法。
- 三元作为预测残差码 - 该技术的应用与创建优秀的自适应(无头)熵压缩器相关。
- LZ4是如何工作的 - 这描述了LZ4压缩算法的工作原理。
- 嵌套哈希表冲突解决 - 这描述了用于目录结构的嵌套哈希表方法。
- 原子哈希表 - 这描述了并发、内存中的哈希表/键值存储。
规范
完整规范可在 specification.tex
文件中找到,要渲染它,请安装 texlive
或其他带有 XeTeX 的发行版,并运行
xelatex --shell-escape specification.tex
然后打开名为 specification.pdf
的文件
lib.rs
:
小端格式编码和解码。
这是出于对 byteorder
包的挫败感而创建的,我觉得它的API很重,因此我创建了此包。