#backup #convert #markdown #convert-html #wget #copy #don-t

app wget2hugo

一个小工具,用于将 wget 备份转换为 Markdown

3 个版本

0.1.2 2021 年 10 月 28 日
0.1.1 2021 年 10 月 27 日
0.1.0 2021 年 10 月 26 日

#6#wget

MITGPL-3.0+

10KB
116 代码行

wget2hugo

这是一个程序,可以将网站的 wget 备份转换为 Markdown,然后可以作为 Hugo 或类似静态网站生成器的内容使用。

您可以使用以下方法创建网站的完整备份:

wget \
    --mirror \
    --convert-links \
    $URL

这很好!但如果您不只想存储该备份或托管一个精确的镜像,您可能希望将该备份转换为更易于管理的格式。此程序将 HTML 转换为 Markdown 文件,并将所有静态文件(PDF、.doc 文件、图像等)一并复制。目标是生成可以直接放入 Hugo 网站的 content 目录中的输出,进行构建和部署。

它用 Rust 编写,使用了 此 HTML -> Markdown crate。我之前用 node.js 编写了一个版本,使用了 turndown,但遇到了内存泄漏和性能问题。

运行它

只需执行

cargo run --help

它应该会打印使用信息。

依赖项

~10–20MB
~330K SLoC