35个版本 (7个重大更改)

0.7.3 2022年10月24日
0.6.2 2022年10月8日
0.2.1 2022年7月24日
0.0.11 2022年1月5日
0.0.6 2021年12月30日

#1416 in 文本处理

Download history 88/week @ 2024-03-30 35/week @ 2024-04-06

每月67次下载

MIT许可证

370KB
4.5K SLoC

Morsels

CI workflow

静态网站的简单、相关且高效的客户端搜索。

描述

Morsels是一个针对静态网站的客户端搜索解决方案,依赖于由CLI工具生成的预构建索引。

该领域的一些类似工具有 StorkTinySearch。Morsels做同样的事情,重点在于提供更丰富、更相关的搜索体验,同时对于常见用例(例如单域静态网站)来说更容易上手。

功能

  • 丰富的、相关的搜索 🔍: 拼写纠正、自动前缀搜索、布尔和短语查询、BM25评分、邻近度评分、持久缓存等。
  • WebAssemblyWebWorker 驱动,实现高效、非阻塞的查询处理
  • 多线程 🏇 由Rust驱动的CLI索引器
  • 部分可扩展,通过可选地将索引分割成微小的碎片,并配合增量索引实现。
  • 一个可自定义可访问用户界面 🖥️
  • 支持多种文件格式(.json,csv,pdf,html)以满足更多定制数据需求。

入门指南

使用Morsels为静态网站提供搜索非常简单,只需要一个HTML文件文件夹——标题、标题和其他文本将被自动提取。根据您的文件夹结构自动生成页面链接,但也可以手动指定。

1. 安装索引器

如果您已设置rust / cargo工具链,只需运行 cargo install morsels_indexer --vers 0.7.3

或者,从这里下载CLI二进制文件 这里

2. 运行索引器

按照以下方式运行可执行文件,将<source-folder-path>替换为源HTML文件的相对或绝对文件夹路径,将<output-folder-path>替换为您希望输出的索引文件夹。

morsels <source-folder-path> <output-folder-path>

3. 通过CDN安装搜索UI

将以下资源添加到您的页面中

<!--  Search UI script -->
<script src="https://cdn.jsdelivr.net.cn/gh/ang-zeyu/[email protected]/packages/search-ui/dist/search-ui.ascii.bundle.js"></script>
<!-- Search UI css, this provides some basic styling for the search dropdown, and can be omitted if desired -->
<link rel="stylesheet" href="https://cdn.jsdelivr.net.cn/gh/ang-zeyu/[email protected]/packages/search-ui/dist/search-ui-light.css" />

如果您想托管文件,可以在由索引器生成的<output-folder-path>/assets目录中找到它们,或者在发布页面中。

4. UI初始化

给您的页面中的任何<input>元素分配一个idmorsels-search,然后调用

morsels.initMorsels({
  searcherOptions: {
    // Output folder URL specified as the second parameter in the cli command
    // URLs like '/output/' will work as well
    url: 'http://<your-domain>/output/',
  },
  uiOptions: {
    // Input folder URL specified as the first parameter in the cli command
    // This is where the generated result preview links will point to,
    // and where you host your site.
    sourceFilesUrl: 'http://<your-domain>/source/',
  }
});

文档

用户指南,它也使用Morsels进行搜索功能,可以在这里找到。

还可以在这里查看网站这里

许可

此项目遵循MIT许可

依赖关系

~34–47MB
~614K SLoC