#计算机视觉 #数据集 #建筑 #工具 #小巧 #图像 #命令行工具

bin+lib tiny-data

用于构建计算机视觉数据集的命令行工具

3 个版本

0.1.2 2024年6月2日
0.1.1 2024年6月2日
0.1.0 2024年5月27日

276图像

Download history 154/week @ 2024-05-25 237/week @ 2024-06-01 17/week @ 2024-06-08 2/week @ 2024-06-15

每月 63 次下载

MIT 许可证

250KB
288

tiny-data

使用 reqwesttokio 构建 computer vision datasets 的基于 rust 的命令行工具。

alt text

您可以通过运行以下命令获取可用选项的列表

>> tiny-data -h
Usage: tiny-data [OPTIONS]

Options:
  -t, --topics <TOPICS>...   Space-delimited list of image classes
  -n, --nsamples <NSAMPLES>  number of images to download per-class [default: 20]
  -d, --dir <DIR>            name of directory to save to [default: images]
  -h, --help                 Print help

示例

>> tiny-data --topics bats wombats -n 10 --dir images
>> tree images
images
├── bats
   ├── 0.jpeg
   ├── 1.jpeg
   ├── 2.jpeg
   ├── 3.jpeg
   ├── 4.jpeg
   ├── 5.jpeg
   ├── 6.jpeg
   ├── 7.jpeg
   ├── 8.jpeg
   └── 9.jpeg
└── wombats
    ├── 0.jpeg
    ├── 1.jpeg
    ├── 2.jpeg
    ├── 3.jpeg
    ├── 4.jpeg
    ├── 5.jpeg
    ├── 6.jpeg
    ├── 7.jpeg
    ├── 8.jpeg
    └── 9.jpeg

安装

要开始使用 tiny-data,您需要启用 Google 的 Custom Search API 并将变量 SEARCH_ENGINE_IDCUSTOM_SEARCH_API_KEY 导出到您的环境中。

注意:Google 限制每天请求数量为 100,这本质上限制了您可下载的图片数量。

您可以通过运行以下命令从 crates.io 下载软件包

cargo install tiny-data

您可以通过运行以下命令从 pypi 下载软件包的 Python 绑定,并使用 CLIP 进行下载后的过滤,具有额外的功能

pip install tinydata[ml]

依赖项

~11–23MB
~343K SLoC