#生物学 #生物信息学

bin+lib GetPDB

从rcsb.org下载蛋白质文件

3个版本 (稳定)

1.0.1 2019年9月26日
1.0.0 2019年9月23日
0.1.0 2019年9月18日

#234 in 生物学

每月45次下载

Apache-2.0

21KB
208

PDBget

Crates.io license

CLI程序,用于从rcsb.org或PDBe下载文件

安装

使用Cargo

cargo install GetPDB
pdbget -v

从源代码

git clone https://gitlab.com/philippe_noel/pdbget.git
cd pdbget
cargo install --path
pdbget --help

用法

Get Protein files 1.0.1
Philippe Noel
Download Protein files on rcsb.org or pdbe

USAGE:
    pdbget [OPTIONS] <PDBs>...

FLAGS:
    -h, --help       Prints help information
    -V, --version    Prints version information

OPTIONS:
    -o <Output>         Output folder where to store files [default: ./]
    -s <Server>         Server name where to download pdb files. 'rcsb', 'pdbe'.
                        Format for rcsb: 'fasta', 'pdb', 'pdbgz', 'cif', 'cifgz', 'xmlgz'.
                        Format for pdbe: 'fasta', 'pdb', 'pdbgz', 'cif', 'xml'.
                         [default: rcsb]
    -t <UriType>        File type to download. 'pdb', 'pdbgz', 'cif', 'cifgz', 'fasta', 'xml', 'xmlgz' [default: PDB]

ARGS:
    <PDBs>...    PDB identifiers

使用-s选项,您可以选择下载文件的服务器。可能的服务器有

  • rcsb : RCSB.org
  • pdbe : PDBe 注意,并非所有格式都适用于所有服务器。请查看表格。
格式 RCSB PDBe
FASTA ✔️ ✔️
PDB ✔️ ✔️
PDBGZ ✔️ ✔️
CIF ✔️ ✔️
CIFGZ ✔️
XML ✔️
XMLGZ ✔️

使用-t选项,您可以指定输出文件格式。可能的格式有

  • pdb : PDB格式
  • pdbgz : PDB文件的GZ压缩
  • cif : CIF格式
  • cifgz : CIF文件的GZ压缩
  • fasta : 蛋白质的FASTA序列
  • xml : XML文件的GZ压缩(rcsb.org上不提供未压缩的XML)

依赖项

~20MB
~433K SLoC