1 个稳定版本
1.0.0 | 2024年6月18日 |
---|
#134 在 生物学
7KB
97 代码行
Efetch2jsonl
一个简单的解析器,可以将 efetch 的输出转换为更易解析的格式。
此工具是为从 SRA 生物样本的查询中转换而构建的,但由于其可配置性,它应该适用于更广泛的应用。
示例用例:您想获取单个生物项目的所有 SRA 运行的元数据
BIOPROJECT_ID=1081646
efetch -db bioproject -id $BIOPROJECT_ID -format xml | elink -db bioproject -target sra > bioproject_query.elink
cat bioproject_query.elink | efetch -mode xml -format xml > biosamples.out.xml
efetch2jsonl -i biosamples.out.xml -o biosamples.jsonl -k . -r EXPERIMENT_PACKAGE
可以使用类似 Polars 的工具轻松地对数据进行进一步处理,以生成干净的表格。
依赖项
~5–7MB
~139K SLoC