#xml #line #convert #json #output #metadata #sra

app efetch2jsonl

将 EFetch XML 转换为 JSON Lines

1 个稳定版本

1.0.0 2024年6月18日

#134生物学

MIT 许可证

7KB
97 代码行

Efetch2jsonl

一个简单的解析器,可以将 efetch 的输出转换为更易解析的格式。

此工具是为从 SRA 生物样本的查询中转换而构建的,但由于其可配置性,它应该适用于更广泛的应用。

示例用例:您想获取单个生物项目的所有 SRA 运行的元数据

BIOPROJECT_ID=1081646
efetch -db bioproject -id $BIOPROJECT_ID -format xml | elink -db bioproject -target sra > bioproject_query.elink
cat bioproject_query.elink | efetch -mode xml -format xml > biosamples.out.xml
efetch2jsonl -i biosamples.out.xml -o biosamples.jsonl -k . -r EXPERIMENT_PACKAGE

可以使用类似 Polars 的工具轻松地对数据进行进一步处理,以生成干净的表格。

依赖项

~5–7MB
~139K SLoC