#nlp #music #llm #ai #audio

app musicgpt

使用本地运行的LLM根据自然语言提示生成音乐

21个版本

0.3.3 2024年5月21日
0.3.2 2024年5月21日
0.2.1 2024年5月18日
0.1.34 2024年5月15日

#109 in 机器学习

每月 38 次下载

MIT 许可证

1.5MB
4K SLoC

Rust 3K SLoC // 0.0% comments TSX 591 SLoC TypeScript 269 SLoC // 0.0% comments Shell 56 SLoC // 0.1% comments Ruby 28 SLoC // 0.2% comments JavaScript 17 SLoC

Signway logo MusicGPT

使用本地运行的LLM根据自然语言提示生成音乐。

安装

Mac和Linux

MusicGPT可以使用brew在Mac和Linux上安装。

brew install gabotechs/taps/musicgpt

或直接从此链接下载预编译的二进制文件。

Windows

在Windows上,可以从此链接下载可执行文件。

Docker(推荐使用CUDA运行)

如果您想使用具有CUDA功能的GPU运行MusicGPT,这是最佳方式,因为您只需要在系统中安装基本的NVIDIA驱动程序,其他所有内容都包含在Docker镜像中。

docker pull gabotechs/musicgpt

镜像下载后,您可以按以下方式运行它

docker run -it --gpus all -p 8642:8642 -v ~/.musicgpt:/root/.local/share/musicgpt gabotechs/musicgpt --gpu

使用cargo

如果您已在系统中安装了Rust工具链,则可以使用cargo安装它。

cargo install musicgpt

用法

与MusicGPT交互有两种方式:UI模式和CLI模式。

UI模式

此模式将显示一个类似聊天的Web应用程序,用于与LLM交换提示。它将存储您的聊天历史记录,并允许您随时播放生成的音乐样本。您可以运行UI,只需执行以下命令

musicgpt

您还可以选择不同的模型进行推理,以及是否使用GPU,例如

musicgpt --gpu --model medium

[!WARNING]
大多数模型需要非常强大的硬件才能进行推理

如果您想使用具有CUDA功能的GPU,建议您使用Docker运行MusicGPT

docker run -it --gpus all -p 8642:8642 -v ~/.musicgpt:/root/.local/share/musicgpt gabotechs/musicgpt --gpu

CLI模式

此模式将在终端中直接生成和播放音乐,允许您提供多个提示,并在生成后立即播放音频。您可以使用以下命令根据提示生成音频

musicgpt "Create a relaxing LoFi song"

默认情况下,它生成10秒的样本,这可以配置

musicgpt "Create a relaxing LoFi song" --secs 30

有多种模型可供选择,它默认使用最小的模型,但用户可以选择更大的模型

musicgpt "Create a relaxing LoFi song" --model medium

[!WARNING]
大多数模型需要非常强大的硬件才能进行推理

如果您想使用具有CUDA功能的GPU,建议您使用Docker运行MusicGPT

docker run -it --gpus all -v ~/.musicgpt:/root/.local/share/musicgpt gabotechs/musicgpt --gpu "Create a relaxing LoFi song"

您可以通过运行以下命令来查看所有可用选项

musicgpt --help

许可证

代码遵循MIT许可证,但应用程序启动时下载的AI模型权重遵循CC-BY-NC-4.0许可证,因为这些权重是基于以下存储库生成的:

依赖项

~33–69MB
~1M SLoC