Release 1.6.2

Latest

Latest

SUC-DriverOld released this 24 Sep 11:55

· 35 commits to main since this release

更新

新增对apollo和bs_mamba2模型的支持
新增mp3音质修复模型Apollo_LQ_MP3_restoration.ckpt
新增两个气声分离模型aspiration_mel_band_roformer_(less_aggr)_sdr_18.1201.ckpt
MSST分离新增“仅输出次级音轨”功能
非加速训练train.py现在也能使用“训练前验证”功能

优化

优化次级输出选项，当模型配置文件中的target_instrument为null时，默认输出所有音轨，此时“同时输出次级音轨”将更改为“此模型默认输出所有音轨”且无法进行修改。
优化预设流程中MSST模型输出音轨显示。从原先的“primary_only”更改为此模型对应的target_instrument。若此模型的target_instrument为null，则显示“All stems”即输出所有音轨，此时保留次级输出选项无效。
优化WebUI中GPU选择方式。从原先的手动填入GPU ID更改为复选框选择GPU。
优化WebUI中音频输出格式选择。从原先的下拉选择更改为单选框。
将处理输出信息更改为“处理完成，耗时x.xx”。注意：处理完成不一定代表处理成功，有可能中途报错。
第一次使用swin_upernet, segm_models类型的模型时，需要从huggingface上下载pretrain模型，下载链接会根据所处地区进行修改。且下载的模型文件存放在pretrain/hub而非C盘。

修复

修复了当预设流程的预设只使用了一个模型时，无法准确将结果输出到输出文件夹的问题。
修复了预设流程上传音频运行时，错误的将临时目录保存为输入文件夹路径的问题。
修复将gradio cache设置到程序根目录后会导致ensemble模式无法使用的问题。
修复使用swin_upernet模型时出现的报错，详见 (#24)。

下载整合包

123盘：https://www.123pan.cn/s/1bmETd-AefWh.html 提取码：1145
百度网盘：https://pan.baidu.com/s/1uzYHSpMJ1nZVjRpIXIFF_Q 提取码：1145

Assets 4