Skip to content

Release 1.6.2

Latest
Compare
Choose a tag to compare
@SUC-DriverOld SUC-DriverOld released this 24 Sep 11:55
· 35 commits to main since this release

更新

  • 新增对apollo和bs_mamba2模型的支持
  • 新增mp3音质修复模型Apollo_LQ_MP3_restoration.ckpt
  • 新增两个气声分离模型aspiration_mel_band_roformer_(less_aggr)_sdr_18.1201.ckpt
  • MSST分离新增“仅输出次级音轨”功能
  • 非加速训练train.py现在也能使用“训练前验证”功能

优化

  • 优化次级输出选项,当模型配置文件中的target_instrument为null时,默认输出所有音轨,此时“同时输出次级音轨”将更改为“此模型默认输出所有音轨”且无法进行修改。
  • 优化预设流程中MSST模型输出音轨显示。从原先的“primary_only”更改为此模型对应的target_instrument。若此模型的target_instrument为null,则显示“All stems”即输出所有音轨,此时保留次级输出选项无效。
  • 优化WebUI中GPU选择方式。从原先的手动填入GPU ID更改为复选框选择GPU。
  • 优化WebUI中音频输出格式选择。从原先的下拉选择更改为单选框。
  • 将处理输出信息更改为“处理完成,耗时x.xx”。注意:处理完成不一定代表处理成功,有可能中途报错。
  • 第一次使用swin_upernet, segm_models类型的模型时,需要从huggingface上下载pretrain模型,下载链接会根据所处地区进行修改。且下载的模型文件存放在pretrain/hub而非C盘。

修复

  • 修复了当预设流程的预设只使用了一个模型时,无法准确将结果输出到输出文件夹的问题。
  • 修复了预设流程上传音频运行时,错误的将临时目录保存为输入文件夹路径的问题。
  • 修复将gradio cache设置到程序根目录后会导致ensemble模式无法使用的问题。
  • 修复使用swin_upernet模型时出现的报错,详见 (#24)。

下载整合包