Skip to content

Release 1.5

Compare
Choose a tag to compare
@SUC-DriverOld SUC-DriverOld released this 17 Aug 07:45
· 81 commits to main since this release

更新

  • 支持自定义Grdaio启动端口,自定义选择是否开放对外链接 (#13)
  • MacOS支持,MSST推理支持选择MPS为加速设备。需手动拉源码部署 (#14)
  • 增加“强制停止”按钮,支持在推理/训练过程中,强制停止进程
  • i18n支持,目前支持简体中文,繁体中文,英语,日语 (#15)
  • 支持选择huggingface或huggingface镜像站作为模型下载地址
  • 新增train_accelerate.py代码,对于多显卡用户,能加快训练速度
  • vocal_model新增两个模型:model_mel_band_roformer_karaoke_aufr33_viperx_sdr_10.1956.ckptmodel_vocals_mel_band_roformer_kj_sdr_10.98.ckpt,前一个是去和声模型
  • 小工具中添加“歌声转MIDI”功能,使用项目SOME,需自行下载权重文件后才可使用(1.4.3版本)
  • 设置页面添加系统信息显示,可显示GPU及序号,以及系统版本(1.4.3版本)
  • 预设流程中增加单个音频输入(1.4.3版本)
  • 添加最新去混响模型deverb_bs_roformer_8_384dim_10depth.ckpt(1.4.2版本)
  • MSST分离中,添加子进度条,现在单个音频文件分离也有进度条了(1.4.2版本)
  • 设置页面新增检查更新(1.4.2版本)
  • 添加最新降噪模型denoise_mel_band_roformer_aufr33_sdr_27.9959.ckptdenoise_mel_band_roformer_aufr33_aggr_sdr_27.9768.ckpt(1.4.1版本)
  • 新增bandit_v2模型支持(1.4.1版本)
  • 新增Valid的WebUI页面,在训练MSST的子页面(1.4.1版本)

优化

  • 若检测不到ffmpeg及python,将使用系统环境变量中的值 (#12)
  • 备份和恢复预设的功能迁移至预设流程子页面
  • 优化WebUI布局
  • 更新至原仓库8月15日的commits,优化bs_roformer代码,优化推理代码
  • 将3个去混响模型和2个降噪模型移动至single_stem_model
  • 优化覆盖安装,现在覆盖安装或增量更新后不会重置配置文件了(1.4.3版本)
  • 完善setup_webui函数以适合覆盖安装(1.4.2版本)
  • 小幅度优化了下载模型速度慢的问题(但实际上可能还是很慢)(1.4.2版本)
  • 修改部分模型配置文件参数(1.4.1版本)
  • 优化控制台日志输出(1.4.1版本)

修复

  • 修复requirements.txt部分依赖版本
  • 修复了FLAC格式的音频会导致输出文件名字不正确的bug (#11)(1.4.3版本)
  • 修复了预设流程中重复模型不会推理的bug(1.4.3版本)

下载整合包

若安装完整包后出现无法使用CPU进行推理的情况,请再安装一遍增量包获得更新