Releases: SUC-DriverOld/MSST-WebUI
Releases · SUC-DriverOld/MSST-WebUI
Release 1.6.1
更新
- 支持多条音频同时上传进行分离,而非以文件夹形式上传。
- Gradio缓存路径从原本的%TEMP%修改至程序目录cache文件夹内。
- 设置页面增加自动清理缓存: 开启后, 每次启动WebUI时会自动清理缓存。
修复
- 修复“设置-重置设置/路径记录”无法正确执行的问题 (#20)
Release 1.6.0
更新
- 新增emoji语言
- 新增多轨分离模型
model_scnet_sdr_9.3244.ckpt
,去混响模型dereverb_mdx23c_sdr_6.9096.ckpt
- 新增和声&混响分离模型
dereverb_mel_band_roformer_anvuew_sdr_19.1729.ckpt
和dereverb_mel_band_roformer_less_aggressive_anvuew_sdr_18.8050.ckpt
- 新增VR去混响模型
UVR-DeReverb-aufr33-jarredou_4band_v4_ms_fullband.pth
- 新增云端专属webUI(目前仅适用于Linux),此webUI默认所有模型可用,推理时缺什么模型,会先自动下载,然后推理。模型默认下载地址是huggingface.co(需要学术加速)。
- webUI设置增加“对本地局域网开放”的选项。局域网中的设备可通过“本机ip:端口”来访问webUI。
- 支持添加非官方MSST模型和UVR模型,且非官方模型可以参与预设流程
- msst分离和预设流程支持选择音频输出格式
- 支持用户自定义模型名称
- 更新至原仓库8月28日的commits
优化
- 细分MSST模型类型和预设流程模型类型,方便在模型数量较多时,筛选出想要使用的模型
- 优化webui_config.json的备份和恢复逻辑。
- 简化vr_inference代码,仅保留关键代码,去除复杂的判断过程 (#17, #18)
- 优化增量更新判断逻辑
- 删除无用依赖项
- 整理了配置文件文件夹和第三方配置文件文件夹
- 大大加快了SDR的计算时间
修复
- 模型
model_vocals_mel_band_roformer_kj_sdr_10.98.ckpt
重命名为Kim_MelBandRoformer.ckpt
(#19) - 修复云端修改模型下载链接后不生效的错误
下载整合包
- 123盘:https://www.123pan.cn/s/1bmETd-AefWh.html? 提取码:1145
- 百度网盘:https://pan.baidu.com/s/1uzYHSpMJ1nZVjRpIXIFF_Q 提取码:1145
Release 1.5
更新
- 支持自定义Grdaio启动端口,自定义选择是否开放对外链接 (#13)
- MacOS支持,MSST推理支持选择MPS为加速设备。需手动拉源码部署 (#14)
- 增加“强制停止”按钮,支持在推理/训练过程中,强制停止进程
- i18n支持,目前支持简体中文,繁体中文,英语,日语 (#15)
- 支持选择huggingface或huggingface镜像站作为模型下载地址
- 新增train_accelerate.py代码,对于多显卡用户,能加快训练速度
- vocal_model新增两个模型:
model_mel_band_roformer_karaoke_aufr33_viperx_sdr_10.1956.ckpt
和model_vocals_mel_band_roformer_kj_sdr_10.98.ckpt
,前一个是去和声模型 - 小工具中添加“歌声转MIDI”功能,使用项目SOME,需自行下载权重文件后才可使用(1.4.3版本)
- 设置页面添加系统信息显示,可显示GPU及序号,以及系统版本(1.4.3版本)
- 预设流程中增加单个音频输入(1.4.3版本)
- 添加最新去混响模型
deverb_bs_roformer_8_384dim_10depth.ckpt
(1.4.2版本) - MSST分离中,添加子进度条,现在单个音频文件分离也有进度条了(1.4.2版本)
- 设置页面新增检查更新(1.4.2版本)
- 添加最新降噪模型
denoise_mel_band_roformer_aufr33_sdr_27.9959.ckpt
和denoise_mel_band_roformer_aufr33_aggr_sdr_27.9768.ckpt
(1.4.1版本) - 新增bandit_v2模型支持(1.4.1版本)
- 新增Valid的WebUI页面,在训练MSST的子页面(1.4.1版本)
优化
- 若检测不到ffmpeg及python,将使用系统环境变量中的值 (#12)
- 备份和恢复预设的功能迁移至预设流程子页面
- 优化WebUI布局
- 更新至原仓库8月15日的commits,优化bs_roformer代码,优化推理代码
- 将3个去混响模型和2个降噪模型移动至single_stem_model
- 优化覆盖安装,现在覆盖安装或增量更新后不会重置配置文件了(1.4.3版本)
- 完善
setup_webui
函数以适合覆盖安装(1.4.2版本) - 小幅度优化了下载模型速度慢的问题(但实际上可能还是很慢)(1.4.2版本)
- 修改部分模型配置文件参数(1.4.1版本)
- 优化控制台日志输出(1.4.1版本)
修复
- 修复requirements.txt部分依赖版本
- 修复了FLAC格式的音频会导致输出文件名字不正确的bug (#11)(1.4.3版本)
- 修复了预设流程中重复模型不会推理的bug(1.4.3版本)
下载整合包
- 123盘:https://www.123pan.cn/s/1bmETd-AefWh.html? 提取码:1145
- 百度网盘:https://pan.baidu.com/s/1uzYHSpMJ1nZVjRpIXIFF_Q 提取码:1145
若安装完整包后出现无法使用CPU进行推理的情况,请再安装一遍增量包获得更新
Release 1.4.3
更新
- 小工具中添加“歌声转MIDI”功能,使用项目SOME,需自行下载权重文件后才可使用
- 添加查看预设的功能。此外,我们将删除预设移动到了查看预设页面
- 设置页面增加备份和恢复预设的功能
- 设置页面添加系统信息显示,可显示GPU及序号,以及系统版本
- dataset中添加verbose选择,配置文件中的use_amp选项现在会影响到推理了
- 预设流程中增加单个音频输入
优化
- 优化进度条,现在只有推理会有二级进度条,训练和验证保持仅总进度条
- 优化覆盖安装,现在覆盖安装或增量更新后不会重置配置文件了
修复
- 修复了FLAC格式的音频会导致输出文件名字不正确的bug #11
- 修复了预设流程中重复模型不会推理的bug
下载整合包
- 123盘:https://www.123pan.cn/s/1bmETd-AefWh.html? 提取码:1145
- 或百度网盘:https://pan.baidu.com/s/1uzYHSpMJ1nZVjRpIXIFF_Q 提取码:1145
Release 1.4.2
更新
- 添加最新去混响模型
deverb_bs_roformer_8_384dim_10depth.ckpt
- MSST分离中,添加子进度条,现在单个音频文件分离也有进度条了
- 设置页面新增检查更新
优化
- 完善
setup_webui
函数以适合覆盖安装 - 小幅度优化了下载模型速度慢的问题(但实际上可能还是很慢)
Release 1.4.1
更新
- 添加最新降噪模型denoise_mel_band_roformer_aufr33_sdr_27.9959.ckpt和denoise_mel_band_roformer_aufr33_aggr_sdr_27.9768.ckpt
- 项目源码更新至7月31日原作者ZFTurbo的commits
- 新增bandit_v2模型支持
- 新增Valid的WebUI页面,在训练MSST的子页面
优化
- 修改部分模型配置文件参数
- 优化WebUI布局
- 优化控制台日志输出
此版本更新了环境,不支持增量更新,需要下载完整包
Release 1.4
更新
- 预设流程支持用户选择是否输出次要音轨(保留的次要音轨将会被直接输出到输出文件夹,不输入下一个模型)
- 支持几乎全部MSST模型输出次要音轨
- uvr推理和msst推理(命令行)支持选择额外输出路径(为了适配预设流程)
优化
- 优化log输出及log格式,减少不必要的log输出
- WebUI更改部分标签说明
- 整合包删除workenv中的__pycache__缓存
此版本更新后,项目将进入暂时性停止更新阶段
Release 1.3.2
修复以下bug
- MSST分离及UVR分离单个音频上传时,非wav格式音频会处理两次
- UVR分离采样率不等于44100时,会出现变调现象
- MSST分离仅会在全部处理完成以后才显示进度条
- MSST多个音频分离时,音频总数超过30会出现卡住的情况
- 其他代码问题
优化
- 优化部分参数标签说明
- 更改UVR分离模块中batch_size的默认值为2,以适应显存<=6G的用户
- 更改UVR分离模块中Normalization的默认值为1
- 预设流程处理时,控制台突出显示每一步使用的模型名字
- 所有处理命令使用蓝色字体输出至控制台,便于debug
- 代码:宏定义PHTHON合FFMPEG常量
- 代码:降低gradio版本至4.8.0以解决依赖冲突
Release 1.3.1
MSST-WebUI第一个对外发布的版本
实现基本功能
- MSST模型分离支持
- UVR模型分离支持
- 预设流程(支持MSST和UVR模型混合)
- 小工具(音频格式转换,音频合并,计算SDR,Ensemble模型)
- 模型下载(支持自动下载和手动下载)
- 提供简易的MSST模型训练页面和训练集制作教程
- WebUI设置(支持选择UVR模型路径)