Releases: Huanshere/VideoLingo
Releases · Huanshere/VideoLingo
v0.6.0
-
推荐使用whisperX 在replicate上挂载的api,见本地安装指南,这样本地安装完仅需600M
-
暂时放弃输入视频的多语言支持,测试下来发现英文效果好,日文一般可用,中文有可能出错
-
streamlit增加了多语言
-
Recommend using the API mounted on replicate with whisperX, see the local installation guide, so that after local installation, it only takes up 600M
-
Temporarily abandon multi-language support for input videos, after testing, it was found that English works well, Japanese is generally usable, and Chinese may have errors
-
Streamlit has added multi-language support
v0.5.2
在 ask_gpt 中加入了验证 json key 的步骤,能够避免 api 不稳定返回空影响后续处理的情况
隐藏了不用的文件
git pull 或者下载覆盖到项目即可更新
v0.5.1
更新了文档,请按照 安装 文档从头安装
经测试,多语言效果比旧版大幅提升
警告:需要30G的C盘空间,请酌情更新
v0.5.0
-
提供了多种whisper方式(见本地安装文档),推荐选择WhisperX,拥有非常好的多语言识别能力,但安装较麻烦
-
更新了nlp切割步骤,处理超长无标点转录文本(通常出现在亚洲语言的识别上)
-
spacy model全改为lg,单个模型需要500M,断句效果更好
-
移除了一键安装包,因为推荐的 WhisperX 需要手动安装许多前置依赖
-
未广泛测试
v0.4.0
- 弃用 whisper api,重新使用 whisper timestamped,使用更耗费算力的方法
- 现在应该能支持中文日文输入了,未广泛测试,遇到问题请反馈~
v0.3.3
- 修复少许bug
- 仍然存在许多whisper识别bug
- 旧版备份 即将重构恢复本地whisper timestamped
v0.3.2
- 修复了n多bug
- 更换了对齐算法,更稳定了
- 测试过了...
v0.3
- 增加了自动多语言支持(Spacy 官方的国家列表,改功能需要测试稳定性)
- 使用 whisper 的 api,不需要本地算力了
- 重构优化代码结构
- 切换成全英文 prompt,质量提升了少许
v0.2.2
旧版备份即将重构换用 api 版本的 whisper
优化了稳定性
-
完善了重试 ask_gpt 的步骤
-
加入了保存设置后重启 streamlit 的提示