Releases: WEIFENG2333/VideoCaptioner
Releases · WEIFENG2333/VideoCaptioner
VideoCaptioner v1.2.0
2024年12月8日发布更新:
✨ 新功能
- 新增 Faster-whisper 支持,提供更高质量的音频转字幕功能
强烈建议使用!!
- 新增 VAD 语音活动检测,显著减少字幕幻觉现象
- 新增人声分离功能,可有效去除视频背景噪音
- 新增开关单词时间戳生成选项
- 新增关闭视频合成选项
- 新增字幕最大长度设置
- 新增字幕末尾标点去除设置
🔧 优化改进
- 优化字幕优化和翻译的提示词
- 优化 LLM 字幕断句逻辑,提升断句准确性
- 优化音频转换格式一致性
🐛 问题修复
- 修复进程泄露问题 (#83)
- 修复断句时 eng_seg_index 变量错误 (#71)
- 修复音频转换格式不一致问题 (#104)
- 修复其他导致闪退的问题 (#78)
- 移除Cpp不稳定的 Whisper-v3 支持 (#93, #64)
📥 下载
Windows 用户可以通过以下方式下载:
- [GitHub Release] 选择
VideoCaptioner-Setup-win64-v1.2.0.exe
进行下载 - 蓝奏云盘
📝 注意事项
- 本次更新优化了音频处理流程,建议更新到最新版本
感谢各位用户的反馈和建议!
VideoCaptioner v1.1.1
2024年11月24日发布更新:
临时修复管理员权限不足导致路径创建错误的问题
修复whisper转录过程错误的问题
✨ 新功能
- 新增 Whisper-v3 模型支持
- 新增 Whisper API 调用功能
- 软件主页支持查看软件相关的日志
- 支持查看字幕优化和反思翻译的日志
- 支持双语/单语字幕导出选择 (#15)
- 支持文稿匹配提示对齐功能 (#47)
- 支持自定义调节字幕位置 (#23)
- 支持导入
cookie.txt
以绕过 Youtube 验证及下载其他网站高清视频 (#9) - 字幕文件名现与视频文件名保持一致 (#7)
🐛 问题修复
- 修复字幕导入时的闪退问题 (#16)
- 优化字幕断句效果 (#20)
- 优化视频工作目录的文件排布结构 (#7)
- 修复检测模型可用性时的闪退问题 (#43)
- 修复下载模型时非中文路径报错问题 (#13)
- 修复使用 API 时自动翻译的问题 (#10)
- 修复软件内一些功能不统一的问题
- 优化字幕断句的效果
为了后续更新的方便,新版本使用安装包的形式,以往压缩包的版本不再使用,用户可以直接删除之前的版本。(如果不想再次下载模型请先进行备份)
也可以通过蓝奏网盘下载安装包:https://wwwm.lanzoue.com/iR8Tp2g2bzli
VideoCaptioner v1.1.0
VideoCaptioner v1.1.0
2024年11月23日发布更新:
✨ 新功能
- 新增 Whisper-v3 模型支持
- 新增 Whisper API 调用功能
- 软件主页支持查看软件相关的日志
- 支持查看字幕优化和反思翻译的日志
- 支持双语/单语字幕导出选择 (#15)
- 支持文稿匹配提示对齐功能 (#47)
- 支持自定义调节字幕位置 (#23)
- 支持导入
cookie.txt
以绕过 Youtube 验证及下载其他网站高清视频 (#9) - 字幕文件名现与视频文件名保持一致 (#7)
🐛 问题修复
- 修复字幕导入时的闪退问题 (#16)
- 优化字幕断句效果 (#20)
- 优化视频工作目录的文件排布结构 (#7)
- 修复检测模型可用性时的闪退问题 (#43)
- 修复下载模型时非中文路径报错问题 (#13)
- 修复使用 API 时自动翻译的问题 (#10)
- 修复软件内一些功能不统一的问题
- 优化字幕断句的效果
为了后续更新的方便,新版本使用安装包的形式,以往压缩包的版本不再使用,用户可以直接删除之前的版本。(如果不想再次下载模型请先进行备份)
也可以通过蓝奏网盘下载安装包:https://wwwm.lanzoue.com/iKMhH2g0se9a
VideoCaptioner v1.0.0
🎉 首个正式版本发布!
✨很高兴发布 VideoCaptioner v1.0.0 版本。这是一款基于大语言模型的智能视频字幕处理助手,支持字幕生成、断句、优化、翻译等全流程处理。
程序不知道会有一丢丢我没发现的BUG,如果遇到欢迎提出。
📥 下载
-
Windows用户:
- 下载
VideoCaptioner-win-v1.0.0.7z
- 解压后运行
VideoCaptioner.exe
- 下载
-
MacOS用户:
- 请参考项目README进行源码安装
📋 使用说明
- 运行程序后可直接拖拽视频文件进行处理
- 可选配置LLM API以获得更好的优化效果
- 支持自定义字幕样式和排版方式
📝 反馈
目前还要兼顾学业,维护可能会稍缓,但是欢迎如有任何问题或建议,欢迎在GitHub提交 Issue。
感谢支持!