管道概览
- 拖入视频 — MP4、MKV、AVI、MOV、WebM、WMV、FLV 或 M4V。
- 语音识别在设备内运行,使用为广播字幕调整的短语级分段。
- 设备内 AI 翻译每行,同时意识到角色声音和连续性。
- 第二个 AI 通过重新阅读整个字幕文件以保持一致性 — "审查通过"。
- 词级 diff 突出显示 AI 修正了什么。
- 质量报告:覆盖率 %、平均阅读速度、间隙检测、快/慢行计数器。
五种质量预设
从快速(最大吞吐量)到最大质量(最慢但最准确),平衡作为推荐默认值,以及一个专用的柔和语音预设来捕捉耳语或安静的声音。自定义模式为高级用户暴露每个参数。
一次转录多语言
转录一次,翻译多次。"+ 添加语言"按钮在几秒钟内将缓存的转录重新翻译为新的目标语言,生成每语言 SRT 文件,而无需重新运行语音识别通过。
硬件加速烧录
使用你的 GPU 视频编码器(NVIDIA、AMD 或 Intel)将翻译字幕烧入视频 — 自动检测。或当你的播放器支持时,使用零质量损失的软多路复用。字体、大小、颜色和轮廓都可配置。
多视频队列
拖入文件夹,顺序处理每个视频。Skip-on-exists 防止重新运行已完成的视频。每个项目缓存存储转录加上完成的语言 — 重新启动后无需重新运行语音识别即可恢复。