WhisperDesktop 完全免费的AI 影片、语音转字幕工具,还提供翻译功能
之前我们曾介绍过一款MacWhisper的语音转字幕免费工具,这款仅支援Mac 系统,而且需要搭配OpenAI API 才能运作,不是完全免费,对于Windows 用户和预算有限的人可能不太适合,而这篇就要推荐另一个WhisperDesktop 工具,支援Windows 系统,而且是真的完全免费,语音转字幕的速度不仅快,还支援翻译功能,相当强大。
WhisperDesktop 完全免费的AI 影片、语音转字幕工具,还提供翻译功能
WhisperDesktop 是一款开源工具,有在GitHub 上分享,下载之后可直接打使用,无需安装。首次打开可能会跳出这个讯息,点击“其他资讯”:
就会出现“仍要执行” 的按钮了:
操作介面虽然是英文,但使用上蛮简单的,一开始需要先读入模型档才可以,模型档可以到Hugging Face下载:
根据开发者说明,他推荐使用ggml-medium.bin 这一个,你可以先试试看电脑跑不跑得动,基本上电脑硬体规格没有太入门的应该都可以:
进到下一页后,要再点击download 才会下载,模型档还蛮大的,要1.53GB,下载需要等一些时间:
下载完成之后,就把ggml-medium.bin 这个模型档读进来,Model Implementation 保留GPU 即可,然后按OK:
会跳转到这画面,Language 部分选择你要的字幕语言,我测试把中文影片转成中文字幕,所以我选“Chinese”:
把影片档读进来后,Output Format 部分选择SubRip subtitles:
设定字幕档名以及储存位置,按Transcribe 就会开始转换:
我测试的这部影片是5 分多钟,只花38 秒就完成转换,速度真的超快:
精准度真的高,不仅时间戳都正确,我快速扫下来看起来都没有辨识错误,连中文+ 英文也都精准辨识。所以说,对于有在制作影片的人,有这工具之后,上字幕就简单了!也不用再使用其他付费版的工具:
再来我测试英文字幕也行,翻译品质也还不错:
档案格式部分,我测试MP4、MP3 格式都可以,对于需要将开会、演讲录音转成字幕的朋友,也可以用这工具来实现。比较可惜是目前还没有Mac 版本,Mac 用户想用的话,就必须透过虚拟机来实现。想摸索的人,也可以试试看其他Whisper 模型的辨识精准度和速度。
文章转自网络,原文地址