以前的那个很多文件,这个是另一个作者的,很干净,只是目前有一个缺点:现在还没支持批量任务。
但是显存占用更低速度更快,支持话筒语音实时提取文字。
这样你就可以用大模型获得更准确的字幕,大模型机翻也比中的准确很多,免去在线翻译的烦恼。
Model | Disk | Mem | SHA |
tiny | 75 MB | ~390 MB | bd577a113a864445d4c299885e0cb97d4ba92b5f |
tiny.en | 75 MB | ~390 MB | c78c86eb1a8faa21b369bcd33207cc90d64ae9df |
base | 142 MB | ~500 MB | 465707469ff3a37a2b9b8d8f89f2f99de7299dac |
base.en | 142 MB | ~500 MB | 137c40403d78fd54d454da0f9bd998f78703390c |
small | 466 MB | ~1.0 GB | 55356645c2b361a969dfd0ef2c5a50d530afd8d5 |
small.en | 466 MB | ~1.0 GB | db8a495a91d927739e50b3fc1cc4c6b8f6c2d022 |
medium | 1.5 GB | ~2.6 GB | fd9727b6e1217c2f614f9b698455c4ffd82463b4 |
medium.en | 1.5 GB | ~2.6 GB | 8c30f0e44ce9560643ebd10bbe50cd20eafd3723 |
large-v1 | 2.9 GB | ~4.7 GB | b1caaf735c4cc1429223d5a74f0f4d0b9b59a299 |
large | 2.9 GB | ~4.7 GB | 0f4c8e34f21cf1a914c59d8b3ce882345ad349d6 |
使用方法:首次运行需要选择下载的模型载入,如果想机翻英文到中文,
语言只要选中文就好,旁边的不用打勾我不懂这是不是BUG,选好格式打勾旁边的同目录输出字幕。
模型我选的是ggml-large.bin,V1那个可能是老版本。
软件:
https://github.com/Const-me/Whisper
模型:
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main
------------------------------------------------------------------------------------------------------------
作者好像是个学生,似乎没有太多时间来搞软件,上面的软件也是在学校放假的时候完成的。
我在他的项目反馈里提了一些建议,另一位码神通过他的源码实现了批量任务功能,好像也没有格式限制。
使用方法:输入原先下载的.bin模型,在勾选same as input folder(同个目录生成字幕)前把字幕路径修改成你存在的盘符,不然会提示错误。
skip if .srt exists如果视频存在.srt字幕跳过识别,如果英文视频语言选中文会强制机翻到中文。
勾选translate to english,就是强制所有输出为英文字幕,英文视频只要选语言可以不用勾选这个。
拖入视频框选需要识别的视频点go开始识别,completed显示已完成数。机翻效果还行,也许用腾讯和阿里来翻译字幕更好。
完成后点clear清空队列。
支持批量任务,AMD显卡的软件:
https://github.com/tigros/Whisperer
繁体字幕转简体工具:
https://martjay.lanzouw.com/iMDgb0qjggdg
批量文本替换软件:
https://martjay.lanzouw.com/iYv2l0qjcvkj
批量重命名软件:
https://martjay.lanzouw.com/ipm6Q09uopgf
批量文本替换软件,可以对批量替换所有字幕文件某个词为指定的词。
这款小软件意义非凡,希望各位善用,好好学习,天天向上~
本帖最后由 martjay 于 23-3-20 16:18 编辑
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x