录音/制作/创作 吉他 扩声技术 视频技术 作品展示 生活 信息 更多... | 音频应用专卖店

[新闻] Whisper本地字幕识别提取带机翻-低显存提速版【已经更新批量任务功能,AMD支持】!

( 33 )
 
[收藏]
-  第 1 页  -
#1 23-3-15 08:00

Whisper本地字幕识别提取带机翻-低显存提速版【已经更新批量任务功能,AMD支持】!


5646


以前的那个很多文件,这个是另一个作者的,很干净,只是目前有一个缺点:现在还没支持批量任务。
但是显存占用更低速度更快,支持话筒语音实时提取文字。
这样你就可以用大模型获得更准确的字幕,大模型机翻也比中的准确很多,免去在线翻译的烦恼。

ModelDiskMemSHA
tiny75 MB~390 MBbd577a113a864445d4c299885e0cb97d4ba92b5f
tiny.en75 MB~390 MBc78c86eb1a8faa21b369bcd33207cc90d64ae9df
base142 MB~500 MB465707469ff3a37a2b9b8d8f89f2f99de7299dac
base.en142 MB~500 MB137c40403d78fd54d454da0f9bd998f78703390c
small466 MB~1.0 GB55356645c2b361a969dfd0ef2c5a50d530afd8d5
small.en466 MB~1.0 GBdb8a495a91d927739e50b3fc1cc4c6b8f6c2d022
medium1.5 GB~2.6 GBfd9727b6e1217c2f614f9b698455c4ffd82463b4
medium.en1.5 GB~2.6 GB8c30f0e44ce9560643ebd10bbe50cd20eafd3723
large-v12.9 GB~4.7 GBb1caaf735c4cc1429223d5a74f0f4d0b9b59a299
large2.9 GB~4.7 GB0f4c8e34f21cf1a914c59d8b3ce882345ad349d6


使用方法:首次运行需要选择下载的模型载入,如果想机翻英文到中文,
语言只要选中文就好,旁边的不用打勾我不懂这是不是BUG,选好格式打勾旁边的同目录输出字幕。
模型我选的是ggml-large.bin,V1那个可能是老版本。

软件:https://github.com/Const-me/Whisper
模型:https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

------------------------------------------------------------------------------------------------------------


作者好像是个学生,似乎没有太多时间来搞软件,上面的软件也是在学校放假的时候完成的。
我在他的项目反馈里提了一些建议,另一位码神通过他的源码实现了批量任务功能,好像也没有格式限制。



使用方法:输入原先下载的.bin模型,在勾选same as input folder(同个目录生成字幕)前把字幕路径修改成你存在的盘符,不然会提示错误。
skip if .srt exists如果视频存在.srt字幕跳过识别,如果英文视频语言选中文会强制机翻到中文。
勾选translate to english,就是强制所有输出为英文字幕,英文视频只要选语言可以不用勾选这个。
拖入视频框选需要识别的视频点go开始识别,completed显示已完成数。机翻效果还行,也许用腾讯和阿里来翻译字幕更好。
完成后点clear清空队列。



支持批量任务,AMD显卡的软件:https://github.com/tigros/Whisperer
繁体字幕转简体工具:https://martjay.lanzouw.com/iMDgb0qjggdg
批量文本替换软件:https://martjay.lanzouw.com/iYv2l0qjcvkj
批量重命名软件:https://martjay.lanzouw.com/ipm6Q09uopgf

批量文本替换软件,可以对批量替换所有字幕文件某个词为指定的词。

这款小软件意义非凡,希望各位善用,好好学习,天天向上~
本帖最后由 martjay 于 23-3-20 16:18 编辑

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
观众反应

1307
#2 23-3-15 08:30
有很多视频没有字幕,这种有招吗?

901
#3 23-3-15 08:52
应该很实用吧

11120
#4 23-3-15 10:02
“大模型机翻也比中的准确很多”,这是什么意思?

5646
#5 23-3-15 11:19
音飞阿伟 发表于 23-3-14 16:30
有很多视频没有字幕,这种有招吗?

它就是本地识别字幕带机翻功能的

1092
#6 23-3-15 11:53
翻译目前支持啥翻译

5646
#7 23-3-15 12:24
繁华岁月 发表于 23-3-14 19:53
翻译目前支持啥翻译

先去看老帖啥都懂了

207
#8 23-3-15 13:45
申请个免费的百度翻译API标准版在Potplayer就可以在线翻译了

5646
#9 23-3-15 13:46
springdoo 发表于 23-3-14 21:45
申请个免费的百度翻译API标准版在Potplayer就可以在线翻译了

百度喜欢自作主张乱改意思,所以我更建议用阿里或者腾讯

658
#10 23-3-15 15:27
我下载了但是没发现有可运行的exe程序,难道我下错了?

5646
#11 23-3-15 15:47
wangwenqi0987 发表于 23-3-14 23:27
我下载了但是没发现有可运行的exe程序,难道我下错了?

desktop

658
#12 23-3-15 16:26

抱歉,我还是没有找到哈,点击这个“whisper desktop没有反应,应该在哪呢

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

8875
#13 23-3-15 18:03
谢谢分享

5646
#14 23-3-15 20:12
wangwenqi0987 发表于 23-3-15 00:26
抱歉,我还是没有找到哈,点击这个“whisper desktop没有反应,应该在哪呢

右边release

5646
#15 23-3-15 23:16
筱沐 发表于 23-3-14 18:02
“大模型机翻也比中的准确很多”,这是什么意思?

大模型比中模型机翻准确,很难理解吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

搜索