录音/制作/创作 吉他 扩声技术 视频技术 作品展示 生活 信息 更多... | 音频应用专卖店

[新闻] Whisper本地字幕识别提取带机翻-低显存提速版【已经更新批量任务功能,AMD支持】!

( 13 )
 
[收藏]
#1 23-3-15 08:00

Whisper本地字幕识别提取带机翻-低显存提速版【已经更新批量任务功能,AMD支持】!


5388


以前的那个很多文件,这个是另一个作者的,很干净,只是目前有一个缺点:现在还没支持批量任务。
但是显存占用更低速度更快,支持话筒语音实时提取文字。
这样你就可以用大模型获得更准确的字幕,大模型机翻也比中的准确很多,免去在线翻译的烦恼。

ModelDiskMemSHA
tiny75 MB~390 MBbd577a113a864445d4c299885e0cb97d4ba92b5f
tiny.en75 MB~390 MBc78c86eb1a8faa21b369bcd33207cc90d64ae9df
base142 MB~500 MB465707469ff3a37a2b9b8d8f89f2f99de7299dac
base.en142 MB~500 MB137c40403d78fd54d454da0f9bd998f78703390c
small466 MB~1.0 GB55356645c2b361a969dfd0ef2c5a50d530afd8d5
small.en466 MB~1.0 GBdb8a495a91d927739e50b3fc1cc4c6b8f6c2d022
medium1.5 GB~2.6 GBfd9727b6e1217c2f614f9b698455c4ffd82463b4
medium.en1.5 GB~2.6 GB8c30f0e44ce9560643ebd10bbe50cd20eafd3723
large-v12.9 GB~4.7 GBb1caaf735c4cc1429223d5a74f0f4d0b9b59a299
large2.9 GB~4.7 GB0f4c8e34f21cf1a914c59d8b3ce882345ad349d6


使用方法:首次运行需要选择下载的模型载入,如果想机翻英文到中文,
语言只要选中文就好,旁边的不用打勾我不懂这是不是BUG,选好格式打勾旁边的同目录输出字幕。
模型我选的是ggml-large.bin,V1那个可能是老版本。

软件:https://github.com/Const-me/Whisper
模型:https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

------------------------------------------------------------------------------------------------------------


作者好像是个学生,似乎没有太多时间来搞软件,上面的软件也是在学校放假的时候完成的。
我在他的项目反馈里提了一些建议,另一位码神通过他的源码实现了批量任务功能,好像也没有格式限制。



使用方法:输入原先下载的.bin模型,在勾选same as input folder(同个目录生成字幕)前把字幕路径修改成你存在的盘符,不然会提示错误。
skip if .srt exists如果视频存在.srt字幕跳过识别,如果英文视频语言选中文会强制机翻到中文。
勾选translate to english,就是强制所有输出为英文字幕,英文视频只要选语言可以不用勾选这个。
拖入视频框选需要识别的视频点go开始识别,completed显示已完成数。机翻效果还行,也许用腾讯和阿里来翻译字幕更好。
完成后点clear清空队列。



支持批量任务,AMD显卡的软件:https://github.com/tigros/Whisperer
繁体字幕转简体工具:https://martjay.lanzouw.com/iMDgb0qjggdg
批量文本替换软件:https://martjay.lanzouw.com/iYv2l0qjcvkj
批量重命名软件:https://martjay.lanzouw.com/ipm6Q09uopgf

批量文本替换软件,可以对批量替换所有字幕文件某个词为指定的词。

这款小软件意义非凡,希望各位善用,好好学习,天天向上~
本帖最后由 martjay 于 23-3-20 16:18 编辑

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
观众反应

5388
#2 23-3-15 11:19
音飞阿伟 发表于 23-3-14 16:30
有很多视频没有字幕,这种有招吗?

它就是本地识别字幕带机翻功能的

5388
#3 23-3-15 12:24
繁华岁月 发表于 23-3-14 19:53
翻译目前支持啥翻译

先去看老帖啥都懂了

5388
#4 23-3-15 13:46
springdoo 发表于 23-3-14 21:45
申请个免费的百度翻译API标准版在Potplayer就可以在线翻译了

百度喜欢自作主张乱改意思,所以我更建议用阿里或者腾讯

5388
#5 23-3-15 15:47
wangwenqi0987 发表于 23-3-14 23:27
我下载了但是没发现有可运行的exe程序,难道我下错了?

desktop

5388
#6 23-3-15 20:12
wangwenqi0987 发表于 23-3-15 00:26
抱歉,我还是没有找到哈,点击这个“whisper desktop没有反应,应该在哪呢

右边release

5388
#7 23-3-15 23:16
筱沐 发表于 23-3-14 18:02
“大模型机翻也比中的准确很多”,这是什么意思?

大模型比中模型机翻准确,很难理解吗?

5388
#8 23-3-16 22:17
shadow 发表于 23-3-16 04:58
这个好像只认mp4格式的视频,其他格式的视频文件不认。

也支持音频格式,wma,mp3,wav,比较简单的方法是把格式直接改成它支持的格式,你的视频仍然可以看它也能认 本帖最后由 martjay 于 23-3-16 06:26 编辑

5388
#9 23-3-17 16:25
ggman 发表于 23-3-16 23:39
百度一个月只能免费给5万个字的翻译而已

个人验证后一个月免费100万
观众反应

5388
#10 23-3-17 17:41
ggman 发表于 23-3-17 01:23
一个视频两个半小时还没完成,太久了吧 本帖最后由 ggman 于 23-3-17 17:25 编辑

不是独立显卡别用了

5388
#11 23-3-17 22:28
每一次 发表于 23-3-17 05:50
能识别中文吗?


5388
#12 23-3-19 21:18
shadow 发表于 23-3-17 18:15
ok,我刚转成mp4格式的就可以了

更新了可以批量任务了

5388
#13 23-3-19 21:18
tdwfwsk 发表于 23-3-18 09:26
原来那个我觉得很不错,我就用来中文语音转文字,准确率真不错,对比以前吾爱论坛上有一个CPU版本的要好

吾爱论坛的估计就是哪个buzz,作者没有能力完成GPU模式

5388
#14 23-3-20 08:59
tdwfwsk 发表于 23-3-19 08:23
感谢分享!WhisperDesktop这个挺好,启动速度快,界面直观,批量的那个好像每次都要填路径。

刚出来我已经反馈这个bug了,也没有多麻烦,建立一个文本写路径,复制粘贴就行,这个识别快

2.2版本已经修复配置文件保存问题

本帖最后由 martjay 于 23-3-19 19:19 编辑
您需要登录后才可以回帖 登录 | 注册

本版积分规则

搜索