卡卡字幕助手(电脑)

卡卡字幕助手是一款基于AI大模型开发的字幕识别工具,只要接入对应的大模型接口,或者下载本地模型,即可对视频或者音频中的字幕进行提取,并生成srt等格式的字幕文件。
软件安装流程比较常规,这里就不过多赘述了。

图片[1]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

支持本地模型Whisper和LLM(大语言模型)API接入识别两种方式,大家可以按需选择。

图片[2]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

先看本地的Whisper模型,使用前需要先根据配置安装GPU+CPU使用或者CPU使用的模型底包,然后下载用于识别的模型。模型体积越大,识别效果也就越好,但对设备性能的要求也在提高

图片[3]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

我为核显,这里就下载CPU版版本的Faster Whisper,然后下载Medium模型。下载完成后,打开Faster Whisper设置,选择之前下载的模型、运行设备、音频的语言即可。

图片[4]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

软件使用就比较简单了,把需要识别的视频或者音频文件拖进来,点击开始,就会对其进行自动处理,使用本地模型的情况下,速度快慢就看设备性能了。

图片[5]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

Faster Whisper模型转录完成后,会利用AI,对识别结果进行优化,确认字幕呜呜后,点击左上角的保存,即可导出srt、ass、vtt等格式的字幕文件。

图片[6]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

如果优化后仍旧存在错别字,可以手动点击,进行修改。

图片[7]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

然后,咱们再看在线大语言模型识别。可以填入OPENAI官方的API接口或者使用第三方提供的接口,接入各种开放API接口的大语言模型。
填入API Key、Base URL后,点击检查连接,当弹出模型获取成功、LLM连接成功的提示时,就说明大模型接入成功!

图片[8]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

使用LLM模型时,需要在首页将转录模型设置为B接口。

图片[9]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

至于后面的操作,就和使用Faster Whisper模型一模一样,直接抄前面的作业即可

值得一提的是,得益于云端强大的计算能力,通过LLM API所进行的字幕识别,速度要远远高于本地识别(如果本地GPU算力比较强大,影响则可pass)。

图片[10]-卡卡字幕助手(电脑)-小虎队软件库,软件库合集,免费资源分享

在大模型加持之下,字幕翻译也变得轻松,简单几步,就能制作外文视频的中文版,拿来啃某些生肉,简直不要太爽!

软件的字幕识别功能不局限于视频创作,如果你是一位影视爱好者或者影视老司机,它亦能帮你解决不少观影中存在的语言障碍。

卡卡字幕助手(电脑)
© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容