NASTool新增AI字幕生成与翻译功能实测:强大但耗时1-2小时
提示:本篇文章约2537字符,阅读大约需要4分钟。
写在前面
试了新添的字幕生成,又试了字幕翻译工作,就在昨天,深切体会到当下 AI 的强大力量。这时间着实很耗时,从进行音轨提取开始,接着生成字幕,之后再翻译变为最终字幕,所需的时长大概要 1 至 2 个小时,这是由视频文件长短以及本地 AI 算力来决定的。
阅读指南实际操作
ssh连接群晖,进入 容器:
将执行,以交互方式,针对用户nt,在-nas-tools环境下,运行/bin/bash 。
注:那些尚不清楚怎样把套件版切换为版的朋友,能够去瞧我的上一篇文章 。 , 。
执行一键安装脚本就行,这儿我采用的是large模型并且使用国内源:
bash,AI字幕自动生成,填写相应信息就行,文件路径可直接复制,ssh命令行生成的路径就行。
体验字幕生成
进行字幕生成时,具体的过程,先是要提取视频音轨,之后在于本地去运用AI模型予以完成。所以,在本地使用时,需要具备比较强大的算力,要是没有GPU的情况下,就会造成比较高的CPU占用,详情显现于以下:

我的,终于,要接近,满负载运行啦( Ĭ ^ Ĭ ) 。以后,谁要是再来问,你用这么强大的硬件组 NAS 干什么 。你,就可以,理直气壮地回答他,用来生产 AI 字幕啊 。
下图是针对《更衣人偶坠入爱河》第一集的部分的生成示例:
它连bgm什么的都标注出来了,不明觉厉中。
请注意,要是视频当中已然内置了字幕文件,那么就会越过字幕生成这一环节,直接开展字幕翻译工作。
字幕翻译
字幕的翻译,是要运用到 API 的,当前呢,总共针对两个视频的字幕翻译进行了测试,其结果如下:
无字幕源文件——日语字幕生成+翻译
这个体验,目前大概处于“图一乐”的阶段模样,绝大部分意思,是不需要上下文去理解的那种,基本都能够翻译得差不多,达到八九不离十的程度 。
不过里面还会出现的对话,比较影响观感。

所以呀,大伙拿去给一位很漂亮的年轻女子用一下还行(可等着字幕生成以及翻译完毕得要两个小时咧,感觉时间耽搁太长都没指望咯 hhhh)喏,要是正儿八经看一部影视剧还是老老实实地去寻觅字幕文件吧 。
有字幕源文件——英语字幕翻译
用于测试的影片是《最后生还者》第一季第九集,时长来讲呐,由于已经内嵌英文字幕了,所以呢,仅仅只需要提取那内嵌的字幕进而开展翻译就行啦。
翻译耗费时间如下图所示:
对于这类需求而言,其全程是在线完成的,并不会耗费本地资源,它适用在刚刚发布的媒体资源,且还并无字幕组来进行翻译的那个时候。所生成的翻译字幕极为准确,算得上是具备可用水准的了。
总结
人工智慧的确能够对人类生活予以改变,许多年前所设想的一键生成中文字幕情况,于当下已然成为了现实,特别是在英文字幕生成以及翻译方面,已然达到了能够使用的阶段,当然,人工智慧强大功能的应用远远不止这些,还需要各位自行去进行探索。
确实,AI能够将你的工作替代掉,然而,只要你会借助AI来替你开展工作,那么你便不会被淘汰掉。
欢迎 你 发表评论: