首页 每日干货分享 一款能将话语转文字且功能强大、使用便捷的工具介绍

一款能将话语转文字且功能强大、使用便捷的工具介绍

发布时间: 浏览量:36 0

这东西具备将你所说的话直接转化成文字这一功能,其能够在本地得以达成,且能令转写自动粘贴至当前光标所处位置,同时还可以把模型、历史、设置统统放置于一个控制面板内加以管理。它拥有开源、跨平台、界面现代化、响应迅速以及隐私有保障这些特性——情况就是如此简单清晰。

讲讲最直观的用况,按下全局热键(默认反引号 `)开始说话,松手或再按一次结束,文字即刻于编辑处出现,或存于本地历史,过程直接便捷,面板为可拖拽小窗,随手置于屏幕角落,窗内可见所用模型、转写进度及最近记录,似小工具箱应用简洁 。

在功能方面,具备能够在本地运行的特性,同时也能够走向云端。若想要将语音数据完整地留存于自己的电脑之中,那么可以开启本地模式,在此模式下音频以及文本仅仅存在于本地数据库;要是希望贪图省事或者想要拥有实力更为强劲的模型,那样就可以切换至云端。这种设计成功解决了两件事情:隐私以及能力之间的权衡。你能够在面板里随时随地进行切换,而且界面将会对你明示当前的数据走向,清晰明了,绝对不会让你产生混淆。

在模型管理这方面所做的工作是颇为细致的,其支持下载tiny大小、base大小、small大小、large大小、turbo大小等各异大小的模型,该下载能够并行进行,同时也能够实现断点续传的操作,在有需要的时候能够通过一键操作删除模型并且触发卸载钩子,甚至对于残留缓存也会尽可能地清理得干干净净,在面板当中还会显示模型所占的磁盘空间、所属版本以及最后更新的时间,借此方便你去判断究竟是否要删除掉旧模型,历史记录全部都是存储在本地的,是按照时间先后顺序进行排序的,当点开之后能够看到原始音频、转写文本以及时间戳,并且支持进行检索,查询某次发言并不会感到费劲。

ai语音朗读软件免费_语音转文字_本地转写_开源跨平台

交互时细节方面也考虑得颇为实用,转写任务能够暂停,可取消,如此可避免因误触发而致使资源产生浪费,自动粘贴默认状态下很顺畅,然而在少数富文本编辑器当中会受到权限的限制,读取的时候会看到有提示,macOS上面支持使用 Fn/Globe 键当作硬件触发键,按压物理键会稳定些许,适宜对于需要频繁唤醒的人,小面板能够拖动,不会将主要窗口遮挡住,在体验方面更契合实际办公场景。

采用的技术栈是相对较新的前端组合,其中包括 React 19、CSS v4,构建以及热重载是基于 Vite,其启动速度很快,且开发体验十分流畅。它支持跨平台,涵盖 macOS、Linux,无论是笔记本用户还是台式机用户皆可以使用。该项目的实现方向较为显著,具体是将输入路径予以缩短,把延迟降低到能够忽略不计的程度,从而让用户有一种说完话文字便即刻出现的感觉。

开发者需求也全顾及到,面板之中可填入API Key,能绑定多个AI服务商,切换之后马上就生效,支持API,这表明转写结果能够径直送至更具高级性的对话模型去做后处理或者精修,模型区域能够看见可用空间,还有已下载模型,支持一键删除以及卸载清理,方便开展维护,对于团队部署而言,能够统一下发配置,于内部使用之际把数据留存在内网,削减外泄风险。

场景使用很简单:写文章时不想动手敲字,开启编辑器按下热键,话语说完文字便自动粘贴形成;开会期间做记录,拿起设备放置在会议区域中央进行录音,回去之后能够查询每一句原话以及与之对应的时间戳;对于存在隐私考量的律师、医生或者企业而言,实现完全离线状态下的转写会更加安心;而内容创作者能够先于本地环境完成一轮初稿创作,待感觉满意之后再将其拿到云端开展精修工作。总而言之,能够满足既具备顶速率特点又可兼顾隐私需求的场景数量有许多 。

此外,还有一些实操方面的小细节是值得予以说明的,,模型开展下载操作的时候会呈现出进度以及剩余空间,若下载遭遇失败的情况则会支持进行重试以及断点续传操作,通过这种方式来避免频繁地从起始点开始进行,删除模型之际所触发的卸载钩子能够对缓存实施清理,以此防止磁盘被模型的残留内容所占据,历史记录是支持全文检索功能的,这种功能在需要对讨论内容进行回溯或者找寻上次会议要点的时候是格外有用的,对于资源处于紧张状态的机器而言,可以选择tiny或者base模型,这样能够确保基本体验得以实现,而不会导致系统的运行速度受到拖累。

有关于安全方面,此项目将“本地优先”放置于显著位置上,当选择的是本地这个模式其间音,频的文件以及转写之后获得的结果均不会上传至服务器,云的模式属于是可供选择的,提供给那些追求更高准确率或者更快结果的人员,在面板里将会对当前选项做出实时的显示,从而让用户清楚自身的数据究竟朝着何处流动,对于敏感行业来讲,这一点是相当关键非常重要必不可缺的 ,。

ai语音朗读软件免费_语音转文字_本地转写_开源跨平台

项目属开源性质,代码被放置当中且有安装说明,其中含一步步的部署文档以及常见问题。若想自行编译能克隆仓库,要是想先尝试界面也可去进行在线体验。当社区呈现活跃状态之时,插件式扩展相对易于开展,像接入别的语音模型或者添加自定义的后处理脚本这类操作并非难事。

首先来讲一件事,那就是默认热键为反引号,此键于大多数键盘上,不常被其他常用快捷所占用,然而你能够随意将其改成别的键;接着再说另外一件事,自动粘贴在多数应用当中兼容性良好,不过部分富文本编辑器或许需要额外授权,且含有说明,要是遇到权限问题,需先依照文档来进行处理。

想看源码或试在线版,可以去这两个地址:

欢迎 发表评论:

请填写验证码

评论列表

暂无评论,快抢沙发吧~