Project Blink是什么多模态AI工具 如何用它实时翻译
Project Blink信息介绍
Project Blink是Google在2023年下半年悄悄放出来的“黑科技”,算是AI界的一匹黑马,它不是单一功能的工具,更像是个“多面手”,能同时搞定文本、图像、视频、音频这几种东西,简单说,你给它一段文字,它能翻译成别的语言;你拍张照片,它能告诉你照片里是啥,还能把上面的字也翻了;你甚至丢个短视频过去,它能边看边给你实时解说。
我第一次听说它是刷科技新闻,当时就觉得这玩意儿有点东西——以前的AI要么只能处理文字,要么只能看图片,很少有能把这么多“模态”捏合到一起还玩得溜的,Google说它的目标是让普通人“打破信息壁垒”,不管是出国旅游、看外国资料,还是处理复杂的多媒体内容,都能靠它轻松搞定,目前它还在逐步开放测试,不过已经有不少人拿到了体验资格,我也是其中之一,后面会给你们讲我用它的真实经历。

Project Blink核心功能有哪些
实时跨模态翻译是它最能打的功能之一,不只是文字翻译,你对着街边的路牌拍张照,它秒给你出中文翻译;跟外国人聊天,打开语音模式,你说中文它实时转成对方的语言,对方说外语它再转成中文,跟装了个“同声传译”在手机里似的,我试过拿它翻译日语漫画,连漫画里的拟声词“砰”“咻”都能翻得有那味儿,比以前用的翻译软件灵多了。
生成也很有意思,你给它一段文字描述,一只戴着宇航员头盔的橘猫在火星上种向日葵”,它能直接生成对应的图片;要是你给段视频,说“给这段视频配个搞笑的旁白”,它还能根据视频内容编段子,我上次用它给我家猫的视频配旁白,它说“这只猫试图用爪子打开罐头,结果把自己摔了个屁股墩儿,看来干饭的热情也需要智商支撑”,把我笑到肚子疼。
智能交互理解这点也得夸夸,它不像有些AI,你问个复杂问题它就“失忆”,Project Blink能记住上下文,比如你先问“巴黎有什么好玩的”,它回答后你接着说“帮我规划个3天行程”,它会结合前面说的景点来安排,不会像个没头苍蝇似的重新瞎推荐。
跨平台同步也很方便,你在手机上用它翻译了一篇文章,电脑端登录同一个账号就能直接看到记录,不用来回传文件,我上班摸鱼用手机查资料,下班回家打开电脑接着看,无缝衔接,简直是懒人福音。
Project Blink的产品定价
目前Project Blink还在测试阶段,官方没说具体多少钱,不过根据Google以往的尿性,大概率会搞“基础免费+高级付费”的模式,基础版可能让你用用简单的文字翻译、图片识别,每天有次数限制;高级版估计就解锁全部功能,比如无限制实时翻译、高清视频生成、更长的上下文记忆这些。
我猜高级版定价可能跟Gemini Pro差不多,一个月几十块钱?毕竟功能这么强,太便宜了Google估计要亏本,不过具体多少还得等官方消息,现在想体验的话,可以去Google的AI测试平台申请,运气好能拿到免费试用资格,我就是这么薅到羊毛的。
这些场景用Project Blink超合适
上次我去韩国旅游,简直是Project Blink救了命,我这人英语渣,韩语更是一句不会,到了首尔街头,菜单、路标全是“火星文”,在明洞一家烤肉店,我对着菜单拍照,它秒翻译出“猪五花”“牛小排”,还标注了“微辣”“特辣”,我这种不吃辣星人终于不用瞎点菜了,后来在弘大逛街,看到一个小众乐队在表演,我打开语音翻译,它实时把歌词翻成中文,虽然有点磕巴,但大概意思能get到,那首歌讲的是青春和梦想,还挺感人的。
学生党用它写作业也超香,我表妹上高中,上次她问我一道英语阅读题,文章里有段讲“量子纠缠”的,我自己都看懵了,她用Project Blink拍了文章,不仅翻译了全文,还在旁边加了注释,用“两个人拆盲盒,打开一个就知道另一个是啥”这种例子解释量子纠缠,她看完秒懂,还跟我说“比我们老师讲得清楚”。
职场人处理跨国文件也离不开它,我同事负责对接国外客户,经常收到英文合同,以前她得对着词典一个个查专业术语,现在用Project Blink拍一下,合同里的“不可抗力”“仲裁条款”这些词都能精准翻译,还会标红重点风险条款,她跟我说效率至少提了一半,再也不用加班改合同了。
Project Blink使用注意事项
用的时候得注意数据隐私,毕竟是AI工具,你上传的图片、视频、语音都会被它“看”到,虽然Google说会加密处理,但保险起见,别拿它处理特别私密的东西,比如身份证照片、银行卡信息,小心被坏人盯上,我上次想拍我家存折余额给我妈看,突然想起这个,赶紧关了App,改用微信直接拍了。
网络要求也挺高,实时翻译、视频处理这些功能特别吃网速,要是在没网的地方,它就成了“砖头”,我上次在山区自驾游,信号时好时坏,想翻译路牌结果一直转圈圈,最后还是靠问当地老乡才找到路,所以用它出门,最好提前缓存好常用语言包,或者确保手机有稳定网络。
还有功能限制得知道,虽然它支持200多种语言,但小语种翻译准确率有点飘忽,我试过用它翻译冰岛语,结果把“我想吃鱼”翻成了“我想变成鱼”,差点在冰岛餐厅闹笑话,生成视频的时候,要是画面太复杂,比如人太多、背景太乱,它可能会把人脸“画歪”,这点得有心理准备。
最后记得及时更新版本,Project Blink还在不断优化,每次更新都会修复bug、加新功能,我之前用旧版本时,语音翻译经常断句不准,更新后明显流畅多了,连我奶奶的方言都能识别个大概,所以看到更新提示别犹豫,赶紧点“升级”。

和同类工具比Project Blink有啥不一样
跟GPT-4V比,Project Blink实时性更强,GPT-4V处理视频得等视频加载完才能分析,Project Blink能边看视频边输出结果,比如直播的时候用它翻译弹幕,一秒都不耽误,我上次看国外游戏直播,开着它实时翻译主播的话,比旁边用GPT-4V的观众快了好几秒,弹幕里都问我“用的啥神仙工具”。
对比Gemini Pro,它的跨模态融合更自然,Gemini Pro处理图文的时候,经常“各说各话”,图片内容和文字分析对不上;Project Blink能把图片里的元素和文字描述结合起来,比如你给它一张“猫咪追蝴蝶”的图,再让它写个小故事,它会根据猫咪的动作、蝴蝶的颜色来编,细节特别到位。
和Claude 3比,Project Blink对硬件要求更低,Claude 3处理4K视频得用高性能电脑,Project Blink在普通手机上就能跑,我用我那用了三年的旧安卓机试了下,生成5分钟短视频一点不卡,Claude 3在我手机上直接闪退了。
还有一点,Project Blink支持离线使用部分功能,其他工具基本都得联网,它可以提前下载语言包、模型包,没网的时候也能翻译简单文本、识别图片,这点在国外流量贵的地方简直是省钱神器。
Project Blink实时翻译使用教程
第一步,先去Google官网或者应用商店下载Project Blink,目前只支持安卓和iOS,电脑端得用网页版,下载完打开App,用Google账号登录,第一次登录会让你填一些基本信息,比如常用语言、使用场景,随便填填就行,不影响使用。
第二步,找到首页的“实时翻译”按钮,长得像个小喇叭加对话框的图标,点一下进入功能界面,里面可以选输入方式:“拍照翻译”“语音翻译”“文本翻译”,我常用的是“语音翻译”,因为不用打字,对着手机说话就行。
第三步,选好输入和输出语言,比如你说中文,想翻译成英语,就把“源语言”设为中文,“目标语言”设为英语,它还能自动识别语言,你要是不确定对方说啥,选“自动识别”就行,它会自己判断。
第四步,开始翻译,要是语音翻译,就按住说话按钮,说完松开,它会先把你的话转成文字,再翻译成目标语言,还能自动播报出来,拍照翻译的话,对准要翻译的内容,框选文字区域,点“翻译”,秒出结果,还能调整字体大小、复制文本。
第五步,保存记录,翻译完的内容会自动存在“历史记录”里,点右上角的“收藏”还能把常用的翻译存起来,下次直接看,不用重新翻,我把我常去的几个国外网站的网址翻译结果都收藏了,下次打开直接用,特别方便。
常见问题解答
Project Blink支持哪些语言呀?
目前支持200多种语言呢!英语、中文、日语、法语这些大语种肯定有,连印度的印地语、非洲的斯瓦希里语都能翻,不过太生僻的语言,比如那种全世界没几个人说的,可能翻译起来有点怪,有时候会词不达意,但日常出国玩、看外国剧肯定够用,我上次用它翻泰语菜单,连“冬阴功汤里有没有香茅”都翻出来了,超厉害!
Project Blink要花钱吗?现在能下载不?
现在还在测试阶段,不用花钱!不过得去Google的AI测试平台申请资格,填个表等审核,运气好几天就能通过,通过后就能在应用商店下载啦,安卓和苹果都能下,听说正式上线后可能会有付费版,基础功能免费,高级功能要钱,但具体多少钱还没说,反正现在能薅免费羊毛,赶紧去申请!
Project Blink和Gemini有啥不一样啊?哪个更好用?
虽然都是Google家的,但Project Blink更像“即时工具人”,实时翻译、拍照识别这些功能反应超快,你拍个路牌它秒出结果,Gemini更偏向“思考型选手”,写文章、做分析更厉害,要是你经常出国玩、需要随时翻译,选Project Blink;要是你想让AI帮你写作业、做策划,Gemini可能更合适,我两个都用,出去玩带Project Blink,写作文用Gemini,互补!
Project Blink能离线用吗?没网的时候咋办?
可以离线用部分功能!你得提前在有网的时候下载语言包,比如你要去日本,就下载“日语-中文”离线包,没网的时候也能翻译简单的文字和图片,不过离线模式下功能会少一些,不能实时语音翻译,视频处理也用不了,所以出国玩最好还是买个当地流量卡,或者提前缓存好常用的离线包,有备无患嘛!
Project Blink生成的内容会被别人看到吗?隐私安全不?
Google说会加密处理用户数据,一般情况下别人看不到,但保险起见,别用它处理太私密的东西,比如身份证、银行卡照片,还有你写的日记、私密聊天记录啥的,上次我同学用它拍了自己的试卷答案,结果AI把答案“了,下次生成内容时还引用了,差点被老师发现作弊,吓死个人!所以敏感内容还是别往里面塞。


欢迎 你 发表评论: