毁灭你,与你何干?各种翻译软件被GPT4降维打击!
我因为工作的关系经常会用到翻译软件。
传统的翻译软件在我的印象里,翻译个简单的字词句还行,进行一整段文章英译中时,语言总不是特别通畅。但是总体不影响理解。
之前我的开源站点大量的文档需要中译英时,我对比了大量的翻译软件,对翻译结果也进行了比对,最后用了业内口碑比较好的DeepL,但是即便是DeepL出来的结果,我也不是特别满意,不能无脑复制粘贴。所以后来我对英文的结果进行了大量的修改和润色。整个文档翻译工作花了我一周的时间才完成。
但总体来说DeepL的确帮我节约了大概一半左右的时间。
最近2个月,gpt模型的升级,使得chat-gpt,openAI,GPT4等词汇火出了圈。
很多人觉得chat-gpt只是一个智能聊天机器人,其实我从chat-gpt刚出来的时候就开始接触,到现在为止基于GPT模型构建的各种应用已经成为我生活工作的必须品了。所以我就在想,GPT模型能否能代替翻译软件呢。
所以我找到了一个基于GPT3.5模型构建的一个翻译应用,并和其他主流翻译软件进行了对比。
不比不知道,一比吓一跳。
这时候我只想说:为什么chat-gpt不早点出啊!
我所测试的基于GPT模型所构建的翻译软件为:OpenAi Translator
,在github上可以获取到,是一个开源应用。我会把如何获取方式贴在文末。
这款软件的界面长这样:
界面非常简洁,可就是这个“小”东西,在我的测试过程中,几乎把所有的翻译软件吊起来打。这一切都是因为他背后的引擎是GPT。
所以说叼的不是这个软件,而是GPT,这个开源软件只不过把GPT的API包装成为了一个翻译客户端。
我们来看看GPT的翻译能力有多强大,作为对比,我拿来了谷歌翻译,DeepL,以及国内的有道翻译,百度翻译作为对比。
翻译文本我则选自BBC news的一段文字。
以下是英语原文:
What are you planning to cook when you next make something from scratch in the kitchen? A nice bit of salmon? Lamb chops? Or maybe a vegan pasta dish?
Whatever you have in mind, it will probably involve using some form of spice or herb - whether it's just a sprinkle of freshly ground black pepper, a hint of thyme, or a blizzard of cumin.
"Spice is the key," says UK TV chef and cookery book writer Parveen Ashraf - also known as the "Spice Queen". "It livens up food, gives it flavour, it makes it come alive."
She believes there's a clear current winner in the battle for our taste buds. "The spice I think that's really taken over is turmeric," she says. "Now next time you go out, you notice everything that's got turmeric in it. It's everywhere."
If you are a big fan of spicy food, then buying spices for your cooking is something you take for granted. Yet industry expert Donald Pratt says that demand for herbs and spices has actually risen strongly in recent years.
Mr Pratt, who is in charge of sourcing for US giant McCormick - the biggest spices and herbs company on the planet - says there are a number of factors behind the current strength of the market.
"We think the pandemic accelerated the aspect of everyone being a bit more sophisticated in the kitchen," he says.
"And you see younger generations getting into heat and flavour explorations all over the place. We see it across the board globally as cultures and cuisines come together."
He adds that increased health concerns are also playing a part. "The desire to eat healthier is a global trend. So more home cooking with natural ingredients, and replacing salt, sugar and fats with flavour from herbs and spices."
我们首先用谷歌翻译:
个人点评:其实有很明显的机器翻译痕迹,读起来总体不大顺畅。其中有多处翻译过于生硬,并且有翻译错误。
具体有问题的地方我们一一分析下:
第一句就有问题
What are you planning to cook when you next make something from scratch in the kitchen? A nice bit of salmon? Lamb chops? Or maybe a vegan pasta dish?
当你下次在厨房里从头开始做一些东西时,你打算做什么?来点鲑鱼好吗?羊排?或者也许是素食面食?
前面半句其实尚可,后面一句就是硬生生的翻译了,而且还有些翻译错误,比如salmon虽然也有鲑鱼的意思,但是这里应该是三文鱼的意思,pasta dish是意大利面的意思,但是都没翻译出来。按照中文表达习惯,这里应该翻译成这样更通顺些。
当你下次在厨房里从头开始做一些东西时,你打算做什么?一块美味的三文鱼?羊排?还是素食面食?
第二段语句不通顺
Whatever you have in mind, it will probably involve using some form of spice or herb
无论您有什么想法,它都可能涉及使用某种形式的香料或香草
这句翻译中文读起来太奇怪了。虽然意思大家都能理解。
第三段翻译勉强可以,有一处翻译错误
“香料是关键,”英国电视主厨和烹饪书籍作家帕文阿什拉夫(Parveen Ashraf)说道,他也被称为“香料女王”。
都已经是“香料女王”了,这里翻译竟然是“他”,不应该是“她”么?
第五段中
If you are a big fan of spicy food, then buying spices for your cooking is something you take for granted.
如果您是辛辣食物的忠实拥护者,那么为您的烹饪购买香料是理所当然的事情。
这里完全是直译,后半句太生硬了,这里应该这样翻译比较好:
如果您是辛辣食物的忠实拥护者,那么购买用于烹饪的香料对你来说理所当然。
第七段中
"We think the pandemic accelerated the aspect of everyone being a bit more sophisticated in the kitchen," he says.
“我们认为这种流行病加速了每个人在厨房里变得更加老练的一面,”他说。
这里“the pandemic accelerated the aspect of everyone”虽然直译是“影响每个人的流行病”,但是这里指代什么呢,结合我们当下的情况,这里应该指代“疫情”。
“更加老练的一面”,这样翻译真的通顺么?
第八段中
And you see younger generations getting into heat and flavour explorations all over the place.
你会看到年轻一代到处都在探索热度和风味。
其实上文提到的调味品主体是“姜黄”,所以这里的"heat"应该是辛辣的风味。这是一个上下文理解的能力,让机器翻译的确是有点难。
其实还有很多地方,翻译的不够好。可以看到,即便是谷歌翻译,也基本上是直译的水平。
我们接下来看看有道翻译,百度翻译和DeepL的结果,我就直接贴翻译后的图了,不仔细比对了。
有道翻译 :
百度翻译:
DeepL:
总的来说,三个翻译软件各有问题。其中,百度和有道识别了“疫情”这个指代。但是语句没DeepL通顺。DeepL也有问题,有一些翻译显得很荒唐,比如“一条漂亮的三文鱼”,“暴风雪般的孜然”。
但是总体来说,这3个翻译软件都比谷歌翻译来的准确很多。
接下来轮到GPT出场了。
GPT:你们都翻译的是什么玩意儿,统统给我闪一边去!我来展示下高端操作!
直接放结果:
我觉得GPT翻译比较出彩的地方有:
Whatever you have in mind, it will probably involve using some form of spice or herb - whether it's just a sprinkle of freshly ground black pepper, a hint of thyme, or a blizzard of cumin.
无论你想要做什么,它可能都需要使用某种形式的香料或草药——无论是刚磨碎的黑胡椒粉、少许百里香还是大量孜然。
这句翻译的非常自然,比前4个翻译高明了不少。
"The spice I think that's really taken over is turmeric," she says. "Now next time you go out, you notice everything that's got turmeric in it. It's everywhere."
“我认为真正占据主导地位的调味品是姜黄。”她说,“现在下次出门时,你会注意到所有含姜黄成分的东西。它随处可见。”
这句翻译“随处可见”这个词语用的非常好,其他翻译软件中翻译成“无处不在”,“到处都是”就显得非常别扭。
"We think the pandemic accelerated the aspect of everyone being a bit more sophisticated in the kitchen," he says.
“我们认为疫情加速了每个人在厨房里变得更加精致的方面。”他说。
这句更是秒杀了其他翻译软件,其他翻译软件要么翻译成“加速了xxx复杂的一面”,要么就是“加速了xxx更加老练的一面”,GPT的翻译更加贴近自然语言。使用的词自然且精准。
"And you see younger generations getting into heat and flavour explorations all over the place. We see it across the board globally as cultures and cuisines come together."
“你会看到年轻一代人在各个地方进行辣味和口感探索。随着文化和美食融合,我们在全球范围内都能看到这种趋势。”
这个翻译更是理解了上下文之后的结果,heat翻译成了“辣味”,而不是其他翻译软件的“热量”
其实你仔细看GPT的翻译结果,你会觉得非常自然,没有很生硬的感觉,就像是原本用中文写的段落一样。
其实在英译中方面,讲究的是信,达,雅。
“信”就是忠于原文,“达”指的是流畅顺滑,用接近母语自然方式表达,“雅”就是优雅,要结合上下文优雅有灵性的表达。
很多我们现在使用的翻译软件,虽然有一些的确使用了一部分AI翻译,但是由于训练数据量的不足。还没法真正实现信达雅。
而GPT作为人类目前发明的最强人工智能模型,在翻译表现中,非常优秀,信达雅都达到了预期水平。我觉得GPT模型的优势是能真正理解文字的内容,然后做出翻译。这是其他翻译软件所做不到的。
我后来又尝试了其他英文段落,总体上可以用这句话来形容GPT的翻译水平:“吊打一切我目前已知翻译软件”。
不光能翻译,在这款开源软件中,当你选中翻译的英文,它会给出为什么要这么翻译的原因,以及例句。
这让我直接惊呼:666
还有更加厉害的功能,这款开源软件能对文章进行总结,提取中心思想:
还能对文本进行润色,分析,以及解释代码。这我就不一一演示了。留给读者你们自己探索吧。
回过头来仔细想,其实GPT吊打传统翻译软件,是必然的事情。因为GPT的训练量数据极大,GPT3有1000亿个参数,而GPT4更是夸张的达到了1.6万亿,是GPT3的16倍。它的数据量几乎涵盖了我们人类迄今为止所有的知识,并能根据这些知识形成自己的“认知体系”,几乎在各个方面都表现出令人惊讶的一面,翻译真的只是他九牛一毛的能力展现。
这样说起来,GPT对传统翻译软件就不能用“吊打”来形容了,这就是一个降维打击!
借用三体里的一句话就是:毁灭你,与你何干!
最后给出这款开源软件的下载地址:
要说明的是:并不是下载了就能用的,需要填入chat-gpt的API KEY,以及需要“网络支持”。至于如何获取API KEY和解决网络问题,本文不做说明。
文章转载自公众号:元人部落