让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

栏目分类
热点资讯
马鞍山新闻综合频道
你的位置:今天重大新闻事件 > 马鞍山新闻综合频道 > 最近发生的重大新闻事件 鹅厂造了个AI翻译公司:专攻相聚演义,自动适配言语作风,真东说念主和GPT-4看了都说好
最近发生的重大新闻事件 鹅厂造了个AI翻译公司:专攻相聚演义,自动适配言语作风,真东说念主和GPT-4看了都说好

发布日期:2024-05-29 21:37    点击次数:125

鹅厂搞了个150多东说念主的“翻译公司”,从雇主到职工都是AI智能体!

主买卖务是翻译相聚演义,质地极高,参与评价的读者以为比真东说念主翻译得还要好。

而况比拟于雇佣真东说念主,用它来翻译文学作品,资本裁减了近80倍。

公司名为TransAgents,每个岗亭都配备了30个不同的职工,能够根据言语、文体和主义受众适配不同的翻译作风。

比拟于传统的翻译,产出的译文愈加纯真万般,也更妥当主义言语的抒发俗例,文学性也更强。

是以,TransAgents诚然在以相似度为基础的自动评估中“失败”,却赢得了读者和专科东说念主士的鼎力确定。

这么的进展以致让东说念主钦慕说,梗概东说念主类对东说念主工智能生成的内容愈加好奇的期间,就要来了。

还有东说念主示意,TransAgents是解说我方错看了东说念主工智能的又一凭据——本以为由于模子终端,演义的翻译对AI会极其费劲,终端AI智能体把这个任务完成得相等好。

是以,TransAgents到底有莫得那么神呢?

真东说念主和GPT-4都说好

为了评估TransAgents的翻译质地,作家聘用了WMT2023数据集,需要对其进行篇章级的文学翻译。

该数据集从12部相聚演义中各截取了20个相连的章节,触及如下八种类型:

游戏类(Video Games,VG)

东方奇幻类(Eastern Fantasy,EF)

科幻爱情类(Sci-fi Romance,SR)

现代爱情类(Contemporary Romance,CR)

奇幻类(Fantasy,F)

科幻类(Science Fiction,SF)

恐怖惊悚类(Horror & Thriller,HT)

奇幻爱情类(Fantasy Romance,FR)

起初,作家使用d-BLEU进行了自动评估,该本事会与参考样本进行相似度狡计,相似度越高得分也就越高。

具体到本样式当中,参考样本一共有两组,样本一是东说念主工给出的翻译终端,样本二是对采聚合的双语文本进行对王人后得到。

终端,TransAgents的得分并不睬念念,只须25分,连SOTA的一半都不到。

但这并不料味着TransAgents的翻译质地不成,而是因为用相似度来探究文学作品翻译的进展,自身就有失偏颇。

文学翻译不是逐字对照,而是需要在语义、口吻、作风等方面进行创造性的调节,这些调节可能导致译文与参考译文在名义上相反较大,相似度不高天然就不料外了。

是以,作家干脆径直让真东说念主(至少10东说念主)来评价翻译的质地,趁机也让GPT-4(0125-Preview)来看了看,在TransAgents、GPT-4(1106-Preview)和真东说念主当中,谁的翻译最佳。

测评者会看到针对磨灭段原文的不同翻译,其中真东说念主只看译文,GPT-4则是原文译文都看。

终端,真东说念主测评者有超越一半都以为TransAgents比东说念主类翻译得更好,8.4%以为两者质地荒谬,GPT-4也以为TransAgents比我方(和东说念主类)的翻译质地高。

除了这些群众评审除外,两名专科的翻译也以为,诚然东说念主工翻译愈加针织于原文,但TransAgents给出的翻译显然更有文学色调,愈加精真金不怕火、在遣意用句上体现出了言语禀赋和深厚的文学进展力。

MATTR和MTLD测试盘算推算也解说了这少许,尤其是在MTLD上,TransAgents的言语万般性比真东说念主和GPT-4越过了三分之一左右。

在作家展示的案例中,TransAgents会根据主义言语的俗例对翻译内容作念出调理,真东说念主(Ref1)和GPT-4诚然翻的也没错,但比拟之下不如TransAgents妥当言语俗例。

另外皮前后一致性上,TransAgents也超越了单纯使用GPT-4,对疏导的原文保持使用相同的译文。

天然,也不是说悉数类型它都擅长,在前边提到的8种类型中,TransAgents在游戏、科幻爱情等类型上的进展杰出,而在恐怖惊悚等类型上就比较泛泛了。

图中虚线代表50%Win rate

同期作家也发现,TransAgents在翻译时并非“照单全收”,而是会出现一定进程的遗漏温顺。

不外从测试中未看过原文的读者给出的评分来看,这么的遗漏似乎莫得影响到他们的阅读体验。

是以,这家“翻译公司”是如何运行的呢?

多智能体单干调解

在这个公司当中,不同的智能体隔离演出着CEO、初/高等剪辑、真·翻译、腹地化行家和校对(Proofreader)这些不同的职位,除CEO外每个职位各有30东说念主,每个东说念主擅长的领域也有所不同,另外还有一个Ghost Agent。

这些智能体由GPT-4-Turbo驱动,每个扮装都包含姓名、年事、职位、责任年限及掌持的言语等多维度的设定。

www.482838.com

接到“客户”的翻译条目后,CEO会综合分析原文和主义言语、文体、主义受众等信息,从几位高等剪辑中聘用擅长领域最匹配的一位。

此时,Ghost Agent会对CEO的聘用进行评估,讲演其东说念主选是否合适,从而减少聘用失当的温顺。

被采用的高等剪辑会与CEO合作,再次聚合任务需乞降个东说念主特色,从公司东说念主才库中进一步聘用低级剪辑、翻译、腹地化行家和校平等团队成员。

团队组建好后,最初由低级剪辑逐章节识别悉数潜在的重要术语,生成启动术语表,交由高等剪辑审查,删除其中的通用术语,生成改良后的术语表,反复迭代直到不需要进一步修改。

然后,聚合术语在不同语境下的意旨,高等剪辑会将术语表中的重要术语翻译为主义言语。

有了术语表后,低级剪辑会为每一章生成看重的章节节录,尽可能保留重要信息和细节,然后如故让高等剪辑来审查,并删除冗余或无须要的信息,让章节节录愈加长话短说。

接着,高等剪辑根据改良后的章节节录编写全书的节录,详细主要情节、东说念主物和主题,独立时聘用书中的一章,分析其口吻、作风和主义受众,制定翻译作风指南。

翻译作风指南会发送给样式团队悉数成员,以确保译文作风的一致性。

根据作风指南,公司中的真·舌人会逐章节进行初步翻译,把初稿交给低级剪辑审查,搜检是否死守翻译作风指南,并淡薄创新看法。

在此基础之上,高等剪辑会评估经过修改的译文质地,决定是否需要进一步修改,舌人、低级剪辑和高等剪辑反复迭代,直到译文质地安静条目。

但此时得到的翻译文本并不是终稿,还要交给腹地化行家进行调理。行家会识别可能需要文化调适的内容,如习语、隐喻等等,并对这些内容进行调理,使其在保留原文意图的基础之上更逼近主义言语和文化。

调理后的文本会让低级剪辑和高等剪辑再次审查,确保译文在文化适合性和针织度之间赢得均衡。

这之后,还有校对东说念主员再次搜检语法、拼写、标点和神情造作,如若有修改,还要再让剪辑进一步审核。

这些经过都走完后,高等剪辑会进行临了的终审,要点怜惜相邻章节之间的连贯性,确保情节、东说念主物、主题等元素在全书范围内保持一致,一朝发现问题则发还给前边的团队成员进行修改,直到酿成最终的译本。

如若客户对译本有修改看法,则会再次由高等剪辑牵头,组织干系东说念主员进行修改,直到定稿。

不仅是在责任经过上极其严格步地,在客户对译本舒心后,高等剪辑还会组织样式团队“开会”进行样式转头,共享阅历阅历。

过程中蕴蓄的有价值的术语、翻译妙技、文化调适计策等学问会被整理归纳,上传至公司的学问库,供后续样式参考。

One More Thing

TransAgents如故不是第一个由智能体构成的“公司”了,客岁就有来自清华的“游戏公司”ChatDev爆红相聚,背后所期骗的中枢技艺即是多智能体。

如若把视野放宽,不单看“公司”,还有斯坦福的AI小镇、清华的AI狼东说念主杀游戏,都在使用多智能体进行着确切东说念主类社会的模拟。

总之跟着大模子盘问的深化,智能体和群体智能践诺已成AI盘问最热点主义之一,而况从此次的TransAgents来看,多智能体协同如故开头清爽出了内容效益。

(趁机提一句,有网友发现,从斯坦福小镇到ChatDev,再到此次的TransAgents,多智能体盘问的作家是确切可爱《星露谷物语》式的画图作风。)

天然,也有东说念主对此示意了担忧,以为由AI来主导翻译,会导致言语的同质化,让各式言语中私有的抒发湮灭。

更有甚者,如故跳出TransAgents自身,念念到Ilya对大范围Agent合作的畏忌了……

那么你以为在群体智能这条路上还能创造出什么新奇的恶果呢?接待在批驳区晒出你的脑洞。

— 完 —最近发生的重大新闻事件



腾讯qq新闻 马鞍山新闻综合频道 石城新闻 合川新闻 中国焦点新闻网