最近发生的重大新闻事件鹅厂造了个AI翻译公司：专攻相聚演义，自动适配言语作风，真东说念主和GPT-4看了都说好

栏目分类

热点资讯

马鞍山新闻综合频道

你的位置：今天重大新闻事件 > 马鞍山新闻综合频道 > 最近发生的重大新闻事件鹅厂造了个AI翻译公司：专攻相聚演义，自动适配言语作风，真东说念主和GPT-4看了都说好

发布日期：2024-05-29 21:37 点击次数：125

鹅厂搞了个150多东说念主的“翻译公司”，从雇主到职工都是AI智能体！

主买卖务是翻译相聚演义，质地极高，参与评价的读者以为比真东说念主翻译得还要好。

而况比拟于雇佣真东说念主，用它来翻译文学作品，资本裁减了近80倍。

公司名为TransAgents，每个岗亭都配备了30个不同的职工，能够根据言语、文体和主义受众适配不同的翻译作风。

比拟于传统的翻译，产出的译文愈加纯真万般，也更妥当主义言语的抒发俗例，文学性也更强。

是以，TransAgents诚然在以相似度为基础的自动评估中“失败”，却赢得了读者和专科东说念主士的鼎力确定。

这么的进展以致让东说念主钦慕说，梗概东说念主类对东说念主工智能生成的内容愈加好奇的期间，就要来了。

还有东说念主示意，TransAgents是解说我方错看了东说念主工智能的又一凭据——本以为由于模子终端，演义的翻译对AI会极其费劲，终端AI智能体把这个任务完成得相等好。

是以，TransAgents到底有莫得那么神呢？

真东说念主和GPT-4都说好

为了评估TransAgents的翻译质地，作家聘用了WMT2023数据集，需要对其进行篇章级的文学翻译。

该数据集从12部相聚演义中各截取了20个相连的章节，触及如下八种类型：

游戏类（Video Games，VG）

东方奇幻类（Eastern Fantasy，EF）

科幻爱情类（Sci-fi Romance，SR）

现代爱情类（Contemporary Romance，CR）

奇幻类（Fantasy，F）

科幻类（Science Fiction，SF）

恐怖惊悚类（Horror & Thriller，HT）

奇幻爱情类（Fantasy Romance，FR）

起初，作家使用d-BLEU进行了自动评估，该本事会与参考样本进行相似度狡计，相似度越高得分也就越高。

具体到本样式当中，参考样本一共有两组，样本一是东说念主工给出的翻译终端，样本二是对采聚合的双语文本进行对王人后得到。

终端，TransAgents的得分并不睬念念，只须25分，连SOTA的一半都不到。

但这并不料味着TransAgents的翻译质地不成，而是因为用相似度来探究文学作品翻译的进展，自身就有失偏颇。

文学翻译不是逐字对照，而是需要在语义、口吻、作风等方面进行创造性的调节，这些调节可能导致译文与参考译文在名义上相反较大，相似度不高天然就不料外了。

是以，作家干脆径直让真东说念主（至少10东说念主）来评价翻译的质地，趁机也让GPT-4（0125-Preview）来看了看，在TransAgents、GPT-4（1106-Preview）和真东说念主当中，谁的翻译最佳。

测评者会看到针对磨灭段原文的不同翻译，其中真东说念主只看译文，GPT-4则是原文译文都看。

终端，真东说念主测评者有超越一半都以为TransAgents比东说念主类翻译得更好，8.4%以为两者质地荒谬，GPT-4也以为TransAgents比我方（和东说念主类）的翻译质地高。

除了这些群众评审除外，两名专科的翻译也以为，诚然东说念主工翻译愈加针织于原文，但TransAgents给出的翻译显然更有文学色调，愈加精真金不怕火、在遣意用句上体现出了言语禀赋和深厚的文学进展力。

MATTR和MTLD测试盘算推算也解说了这少许，尤其是在MTLD上，TransAgents的言语万般性比真东说念主和GPT-4越过了三分之一左右。

在作家展示的案例中，TransAgents会根据主义言语的俗例对翻译内容作念出调理，真东说念主（Ref1）和GPT-4诚然翻的也没错，但比拟之下不如TransAgents妥当言语俗例。

另外皮前后一致性上，TransAgents也超越了单纯使用GPT-4，对疏导的原文保持使用相同的译文。

天然，也不是说悉数类型它都擅长，在前边提到的8种类型中，TransAgents在游戏、科幻爱情等类型上的进展杰出，而在恐怖惊悚等类型上就比较泛泛了。

△

图中虚线代表50%Win rate

同期作家也发现，TransAgents在翻译时并非“照单全收”，而是会出现一定进程的遗漏温顺。

不外从测试中未看过原文的读者给出的评分来看，这么的遗漏似乎莫得影响到他们的阅读体验。

是以，这家“翻译公司”是如何运行的呢？

多智能体单干调解

在这个公司当中，不同的智能体隔离演出着CEO、初/高等剪辑、真·翻译、腹地化行家和校对（Proofreader）这些不同的职位，除CEO外每个职位各有30东说念主，每个东说念主擅长的领域也有所不同，另外还有一个Ghost Agent。

这些智能体由GPT-4-Turbo驱动，每个扮装都包含姓名、年事、职位、责任年限及掌持的言语等多维度的设定。

www.482838.com

接到“客户”的翻译条目后，CEO会综合分析原文和主义言语、文体、主义受众等信息，从几位高等剪辑中聘用擅长领域最匹配的一位。

此时，Ghost Agent会对CEO的聘用进行评估，讲演其东说念主选是否合适，从而减少聘用失当的温顺。

被采用的高等剪辑会与CEO合作，再次聚合任务需乞降个东说念主特色，从公司东说念主才库中进一步聘用低级剪辑、翻译、腹地化行家和校平等团队成员。

团队组建好后，最初由低级剪辑逐章节识别悉数潜在的重要术语，生成启动术语表，交由高等剪辑审查，删除其中的通用术语，生成改良后的术语表，反复迭代直到不需要进一步修改。

然后，聚合术语在不同语境下的意旨，高等剪辑会将术语表中的重要术语翻译为主义言语。

有了术语表后，低级剪辑会为每一章生成看重的章节节录，尽可能保留重要信息和细节，然后如故让高等剪辑来审查，并删除冗余或无须要的信息，让章节节录愈加长话短说。

接着，高等剪辑根据改良后的章节节录编写全书的节录，详细主要情节、东说念主物和主题，独立时聘用书中的一章，分析其口吻、作风和主义受众，制定翻译作风指南。

翻译作风指南会发送给样式团队悉数成员，以确保译文作风的一致性。

根据作风指南，公司中的真·舌人会逐章节进行初步翻译，把初稿交给低级剪辑审查，搜检是否死守翻译作风指南，并淡薄创新看法。

在此基础之上，高等剪辑会评估经过修改的译文质地，决定是否需要进一步修改，舌人、低级剪辑和高等剪辑反复迭代，直到译文质地安静条目。

但此时得到的翻译文本并不是终稿，还要交给腹地化行家进行调理。行家会识别可能需要文化调适的内容，如习语、隐喻等等，并对这些内容进行调理，使其在保留原文意图的基础之上更逼近主义言语和文化。

调理后的文本会让低级剪辑和高等剪辑再次审查，确保译文在文化适合性和针织度之间赢得均衡。

这之后，还有校对东说念主员再次搜检语法、拼写、标点和神情造作，如若有修改，还要再让剪辑进一步审核。

这些经过都走完后，高等剪辑会进行临了的终审，要点怜惜相邻章节之间的连贯性，确保情节、东说念主物、主题等元素在全书范围内保持一致，一朝发现问题则发还给前边的团队成员进行修改，直到酿成最终的译本。

如若客户对译本有修改看法，则会再次由高等剪辑牵头，组织干系东说念主员进行修改，直到定稿。

不仅是在责任经过上极其严格步地，在客户对译本舒心后，高等剪辑还会组织样式团队“开会”进行样式转头，共享阅历阅历。

过程中蕴蓄的有价值的术语、翻译妙技、文化调适计策等学问会被整理归纳，上传至公司的学问库，供后续样式参考。

One More Thing

TransAgents如故不是第一个由智能体构成的“公司”了，客岁就有来自清华的“游戏公司”ChatDev爆红相聚，背后所期骗的中枢技艺即是多智能体。

如若把视野放宽，不单看“公司”，还有斯坦福的AI小镇、清华的AI狼东说念主杀游戏，都在使用多智能体进行着确切东说念主类社会的模拟。

总之跟着大模子盘问的深化，智能体和群体智能践诺已成AI盘问最热点主义之一，而况从此次的TransAgents来看，多智能体协同如故开头清爽出了内容效益。

（趁机提一句，有网友发现，从斯坦福小镇到ChatDev，再到此次的TransAgents，多智能体盘问的作家是确切可爱《星露谷物语》式的画图作风。）

天然，也有东说念主对此示意了担忧，以为由AI来主导翻译，会导致言语的同质化，让各式言语中私有的抒发湮灭。

更有甚者，如故跳出TransAgents自身，念念到Ilya对大范围Agent合作的畏忌了……

那么你以为在群体智能这条路上还能创造出什么新奇的恶果呢？接待在批驳区晒出你的脑洞。

— 完 —最近发生的重大新闻事件

上一篇：近8期区间比为13:15:12合川新闻

下一篇：最近发生的重大新闻事件厦门大学的食堂残暴本好有真谛

让建站和SEO变得简单