本文第一作者是徐婷,是香港中文大学博士生,主要研究兴趣是大模型的后训练;通讯作者分别是黄志超和程善伯,来自字节跳动Seed团队。
现在,这些问题迎来了新的解决方案。来自香港中文大学、字节跳动 Seed 和斯坦福大学的研究团队联手提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)
该方法将同传任务巧妙地建模为序贯决策过程,通过优化完整的决策序列,显著提升了翻译质量,同时有效控制了延迟,其性能直逼、甚至在某些方面超越了同等大小的离线翻译模型。
同声传译的核心在于机器需要动态地决定 “继续听”(READ)还是 “开始说”(WRITE)。这个决策直接影响最终的翻译效果。例如,当模型接收到英文单词 “bark” 时,它面临一个困境:如果立即翻译,可能会译为 “狗叫”,但若后文出现 “of the tree”,则正确翻译应为 “树皮”。
传统的同传方法,它每一步决策(是继续听,还是开始翻译)都是孤立的。它可能会因为眼前的 “小利”(比如翻译出一个词)而牺牲掉全局的 “大利”(整个句子的流畅度和准确性)。
针对这一难点,该论文提出了 SeqPO-SiMT 框架。其核心思想是将同声传译任务建模为一个序贯决策问题,综合评估整个翻译流程的翻译质量和延迟,并对整个决策序贯进行端到端的优化。
该方法的主要特点是:它不再孤立地评估每一步决策的好坏,而是将一整句话的翻译过程(即一个完整的决策序贯)视为一个整体,更符合人类对同传的评估过程。
为了验证方法的有效性,研究者们在多个公开的英汉互译测试集上进行了实验,并与多种现有的同传模型进行了对比。实验结果显示:在低延迟水平下,SeqPO-SiMT 框架生成的译文质量相较于基线模型有明显提升。
本文将 SeqPO-SiMT 的实时同传结果与多个高性能模型的离线翻译结果进行对比。结果显示,SeqPO-SiMT 的翻译质量不仅优于监督微调(SFT)的离线模型及 LLaMA-3-8B,其表现甚至能媲美乃至超越 Qwen-2.5-7B 的离线翻译水平。这表明该方法在 70 亿参数(7B)规模上实现了业界顶尖(SoTA)的性能。
总的来说,SeqPO-SiMT 这项工作的主要贡献在于,为解决同声传译中的质量 - 延迟权衡问题提供了一个新的视角。它强调了对决策 “序贯” 进行整体优化的重要性。该研究提出的方法,对于需要进行实时、连续决策的自然语言处理任务具有一定的参考意义,并为未来开发更高效、更智能的同声传译系统提供了有价值的探索。
3DMAX9喷射2D3D区别罗维拉的合同中存在5000万欧元的解约金条款,不过马泰奥-莫雷托指出,国米要想完成交易还需要说服罗维拉本人同意加盟。罗维拉在拉齐奥很开心,对俱乐部很有感情,他目前专注于自己在拉齐奥的未来。而拉齐奥新主帅萨里也对罗维拉非常看重,认为他是球队的基础球员。你和塞巴斯蒂亚诺作为兄弟同时代表国米登场,这已经载入了俱乐部历史。此外,你还与队长劳塔罗并肩作战。能跟我们讲讲这些感受吗?3DMAX9喷射2D3D区别www.xjxjxj18.gov.cn据悉,特雷-杨依然会是老鹰的门面,并且据一位消息人士透露,特雷-杨非常有动力将老鹰重新带回东部季后赛的竞争行列,使球队成为真正的威胁。媒体人Gallagher写道:“如今NBA交易的乐趣在于,几乎每一次交易都让人想起尼科(哈里森)是NBA历史上最烂的总经理,而他居然还在做这份工作简直就是个笑话。父亲节快乐!”
20251207 👄 3DMAX9喷射2D3D区别那么换成近期火爆的苏超球队来踢奥克兰城呢?估计赢不了。因为苏超的球员绝大多数也都不是职业球员,来自各行各业,基本功、训练的专业性、比赛经验等等,都不如奥克兰城。17cao.gov.cn在行业使能套件方面,基于华为深入行业的实践积累,华为云Stack围绕7大行业沉淀了40+开箱即用的Agent模板,助力业务分钟级上线;同时提供工业AI引擎,聚焦视觉质检、工艺优化、预测性维护和生产计划4大核心领域打造了18个场景化工作流,使能政企更快速、更精准地应对复杂工业场景的挑战。
📸 段小慧记者 刘志国 摄
20251207 💃 3DMAX9喷射2D3D区别截至发稿时,韦中平养殖场无防渗漏措施的粪池已被抽干、生猪已被调离,谷里屯的泉水肉眼看起来恢复了清澈,但村民出于担心,不敢饮用。柳城县人民政府协调水利部门为谷里屯钻井解决用水问题。村民们不知道,泉水的水质何时才能恢复如初。77788.gov.cn【环球网报道】当地时间6月14日,美国政府在首都华盛顿举行阅兵式,以纪念美国陆军成立250周年,当天也是美国总统特朗普的79岁生日。然而,据路透社等多家外媒报道,全美各地同日爆发大规模反特朗普政府集会,数十万民众走上街头参与抗议。部分地区抗议现场发生冲突,有示威者向警方投掷石块等物品。
📸 李景深记者 李宏伟 摄
🔞 IT之家援引博文介绍,上周五举办的加拿大广播电视和电信委员会(CRTC)咨询会上,加拿大竞争局副局长 Brad Callaghan 指出,互联网和电话服务不应该仅列出基础价格再通过小字隐藏额外费用,而是应该像食品包装上的标签一样,让消费者一目了然地知道这些信息。www.8x8x.gov.cn