北京時間8月5日,國際頂級學(xué)術(shù)會議ACL 2021正式頒發(fā)“最佳論文”獎項,字節(jié)跳動AI Lab的機器翻譯技術(shù)論文在3350篇論文投稿中脫穎而出,當(dāng)選今年度“最佳論文”。這是ACL成立59年以來,華人科學(xué)家團隊第二次贏得最高獎項,此前由中科院計算所主導(dǎo)的研究項目曾被評為ACL 2019“最佳長論文”。 ACL大會由國際計算語言學(xué)協(xié)會主辦,是自然語言處理與計算語言學(xué)領(lǐng)域最高級別的學(xué)術(shù)會議。自然語言處理被譽為“人工智能皇冠上的明珠”,在機器翻譯、搜索、信息流、輸入法等領(lǐng)域有著廣泛的應(yīng)用。 近年來ACL大會接收的投稿量持續(xù)上升,華人團隊在該領(lǐng)域研究取得了舉世矚目的成績,過去數(shù)年間曾獲得“最佳長論文”、“最佳學(xué)生論文”和“杰出論文”獎項。今年除了字節(jié)跳動贏得最高榮譽,大會還評出了六篇“杰出論文”,香港中文大學(xué)與騰訊AI Lab的合作論文成功入選。 字節(jié)跳動的獲獎?wù)撐奶岢鲆环N新的詞表學(xué)習(xí)方案VOLT。詞表是所有自然語言處理任務(wù)都會使用的基礎(chǔ)組件,其作用就像人類查字典的索引。研究人員創(chuàng)新地把經(jīng)濟學(xué)和數(shù)學(xué)的知識運用到詞表中:首先用“邊際收益”定義了詞表質(zhì)量的評價指標(biāo),然后以“最優(yōu)運輸”的數(shù)學(xué)方法解決最優(yōu)詞表的生成問題,從而在多種翻譯任務(wù)上取得出色的效果。VOLT研究項目現(xiàn)已向全球開發(fā)者開源。 ACL官方評審認(rèn)為,“字節(jié)跳動的VOLT方案對機器翻譯中一個重要問題提出了有效且新穎的解決方案,能顯著減少詞表的學(xué)習(xí)和搜索時間,相信其不僅會在研究界產(chǎn)生重要影響,在工業(yè)應(yīng)用方面也有著巨大潛力”。 據(jù)悉,最佳論文研究成果將在字節(jié)跳動的火山翻譯業(yè)務(wù)中逐步落地,為飛書、今日頭條等產(chǎn)品和火山引擎的企業(yè)級客戶提供機器翻譯支持。2021年以來,火山翻譯實現(xiàn)多項重要技術(shù)突破,研發(fā)出支持150個語種互譯的大規(guī)模翻譯模型mRASP2,并對外開源了當(dāng)前業(yè)界最快的推理和訓(xùn)練引擎LightSeq2.0,以及端到端語音翻譯工具包NeurST,獲得開源社區(qū)的廣泛好評。 在此前由ACL舉辦的機器翻譯大賽WMT2021上,火山翻譯以獨創(chuàng)的“并行翻譯”系統(tǒng)參賽,奪得德語到英語方向比賽自動評估第一名。“并行翻譯”在國際賽事中首次亮相,就擊敗了從左向右逐詞翻譯的傳統(tǒng)技術(shù),打破后者在機器翻譯領(lǐng)域的絕對統(tǒng)治地位,這項技術(shù)的論文也得到ACL 2021大會收錄。(李記)
|