您的位置:首頁(yè) > 資訊 > 行業(yè)動(dòng)態(tài) > 正文

翻譯要失業(yè)?微軟中英翻譯機(jī)器人通過測(cè)試,可媲美人類將商用

2018-03-16 08:01 性質(zhì):轉(zhuǎn)載 作者:AI財(cái)經(jīng)社 來源:AI財(cái)經(jīng)社
免責(zé)聲明:中叉網(wǎng)(m.m21363.cn)尊重合法版權(quán),反對(duì)侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn),與本網(wǎng)無關(guān)。如有需要?jiǎng)h除,敬請(qǐng)來電商榷?。?/div>
3月14日,微軟宣布,其研發(fā)的機(jī)器翻譯系統(tǒng),在通用新聞報(bào)道測(cè)試集newstest2017的中英測(cè)試集上,達(dá)到了可與人工翻譯媲美的水平。這是首...

  3月14日,微軟宣布,其研發(fā)的機(jī)器翻譯系統(tǒng),在通用新聞報(bào)道測(cè)試集newstest2017的中英測(cè)試集上,達(dá)到了可與人工翻譯媲美的水平。這是首個(gè)在新聞報(bào)道的翻譯質(zhì)量和準(zhǔn)確率上可比肩人工翻譯的翻譯系統(tǒng)。
 
  為了確保翻譯結(jié)果準(zhǔn)確且達(dá)到人類的翻譯水平,微軟研究團(tuán)隊(duì)邀請(qǐng)了雙語(yǔ)語(yǔ)言顧問,將微軟機(jī)翻結(jié)果與兩個(gè)不同的人工翻譯結(jié)果進(jìn)行比較。

  微軟技術(shù)院士,負(fù)責(zé)微軟語(yǔ)音、自然語(yǔ)言和機(jī)器翻譯工作的黃學(xué)東稱,這是對(duì)自然語(yǔ)言處理領(lǐng)域最具挑戰(zhàn)性任務(wù)的一項(xiàng)重大突破。“在機(jī)器翻譯方面達(dá)到與人類相同的水平是所有人的夢(mèng)想,我們沒有想到這么快就能實(shí)現(xiàn)?!彼硎?,“消除語(yǔ)言障礙,幫助人們更好地溝通,這非常有意義,值得我們多年來為此付出的努力?!?/P>

微軟技術(shù)院士黃學(xué)東

  機(jī)器翻譯是科研人員攻堅(jiān)了數(shù)十年的研究領(lǐng)域,曾經(jīng)很多人都認(rèn)為機(jī)器翻譯根本不可能達(dá)到人類翻譯的水平。盡管此次突破意義非凡,但這仍不代表人類已經(jīng)完全解決了機(jī)器翻譯的問題,只能說離終極目標(biāo)又近了一步。

  微軟機(jī)器翻譯團(tuán)隊(duì)研究經(jīng)理Arul Menezes解釋:當(dāng)一種語(yǔ)言(比如中-英)擁有較多的訓(xùn)練數(shù)據(jù),且翻譯的是常見的大眾類新聞詞匯時(shí),人工智能加持下的機(jī)器翻譯表現(xiàn)可以與人類媲美。

  近兩年來,深度神經(jīng)網(wǎng)絡(luò)的使用讓機(jī)器翻譯的表現(xiàn)取得了實(shí)質(zhì)性突破。相較于以往,機(jī)器翻譯結(jié)果變得更加自然流暢。

  微軟將他們的最新研究成果——對(duì)偶學(xué)習(xí)(Dual Learning)和推敲網(wǎng)絡(luò)(Deliberation Networks)應(yīng)用在了此次取得突破的機(jī)器翻譯系統(tǒng)中。微軟亞洲研究院副院長(zhǎng)、機(jī)器學(xué)習(xí)組負(fù)責(zé)人劉鐵巖介紹道,“這兩個(gè)技術(shù)的研究靈感其實(shí)都來自于我們?nèi)祟惖淖鍪路绞?。?/P>

  其中,對(duì)偶學(xué)習(xí)使得中文句子翻譯成英文之后,系統(tǒng)會(huì)將相應(yīng)的英文結(jié)果再翻譯回中文,并與原始的中文句子進(jìn)行比對(duì)。從這個(gè)比對(duì)中,機(jī)器會(huì)學(xué)習(xí)有用的反饋信息,對(duì)翻譯模型進(jìn)行修正。

  推敲網(wǎng)絡(luò)則類似于人們寫文章時(shí)不斷推敲、修改的過程。通過多輪翻譯,不斷地檢查、完善翻譯的結(jié)果,從而使翻譯質(zhì)量得到大幅提升。

微軟亞洲研究院副院長(zhǎng)、機(jī)器學(xué)習(xí)組負(fù)責(zé)人劉鐵巖

  周明帶領(lǐng)的自然語(yǔ)言計(jì)算組,多年來一直致力于攻克機(jī)器翻譯——這一自然語(yǔ)言處理領(lǐng)域最具挑戰(zhàn)性的研究任務(wù)。“翻譯沒有唯一的標(biāo)準(zhǔn)答案,它更像是一種藝術(shù),因此需要更加復(fù)雜的算法和系統(tǒng)去應(yīng)對(duì)?!敝苊鞅硎?。

  此次newstest2017新聞報(bào)道測(cè)試集,包括約2000個(gè)句子,由專業(yè)人員從報(bào)紙樣本翻譯而來。微軟團(tuán)隊(duì)每次會(huì)隨機(jī)挑選數(shù)百個(gè)句子翻譯。

  為了驗(yàn)證機(jī)器翻譯是否可以媲美人類翻譯,測(cè)試經(jīng)歷了極為復(fù)雜的驗(yàn)證過程。這是因?yàn)?,沒有所謂“正確的”翻譯結(jié)果,即使是兩位專業(yè)的翻譯人員,對(duì)同一個(gè)句子也會(huì)有略微不同的翻譯,而且兩個(gè)人的翻譯都不是錯(cuò)的。表達(dá)同一個(gè)句子的“正確的”方法不止一種。

  周明解釋:“這也是為什么機(jī)器翻譯比單純的語(yǔ)音識(shí)別復(fù)雜得多,人們可能用不同的詞語(yǔ)來表達(dá)完全相同的意思,但未必能準(zhǔn)確判斷哪一個(gè)更好?!?/P>

  相比之下,判斷語(yǔ)音識(shí)別能否媲美人類則相當(dāng)簡(jiǎn)單:標(biāo)準(zhǔn)答案是唯一的。

  這種沒有標(biāo)準(zhǔn)答案的任務(wù),使得機(jī)器翻譯成為一個(gè)極有挑戰(zhàn)、同時(shí)極富意義的問題。劉鐵巖表示,我們不知道哪一天,機(jī)器翻譯才能在面臨任何語(yǔ)種、任何類型的文本時(shí),都能在“信、達(dá)、雅”上媲美專業(yè)翻譯人員的水準(zhǔn)。但總體而言,他對(duì)技術(shù)的進(jìn)展表示樂觀,因?yàn)檎麄€(gè)學(xué)術(shù)界在持續(xù)發(fā)明大量的新技術(shù)、新模型和新算法,

  “我們可以預(yù)測(cè)的是,新技術(shù)的應(yīng)用一定會(huì)讓機(jī)器翻譯的結(jié)果日臻完善?!蔽④泩F(tuán)隊(duì)還表示,此次技術(shù)突破將被應(yīng)用到微軟的商用多語(yǔ)言翻譯系統(tǒng)產(chǎn)品中。


 

網(wǎng)友評(píng)論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關(guān)資訊

關(guān)注官方微信

手機(jī)掃碼看新聞