中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

機(jī)器翻譯如何解決語言障礙這個(gè)天然痛點(diǎn)?

2019-04-09    來源:鈦媒體

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

上世紀(jì)二十年代,翻譯界發(fā)生了有名的“牛奶路”事件。翻譯家趙景深先生在翻譯契科夫的小說《凡卡》時(shí),因不了解原文中的古希臘神話背景,將“銀河”(Milky Way)按字面意思錯(cuò)譯為“牛奶路”,鬧了個(gè)大笑話,從此“牛奶路”便成為錯(cuò)譯的代名詞。

隨著時(shí)代的發(fā)展和全球化加速,不同語言文化背景的人們交流越來越多,翻譯的需求也越來越重要和多樣化,“牛奶路”的錯(cuò)誤依然層出不窮。在機(jī)器翻譯已經(jīng)一定程度上普及的今天,我們能否利用機(jī)器翻譯技術(shù)的優(yōu)勢,滿足大規(guī)模、復(fù)雜多樣的翻譯需求,繞過不同文化背景帶來的理解藩籬,重塑“巴別塔”,進(jìn)而終結(jié)幾千年來人類語言互不相通的歷史呢?

數(shù)據(jù)紅利

諳熟機(jī)器翻譯發(fā)展史的人都知道,冷戰(zhàn)期間,美國獲得了大批前蘇聯(lián)的資料,但苦于翻譯員不足,只好尋求機(jī)器幫助。1954年,IBM展示了一個(gè)基于6項(xiàng)語法規(guī)則和250字詞匯表的計(jì)算機(jī)翻譯系統(tǒng),可將60個(gè)簡單的俄語斷句直譯為英語,政府非常激動(dòng),開始撥款大力支持機(jī)器翻譯,有樂觀派科學(xué)家宣稱:“三年之后機(jī)器翻譯一定非常成熟。”

如你所知,這種思路很快被證明是錯(cuò)誤的。人類無法馴服自己親手創(chuàng)造的語言,語言仿佛古靈精怪的小姑娘,變化極其靈活,哪怕同一單詞,在不同地域,文化,語境甚至情緒里的意義也迥然不同。IBM 的單詞配語法無疑過于魯莽,直至上世紀(jì)90年代,IBM都還在投入大量資金試圖挑戰(zhàn)機(jī)翻,無奈收效甚微。

而在不少專業(yè)人士看來,經(jīng)過多年發(fā)展,現(xiàn)如今,機(jī)器可以較為準(zhǔn)確地理解每一個(gè)句子的意思,但若想真正做到流暢準(zhǔn)確的翻譯,還必須解決兩個(gè)問題:調(diào)序和消歧。不同語言有不同語序(譬如在英語和德語里形容詞放在名詞前面,但在法語里通常相反),機(jī)器需要做到根據(jù)不同語言的表達(dá)習(xí)慣調(diào)整語序。另外,單個(gè)詞匯,尤其動(dòng)詞常有多個(gè)語義,譬如漢語的“做”,你得讓機(jī)器知道,做作業(yè)和做內(nèi)啥是不一樣的。

好在人類握有數(shù)據(jù)。尤其近些年來,隨著互聯(lián)網(wǎng)的普及和高速發(fā)展,數(shù)據(jù)規(guī)模呈爆發(fā)式增長,機(jī)器翻譯因此受益,取得了不錯(cuò)的進(jìn)展。

嗯,就連學(xué)術(shù)界也頗為期待數(shù)據(jù)產(chǎn)生的紅利。在不久前結(jié)束的中國電子信息技術(shù)年會(huì)上,百度牽頭與中科院自動(dòng)化所、浙江大學(xué)、哈爾濱工業(yè)大學(xué)、中科院計(jì)算所、清華大學(xué)研發(fā)的《基于大數(shù)據(jù)的互聯(lián)網(wǎng)機(jī)器翻譯核心技術(shù)及產(chǎn)業(yè)化》項(xiàng)目獲得了電子學(xué)會(huì)科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。這個(gè)名字有些拗口的學(xué)術(shù)性項(xiàng)目的技術(shù)基礎(chǔ),就是通過海量自然語言語料庫,讓機(jī)器自動(dòng)學(xué)習(xí)理解不同單詞、短語和句式,然后進(jìn)一步優(yōu)化自身系統(tǒng)(畢竟,所謂“智能”的本質(zhì)就是能否根據(jù)數(shù)據(jù)的累積不斷讓自己“進(jìn)化”)——事實(shí)上,這個(gè)在外人眼中非常高大上的項(xiàng)目,就突破了“消歧”和“調(diào)序”等難題。

而從更學(xué)術(shù)的角度,其提出的基于互聯(lián)網(wǎng)大數(shù)據(jù)的翻譯模型,也可實(shí)時(shí)準(zhǔn)確地響應(yīng)多文體、多領(lǐng)域的復(fù)雜翻譯請(qǐng)求;除此之外,該項(xiàng)目的基于樞軸語言的翻譯技術(shù),使得資源非常稀缺的小語種(喜歡小語種的童鞋你們有福啦)翻譯成為可能,且實(shí)現(xiàn)了多語種翻譯的快速部署。

耐心等待

當(dāng)然,你得承認(rèn),“進(jìn)化”還需要時(shí)間。與專業(yè)翻譯相比(所以短期內(nèi)專業(yè)翻譯還不會(huì)失業(yè)對(duì)么),機(jī)器翻譯至少在三個(gè)方面還有待完善。

第一,如前所述,目前機(jī)翻主要以句子作為翻譯單位,缺乏對(duì)篇章知識(shí)的全面理解,翻譯結(jié)果在前后文的統(tǒng)一連貫性上有時(shí)還顯得頗為無奈,如何研究“篇章級(jí)”的翻譯模型是個(gè)問題;

第二,倘若將機(jī)器視作生命,那么處于襁褓之中的它還缺乏對(duì)人類常識(shí)和文化的充分理解,你知道,翻譯一般分為直譯和意譯,在需要意譯的時(shí)候,機(jī)器多選擇笨拙地直譯,譯出的句子常讓人倒吸一口涼氣,所以如何充分發(fā)揮互聯(lián)網(wǎng)優(yōu)勢,利用“群體智慧”更好地獲取人類文化,讓機(jī)翻更加符合母語表達(dá)習(xí)慣是個(gè)重要的問題;

第三,宏觀層面上,機(jī)器翻譯作為計(jì)算機(jī)科學(xué),認(rèn)知科學(xué),信息論等多學(xué)科交叉領(lǐng)域,其他學(xué)科的研究成果對(duì)于語言理解建模和翻譯建模都有借鑒意義,如何持續(xù)探索全新的翻譯模型和方法也頗具挑戰(zhàn)。

在我看來,機(jī)器翻譯若能攻克以上三點(diǎn),而你在文字上又是一個(gè)“功利主義者”,只求穩(wěn)準(zhǔn)狠,不求信雅達(dá),那么機(jī)譯一定會(huì)很好地滿足你。當(dāng)然,對(duì)于那些基本屬于“二次創(chuàng)作“的文學(xué)翻譯而言,至少在現(xiàn)階段,你若想奢求機(jī)器能將“In me the tiger sniffs the rose”譯為“心有猛虎,細(xì)嗅薔薇”,可就有些過分啦。

此外,對(duì)于機(jī)器翻譯的苛責(zé)還包括情感方面。你知道,哪怕同一句話,由于人類非常不確定性的情感注入,也會(huì)帶來語氣的千差萬別。然而,就像一位評(píng)論者所言:“中國人可將‘你吃了么’這樣的簡單問句問出千回百轉(zhuǎn)的意味,而機(jī)器則只會(huì)將其翻譯成‘Have you eaten?’或者更加拙劣的‘Do you eat?’。但實(shí)際上,哪怕是精通雙語的人員,往往也很難區(qū)分非母語一方語言中的細(xì)微情感變化。”

對(duì)于機(jī)器,我們還需要耐心等待,何況我們已經(jīng)窺見了機(jī)器翻譯為人類社會(huì)帶來的變革。

應(yīng)用場景

可以肯定,從離你最近的出國旅行,到互聯(lián)網(wǎng)上的外貿(mào),電商和金融等服務(wù)的國際化推廣,對(duì)不少如我這般英語糟透了的人而言,語言障礙是一個(gè)天然痛點(diǎn)。

就拿出境自由行來說(畢竟世界那么大,每個(gè)人都想去看看),翻譯軟件幾乎成為標(biāo)配,而在更為具體的應(yīng)用場景上——譬如點(diǎn)菜,機(jī)器翻譯的角色則顯得無比重要。嗯,去國外吃飯最憂傷的并不是價(jià)格,而是面對(duì)餐單時(shí)一臉無助,最后點(diǎn)什么菜只得聽天由命。西餐餐單少有配圖,且不同于中餐“三鮮丁兒”“四喜丸子”這些菜名,西餐菜名一般都直接標(biāo)注原料與做法,哪怕你英文還算不錯(cuò),挑出心儀菜品也頗具挑戰(zhàn),這時(shí)候,你可以打開翻譯軟件用攝像頭拍攝菜名進(jìn)行翻譯,當(dāng)然,你最好選擇性拍攝,以避免看一遍菜單就花上個(gè)把小時(shí)的風(fēng)險(xiǎn)……

除了自由行,在更加廣泛的應(yīng)用領(lǐng)域上,則可以通過翻譯API的二次開發(fā),實(shí)現(xiàn)機(jī)器翻譯的大眾化使用,從而在經(jīng)濟(jì)層面激發(fā)巨大的商業(yè)價(jià)值。就拿百度翻譯來說,其通過免費(fèi)開放API支持了超過7000個(gè)第三方應(yīng)用,譬如:華為將帶有翻譯功能的手機(jī)銷往法國等30 多個(gè)國家和地區(qū);敦煌網(wǎng)等電子商務(wù)網(wǎng)站通過百度翻譯進(jìn)行跨境貿(mào)易;甚至有俄羅斯購物網(wǎng)站用其將淘寶的商品信息翻譯為俄語,為俄羅斯人民提供代購服務(wù)……

嗯,人類對(duì)不同民族之間無障礙交流的渴望遠(yuǎn)早于發(fā)明計(jì)算機(jī)的時(shí)間,而這一點(diǎn)在宣稱自由互聯(lián)的互聯(lián)網(wǎng)時(shí)代更能彰顯它的價(jià)值。

其實(shí)在我看來,機(jī)器翻譯技術(shù)的真正意義,就如同搜索引擎,致力于讓所有人平等便捷獲取信息和服務(wù)。只要有網(wǎng)絡(luò),搜索引擎使得在北京的孩子跟在遙遠(yuǎn)山村的小孩獲取知識(shí)的能力是一樣的。機(jī)器翻譯無疑與搜索引擎有著類似的特質(zhì),它使在地球任何一個(gè)角落的人不再受語言不通的束縛,自由交流和獲取信息及服務(wù)。

【作者介紹:李北辰;微信公眾號(hào):future-is-coming】

標(biāo)簽: 機(jī)器翻譯 翻譯產(chǎn)品 翻譯API 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:淘寶運(yùn)營:直通車和鉆展“聯(lián)合”式推廣營銷

下一篇:2015年天貓豆腐塊 淘寶搜索排名 實(shí)操案例