青草视频在线观看视频,午夜香吻免费观看视频在线播放,又污又爽又黄的网站,午夜直播免费看

提供高品質(zhì)的翻譯服務(wù)是卓越翻譯的生存之道

語(yǔ)言研究漫談巴別塔和機(jī)器翻譯引擎

卓越翻譯 2023年03月15日


最近幾年,人類(lèi)的世界的確熱鬧非凡。除了可控核聚變實(shí)驗(yàn)取得歷史性突破外,去年年底發(fā)布的ChatGPT就頗讓上帝驚呼了一番人類(lèi)的瘋狂,前幾日常溫超導(dǎo)的新聞橫空出世也讓人們浮想聯(lián)翩。未來(lái),一切常規(guī)工種也許都被AI和AI指揮的各種機(jī)器人承包了;人類(lèi)也許解決了能源問(wèn)題,出行不再依賴(lài)地面交通網(wǎng)絡(luò)。那時(shí)候,世界必定更加精彩,也許更加無(wú)趣。

《圣經(jīng)舊約創(chuàng)世記》第11章里面講了一個(gè)關(guān)于巴別塔的故事。在很久很久以前,人類(lèi)都講著同一種語(yǔ)言。瘋狂的人類(lèi)產(chǎn)生了修建一座通天之塔,順著通天之塔爬到天堂的想法。由于大家的語(yǔ)言統(tǒng)一,協(xié)調(diào)起來(lái)很快,通天之塔很快就進(jìn)入修建狀態(tài)。這座修建中的通天之塔被命名為Babel Tower,中文世界一般將之翻譯為巴別塔。萬(wàn)能的上帝很不滿(mǎn)于人類(lèi)的狂妄自大和對(duì)神靈的褻瀆,決定懲罰一下愚蠢的人類(lèi)。上帝施展魔法,讓全世界有了各種各樣的語(yǔ)言。從此,人類(lèi)世界的溝通不再暢順,誤解和嫌隙很快出現(xiàn),巴別塔的修建因?yàn)檫@種誤解半途而廢。正是因?yàn)橛辛瞬煌恼Z(yǔ)言和文化背景,人類(lèi)世界從此沖突不斷,戰(zhàn)亂頻仍。從這個(gè)故事來(lái)看,萬(wàn)能的上帝不但會(huì)魔法,而且不經(jīng)意間創(chuàng)造了人類(lèi)世界的種族沖突和戰(zhàn)亂。但,就像古希臘神話中統(tǒng)治世間萬(wàn)物至高無(wú)上的天神宙斯一樣,被供奉于殿堂之上。對(duì)于無(wú)神論者來(lái)說(shuō),這個(gè)故事顯然只是一個(gè)故事。對(duì)于信奉上帝的人們來(lái)說(shuō),上帝永遠(yuǎn)是那么的仁慈。

獲得奧斯卡提名的影片《Babel》在結(jié)束語(yǔ)中講到,“the brightest light in the darkest night”,即便是在溝通困難重重的環(huán)境下,人類(lèi)還是克服一切阻力來(lái)達(dá)到信息傳遞和交流。據(jù)說(shuō),巴別塔的故事,便是翻譯這門(mén)職業(yè)的起源。在中國(guó),最早的翻譯起源于《越人歌》的翻譯,相傳是中國(guó)第一首譯詩(shī)。鄂君子皙泛舟河中,打槳的越女愛(ài)慕他,用越語(yǔ)唱了一首歌,歌詞中唱到“山有木兮木有枝,心悅君兮君不知”鄂君請(qǐng)人用楚語(yǔ)譯出,就是這一首美麗的情詩(shī)。有人說(shuō)鄂君在聽(tīng)懂了這首歌,明白了越女的心之后,就微笑著把她帶回去了。不管是西方的故事還是東方的故事,翻譯所起到的作用都是信息的傳遞和溝通。信息的傳遞和溝通是消除一切誤會(huì)和嫌隙的必要手段。巴別塔的修建雖然半途而廢,但是人類(lèi)世界修建新的巴別塔的努力從來(lái)沒(méi)有停止過(guò)。這“新的巴別塔”便是機(jī)器翻譯引擎,它被譽(yù)為AI領(lǐng)域的明珠,人工智能的終極目標(biāo)。

說(shuō)起來(lái),機(jī)器翻譯引擎的發(fā)展也有了近百年的歷史了。

1933年,蘇聯(lián)科學(xué)家Peter Troyanskii、法國(guó)科學(xué)家G.B. Artsouni提出了“自動(dòng)翻譯機(jī)”的想法。1954年1月7日,美國(guó)喬治敦大學(xué)在IBM協(xié)助下,首次完成了機(jī)器翻譯試驗(yàn),使用IBM 701計(jì)算機(jī)完成了史上首例機(jī)器翻譯,自動(dòng)將60個(gè)俄語(yǔ)句子翻譯成了英語(yǔ),正式拉開(kāi)了機(jī)器翻譯研究的序幕。1966年11月,美國(guó)科學(xué)院語(yǔ)言自動(dòng)處理咨詢(xún)委員會(huì)公布了一份名為《語(yǔ)言與機(jī)器》(簡(jiǎn)稱(chēng) ALPAC 報(bào)告)的報(bào)告,全面否定了機(jī)器翻譯的可行性,導(dǎo)致機(jī)器翻譯的發(fā)展陷入了十幾年的停滯。1976 年由加拿大蒙特利爾大學(xué)與加拿大聯(lián)邦政府翻譯局聯(lián)合開(kāi)發(fā)了TAUM-METEO 系統(tǒng);1980年IBM開(kāi)發(fā)了“翻譯助手”工具。這些古老的翻譯系統(tǒng)都是通過(guò)對(duì)句子的語(yǔ)法結(jié)構(gòu)進(jìn)行分析,構(gòu)建語(yǔ)法樹(shù),通過(guò)詞語(yǔ)及其形變等進(jìn)行對(duì)應(yīng)的翻譯和修改,簡(jiǎn)稱(chēng)為RBMT。RBMT視圖使用規(guī)則的方法來(lái)解釋不規(guī)則的語(yǔ)言,這注定了它的結(jié)局。

1990年代,人類(lèi)開(kāi)發(fā)的機(jī)器翻譯系統(tǒng)進(jìn)入了基于機(jī)器統(tǒng)計(jì)引擎Statistical Machine Translation的時(shí)代,其特點(diǎn)是通過(guò)統(tǒng)計(jì)分析大量的翻譯語(yǔ)料庫(kù)Translation Corpus建立翻譯模型來(lái)完成翻譯任務(wù)。它背后的邏輯很簡(jiǎn)單,就是“如果人們都這么翻譯,我也這么翻”。翻譯引擎的質(zhì)量終于達(dá)到了實(shí)用的階段,但是仍然不夠準(zhǔn)確。

2014年,蒙特利爾大學(xué)學(xué)者Kyunghyun Cho等人發(fā)表論文《Learn Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation》,被稱(chēng)為是在機(jī)器翻譯中應(yīng)用神經(jīng)網(wǎng)絡(luò)的定鼎制作,這催生了兩年之后谷歌翻譯引擎的誕生。神經(jīng)網(wǎng)絡(luò)技術(shù)本身提出時(shí)間很早,但是人類(lèi)重新注意到它也只是20年前的事情。今天,人們熟悉的谷歌翻譯、DeepL,都采用了這一技術(shù)。簡(jiǎn)單來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)技術(shù)通過(guò)尋找語(yǔ)言文本里面的特征,對(duì)語(yǔ)言進(jìn)行“理解”之后,用另外一種語(yǔ)言進(jìn)行重新描述,從而達(dá)成翻譯的任務(wù)。DeepL采用改進(jìn)的神經(jīng)網(wǎng)絡(luò)技術(shù),其翻譯結(jié)果準(zhǔn)確性較谷歌翻譯引擎更為優(yōu)異。

2022年底,美國(guó)OpenAI發(fā)布了基于大型語(yǔ)言模型Large Language Model理論的聊天機(jī)器人ChatGPT,把機(jī)器翻譯的算法再次向前推進(jìn)了一大步。ChatGPT通過(guò)處理大量數(shù)據(jù)來(lái)響應(yīng)提示,這注定了其算法的優(yōu)異之處在于,只要給它足夠的數(shù)據(jù),其翻譯的結(jié)果必定會(huì)越來(lái)越準(zhǔn)確。和別的翻譯引擎不同的是,可以告訴ChatGPT需要翻譯的句子的一些環(huán)境信息,這被稱(chēng)為提示詞(Prompt)翻譯。比如,你可以告訴它“這是醫(yī)療領(lǐng)域的一個(gè)句子,請(qǐng)將它從法語(yǔ)翻譯成德語(yǔ)”。目前業(yè)界普遍認(rèn)為,通過(guò)不同領(lǐng)域、不同語(yǔ)種的大量數(shù)據(jù)訓(xùn)練之后,ChatGPT前景光明。ChatGPT將來(lái)既可以適用于口語(yǔ)化的翻譯,也足以適用于專(zhuān)業(yè)化的翻譯。但是,就目前的實(shí)際測(cè)試結(jié)果來(lái)看,ChatGPT相較人工專(zhuān)業(yè)翻譯,不論是準(zhǔn)確性還是魯棒性,仍然存在不小的差距。專(zhuān)業(yè)的翻譯會(huì)對(duì)ChatGPT翻譯的結(jié)果提出很多優(yōu)化建議。不管怎么說(shuō),現(xiàn)在的谷歌翻譯、DeepL和ChatGPT,已經(jīng)能夠解決很多問(wèn)題。那么,機(jī)器翻譯引擎何時(shí)能夠達(dá)到并超過(guò)人工專(zhuān)業(yè)翻譯的水平?時(shí)間,會(huì)告訴我們一切問(wèn)題的答案,不是么?可以想象,隨著人工智能引擎的發(fā)展,人類(lèi)修建的新的巴別塔將越來(lái)越高,萬(wàn)能的上帝給人類(lèi)設(shè)置的懲罰將遲早有一天不復(fù)存在。

文章最后,順便探討一個(gè)話題,人類(lèi)是不是就可以不再學(xué)習(xí)新的語(yǔ)言了呢?人們?cè)谡麄€(gè)小學(xué)階段、初中階段,花費(fèi)最大的精力進(jìn)行學(xué)習(xí)的,其實(shí)是自己的母語(yǔ)。人們連自己的母語(yǔ)尚且需要花費(fèi)大量的精力進(jìn)行學(xué)習(xí),何況新的語(yǔ)言乎?學(xué)習(xí)語(yǔ)言不僅僅只是為了推翻上帝的懲罰,不僅僅只是簡(jiǎn)單的溝通,更重要的,其實(shí)是在學(xué)習(xí)語(yǔ)言的過(guò)程中,體驗(yàn)各種文化的魅力。Ludwig Wittgenstein的一句名言:“我的語(yǔ)言之局限,即我的世界之局限”,可以作為這個(gè)問(wèn)題的the Best Answer。

 

本文為本站(www.jurx.cn)原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系。