《機器翻譯概論》由會員分享,可在線閱讀,更多相關《機器翻譯概論(21頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,*,*,第十章,第一節(jié) 機器翻譯概論,1.機器翻譯,2.機器翻譯的應用,概念,機器翻譯(machine translation),又稱機譯(MT),是利用計算機把一種自然語言轉變成另一種自然語言的過程。用以完成這一過程的軟件叫做機器翻譯系統(tǒng)。,國外機器翻譯歷史,國外機器翻譯的發(fā)展歷史:,20紀30年代初,法國科學家G B阿爾楚尼最早提出機器翻譯的設想。,1946年,英國和美國的兩位工程師在1949年出版了翻譯備忘錄一書。,1954年 年,美國喬治敦大學和國際商用機器公司(IBM)首次聯(lián)合試驗使用電腦機譯系統(tǒng)
2、,并將由250個詞組成的簡單的俄文材料譯成了基本上可以接受的英文。,這次試驗的成功標志著機器翻譯系統(tǒng)的真正誕生。,中國機器翻譯歷史,1956年我國開始研究機器翻譯。,1987 年中國軍事科學院成功研制出“科譯 4 號”,這標志著我國機譯系統(tǒng)從無到有。,1967-1976年的沉寂期,1997 年底,東方快車以“智能漢化”為口號,在國內掀起翻譯軟件的高潮。,1988年是中國翻譯軟件最紅火的一年,國內出現(xiàn)了通譯、譯星、朗道、即時通、漢神、Internet寶典等幾十種翻譯軟件。,機器翻譯方法分類,(1),基于規(guī)則分析,,就是對源語言語句,的詞法、語義、語法和句法進行分析并進行判斷和取舍,然后重新進行排
3、列組合,最后生成目標語言。這一系列過程均是模仿人腦進行翻譯的過程。,2),基于語料庫技術,,工作原理是利用統(tǒng)計學和,概率方法建立一個包含各種句型的雙語對照語料庫。,基于規(guī)則的機器 翻 譯(Rule-Based),:,直接翻譯法,,即輸入形態(tài)分析雙語字典查詢詞序調整輸出;,轉換系統(tǒng);基于中間語的機器翻譯,逐詞進行翻譯,又稱逐詞翻譯法:翻譯效果差,屬于早期過時認識,現(xiàn)已無人采用:,How are you?,怎么是你?,How old are you?,怎么老是你?,基 于 語 料 庫 的 方 法(Corpus-Based):,基于實例的機 器翻譯EBMT,(,example-based machi
4、ne translation,),統(tǒng)計機器翻譯SBMT,(,statistics-based machine translation,):,如翻譯引擎,機器翻譯的缺陷,以至于近來有人說“MT,不是machine translation的縮寫,而是mad translation(瘋子的翻譯)的縮寫”。,雖然機器翻譯歷經了70多年的研究,機譯的譯文質量確實還是不能令人滿意。,從語言文化角度,每個國家都有其獨特的文化,文化的差異形成于歷史沉積,滲透于生活的方方面面。,機器翻譯在進行翻譯過程中遇到英漢之間文化差異和文化障礙,通過“金山快譯”和“東方快車”這兩種常用的翻譯軟件來舉例說明:這是機器翻譯的一
5、個缺陷,也是其重要的薄弱點。,She is a fox.,機器翻譯:她是狐貍.,機器翻譯對這個句子進行了直接字面翻譯,似乎沒有錯。在中英文中,“狐貍”一詞都可以與狡猾或詭計多端的人聯(lián)系在一起。,但是“當 狐貍”一詞與女性聯(lián)系在一起時,漢語與英語卻分別具有了不同的色彩和暗示。,按照中國人的心理“狐貍”形容女性是貶義,指“狐貍精”,這無疑是錯誤的,因為在英語中“FOX”形容女性是指時髦迷人的女子。,如果直譯為“:她是只狐貍”,便容易在中國讀者心中喚起一種傳統(tǒng)上遭到貶斥的形象。,參考譯文:,她是位時髦迷人的女郎,。,狗嘴里吐不出象牙,機器翻譯:No ivory issues from the mou
6、th of a dog.,在漢語中有關狗的詞語往往帶有貶義色彩,然而在英語國家中,狗被普遍認為是人類最忠誠的朋友,對狗的忠誠大加贊賞,因此如果在這個句子中,把狗直譯為 dog,會產生文化色彩的變異。,在這里機器翻譯忽略了“狗”(dog)在中英的特殊文化意義。對這個句子大家比較接受的翻譯為:,A filthy mouth cant utter decent language.,天有不測風云,機器翻譯:A wind and cloud may arise from a clear sky.,漢語中的“風云“一詞如果照字面直譯為英語中的 wind and cloud,那么英語讀者是很難體會出“風云”
7、一詞所包含的文化內涵的。,“風云”一詞在漢語中可以用來比喻“不安定的,多變的局勢”,比如“風云變幻”,“風云突變”等詞組中的“風云”都包含有這一層的含義。為了便于英語讀者的理解,應當根據(jù)其真正的文化意義來真實再現(xiàn)原文信息:,參考譯文:,Something unexpected may happen any time.,從語言語法角度,We dont read books for amusement.,機器翻譯:我們?yōu)榱讼捕蛔x書。,原文中的 not位于 read 前,形式上是否定謂語,而在實際意義上是否定后面的 for amusement,原文的正常語序應是:We read books no
8、t for amusement.,但英語中習慣把 not提到前面去,這叫“否定前置”。又如我們常說的“:我們活著不是為了吃飯,而吃飯是為了活著”,譯為英語就是:We do not live to eat but eat to live.原譯單純在形式上與原文相對應,但意思卻完全錯誤。,參考譯文:,我們讀書不是為了消遣。,他有兩米高。,機器翻譯:He has two meters high.,這就是我們經常所說的 Chinglish(中式英語)現(xiàn)象,機器翻譯也同樣出現(xiàn)了這種問題,只懂得按字面意思翻譯。,have(has)是“有”的意思,表示擁有某物,具有所屬的關系。但是漢語中的“有”不能完全等同
9、于“have(has)”。他“有”兩米高表示他的特征,本身所具有的屬性,不能按照字面進行直譯。,參考譯文:,He is two meters high.,從語言上下文聯(lián)系角度,不勝慚愧。,機器翻譯:It is ashamed very。,這句話的上下文若是為自己有缺點,做錯了事或未能盡到責任而感到不安,此句應譯為“I feel quite ashamed.”,但其上下文若是受人贊揚而表示自謙,則此句話只具備語用意義,應譯為“,I feel greatly flattered.”,數(shù)碼相機,機器翻譯,:,數(shù) ,這里“數(shù)碼相機”翻譯成“數(shù) ”,日本人是不會懂的。,參考譯文,:,機器翻譯的優(yōu)點,機器
10、翻譯是科技翻譯,尤其是各具體學科、專業(yè)翻譯的最佳途徑。因為這類翻譯句式結構較為簡單,專業(yè)詞匯重復量大,而機器翻譯速度快、效率高,完全可以在這方面大顯身手。,1.These tests determine if the subsystem has a problem.,機器翻譯:這些測試確定子系統(tǒng)是否有問題。,非文學出版物的機器翻譯一直在進行,產品說明書、天氣預報等一些基于專業(yè)語料庫的材料的翻譯效果還是不錯的。例如,蒙特利爾大學研制的英法翻譯系統(tǒng)進行天氣預報的自動翻譯,多年來每天自動翻譯1,5002,000份天氣預報材料,具有很強的實用性。,世界上有70%以上的網(wǎng)站都是用英文編寫的,而只有12%
11、13%的網(wǎng)站是由漢語編寫而成的。,互聯(lián)網(wǎng)以及與計算機相關材料的翻譯很大一部分依賴機器翻譯。機器翻譯在這方面發(fā)揮著機器輔助翻譯所不能比擬的作用。,目前有多種網(wǎng)絡資源可以提供詞匯、專有名詞、例句、文化背景等資料檢索功能,大大方便了翻譯學習和研究,并為翻譯教學提供新的思路。,常見的資料檢索渠道有搜索引擎、在線詞典(如金山在線)、在線百科全書(如維基百科等)、雙語平行語料庫(如中國譯網(wǎng)、句酷等)。,人類對自然語言的認識是無盡的,對機器翻譯的研究也是無盡的。不管怎么說,機器翻譯的速度卻是無可置疑的,因此我們必須相信機器翻譯的質量將會越來越好,越來越成熟。,我們不能完全依賴于機器翻譯,最多把機器翻譯當做一種參考,一份“草稿”,再進行人工翻譯的思考與修改。,