- 翻譯公司資訊
-
“譯者”在人工智能時代扮演的角色
發(fā)布時間:2017-08-30 09:48 點擊:
現(xiàn)代語音識別和自然語言處理研究的先驅(qū)、美國工程院院士Frederick Jelinek曾經(jīng)有句名言:“Every time I fire a linguist, the performance of the speech recognizer goes up.”(我每開除一位語言學(xué)家,我的語言識別系統(tǒng)性能就會提升。)Unitrans世聯(lián)翻譯公司在您身邊,離您近的翻譯公司,心貼心的專業(yè)服務(wù),專業(yè)的全球語言翻譯與信息解決方案供應(yīng)商,專業(yè)翻譯機(jī)構(gòu)品牌。無論在本地,國內(nèi)還是海外,我們的專業(yè)、星級體貼服務(wù),為您的事業(yè)加速!世聯(lián)翻譯公司在北京、上海、深圳等國際交往城市設(shè)有翻譯基地,業(yè)務(wù)覆蓋全國城市。每天有近百萬字節(jié)的信息和貿(mào)易通過世聯(lián)走向全球!積累了大量政商用戶數(shù)據(jù),翻譯人才庫數(shù)據(jù),多語種語料庫大數(shù)據(jù)。世聯(lián)品牌和服務(wù)品質(zhì)已得到政務(wù)防務(wù)和國際組織、跨國公司和大中型企業(yè)等近萬用戶的認(rèn)可。 專業(yè)翻譯公司,北京翻譯公司,上海翻譯公司,英文翻譯,日文翻譯,韓語翻譯,翻譯公司排行榜,翻譯公司收費價格表,翻譯公司收費標(biāo)準(zhǔn),翻譯公司北京,翻譯公司上海。
人們有時候會誤讀這句話,認(rèn)為在自然語言處理技術(shù)發(fā)展的進(jìn)程中,語言專家的作用微乎其微,拯救世界的任務(wù)還得落在程序員身上。
我去專門查過Frederick Jelinek大牛的維基百科介紹,里面有段話很有意思(注意粗體加下劃線的部分):
“Although its fame and iconic status are undisputed (it was for example used as the title of a 1998 speech by Julia Hirschberg), its context is unknown and its specific wording and dating are unclear. According to Daniel Jurafsky and James H. Martin, Jelinek himself recalled the quote as "Anytime a linguist leaves the group the recognition rate goes up" and dated it to December 1988 (Wayne, Pennsylvania), further noting that the quote did not appear in the published proceeding,[2][3] whereas Roger K. Moore gave the wording as "Every time we fire a phonetician/linguist, the performance of our system goes up" and dated it to an IEEE Automatic Speech Recognition and Understanding workshop held in 1985.[4] According to Steve Young, "the story goes that one day one of his linguists resigned, and Fred decided to replace him not by another linguist but by an engineer. A little while later, Fred noticed that the performance of his system improved significantly. So he encouraged another linguist to find alternative employment, and sure enough performance improved again."”
思考
自然語言處理專家嘴邊經(jīng)常提及這句話,搞機(jī)器翻譯技術(shù)的專家也時不時拿這句話調(diào)侃一下。如今很多機(jī)器翻譯團(tuán)隊里并沒有所謂的“語言學(xué)家”(Linguist),不需要任何語言學(xué)家就能搭建一套高效能的機(jī)器翻譯程序,產(chǎn)出他們眼中高質(zhì)量的機(jī)器翻譯譯文,發(fā)布令他們興奮不已的成果。
而令他們興奮不已的論文數(shù)據(jù)又會令媒體記者的雙手顫抖不已,寫下驚天地泣鬼神,令翻譯人員聞字喪膽的熱文。
但以下新聞引發(fā)了我的思考:
新聞一:
《谷歌:用算法和大數(shù)據(jù)“干掉”語言學(xué)家》
時間:2013年9月25日
摘要:
谷歌是一家極度看重算法、充滿工程師文化的公司,但或許你還是會為此而感到驚奇——他們認(rèn)為翻譯是一個數(shù)學(xué)和統(tǒng)計學(xué)方面的問題。最近,位于谷歌總部的谷歌翻譯團(tuán)隊正迅速擴(kuò)張,他們新招了數(shù)名德國計算機(jī)科學(xué)家,但卻沒有招收一名語言學(xué)家。
新聞二:
《實現(xiàn)無監(jiān)督學(xué)習(xí)?谷歌雇百名語言學(xué)家為訓(xùn)練數(shù)據(jù)“鍍金”》
時間:2016年12月01日
摘要:
谷歌組織了一個由大量語言學(xué)博士組成團(tuán)隊,它把這支團(tuán)隊稱為“Pygmalion”,使用這些語言學(xué)家人工篩選的數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。實際上,谷歌的機(jī)器通過觀察人類的做法來學(xué)習(xí)如何從長段落中提取相關(guān)答案,這個過程需要重復(fù)多遍,相當(dāng)漫長。這些艱苦的努力同時證明了深度學(xué)習(xí)的能力和局限性。為了訓(xùn)練像這樣的人工智能系統(tǒng),需要大量的、由專業(yè)人士篩選過的數(shù)據(jù)。這些數(shù)據(jù)不容易得到,也不便宜,而且對這種數(shù)據(jù)的需求不會很快消失。
新聞三:
《特寫 | 人工智能背后的人》
時間:2017年4月7日
摘要:
秦嬌今年剛滿 30 歲,幾個月前剛剛從呼叫中心跳槽到一家「數(shù)據(jù)加工」公司。雖然跨了行業(yè),她并不覺得兩份工作有什么不同,都是按照甲方的要求和己方的工作節(jié)奏,把人手安排到一個又一個項目中去。
公司剛成立不到一年,眼下業(yè)務(wù)大多是標(biāo)注數(shù)據(jù),即根據(jù)項目方要求,人工為圖片、視頻和語音內(nèi)容打標(biāo)簽、做標(biāo)記。標(biāo)注好的數(shù)據(jù)會被人工智能公司用來訓(xùn)練算法模型,然后應(yīng)用到圖像識別、語音識別等不同領(lǐng)域。
「數(shù)據(jù)加工」公司所在地距「大數(shù)據(jù)之城」貴陽五十多公里,是一座只接受科技公司入駐的「數(shù)字小鎮(zhèn)」。
小鎮(zhèn)的隔壁有一間規(guī)模不小的高職學(xué)校,學(xué)校的學(xué)生構(gòu)成了這家公司目前主要的員工來源。高職學(xué)校初建的目的是教育扶貧,因此學(xué)生們大多來自貧困山區(qū),學(xué)校會提供不少補(bǔ)助和獎學(xué)金。在數(shù)據(jù)加工公司兼職賺來的錢不僅足夠生活,有些學(xué)生還會拿出一部分補(bǔ)貼家用。偶爾這份工作還能成為職業(yè)跳板,「我們的學(xué)生踏實又努力,有的去北京實習(xí),因為熟悉標(biāo)注工作、又認(rèn)真,反饋回來說比同樣實習(xí)的北京大學(xué)生強(qiáng)得多」。
除此之外,她們還可以承接小語種的語料收集工作。地處西南、臨近東南亞,當(dāng)?shù)氐娜穗H關(guān)系鏈和頻繁的商務(wù)交往能提供不少便利。
我不知道諸位讀者看到這三條新聞后是什么樣的感受?我的感受是這樣的:
嚴(yán)格意義上來說,“語言學(xué)家”、“語言專家”、“語言學(xué)博士”與“翻譯學(xué)家”、“翻譯家”、“翻譯專家”、“翻譯學(xué)博士”是兩個圈子的人。我如果說“我身邊最牛的翻譯根本不知道語言學(xué)是什么”,你信嗎?我如果說“做翻譯根本不需要語言學(xué)知識”,你信嗎?我如果說“現(xiàn)在的翻譯專業(yè)學(xué)生根本不需要《語言學(xué)》”,你信嗎?
機(jī)器翻譯研發(fā)團(tuán)隊之所以沒有大牛翻譯,并不是因為翻譯人員沒有作用,而是因為他們已經(jīng)過氣了,機(jī)器翻譯研發(fā)團(tuán)隊手里拿來訓(xùn)練機(jī)器翻譯程序的“語料/數(shù)據(jù)”是哪兒來的?還不是一堆他們并不知道名字的譯者一個字一個字翻譯出來的,但翻譯完就完了,他們并不清楚自己的譯文以后會起到什么作用,以為只是作為“作品”被陌生讀者閱讀罷了。
谷歌之所以又需要語言學(xué)博士來標(biāo)注數(shù)據(jù)了,并不是因為他們的技術(shù)沒有作用,而是因為他們手里的數(shù)據(jù)不夠用了,需要由人來補(bǔ)充新的更高質(zhì)量的數(shù)據(jù)。而機(jī)器翻譯研發(fā)團(tuán)隊還沒有開始招募“語言學(xué)博士”、“翻譯學(xué)博士”,是因為人翻譯的速度太慢了,價格又太貴了,短時間內(nèi)提供的高質(zhì)量的雙語數(shù)據(jù)對機(jī)器翻譯程序性能的提升并沒有太大提升,而直接從第三方公司手中買廉價的雙語數(shù)據(jù)或者自己寫程序去抓取免費的雙語數(shù)據(jù)則更劃算一些。
標(biāo)注數(shù)據(jù)這種工作跟富士康流水線上裝配手機(jī)的工作一樣,“惡心但必需”。“人工智能”時代,耗費多少“人工”,就有多么“智能”。
譯者通常認(rèn)為自己產(chǎn)出的“雙語平行文本”沒有什么用,但通過技術(shù)可以進(jìn)一步挖掘雙語平行文本中的諸多信息,比如雙語術(shù)語、語義信息、句法信息等。那些年長的譯者花幾十年從雙語文本中靠經(jīng)驗挖掘出來的“知識”可能遠(yuǎn)不及計算機(jī)程序幾秒鐘挖掘出來的的信息。
那人工智能時代,“譯者”究竟扮演著什么樣的角色?在我看來,只要世界不停轉(zhuǎn),譯者就有翻譯不完的文字,只要有翻譯不完的文字就有賺不完的錢,所以譯者的生存問題是不會受到影響的。
但,在今天的翻譯行業(yè)生態(tài)環(huán)境下,“譯者”也要順應(yīng)適者生存、優(yōu)勝劣汰的法則,總有人因為不適應(yīng)人工智能時代工作模式的變革而被淘汰,也總有人會在人工智能時代找到駕馭技術(shù)迎難而上的突破口。
人工智能時代,聰明的“譯者”要做一個“變革者”,熟悉技術(shù)、擁抱技術(shù)、使用技術(shù)。但在這個過程中,譯者其實處于非常弱勢的位置,因為最終改變譯者命運的不是譯者自己,而是為譯者提供技術(shù)服務(wù)的開發(fā)者。因此,聰明的“譯者”還要做一個“合作者”,熟悉提供技術(shù)服務(wù)的人、使用他們提供的技術(shù)。
結(jié)語
人工智能時代,年輕一代譯者的價值應(yīng)當(dāng)在兩方面凸顯,一方面是自身的翻譯水平,另一方面是自身的技術(shù)認(rèn)識。老一輩的譯者可以在翻譯水平方面引領(lǐng)年輕一代譯者的發(fā)展,但不能冥頑不化,令年輕一代錯失認(rèn)識技術(shù)的良機(jī)。“技術(shù)”包羅萬象,年輕一代譯者并不需要樣樣精通,也絕無可能,需要有人引領(lǐng)年輕一代譯者認(rèn)識對其有價值的真技術(shù)。
作為年輕一代譯者,被機(jī)器翻譯專家開除并不可怕,可怕的是被翻譯專家開除。- 上一篇:論英語閱讀諸變量對閱讀的影響
- 下一篇:口譯員如何提升記憶力