- 說(shuō)明
-
分類(lèi):資訊
-
-
點(diǎn)擊數:2468
出國旅游語(yǔ)言不通怎么辦?來(lái)個(gè)XX翻譯機讓你從此暢通無(wú)阻。相信很多人都看過(guò)類(lèi)似的智能翻譯機廣告,仿佛小時(shí)候看哆啦A夢(mèng)里的?翻譯蒟蒻道具已成為現實(shí),但在筆者看來(lái),受制于語(yǔ)音識別精度及機器翻譯能力的不足,目前這些所謂的智能翻譯機全是扯淡。
6年前筆者研究生畢業(yè)時(shí),曾邀請母上大人來(lái)美國參加畢業(yè)典禮順帶玩了一圈,回來(lái)之后母上大人就開(kāi)始時(shí)不時(shí)看看旅游常用短句之類(lèi)的書(shū)計劃未來(lái)跟朋友一起來(lái)個(gè)海外自由行。但無(wú)奈歲數大了,記憶力下降嚴重,這么多年過(guò)去母上大人的英文并沒(méi)有太大長(cháng)進(jìn),所以作為兒子,筆者一直很希望智能翻譯技術(shù)能有所突破,好幫助母上大人實(shí)現環(huán)游世界的夢(mèng)想。
這兩年人工智能概念火熱,而翻譯作為一個(gè)重要的剛需自然得到大量公司的青睞,從翻譯軟件到翻譯網(wǎng)站再到翻譯手機、翻譯機的產(chǎn)品層出不窮,價(jià)格從一兩百到幾千不等。各家都將“人工智能”四個(gè)大字當做金字招牌來(lái)用于自家產(chǎn)品的宣傳,而各路媒體也在旁煽風(fēng)點(diǎn)火,大有人工智能技術(shù)將一統江山,翻譯人員全要下崗的態(tài)勢。
如果對智能翻譯技術(shù)不太了解的小白很容易就被這樣的宣傳所蠱惑,但實(shí)際上,如果對行業(yè)稍微有點(diǎn)了解就能知道這些產(chǎn)品目前還遠達不到用戶(hù)所期待的交流無(wú)礙這個(gè)標準。
從實(shí)現方案來(lái)說(shuō),分為離線(xiàn)和在線(xiàn)兩種。離線(xiàn)顧名思義有點(diǎn)類(lèi)似小時(shí)候用的那種電子詞典,缺點(diǎn)是詞匯量和參考翻譯都有局限性。在線(xiàn)的則是借助云計算和搜索引擎,缺點(diǎn)是沒(méi)了網(wǎng)基本就快廢了。
從功能分工來(lái)看,智能翻譯分為兩方面:一個(gè)是語(yǔ)音識別 ,一個(gè)是智能翻譯。所以對于所有智能翻譯機的第一道門(mén)檻就是語(yǔ)音識別的精確度,事實(shí)就是來(lái)說(shuō),在這方面,人工智能算法的引入及發(fā)展確實(shí)讓精確度得到了一個(gè)質(zhì)的飛躍。
?根據公開(kāi)資料顯示,借助訓練過(guò)得神經(jīng)網(wǎng)絡(luò )系統,谷歌的單次錯誤識別率開(kāi)始大幅下降,2013年時(shí)還高達23%,而2017年時(shí)已降到4.9%,而谷歌的兩大對手IBM和微軟在2017年的表現分別是5.5%和5.1%,這個(gè)成績(jì)同人類(lèi)相比如何呢?根據報告可知,用英語(yǔ)做日常用語(yǔ)的人類(lèi)語(yǔ)音識別錯誤率在5%左右,所以谷歌、微軟和IBM的成績(jì)在英語(yǔ)國家已堪比人類(lèi)。在中文方面,科大訊飛今年公布信息宣布語(yǔ)音識別準確率已達到98%,搜狗和百度則是97%(今年兩者信息沒(méi)有更新)。
從數據來(lái)看,語(yǔ)音識別精確度的問(wèn)題已不嚴重,但從實(shí)際應用來(lái)說(shuō),依然不盡如人意,一方面是遠場(chǎng)語(yǔ)音識別非常容易受到噪音干擾影響準確率(你總不能舉著(zhù)翻譯機湊到對方嘴邊吧?),另一方面則是一音多字或者多詞的問(wèn)題難以解決。
眾所周知,中文的一音多字情況非常普遍,而智能翻譯的原理是先將語(yǔ)音識別為正確的文字,然后再從文字轉換到希望翻譯的語(yǔ)言,當出現一些專(zhuān)有名詞或者句子過(guò)于簡(jiǎn)短的時(shí)候,中文的識別錯誤率都會(huì )大幅攀升,就比如姓名。?別說(shuō)機器,就算是我們自己如果脫離語(yǔ)境單純聽(tīng)都能聽(tīng)錯,否則相聲里的包袱怎么來(lái)的?
?當然,語(yǔ)音識別精確度并不是最大的攔路虎,真正的挑戰還在于智能翻譯。每當討論到這個(gè)話(huà)題時(shí),筆者的回答永遠是:什么時(shí)候在線(xiàn)翻譯軟件能把文檔翻譯利索了,什么時(shí)候智能語(yǔ)音翻譯就能實(shí)現。如果100%精確度的文檔都沒(méi)翻譯對,還談什么語(yǔ)音翻譯?
客觀(guān)來(lái)說(shuō),中文由于過(guò)于博大精深,因此我們不能苛求翻譯機實(shí)現100%的準確率,但在筆者看來(lái),在技術(shù)不成熟的情況下進(jìn)行夸張的宣傳短期內確實(shí)可以促進(jìn)銷(xiāo)量,可從長(cháng)期來(lái)看,這很有可能讓消費者未來(lái)對此類(lèi)產(chǎn)品的不信任感不斷加深,而這顯然不是行業(yè)參與者們所愿意看到的。所以筆者還是那句話(huà),適當夸張宣傳可以,但別過(guò)度忽悠消費者,否則最終砸的還是自己的飯碗。
?