Skype Translator:實(shí)時(shí)語音翻譯神器能否解除“巴別塔魔咒” ?

我是創(chuàng)始人李巖:很抱歉!給自己產(chǎn)品做個(gè)廣告,點(diǎn)擊進(jìn)來看看。  

語音

長久以來,人類都有一個(gè)共同夙愿:發(fā)明一個(gè)機(jī)器,實(shí)現(xiàn)全人類之間毫無障礙的自由交談。而毫無疑問,自由交談在一個(gè)宣稱自由連接的互聯(lián)網(wǎng)時(shí)代更能彰顯它的價(jià)值——畢竟,同是地球人,同住地球村,當(dāng)你我覓得彼此,卻聽不懂彼此語言,實(shí)在有些尷尬。

事實(shí)上,與那些讓生活變得復(fù)雜的“智能產(chǎn)品”不同,實(shí)時(shí)翻譯是那種讓人在直覺上理應(yīng)擁有的技術(shù),正因如此,它也一直存在于《星際迷航》《神秘博士》以及《銀河系漫游指南》等科幻作品中。好消息是,人類似乎離這個(gè)夙愿越來越近了。

幾天之前,微軟旗下的Skype(聽起來很久遠(yuǎn)的名字)宣布,具備實(shí)時(shí)語音翻譯技術(shù)的翻譯器Skype Translator中文預(yù)覽版正式在中國市場推出。其實(shí)不同母語間的人直接對話,讓機(jī)器實(shí)時(shí)翻譯,這些技術(shù)微軟早在去年就已與公眾見面,只是那時(shí)還不支持中文——你知道,哪怕是對于機(jī)器,有大約一萬個(gè)常用漢字以及各種語音語調(diào)的中文也頗具挑戰(zhàn)性。但如今,包括微軟和谷歌在內(nèi)的科技巨頭的發(fā)力,使得地球上使用人數(shù)最多的語言和使用最廣泛的語言能直接展開對話。

那么問題來了,作為不同文化之間的擺渡人,倘若實(shí)時(shí)翻譯真能實(shí)現(xiàn)人類的自由交談,這一切意味著什么?

 

翻譯神器

作為一項(xiàng)長久愿望,在此前數(shù)十年時(shí)間,語音實(shí)時(shí)翻譯的發(fā)展一直受到錯(cuò)誤率高,麥克風(fēng)敏感度差異,噪音環(huán)境等因素阻礙。但近些年來,由于大數(shù)據(jù)的涌現(xiàn),這項(xiàng)技術(shù)取得了不錯(cuò)的進(jìn)展。而Skype Translator更是凝聚了微軟在語音識別,自動翻譯和機(jī)器學(xué)習(xí)等多領(lǐng)域的成果。

簡單地說,Skype Translator的翻譯邏輯主要分為三步:將你的實(shí)時(shí)語音轉(zhuǎn)成文字;將文字翻譯成另一種語言的文字;將文字轉(zhuǎn)成語音。其中,識別實(shí)時(shí)語音并轉(zhuǎn)成文字是最棘手的部分。

如你所知,精確的實(shí)時(shí)語音翻譯有賴于強(qiáng)大的機(jī)器學(xué)習(xí)——也就是軟件學(xué)習(xí)訓(xùn)練數(shù)據(jù)的能力。這些訓(xùn)練數(shù)據(jù)包括翻譯的網(wǎng)頁,配有字幕的視頻,以及預(yù)先翻譯且轉(zhuǎn)錄成文字的一對一談話。事實(shí)上,已有不少人分享了他們過去的對話記錄。Skype Translator通過記錄對話來分析文本并訓(xùn)練系統(tǒng)更好地“學(xué)習(xí)”語言——當(dāng)準(zhǔn)備好的數(shù)據(jù)錄入系統(tǒng)后,機(jī)器學(xué)習(xí)軟件會在這些對話和環(huán)境涉及到的單詞中搭建一個(gè)統(tǒng)計(jì)模型,當(dāng)你說話時(shí),軟件會在統(tǒng)計(jì)模型中尋找相似內(nèi)容,然后應(yīng)用到預(yù)先“學(xué)到”的轉(zhuǎn)化程序中,得以讓語音轉(zhuǎn)換為文本,再從文本轉(zhuǎn)換成另一種語言。

值得一提的是,與程序設(shè)定一般的朗誦不同,人會一邊思考一邊說話,會犯錯(cuò),這種犯錯(cuò)在口語表達(dá)中的體現(xiàn)就是打磕巴,停頓,重復(fù),或者頻頻出現(xiàn)如“嗯”“啊”“呃”之類的語氣助詞,針對于此,Skype Translator的機(jī)器學(xué)習(xí)模型也會處理這些停頓。在預(yù)覽版中,用戶可以看到部分語氣詞停頓被移除,而未被移除的部分則可能通過用戶反饋進(jìn)行再優(yōu)化。

不過,作為一項(xiàng)不斷優(yōu)化的技術(shù),無論是微軟的Skype Translator還是“老對手”谷歌的Google Translate,至少在現(xiàn)階段,實(shí)時(shí)語音翻譯技術(shù)應(yīng)該還談不上完美,系統(tǒng)對語音的識別準(zhǔn)確率也有待完善——你知道,語言如一只野獸,時(shí)刻都在變化,哪怕同一國家,因地域不同也有不同口音與俚語文化(有人就非常期待機(jī)器實(shí)時(shí)翻譯以下對話:“約嗎?我在火車站等你。”“我去!太遠(yuǎn)了!我不去!”)。這些問題可以通過更大范圍的數(shù)據(jù)解決么?也許能,但還需要時(shí)間。

然而無論怎樣,就像一位評測者所言:“(如今語音實(shí)時(shí)翻譯)整個(gè)體驗(yàn)就像是兩名電話銷售員在使用對講機(jī),不過在使用過程中,這樣的抱怨將會被‘奇跡’帶來的震驚所取代。”

 

地球村

在《圣經(jīng)·創(chuàng)世紀(jì)》中記載,曾有一個(gè)時(shí)代,人類擁有共同的語言,于是有人想在巴比倫造一座通天塔——巴別塔,以便直接跟上帝對話,為了懲罰人類的傲慢與虛榮,上帝讓這些人說不同的語言,導(dǎo)致人們無法溝通,雞同鴨講,人類計(jì)劃失敗,自此各散東西。

那么技術(shù)能解除“巴別塔魔咒”么?倘若語言不再是人類交流的壁壘,會發(fā)生什么?

讓我們先來談?wù)務(wù)Z言的意義。在全球7000多種語言中(盡管有不少“小語種”已日漸枯萎),除了詞匯和語法的表層差異,不同的語言是否能使人類產(chǎn)生不同的思維方式——譬如對時(shí)間與空間概念的認(rèn)知,或者對因果關(guān)系的認(rèn)知,幾千年來就一直是學(xué)者們爭論的主題。神圣羅馬帝國的查理曼大帝就曾在科技還不甚昌明的時(shí)代宣稱:“掌握第二種語言就是擁有第二個(gè)靈魂。”

當(dāng)然,從科學(xué)的角度,斯坦福大學(xué)教授Lera Boroditsky也曾頗具詩意地表達(dá)過語言的意義:“每種語言都包含著一種獨(dú)特的世界觀,反映了使用者數(shù)千年來的思想,傾向和認(rèn)知方式。一種語言就像一個(gè)完整的宇宙,人類有7000多個(gè)平行宇宙,有的彼此相似,有的大相徑庭。這種巨大的多樣性是人類頭腦靈活性和精致性創(chuàng)造出的奇跡。我相信,對人類認(rèn)知世界的認(rèn)識越深刻,就越能更好地理解人類的本質(zhì)。”

嗯,倘若互聯(lián)網(wǎng)發(fā)展的底層邏輯是將全人類更好地連接在一起,形成一個(gè)巨大村落,那么語言也許就是最后一個(gè)技術(shù)障礙。在此之前,圖片作為全世界的通用語言,在社交應(yīng)用上發(fā)揮了巨大作用——無論在哪個(gè)國家,笑容就是笑容,哭泣就是哭泣。當(dāng)然,表情符號也發(fā)揮了類似作用——你知道么,真的有人曾用表情符號聊了45分鐘。

所以,可以肯定的是,當(dāng)人類連接在一起,打破語言的壁壘,更好地理解彼此,勢必將開啟“地球村”的新篇章。

最后我想說,對于那些連四級都沒過的同學(xué),你們也許真的有福啦。

【李北辰:微信公號:future-is-coming】

(關(guān)注更多鈦媒體作者觀點(diǎn),參與鈦媒體微信互動(微信搜索“鈦媒體”或“taimeiti”))

本文被轉(zhuǎn)載2次

首發(fā)媒體 鈦媒體 | 轉(zhuǎn)發(fā)媒體

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
久久国产乱子伦精品免费看| 精品特级一级毛片免费观看| 日本无码小泬粉嫩精品图| 国产精品视频网站你懂得| 中文字幕精品久久| 国产三级精品在线观看| 亚洲第一精品电影网| 香蕉在线精品一区二区| 精品久久久久亚洲| 1024你懂的国产精品| 久久久这里有精品中文字幕| 日韩精品视频观看| 久视频精品免费观看99| 亚洲精品国产精品乱码不99| 国产最新精品视频| 99久久免费国产精品特黄| 久久国产精品亚洲一区二区| 精品亚洲成α人无码成α在线观看 | 亚洲国产精品自在自线观看| 久久精品一区二区免费看| 国产精品自在拍一区二区不卡| 野花国产精品入口| 日本尤物精品视频在线看| 熟女精品视频一区二区三区| 久久丝袜精品中文字幕| 国产精品国三级国产AV| 国产精品一区二区久久精品| 久久99精品久久久久久首页| 国产啪精品视频网站免费尤物| 亚洲精品视频在线看| 精品国产日韩一区三区| 国产精品久久久久久久久软件| 久久九九精品99国产精品| 久久国产精品麻豆映画| 伊人久久国产精品| 精品乱子伦一区二区三区高清免费播放| 国产精品黄大片在线播放| 亚洲精品色播一区二区| 久久综合鬼色88久久精品综合自在自线噜噜| 久久婷婷国产综合精品| 久久久久久国产精品mv|