4月22日-24日,,首屆數(shù)字中國建設峰會在福州舉行。隨著會議的進行和企業(yè)最新成果的發(fā)布,記者發(fā)現(xiàn)在大屏幕上會不斷呈現(xiàn)出發(fā)言內容的中英雙語字幕,,隨著發(fā)言內容的逐漸完整,屏幕上顯示的字幕也會根據(jù)語境自動完善,。
據(jù)工作人員介紹,在現(xiàn)場擔任機器同傳工作的“機器人”來自搜狗公司,,通過機器同傳,,嘉賓演講內容可以實時以中英文字幕顯示在屏幕上,。它能讓參會者無需佩戴同傳耳機,而是通過字幕就能直觀的接收有效信息,。并且“機器人”可以識別方言,,降低由于普通話不標準而導致的分享內容的折損,,讓參會人員最大限度的理解發(fā)言內容,。
搜狗AI事業(yè)部總經理張博告訴經濟日報-中國經濟網記者,2011年,,搜狗開始研究語音識別技術,,至今已有7年,搜狗采取“雙引擎”戰(zhàn)略,,不斷加大人工智能技術,、產品和服務的研發(fā)投入。
全球首家商用機器同傳系統(tǒng)
據(jù)了解,,2016年11月,,搜狗的機器同傳在第三屆世界互聯(lián)網大會“移動互聯(lián)網論壇”亮相,成為全球首個商用機器同傳,。
從首次亮相開始,,搜狗同傳不斷升級。張博表示,,在產品化的過程中,,為了達到實時的效果,搜狗在速度和精度上做了很多嘗試,,比如使用了GRU作為搜狗同傳的神經元結構,,使其可以在性能保持不變的前提下,降低運算復雜度,,在層數(shù)和參數(shù)量上也做了一定的精簡。在提升翻譯效果方面,,針對實體詞,、集外詞、對齊效果的處理上也做了很多研發(fā)工作,。目前,,搜狗同傳語音識別的準確率可以達到97%,支持最快400字每分的高速聽寫,,翻譯的準確率可以達到90%,。方便了參會者更好地理解發(fā)布者所講述的內容。
先進的神經網絡翻譯技術
張博介紹,,搜狗還支持語音實時翻譯技術SNMT(Sogou Neural Machine Translation),,即搜狗同傳翻譯系統(tǒng),集成了語音識別,、機器翻譯,、語音合成等先進技術,運行同傳翻譯時,,屏幕上會實時顯示出語音識別出的中文或英文,,同時也會實時翻譯成對應的英文或中文,,此外,還可實現(xiàn)男,、女聲或某特定個人的聲音輸出翻譯后的語言,。
目前,市面上一些機器同傳系統(tǒng)在實際操作中會出現(xiàn)大面積單詞無意義重復,、大小寫及字符混亂,、中英夾雜翻譯混亂、帶口音普通話無法識別等現(xiàn)象,�,!八压纷鳛槿蚴准疑逃脵C器同傳,兩年多的時間里已經積累了無數(shù)場同傳的實戰(zhàn)經驗,,通過技術創(chuàng)新基本上克服了以上出現(xiàn)的所有問題,,為機器同傳技術的大規(guī)模商用做了有益探索�,!睆埐⿲洕請�-中國經濟網記者表示,。 (經濟日報-中國經濟網記者王婉瑩)