「語音」也是所謂自然操作介面的一種方式,過去幾年來,科學家們一直試圖讓機器能夠了解、識別人類的語言,如同蘋果的Siri語音助理便是其中一種應用。而最近微軟所發表的一項語音技術,不但能讓機器理解人類的語言,甚至還能讓人口中說出來的英文直接翻譯成中文語音,並且相當接近人類正常的腔調!

微軟的首席研究長(Chief Research Officer)Rick Rashid在一場發表會中,示範了這個技術。當他在場上演講時,可看見螢幕上由機器自動將他說的話轉變成英文字幕;不過這不算什麼,接下來機器還居然直接將他講的英文,自動翻譯成中文說出來。

從以下影片7分30秒的地方開始,可以看見機器自動翻譯的實況,到底準不準確?聽起來效果如何?大家可以親自體驗。



▲ 從7分30秒的地方開始,可以看見機器自動將英文語音,翻譯成中文語音的實況(影片取自/YouTube,若遭移除請見諒)



這項技術是由微軟研究中心,與多倫多大學所共同研發出來,利用一種稱為深度神經網路(Deep Neural Networks,暫譯)的技術,透過將人腦行為模式化,訓練機器具有更佳的識別率。這種方式與先前的技術比起來,可將錯誤率降低30%左右,以往大約講4到5個字便會出現一個錯字;但現在可以講7到8個字才出現錯字了。

要讓機器理解人類的語言不是件容易的事,不只是每個人口音不同,即使同一個人,在不同的場合、不同的情境,對同一個詞句都可能有不同的表達方式。之所以可以達到目前的進展,透過巨量資料(Big data)的分析也是個因素。Rick Rashid提到此系統分析了許多中國人的語音資料,而在示範之前,他也花了一些時間訓練系統學習他的腔調。

操作介面在科技領域始終扮演著關鍵角色,直接影響到產品「好不好用」這件事,從早期作業系統由文字轉成圖形介面,造成個人電腦的普及;到近幾年iPhone創新的觸控介面,促成行動時代的來臨,都是由於操作介面上的突破,所帶來的改革。微軟近幾年來相當專注於「自然操作介面(Natural user interface,NUI)」的研究,如Windows 8的觸控介面,以及Kinect的手勢操作,這次的語音翻譯功能,再度令人大開眼界,或許下一波大改革的日子已然不遠?

資料來源:
Amazing: Microsoft turns spoken English into spoken Mandarin – in the same voice - The Next Web


arrow
arrow
    全站熱搜

    arick 發表在 痞客邦 留言(0) 人氣()