你可能不知道Nuance是做什么的,但你一定知道iphone4S帶來(lái)的一項革命性的人機交互產(chǎn)品——“Siri”。事實(shí)上,事實(shí)上,Nuance正是Siri的技術(shù)提供商。作為全球領(lǐng)先的語(yǔ)音和語(yǔ)言解決方案提供商,Nuance因為是T9輸入法的擁有者被業(yè)界所熟知,目前全球90%以上的手機都采用T9輸入法,這個(gè)輸入法原本是一家名為“Tegic Communications”所開(kāi)發(fā),后來(lái)被Nuance買(mǎi)了下來(lái)。Nuance同時(shí)也在近期收購了滑動(dòng)輸入法的公司Swype。
關(guān)鍵的數據收集
5月12日,Nuance在深圳舉行了“2012年Nuance移動(dòng)論壇”,這家以往“隱身”于各大國際公司背后的企業(yè)出現在了國內,吸引了深圳諸多廠(chǎng)商的興趣。Nuance在會(huì )上展示了三段不同的Video,這三段Video其中就有大家所熟知的Siri的廣告片,另外一段則是Nuance自己的“聲龍”系列產(chǎn)品,最后一段則是將語(yǔ)音技術(shù)結合手勢控制應用到智能電視的場(chǎng)景。通過(guò)短片,Nuance不但展示了目前語(yǔ)音技術(shù)發(fā)展的最新動(dòng)態(tài)和趨勢,同時(shí)也展示了諸多國際企業(yè)所重視的關(guān)鍵點(diǎn)——用戶(hù)體驗,這將是在未來(lái)企業(yè)競爭中取勝的殺手锏。而Nuance的目標,也就是幫助這些企業(yè)提高用戶(hù)體驗。
語(yǔ)音技術(shù)的出現顯著(zhù)改變了人機互動(dòng)的方式,但如果你對Siri有一定的研究,你會(huì )發(fā)現其實(shí)語(yǔ)音識別技術(shù)(ASR)只占到其中的20%,真正重要的則是語(yǔ)義識別技術(shù)。語(yǔ)義識別能幫助用戶(hù)更準確地能否搜索出想要的結果。這種技術(shù)基于Statistic Language model(語(yǔ)言模型統計),需要大量的數據來(lái)完善搜索的結果。同時(shí)對于自然語(yǔ)言的理解(NLU技術(shù)),也需要數據庫的數據,來(lái)進(jìn)行語(yǔ)法的收集。“越多的數據,越容易幫助我們配對用戶(hù)所需要的內容,了解用戶(hù)的意圖,將意圖翻譯成行動(dòng),效果最終也是取決于本身數據的質(zhì)量。”Nuance大中華區總經(jīng)理鄭裕慶表示。

鄭裕慶,Nuance大中華區總經(jīng)理
Nuance的Dragon Go憑借在美國的Apple App Store和Android Market兩大移動(dòng)應用平臺巨大的下載量而被用戶(hù)熟知。Dragon Go將Nuance的聲龍語(yǔ)音識別和自然語(yǔ)言理解技術(shù)與人工智能技術(shù)相結合,從而顯著(zhù)簡(jiǎn)化了搜索移動(dòng)內容的體驗。因此,用戶(hù)僅憑借語(yǔ)音便能得到他們想要的內容,并能將更多的時(shí)間用于瀏覽而非查找在線(xiàn)內容。也就是說(shuō),Dragon Go能聽(tīng)懂用戶(hù)說(shuō)的話(huà)并能理解用戶(hù)意圖。用戶(hù)僅需說(shuō)出一個(gè)簡(jiǎn)單的短語(yǔ),他們所喜愛(ài)和最相關(guān)的內容提供商便會(huì )顯示在眼前,用戶(hù)能輕松地獲取餐廳評述、購買(mǎi)電影票、觀(guān)看流媒體電影和電視節目、在線(xiàn)購物、查找方向、聽(tīng)喜愛(ài)的音樂(lè )、還可以通過(guò)Expedia預定酒店。
如何提供更好的用戶(hù)體驗?
據了解,目前Nuance主要采用兩種商業(yè)模式。一種是直接向OEM廠(chǎng)商和制造廠(chǎng)商提供語(yǔ)音技術(shù)和解決方案,同時(shí)收取授權費用。這里不僅包括了手機、TV、PC等消費電子產(chǎn)品,還包括大量的企業(yè)級行業(yè)應用。另一方面,Nuance提供了自主研發(fā)的產(chǎn)品“如Dragon go”,供智能手機用戶(hù)方便的在AppStore以及Android Market免費下載。通過(guò)向消費者提供免費下載使用,Nuance得以收集龐大的語(yǔ)音數據,從而對語(yǔ)音引擎進(jìn)行訓練,從而提高引擎的準確度。
事實(shí)上,早在Siri出現之前,Nuance 的自然語(yǔ)言應用DragonDictation(聲龍聽(tīng)寫(xiě))和DragonSearch(聲龍搜索)就已經(jīng)推向市場(chǎng)了。鄭裕慶表示,數據庫的豐富程度會(huì )直接影響到語(yǔ)音和語(yǔ)義的辨識度。所以Nuance早在1999年就已經(jīng)開(kāi)始在PC上應用語(yǔ)音引擎,到目前為止已經(jīng)更新了11個(gè)版本,可以說(shuō)是一個(gè)非常成熟的引擎。

從左到右依次為:JasonStirling,Nuance亞太區高級副總裁、鄭裕慶,Nuance大中華區總經(jīng)理、StuartSharpe,Nuance亞太區銷(xiāo)售工程部高級總監
“除了成熟的引擎,我們最大的優(yōu)勢,其實(shí)是如何能把用戶(hù)體驗做得更好的經(jīng)驗。事實(shí)上語(yǔ)音識別率已經(jīng)不是目前最重要的因素了,因為大家可能差距都不太大。但是用戶(hù)體驗就不一樣了。”鄭裕慶表示,包括如何解決噪音問(wèn)題、如何優(yōu)化語(yǔ)音控制界面,這些提高用戶(hù)體驗的東西,Nuance有著(zhù)豐富的經(jīng)驗以及完善的解決方案。
據統計,2011年通過(guò)云端訪(fǎng)問(wèn)Nuance的語(yǔ)音數據庫便有20億的訪(fǎng)問(wèn)量。而據鄭裕慶介紹,Nuance目前已經(jīng)跟不少?lài)H知名的品牌進(jìn)行了合作。其中就包括三星智能電視,以及BMW汽車(chē)。而在今天年年初,Nuance也發(fā)布了跟Intel的合作,未來(lái)Nuance將為Urtrabook提供語(yǔ)音服務(wù),包括開(kāi)啟軟件、寫(xiě)email、更新社群網(wǎng)站、控制音樂(lè )播放等操作都可通過(guò)語(yǔ)音完成。
Dragon TV讓電視真正智能
在論壇現場(chǎng),鄭裕慶還特別強調了Nuance在數字客廳領(lǐng)域的創(chuàng )新。作為智能語(yǔ)音技術(shù)在數字客廳應用的創(chuàng )新應用方案,Dragon TV是一款專(zhuān)門(mén)針對電視原始設備制造商和運營(yíng)商開(kāi)發(fā)的一種獨特的語(yǔ)音和自然語(yǔ)言平臺,它可以讓消費者在數字起居室內利用語(yǔ)音、自然語(yǔ)言理解和觸摸輸入等移動(dòng)創(chuàng )新技術(shù),獲得無(wú)縫、直觀(guān)的互動(dòng)體驗,使電視也成為與他們的手機、平板電腦、計算機和汽車(chē)一樣最常用的設備。消費者不僅能使用自然語(yǔ)指令切換頻道、搜索在線(xiàn)內容、訪(fǎng)問(wèn)三星SmartHub,還可以通過(guò)Skype與朋友和家人交流。用戶(hù)僅需說(shuō)一聲“HiTV(你好,電視),開(kāi)機”,便能打開(kāi)電視。
借助該平臺,消費者將不再受困于傳統電視遙控器繁瑣的操控方式,Dragon TV使電視從單純的接收設備變身為了一個(gè)互動(dòng)系統。同時(shí)通過(guò)攝像頭鎖定技術(shù)以及手勢控制技術(shù),Dragon TV可以在一定范圍內鎖定用戶(hù),這樣在語(yǔ)音控制的過(guò)程中,不會(huì )出現噪音干擾的問(wèn)題。

現場(chǎng)展示的采用Dragon TV的智能電視,可通過(guò)手勢進(jìn)行控制
Dragon TV還可以使數字家庭設備所集成的電子郵件、社交網(wǎng)絡(luò )和互動(dòng)通信等應用的操作變得更加直接簡(jiǎn)單。憑借Nuance強大的語(yǔ)音和自然語(yǔ)言技術(shù),用戶(hù)獲取內容時(shí)只需要說(shuō)出頻道名稱(chēng)、電視臺名稱(chēng)、節目和電影的名稱(chēng)等,便可完成直達目標,開(kāi)始一場(chǎng)愉悅的互動(dòng)視覺(jué)旅程。而隨著(zhù)Dragon TV的發(fā)布,包括服務(wù)提供商、消費電子廠(chǎng)商和通過(guò)互聯(lián)網(wǎng)傳輸(OTT)的內容提供商等角色將共同構成一個(gè)更具競爭力的互聯(lián)網(wǎng)電生態(tài)系統,在為用戶(hù)提供更佳應用體驗的基礎上,贏(yíng)得更廣闊的市場(chǎng)先機。
語(yǔ)音技術(shù)的門(mén)檻
盡管有消息稱(chēng),蘋(píng)果IOS下一個(gè)版本將會(huì )出現中文版本,但是在這個(gè)市場(chǎng)空白期,足以給“中國版siri”以成長(cháng)空間。雖然中國有類(lèi)似于安徽科大訊飛這樣的專(zhuān)注中文語(yǔ)音識別的本土廠(chǎng)商,但對Nuance并未造成威脅。鄭裕慶認為Nuance在中文領(lǐng)域并不存在劣勢,“我們現在主要支持普通話(huà)和廣東話(huà),還有臺灣 國語(yǔ)。對于中文最難解決的口音問(wèn)題嗎,我們從1999年開(kāi)始就在采集各種口音來(lái)訓練我們的引擎。”
作為全球最大的手機制造中心以及市場(chǎng),對于中國的手機廠(chǎng)商來(lái)說(shuō),在從功能機轉型智能機的過(guò)程中,他們急切的希望能夠添加完善的語(yǔ)音解決方案,而不僅僅是簡(jiǎn)單的下載一個(gè)“語(yǔ)音識別”輸入法或應用這么簡(jiǎn)單。
鄭裕慶表示,其實(shí)語(yǔ)音解決方案對于技術(shù)和投入的要求還是很高的,需要投入大量的人力物力,一些小公司很難有這個(gè)決心去做。“比如語(yǔ)音的話(huà),就是你要知道怎么去設計這個(gè)語(yǔ)音界面,需要有語(yǔ)音設計背景的專(zhuān)業(yè)人員。技術(shù)和硬件都有要求。硬件如耳麥等,要求用比較好的產(chǎn)品,但是會(huì )提高成本。出于技術(shù)成熟度來(lái)考慮,需要對產(chǎn)品有一定時(shí)間的磨合,比如Siri從蘋(píng)果收購到最終出產(chǎn)品就用了兩年,這些對于中小客戶(hù)來(lái)說(shuō)都不太可能接受。” |