谷田表示,如何讓機器學(xué)會只錄取特定人和特定聲音是視頻會議音頻處理技術(shù)的重要研究方向,也是雅馬哈人工智能理念的體現(xiàn)。
首先,在網(wǎng)絡(luò)或視頻會議進行的過程中,如果在開放空間或者有來自投影儀等雜音源的場所,如何識別音源的位置是對視頻會議產(chǎn)品與技術(shù)的一個挑戰(zhàn)。
面對這個挑戰(zhàn),雅馬哈采取的對策是,使會議用傳聲揚聲器可以根據(jù)場面的不同而采取不同的收音模式。該揚聲器中的麥克風(fēng)陣列可以識別音源的位置,只收錄說話人的聲音,并清楚地傳達給對方。具體到具備了這樣功能的PJP-100H上,它擁有三種特定模式:第一,區(qū)域模式:最適合在安靜環(huán)境下的會議,在場所有人的聲音都可被錄入;第二,點式模式:可收錄特定方向上的聲音;第三:追蹤模式,設(shè)備可以自動追蹤發(fā)言人的聲音。
其次,視頻會議系統(tǒng)通常會面臨出差員工從外地接入,參加會議這樣的情況,臨時會議錄音功能非常重要。市場上現(xiàn)有的產(chǎn)品一般的解決思路是靠一臺筆記本電腦、軟件外加耳麥,組成臨時的視頻會議端點。但是,長時間使用耳麥容易造成疲勞,也不利于兩位以上的出差員工同時參與。因此,雅馬哈研制了一系列輕巧、便于攜帶的Web會議用傳聲揚聲器,采用USB供電的方式,供連接筆記本電腦使用。
針對此類產(chǎn)品,谷田如此描述他們的技術(shù)設(shè)計思路:這類小型揚聲器具備和個人電腦、音樂播放器連接,以增強其使用率;但更重要的是,不能忽略其傳聲和會議錄音的功能,只錄最需要的聲音。在一次對此類產(chǎn)品PJP-25UR的體驗中,記者一邊利用揚聲器大聲播放電腦中的音樂,同時利用揚聲器錄音現(xiàn)場的對話。最后播放錄音,里面只能聽到記者說話的聲音,完全沒有音樂等雜聲。田丸卓也表示,這是通過對揚聲器和軟件的設(shè)定實現(xiàn)的。