Google 的新 AI 技術可以將兩個同時在說話的人聲分離出來

強大了!手機也可以換單反鏡頭!
April 13, 2018
《魔物獵人世界》官方透露新地圖計劃中!
April 13, 2018

Google 的新 AI 技術可以將兩個同時在說話的人聲分離出來

人類一個極為強大的能力,是能在一片有著許多人在說話的背景雜音中,精準地「過濾」掉其他人的聲音,只留下自己對話的對象。過去一直認為電腦要獲得這樣的能力不容易,但 Google 的專家們取了個巧,利用深度學習結合臉部辨識,達到了相當好的效果。

簡單來說,研究學者先用「乾淨」的人聲與對應的視覺影像混合成一個假想的吵鬧場景,然後訓練機器去辨識如何從場景中還原出單一的人聲來,最後產生一個模型。以這個臉部與聲線對應的模型為基礎,餵給電腦真實世界的影片時,當臉部偵測到目標嘴巴在動,系統就會試圖抓取音訊檔,將…
Source: Engadget

發表迴響

你的電子郵件位址並不會被公開。