當前位置:
首頁 > 新聞 > Sceince子刊:利用AI+腦電波,鎖定你想聽的聲音

Sceince子刊:利用AI+腦電波,鎖定你想聽的聲音

新智元原創

來源:Medium

編輯:鵬飛

【新智元導讀】哥倫比亞大學的工程師們宣布一項實驗技術,該技術可模仿大腦檢測和放大許多聲音的天生能力。這種由大腦控制的助聽器由人工智慧驅動,可作為自動過濾器,監控佩戴者的腦電波並增強他們想要關注的聲音。雖然仍處於早期開發階段,但該技術是邁向更好助聽器的重要一步,使佩戴者能夠無縫,高效地與周圍的人交談。

人類大腦具有非凡的能力,可以在嘈雜的環境中挑選出特定的聲音。比如,在嘈雜的酒吧里留意中意對象的說話、在車水馬龍的街道分辨身後來車等等。

這在人類來說很輕鬆就能做到,可連最先進的助聽器也無法實現。不過,哥倫比亞大學的工程師們正在改變這種情況。

他們宣布已經實現一項技術,可以模仿大腦天生具備的檢測並放大特定聲音的能力,並開發出一款由大腦控制的助聽器。

助聽器由AI驅動,可作為自動過濾器,監控佩戴者的腦電波並增強他們想要關注的聲音,從而能夠讓佩戴者無縫並高效地與周圍的人交流。

論文發表在Science Advances上。據悉,一作Cong Han在杭州科技大學獲得學士學位,在哥倫比亞大學獲得碩士學位。

雞尾酒會難題

哥倫比亞大學Mortimer B. Zuckerman Mind Brain Behavior Institute的主要研究員和該論文的資深作者Nima Mesgarani博士說,處理聲音的大腦區域非常敏感,也非常強大,可以毫不費力的放大一個特定聲音而不牽扯其他聲音,今天的助聽器卻做不到。

那麼通過創造一種利用大腦本能的助聽設備,有望使全球數億聽障人士能夠像普通人一樣輕鬆地進行交流。

現代助聽器在降噪方面已經做的非常出色了,但實現的過程卻是通過提高特定種類的聲音,使其蓋過其它背景音。科學家稱之為雞尾酒會難題。

想像一下,我們在一個嘈雜的雞尾酒會,不僅每個人都在說話,大廳還放著BGM。為了讓身邊的人聽清楚你不得不提高嗓門說話,而旁邊的人為了讓你聽清楚也不得不提高自己的音量。

哥倫比亞工程公司電氣工程副教授Mesgarani博士說:「助聽器會立刻放大所有人的聲音,你仍然無法將你的談話對象和其他人區分出來」

用腦電波來放大特定聲音

為什麼會想到利用腦電波呢?Mesgarani稱他們發現兩個人在交談的時候,講者的腦電波開始和聽著趨同。

於是該團隊將語音分離演算法與神經網路、以及模仿大腦自然計算能力的複雜數學模型相結合,開發了一款腦控助聽器,使用腦電波來判斷哪些聲音應該被放大,哪些聲音應該被抑制。

具體實現方式如下:

首先從一個組中分離出每個說話者的聲音。設備自動將多個揚聲器分離成單獨的流,然後將每個揚聲器與來自用戶大腦的神經數據進行比對。一旦某人的聲音模式與聽者的腦電波匹配度最高,他的聲音就會被放大。

其實團隊早在2年前就發布了這項技術的初代版本,但限於預訓練數據集,效果剛開始不是很理想。比如一旦出現不在數據集的聲音,比如來個路人問路,系統就凌亂了。

好在哥倫比亞科技風險投資公司的資助下,團隊對原始演算法進行了改進,Mesgarani博士、第一作者Cong Han和James O"Sullivan博士再次利用深度神經網路,構建了一個更加複雜的模型,從而能夠識別任何人聲,從而解決了上述問題。

室內測試顯示,效果還不錯

為了測試該演算法的有效性,研究人員與Northwell Health Institute for Neurology and Neurosurgery的神經外科醫生Ashesh Dinesh Mehta合作,找來志願患者聽取不同的講者發言,研究人員利用植入患者大腦的電極直接監測他們的腦電波、

當患者專註於一個揚聲器時,系統會自動放大該聲音。當他們的注意力轉移到另一個揚聲器時,音量水平發生變化以反映這種轉變。

接下里,研究人員希望不用植入大腦這種太過簡單粗暴的方式,例如將其置於頭皮外部或耳朵周圍。

目前為止只在室內環境中進行了測試,Mesgarani博士說未來有望在室外環境也實現相同的效果。

參考鏈接:

https://medium.com/predict/can-our-minds-live-forever-29105faf2d80

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

首鋼園「創新英雄召集令」擴大徵集!最高補助2000萬!
【GitHub金牌】程序員必讀職場15大定律和7大原則

TAG:新智元 |