當前位置：

首頁 > 新聞 > Sceince子刊：利用AI＋腦電波，鎖定你想聽的聲音

Sceince子刊：利用AI＋腦電波，鎖定你想聽的聲音

新聞 05-23

新智元原創

來源：Medium

編輯：鵬飛

【新智元導讀】哥倫比亞大學的工程師們宣布一項實驗技術，該技術可模仿大腦檢測和放大許多聲音的天生能力。這種由大腦控制的助聽器由人工智慧驅動，可作為自動過濾器，監控佩戴者的腦電波並增強他們想要關注的聲音。雖然仍處於早期開發階段，但該技術是邁向更好助聽器的重要一步，使佩戴者能夠無縫，高效地與周圍的人交談。

人類大腦具有非凡的能力，可以在嘈雜的環境中挑選出特定的聲音。比如，在嘈雜的酒吧里留意中意對象的說話、在車水馬龍的街道分辨身後來車等等。

這在人類來說很輕鬆就能做到，可連最先進的助聽器也無法實現。不過，哥倫比亞大學的工程師們正在改變這種情況。

他們宣布已經實現一項技術，可以模仿大腦天生具備的檢測並放大特定聲音的能力，並開發出一款由大腦控制的助聽器。

助聽器由AI驅動，可作為自動過濾器，監控佩戴者的腦電波並增強他們想要關注的聲音，從而能夠讓佩戴者無縫並高效地與周圍的人交流。

論文發表在Science Advances上。據悉，一作Cong Han在杭州科技大學獲得學士學位，在哥倫比亞大學獲得碩士學位。

雞尾酒會難題

哥倫比亞大學Mortimer B. Zuckerman Mind Brain Behavior Institute的主要研究員和該論文的資深作者Nima Mesgarani博士說，處理聲音的大腦區域非常敏感，也非常強大，可以毫不費力的放大一個特定聲音而不牽扯其他聲音，今天的助聽器卻做不到。

那麼通過創造一種利用大腦本能的助聽設備，有望使全球數億聽障人士能夠像普通人一樣輕鬆地進行交流。

現代助聽器在降噪方面已經做的非常出色了，但實現的過程卻是通過提高特定種類的聲音，使其蓋過其它背景音。科學家稱之為雞尾酒會難題。

想像一下，我們在一個嘈雜的雞尾酒會，不僅每個人都在說話，大廳還放著BGM。為了讓身邊的人聽清楚你不得不提高嗓門說話，而旁邊的人為了讓你聽清楚也不得不提高自己的音量。

哥倫比亞工程公司電氣工程副教授Mesgarani博士說：「助聽器會立刻放大所有人的聲音，你仍然無法將你的談話對象和其他人區分出來」

用腦電波來放大特定聲音

為什麼會想到利用腦電波呢？Mesgarani稱他們發現兩個人在交談的時候，講者的腦電波開始和聽著趨同。

於是該團隊將語音分離演算法與神經網路、以及模仿大腦自然計算能力的複雜數學模型相結合，開發了一款腦控助聽器，使用腦電波來判斷哪些聲音應該被放大，哪些聲音應該被抑制。

具體實現方式如下：

首先從一個組中分離出每個說話者的聲音。設備自動將多個揚聲器分離成單獨的流，然後將每個揚聲器與來自用戶大腦的神經數據進行比對。一旦某人的聲音模式與聽者的腦電波匹配度最高，他的聲音就會被放大。

其實團隊早在2年前就發布了這項技術的初代版本，但限於預訓練數據集，效果剛開始不是很理想。比如一旦出現不在數據集的聲音，比如來個路人問路，系統就凌亂了。

好在哥倫比亞科技風險投資公司的資助下，團隊對原始演算法進行了改進，Mesgarani博士、第一作者Cong Han和James O"Sullivan博士再次利用深度神經網路，構建了一個更加複雜的模型，從而能夠識別任何人聲，從而解決了上述問題。

室內測試顯示，效果還不錯

為了測試該演算法的有效性，研究人員與Northwell Health Institute for Neurology and Neurosurgery的神經外科醫生Ashesh Dinesh Mehta合作，找來志願患者聽取不同的講者發言，研究人員利用植入患者大腦的電極直接監測他們的腦電波、

當患者專註於一個揚聲器時，系統會自動放大該聲音。當他們的注意力轉移到另一個揚聲器時，音量水平發生變化以反映這種轉變。

接下里，研究人員希望不用植入大腦這種太過簡單粗暴的方式，例如將其置於頭皮外部或耳朵周圍。

目前為止只在室內環境中進行了測試，Mesgarani博士說未來有望在室外環境也實現相同的效果。

參考鏈接：

https://medium.com/predict/can-our-minds-live-forever-29105faf2d80

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※首鋼園「創新英雄召集令」擴大徵集！最高補助2000萬！
※【GitHub金牌】程序員必讀職場15大定律和7大原則

TAG:新智元 |