AI「小冰」30秒為蘇軾古詞譜曲
微軟(亞洲)互聯網工程院 微軟小冰首席科學家 宋睿華
近期,在中央電視台播出的一期綜藝節目《機智過人》中,音樂創作人李泉、黃國倫與人工智慧助手「小冰」同台,分別為蘇軾的古詞《念奴嬌·赤壁懷古》進行音樂編曲,看人們是否能夠分辨出來哪首樂曲是人工智慧創作的,而哪首又是由人類創作的。
最終,「小冰」只用了30秒就創作出了一首古風的音樂,不論是多麼才華橫溢的音樂人,也無法達到這樣的速度。那麼小冰究竟是如何在短時間內完成音樂的創作和編曲的呢?最近,獲得了KDD2018學術會議最佳學生論文獎的論文《小冰樂隊:流行音樂的旋律與編麴生成框架》對此進行了解釋,而微軟小冰首席科學家宋睿華也對此進行了解析。
一首完整的歌曲,通常需要考慮和弦、節拍、節奏型以及編曲,需要其它樂器來進行背景音樂的伴奏。但是,此前在音樂合成領域的工作大多可以產生歌曲的旋律,卻沒有考慮多音軌編曲的問題。不同的音軌和樂器有各自的特點,如何讓它們相互協調是一個需要解決的問題。「如果有多個音軌,就會存在一個問題,如果每個單獨去編曲,最後合在一起的時候未必和諧。」宋睿華說。
因此,中國科學技術大學、微軟人工智慧和研究院、蘇州大學聯合研發了一個用於歌麴生成的端到端旋律和編麴生成框架,也就是「小冰樂隊」,它能夠生成同時伴隨多種樂器的旋律。具體來說,研究團隊設計了一種基於和弦的節奏和旋律交叉生成模型,以生成帶有和弦進行的旋律。然後,提出了一種基於多任務學習的多樂器協同編曲模型。並在一個真實的數據集上進行了實驗。
在「小冰樂隊」的技能實驗過程中,研究人員首先找到並保存了14077個MIDI文件,每個MIDI文件中都包含各種類型的音軌,如旋律、鼓、貝司和弦樂。為了保證實驗結果的可靠性,需要對數據集進行預處理,比如要將所有MIDI文件轉換為C大調或A小調,讓所有音樂保持在同一曲調上。還要將所有音樂的BPM(每分鐘節拍)設置為60,這確保了所有音符都是整數節拍。最後,將每2個小節並為一個樂段。利用數據進行了訓練、調參和驗證之後,獲得了最終的模型。不過,「小冰樂隊」的整體表現如何?考慮到音樂生成的獨特性,並沒有合適的量化指標來進行評估。因此,研究團隊邀請了8名音樂欣賞專家來對每個生成的音樂進行評分,從韻律、旋律、完整以及可唱性等方面進行了打分,從而證實了「小冰樂隊」的有效性。
「我們希望小冰成為一個人們喜歡去用的人工智慧,這需要她有很高的情商,」宋睿華說,「當人們出生後,去看、去聽、去摸索,慢慢地對這個世界有了一個模型,然後人又會創造出一些新地東西,那麼小冰也希望能夠跟世界有這樣的關係。」
在宋睿華看來,小冰會去吸收、會去創造,產生內容,在與人交流的過程中,她不光是一個語音、命令界面,而且她還具有自己的內涵。
※20篇假論文締造的「保健品神話」
※冰山不止是白色,還可以是五彩斑斕的
TAG:環球科學 |