當前位置:
首頁 > 科技 > 從CD到聲波,動聽音樂從哪來?

從CD到聲波,動聽音樂從哪來?

【CD篇】

光碟數字音頻(Compact Disc DigitalAudio)CDDA或CD-DA是音頻光碟的標準格式,光碟紅皮書規定了調製系統(EFM),糾錯設施(CIRC)和八個子碼通道。第一版紅皮書是1980年由索尼和飛利浦發布的,它由數字音頻光碟委員會採用,由國際電工委員會100批准(InternationalElectrotechnical Commission Technical Committee 100)作為1987年的國際參考標準IEC60908發布,第二版在1999年發布,該標準並不是免費的,其必須從飛利浦和IEC獲得。

專業的朋友們知道CD-DA中包含的音頻格式為雙通道,16bit,44100Hz採樣的線性PCM格式。為什麼會用到44.1kHz16bit這個格式。前者是來源於奈奎斯特採樣定律,即如果想保留一個完整的頻率信息,至少需要以該頻率的2倍進行採樣。通常人耳最高可以聽到20kHz,所以採樣頻率必須高於40kHz,至於為什麼CD中是44.1kHz以及視頻標準中是48kHz就得去問索尼和飛利浦的工程師當年為什麼不湊個整。而16bit的位寬則帶來了96.33 dB的信噪比,有足夠的解析度保證音頻信息足夠清晰不被雜訊淹沒,當年的飛利浦一直採用14bit,索尼一直採用16bit,結果索尼打敗了飛利浦,最終標準為16bit 44.1kHz。當然今天錄音室的錄音標準遠超過16bit以及44.1kHz,不過壓制出來的CD還是這樣。早期的CD還會採用「預加重」的手段來增強音頻當中的高頻信息,以至於在解碼的時候不會損失太多高頻(早期的CD機模擬低通濾波器的性能有限,但今天通常採用數字濾波器取代大部分的模擬濾波器的工作)之後播放時可以選擇是否去加重。當然今天的音頻在錄製中通常不會預加重。

今天的CD通常都可以播放超過80分鐘的歌曲,數據通常以凹坑和平台的方式記錄在光碟上,用來代表一系列0和1,通常凹坑代表0,凹坑的邊緣代表1。音頻數據流通常包含三個部分:引入軌道,主音頻信息,引出軌道,而子碼貫穿這三個部分。引入和引出軌道是靜音的,引入軌道包含了光碟的目錄,即包含了音軌的起始位置以及引出軌道的位置。軌道位置由時間代碼確定,時間代碼以分、秒、幀格式記錄,其中1幀等於1/75秒,CD機讀取目錄裡面的時間碼,再對應子碼裡面的時間碼找到歌曲的位置。這個目錄就相當於硬碟上的分區表。每一幀又包含98個數據小幀,一個數據小幀包含33位元組的數據信息,其中的24位元組是音頻信息(16bit*2channel*6samples= 192bits/8 = 24位元組)其中的8位元組為CIRC糾錯數據,1位元組為子碼數據。所以98*75*6= 44100剛好每秒鐘有44100個音樂樣本,即44.1kHz。

與DVD和CD-ROM不同,音頻CD當中沒有「文件」這個東西,只有一連串的LPCM數據流以及貫穿的8個子碼數據流,但是Windows可以把它的目錄讀取為CDA文件。翻錄的過程中,提取軟體讀取其中的音頻數據保存在常見的音頻格式中,比如WAV、AIFF、FLAC、MP3等。有些出版商為了防止CD被翻錄,在CD中混入DVD層(因為CD與DVD的光碟需要不同的激光讀取)但飛利浦表示這樣的光碟不符合標準,如果使用CDDA的商標會造成侵權。2005年索尼BMG音樂娛樂公司就秘密在電腦上安裝XCP防複製軟體,違反了CDDA的標準。下圖為EsotericVRDS-NEO 光碟讀取機械臂,應該稱得上業界最精密的光碟機械臂了。一般情況下光碟機讀取的數據都會保存在緩存當中,而緩存的速度要比馬達反應快得多。這樣的機械臂算得上工藝品了。一般情況下的速度:CD

音頻文件格式是用於在計算機系統上存儲數字音頻數據的文件格式。這些音頻信息通常是經過編碼器對於音頻信息進行一定規律的編碼,通常需要保存的音頻信息有聲音的時間信息和聲音的振幅信息(或叫做位深,位寬,比特信息)進行有損或者無損編碼,常見的格式有mp3、ogg、aac、flac、wav、ape等,比較知名的無音頻信息損失的(無損)編碼格式有ape、flac、wav,其中wav格式是始於微軟Windows系統上無壓縮的格式,通常比較佔用磁碟空間。有損壓縮之後的音頻文件通常會刪除掉一些人耳很難聽到的音頻信息(特別高的頻率或許只有狗能聽到)取決於不同的有損編碼系統,不同的編碼器對於刪除音頻文件的哪一部分才會儘可能保留最大的音頻信息以及採用什麼樣的音頻解析演算法有不同的措施。通常高碼率的mp3格式會刪除掉16kHz以上的頻率。通過Audition等軟體可以看到頻譜圖中16kHz以上被削去。如果一個人重新用無損格式去錄製一個有損的音頻信息那麼就會很難發現其中的端倪,畢竟自然界中什麼樣的聲音都會存在的。

通常一個CD格式的音頻為雙通道16bit,44.1kHz,這個16bit以及44.1kHz就好像坐標軸,描述著一個聲音的波形。這其中16bit就是音頻當中的振幅信息,也就是下圖中縱坐標的部分,相當於聲波信息的解析度。44.1kHz是時域信息,也就是下圖中橫坐標的部分,相當於聲波的信息量,44,100 samples/second即橫坐標每秒鐘有44100根棒棒糖,縱坐標有16bit也就是2^16= 65536層。音頻文件就是用這些棒棒糖在什麼時刻出現在什麼振幅位置(哪一層)來表達音頻信息。(實際的音頻文件如下圖,但縱坐標(-8~7)的區間內有65536層)。或者你可以認為振幅信息就是音量大小,反映在自然界就是喇叭上振膜的推拉幅度以及位置。

播放音樂文件的過程也是對於編碼後的音頻文件進行解碼的過程,無論是通過電腦播放還是CD機播放,播放器都需要按照均勻的時間順序將音頻文件的振幅信息傳遞給DAC或叫Decoder(Digital to Analog Converter數字到模擬轉換器)而DAC需要做的工作就是按照時間順序把這些振幅信息轉換為電壓信息從而驅動喇叭。如果播放器不能把音頻文件按照標準的時間順序傳遞給DAC,專業領域稱之為Jitter,即時間抖動,如果播放器在1秒內把所有音頻文件傳遞給DAC,那麼你將會聽到爆音;如果一個3分鐘的歌曲在小於3分鐘的時間傳遞給DAC,那麼你將會聽到音頻被加速,效果則會是這個聲音頻率變高,男聲變女聲等;如果是一個不起眼的微小的時鐘誤差傳遞給DAC,(HiFi發燒友眼中是容不下一粒沙的)在不同的解碼系統中會造成不同的結果。通常的結果會是干擾數字濾波器,產生一些不耐聽的不順暢的齒音,造成聲音的不連貫不耐聽。如果你對於CD機或數字音源的讀取以及時鐘抖動感興趣,不妨點閱讀原文來看看這篇文章,這篇文章詳細解讀了CD機的結構,採用CD內部傳輸(一般為飛利浦I2S標準)或外部採用同軸(SPDIF索尼飛利浦數據介面)或光纖的傳輸方式對於解碼系統在時鐘同步上的影響。

標準的音頻解碼DAC定義振幅電壓區間為2Vrms,這同樣是一個比較早期的標準,如同44.1kHz這個標準一樣早,(視頻文件中附帶的音頻文件通常為48kHz)2Vrms換算成標準的電壓區間為5.6Vpp,即一個理想的DAC需要在這5.6Vpp的電壓區間內能夠表達出65536種不同的電壓信息,即2^16= 65536(也就是16bit的音頻信息),那麼這個解碼晶元最精細需要至少可以表達出5.6Vpp/65536 =0.00008545v為一個單位區間的電壓,鑒於成本以及工藝原因,目前市面上許多的音頻晶元還不能達到這個標準,DAC的詳細解釋說明請關注之後的文章。

此外我個人建議在Windows播放歌曲的時候對揚聲器進行這樣設置:

聲音——播放設備——揚聲器——配置——立體聲——下一步——勾選全音域揚聲器下的左前方和右前方——下一步——完成

聲音——播放設備——揚聲器——屬性——增強——勾選禁用所有聲音效果——高級——默認格式選擇24位,44100Hz——確定

這樣設置基於兩點原因,其一是Windows系統本身要對多條音軌進行混合疊加才能輸出,默認格式選擇24位播放既儘可能還原原始的振幅信息,畢竟如果在重採樣階段發生溢出,就會導致輸出失真,這樣一來音質自然會打折扣;其二設置在44100Hz盡量不給Windows過採樣太多自由發揮的空間(如下圖的情況就可能會導致音頻信息的失真),同樣是儘可能保留原始的音頻信息。

圖片引用自數碼多網站

這節當中,我們可以簡單了解一下CD當中音頻是怎麼存在的,後文當中,我們還會進一步對變成聲音的過程進行討論,感興趣的朋友不妨收藏、點贊、轉發一下、讓更多感興趣的朋友關注極客灣,如果有機會的話,我會請專業的錄音師朋友幫大家解讀《從麥克風到CD》,包含一些專業的錄音學問,從麥克風的選擇、保養、場景布置、常用的錄音手段、錄音儀器、以及錄音師與發燒友在「音質」方面不同的理解。謝謝大家!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 極客灣 的精彩文章:

周六聊騷|3000預算買相機?選擇非常多!
是什麼蒙蔽了你的雙眼?是環境光遮蔽(二)

TAG:極客灣 |