2012年12月16日 星期日

音訊媒體

聲音的基本原理 


當介質(如空氣、水)中產生了震動,此震動對介質造成壓力,而此壓力會以波的形式藉由介質向外擴散,當這些波傳到人的耳朵且頻率範圍在人耳可感應的範圍內(20Hz~20kHz),耳膜會因感應而聽見聲音,這就是聲音的產生


各種分貝與功率之範例 


分貝(dB功率(W範例
100.000000001農村的靜夜
200.00000001樹葉落地
300.0000001耳邊輕聲低語
500.000001普通說話聲
600.00001百貨公司內
800.0001公共汽車上
900.001捷運呼嘯聲
1000.01高速公路汽車聲
1100.1電鋸旁邊
140-150100-1000飛機旁邊





Analog to Digital 的流程




首先聲音經過麥克風輸入到電腦
這些聲音波動轉換成一連串高低變化的電壓波
將此波透過一低通濾波器濾除其高頻雜訊
透過類比數位轉換器(Analog Digital Converter,ADC)將聲音波型數位化
將數位化音訊存入記憶體


Digital to Analog 的流程



將數位化音訊讀出記憶體
透過數位類比轉換器((Digital Analog Converter,DAC)將數位訊號還原
還原波再經過一低通濾波器將高次諧波濾除,聲音就會比較平滑。
輸出至揚聲器


取樣頻率

聲音數位化最重要的就是將類比訊號取樣
取樣頻率越高,亦即取樣間隔時間越短,所擷取後的數位音訊資料也就越準確

 一般我們常見的取樣頻率為11.025kHz、22.05kHz、44.1kHz
CD音質則為44.1kHz、16bits位元深度(解析度)
越高的取樣頻率與越高的位元深度會有越好的音質。


量化-位元深度(解析度 )


取樣在每一個上升邊緣時,ADC (Analog Digital Converter) 會將當時的值紀錄下來,而此紀錄的値稱為樣本,單位為bit(或稱為解析度),此動作即為量化。


雜訊產生的原因


當一輸入波形範圍從0~10V時,採用4bits位元深度做為樣本,而4bits為0~15,扣除0有15種區間,所以:
輸入的值為(2/3)V時,樣本值為0001,而(4/3)V時,樣本值為0010,我們可發現,如果當輸入值為1V時,將被四捨五入成為0010=(4/3)V,因為位元深度造成的誤差,就造成了數位還原為類比時的不連續,雜訊就是這樣產生的。


修剪 


量化過程中如果位元深度不足,輸入的類比訊號最大值超過此位元深度可使用的區間時,就會將振幅超出最大值的部分修剪為可用區間的最大值
被修剪掉的部份就成為了失真或是雜音,因此輸入的聲音過大時,錄製起來的聲音會「爆音」即是此原因。


音訊檔案容量

容量計算公式:
取樣率(Hz) * 時間(s) * 位元深度(bit) / 8 * 聲道數量
【其中位元深度 / 8 的8是因為一個位元組(byte)有8個bit】

 例: 30秒的CD音質錄製下的立體聲檔案大小為5292000bytes
44100 * 30 * 16 / 8 * 2 = 5292000bytes(位元組)


常用的音訊設定格式與容量 


取樣率(Hz)解析度(bit)聲道容量(位元組每秒)
44100162172kbytes
4410016186kbytes
441008286kbytes
2205016286kbytes
2205016143kbytes
220508243kbytes
1102516243kbytes
1102516121kbytes
110258221kbytes





最小聽覺門檻:


  最小聽覺門檻是一種用來減少資料流的方法,因為人耳對於2kHz ~ 5kHz的敏銳度與察覺度最高,所以它利用人耳的這項特性,將其他頻率的紀錄容量減少,甚至將微小不易察覺的高頻與低頻訊號刪除,以達到資料容量減少的目的 


遮蔽效應


遮蔽效應是一種運用人類聽覺神經特性的技術。
在心理學中這是一種聽覺模型,它是說當一個感覺非常強烈時,同時間人類不太容易覺察到其他的感覺。
舉例來說:當眼睛注視強烈光源時,視線會被光線遮蔽,不容易看見其他物體;對聲音而言,在一場震耳欲聾的演唱會中,人耳很難去注意到五公尺以外傳來的微小咳嗽聲。
遮蔽效應就是利用刪除或適當分配較低的取樣頻率給這些被別的較突出的聲音遮蔽後變的較不易被察覺的聲音來減少其容量大小。

音訊檔案格式 


未壓縮的波形音訊格式
破壞性壓縮格式
MIDI
網路串流格式 

未壓縮的波形音訊格式
.wav    由微軟制定,採PCM編碼的未壓縮波形格式,主要用於Windows PC中,副檔名為.wav
.au    AU是UNIX下一種常用的格式,為昇陽(SUN)所開發,其副檔名為.au
.aiff    AIFF是Apple的標準格式,其副檔名為.aiff,平時我們熟知的QuickTime就是使用aiff作為音訊的軟體

破壞性壓縮格式
.mp3    MP3(MPEG Audio Layer 3)屬於MPEG標準的一環,其副檔名為.mp3,由於MP3其高效率的資料壓縮與音質效果,再加上便利的播放程式以及編碼程式支援,使得MP3的使用者越來越多,有逐漸成為多媒體影音標準的趨勢
.wma    WMA就是Windows Media Audio,由微軟開發,其副檔名為.wma,其最大特色就是比MP3容量還要小一半,且音質不輸mp3

MIDI(Musical Instrument Digital Interface)樂器數位界面
1983年世界著名電子音樂製造廠商共同制訂MIDI標準,使各種與電子音樂有關的設備能相互連接與訊息交流。
從字義上可以了解,以MIDI是一種數位化的界面,對於電子設備該如何發音訂出了一套統一的規格,所以不同廠商所設計製造的軟、硬體,只要符合MIDI的規格,便具有互通性。
自Window 3.1起,把MIDI列為支援的規格之後,使得MIDI成為電腦音樂軟體必須遵循的標準格式。 

網路串流格式
WMA 在只有64kbps的位元速率下,WMA可以達到接近CD的音質(相當於128kbps的MP3)。 WMA支援串流技術可邊讀邊播,因此WMA可以很輕鬆的完成線上廣播
Real Audio    普遍應用於網際網路上的聲音格式,必須安裝Real Player播放程式,才能播放。 



來源:web.ydu.edu.tw/~hjw/course/media/FCH02.ppt 

沒有留言:

張貼留言

注意:只有此網誌的成員可以留言。