一、聲音的基本概念
聲音是通過(guò)一定介質(zhì)傳播的連續的波。
圖1 聲波
重要指標:
- 振幅:音量的大小
- 周期:重復出現的時(shí)間間隔
- 頻率:指信號每秒鐘變化的次數
聲音按頻率分類(lèi):
圖2 聲音的頻率(語(yǔ)音信號頻率范圍:300Hz-3kHz)
聲音的傳播攜帶了信息,它是人類(lèi)傳播信息的一種主要媒體。 聲音的三種類(lèi)型:
- 波形聲音:包含了所有聲音形式
- 語(yǔ)音:不僅是波形聲音,而且還有豐富的語(yǔ)言?xún)群?抽象→提取特征→意義理解)
- 音樂(lè ):與語(yǔ)音相比,形式更規范。音樂(lè )是符號化的聲音。
二、聲音的數字化
1.聲音信號的類(lèi)型
2.聲音數字化過(guò)程
圖3 聲音數字化過(guò)程
3.聲音數字化過(guò)程示意圖
圖4 聲音數字化過(guò)程示意圖
4.聲音數字化三要素
采樣頻率
|
量化位數
|
聲道數
|
每秒鐘抽取聲波幅度樣本的次數
|
每個(gè)采樣點(diǎn)用多少二進(jìn)制位表示數據范圍
|
使用聲音通道的個(gè)數
|
采樣頻率越高
聲音質(zhì)量越好
數據量也越大
|
量化位數越多
音質(zhì)越好
數據量也越大
|
立體聲比單聲道的表現力豐富,但數據量翻倍
|
11.025kHz
22.05 kHz
44.1 kHz
|
8位=256
16位=65536
|
單聲道
立體聲
|
5.聲音數字化的數據量
音頻數據量=采樣頻率×量化位數×聲道數/8(字節/秒)
采樣頻率
(kHz)
|
量化位數
(bit)
|
數據量(KB/s)
|
單聲道
|
立體聲
|
11.025
|
8
|
10.77
|
21.35
|
16
|
21.53
|
43.07
|
22.05
|
8
|
21.53
|
43.07
|
16
|
43.07
|
86.13
|
44.1
|
8
|
43.07
|
86.13
|
16
|
86.13
|
172.27
|
三、音頻的文件格式
1.WAV文件
WAV是Microsoft/IBM共同開(kāi)發(fā)的PC波形文件。因未經(jīng)壓縮,文件數據量很大。
特點(diǎn):聲音層次豐富,還原音質(zhì)好
2.MP3文件
MP3(MPEG Audio layer3)是一種按MPEG標準的音頻壓縮技術(shù)制作的音頻文件。
特點(diǎn):高壓縮比(11:1),優(yōu)美音質(zhì)
3.WMA文件
WMA(Windows Media Audio)是Windows Media格式中的一個(gè)子集(音頻格式)。
特點(diǎn):壓縮到MP3一半
4.MIDI文件
MIDI(樂(lè )器數字接口)是由一組聲音或樂(lè )器符號的集合。
特點(diǎn):數據量很小,缺乏重現自然音
四、數字音頻壓縮標準
1.音頻壓縮方法概述
圖5
壓縮編碼技術(shù)是指用某種方法使數字化信息的編碼率降低的技術(shù)
音頻信號能壓縮的基本依據:
①聲音信號中存在大量的冗余度;
②人的聽(tīng)覺(jué)具有強音能抑制同時(shí)存在的弱音現象。
音頻信號壓縮編碼的分類(lèi):
①無(wú)損壓縮(熵編碼)
霍夫曼編碼、算術(shù)編碼、行程編碼
②有損壓縮
波形編碼--PCM、DPCM、ADPCM 、子帶編碼、矢量量化
參數編碼--LPC
混合編碼--MPLPC、CELP
2.音頻壓縮技術(shù)標準
分類(lèi)
|
標準
|
說(shuō)明
|
電話(huà)語(yǔ)
音質(zhì)量
|
G.711
|
采樣8kHz,量化8bit,碼率64kbps
|
G.721
|
采用ADPCM編碼,碼率32kbps
|
G.723
|
采用ADPCM有損壓縮,碼率24kbps
|
G.728
|
采用LD-CELP壓縮技術(shù),碼率16kbps
|
調幅廣
播質(zhì)量
|
G.722
|
采樣16kHz,量化14bit,碼率224(64)kbps
|
高保真
立體聲
|
MPEG
音頻
|
采樣44.1kHz,量化16bit,碼率705kbps (MPEG三個(gè)壓縮層次,384-64kbps)
|
五、聲卡
1.聲卡的主要功能
聲卡是負責錄音、播音和聲音合成的一種多媒體板卡。其功能包括:
①錄制、編輯和回放數字音頻文件
②控制和混合各聲源的音量
③記錄和回放時(shí)進(jìn)行壓縮和解壓縮
④語(yǔ)音合成技術(shù)(朗讀文本)
⑤具有MIDI接口(樂(lè )器數字接口)
2.芯片類(lèi)型
- CODEC芯片(依賴(lài)CPU,價(jià)格便宜)
|