1、多媒體中的音頻處理技術(shù)
多媒體涉及到多方面的音頻處理技術(shù),如:音頻采集、語音編碼/解碼、文一-語轉(zhuǎn)換、音樂合成、語音識(shí)別與理解、音頻數(shù)據(jù)傳輸、音頻一-視頻同步、音頻效果與編輯等。其中數(shù)字音頻是個(gè)關(guān)鍵的概念,它指的是一個(gè)用來表示聲音強(qiáng)弱的數(shù)據(jù)序列,它是由模擬聲音經(jīng)抽樣(即每隔一個(gè)時(shí)間間隔在模擬聲音波形上取一個(gè)幅度值)量化和編碼(即把聲音數(shù)據(jù)寫成計(jì)算機(jī)的數(shù)據(jù)格式)后得到的。計(jì)算機(jī)數(shù)字CD、數(shù)字磁帶(DAT)中存儲(chǔ)的都是數(shù)字聲音。模擬一-數(shù)字轉(zhuǎn)換器把模擬聲音變成數(shù)字聲音;數(shù)字一-模擬轉(zhuǎn)換器可以恢復(fù)出模擬來的聲音。
一般來講,實(shí)現(xiàn)計(jì)算機(jī)語音輸出有兩種方法:一是錄音/重放,二是文一-語轉(zhuǎn)換。第二種方法是基于聲音合成技術(shù)的一種聲音產(chǎn)生技術(shù),它可用于語音合成和音樂合成。而第一種方法是最簡單的音樂合成方法,曾相繼產(chǎn)生了應(yīng)用調(diào)頻(FM)音樂合成技術(shù)和波形表(wavetable)音樂合成技術(shù)。
2、樂器數(shù)字接口MIDI的概念
現(xiàn)在我們用的最多的音頻名詞之一MIDI(musical instrument digital interface)是作為“樂器數(shù)字接口”的縮寫出現(xiàn)的,并用它來泛指數(shù)字音樂的國際標(biāo)準(zhǔn)。由于它定義了計(jì)算機(jī)音樂程序、合成器及其他電子設(shè)備交換信息和電子信號(hào)的方式,所以可以解決不同電子樂器之間不兼容的問題。另外,標(biāo)準(zhǔn)的多媒體PC平臺(tái)能夠通過內(nèi)部合成器或連接到計(jì)算機(jī)MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音樂,所需的存儲(chǔ)量最少。
至于MIDI文件,是指存放MIDI信息的標(biāo)準(zhǔn)文件格式。MIDI文件中包含音符、定時(shí)和多達(dá)16個(gè)通道的演奏定義。文件包括每個(gè)通道的演奏音符信息:鍵通道號(hào)、音長、音量和力度(擊鍵時(shí),鍵達(dá)到最低位置的速度)。由于MDDI文件是一系列指令,而不是波形,它需要的磁盤空間非常少;并且現(xiàn)裝載MIDI文件比波形文件容易的多。這樣,在設(shè)計(jì)多媒體節(jié)目時(shí),我們可以指定什么時(shí)候播放音樂,將有很大的靈活性。在以下幾種情況下,使用MIDI文件比使用波形音頻更合適:需要播放長時(shí)間高質(zhì)量音樂,如想在硬盤上存儲(chǔ)的音樂大于4分鐘,而硬盤又沒有足夠的存儲(chǔ)容量;需要以音樂作背景音響效果,同時(shí)從CD-ROM中裝載其它數(shù)據(jù),如圖像、文字的顯示;需要以音樂作背景音響效果,同時(shí)播放波形音頻或?qū)崿F(xiàn)文一語轉(zhuǎn)換,以實(shí)現(xiàn)音樂和語音的同時(shí)輸出。
3、常見的聲音文件格式
再接下來我們介紹七種目前最為流行的多媒體聲音文件效果讓你認(rèn)識(shí)認(rèn)識(shí):
WAVE,擴(kuò)展名為WAV:該格式記錄聲音的波形,故只要采樣率高、采樣字節(jié)長、機(jī)器速度快,利用該格式記錄的聲音文件能夠和原聲基本一致,質(zhì)量非常高,但這樣做的代價(jià)就是文件太大。
MOD,擴(kuò)展名MOD、ST3、XT、S3M、FAR、669等:該格式的文件里存放樂譜和樂曲使用的各種音色樣本,具有回放效果明確,音色種類無限等優(yōu)點(diǎn)。但它也有一些致命弱點(diǎn),以至于現(xiàn)在已經(jīng)逐漸淘汰,目前只有MOD迷及一些游戲程序中尚在使用。
MPEG-3,擴(kuò)展名MP3:現(xiàn)在最流行的聲音文件格式,因其壓縮率大,在網(wǎng)絡(luò)可視電話通信方面應(yīng)用廣泛,但和CD唱片相比,音質(zhì)不能令人非常滿意。
Real Audio,擴(kuò)展名RA:這種格式真可謂是網(wǎng)絡(luò)的靈魂,強(qiáng)大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網(wǎng)絡(luò)傳輸帶寬資源而設(shè)計(jì)的,因此主要目標(biāo)是壓縮比和容錯(cuò)性,其次才是音質(zhì)。
Creative Musical Format,擴(kuò)展名CMF:Creative公司的專用音樂格式,和MIDI差不多,只是音色、效果上有些特色,專用于FM聲卡,但其兼容性也很差。
CD Audio音樂CD,擴(kuò)展名CDA:唱片采用的格式,又叫“紅皮書”格式,記錄的是波形流,絕對(duì)的純正、HIFI。但缺點(diǎn)是無法編輯,文件長度太大。
MIDI,擴(kuò)展名MID:目前最成熟的音樂格式,實(shí)際上已經(jīng)成為一種產(chǎn)業(yè)標(biāo)準(zhǔn),其科學(xué)性、兼容性、復(fù)雜程度等各方面當(dāng)然遠(yuǎn)遠(yuǎn)超過本文前面介紹的所有標(biāo)準(zhǔn)(除交響樂CD、Unplug CD外,其它CD往往都是利用MIDI制作出來的),它的General MIDI就是最常見的通行標(biāo)準(zhǔn)。作為音樂工業(yè)的數(shù)據(jù)通信標(biāo)準(zhǔn),MIDI能指揮各音樂設(shè)備的運(yùn)轉(zhuǎn),而且具有統(tǒng)一的標(biāo)準(zhǔn)格式,能夠模仿原始樂器的各種演奏技巧甚至無法演奏的效果,而且文件的長度非常小。
總之,如果有專業(yè)的音源設(shè)備,那么要聽同一首曲子的HIFI程度依次是:
原聲樂器演奏 > MIDI > CD唱片 > MOD > 所謂聲卡上的MIDI > CMF,而MP3及RA要看它的節(jié)目源是采用MIDI、CD還是MOD了。
另外,在多媒體材料中,存儲(chǔ)聲音信息的文件格式也是需要認(rèn)識(shí)的,共有:WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干種。
WAV文件:Microsoft公司的音頻文件格式,它來源于對(duì)聲音模擬波形的采樣。用不同的采樣頻率對(duì)聲音的模擬波形進(jìn)行采樣可以得到一系列離散的采樣點(diǎn),以不同的量化位數(shù)(8位或16位)把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制數(shù),然后存入磁盤,這就產(chǎn)生了聲音的WAV文件,即波形文件。Microsoft Sound System軟件Sound Finder可以轉(zhuǎn)換AIF SND和VOD文件到WAV格式。
VOC文件:Creative公司波形音頻文件格式,也是聲霸卡(sound blaster)使用的音頻文件格式。每個(gè)VOC文件由文件頭塊(header block)和音頻數(shù)據(jù)塊(data block)組成。文件頭包含一個(gè)標(biāo)識(shí)版本號(hào)和一個(gè)指向數(shù)據(jù)塊起始的指針。數(shù)據(jù)塊分成各種類型的子塊。如聲音數(shù)據(jù)靜音標(biāo)識(shí)ASCII碼文件重復(fù)的結(jié)果重復(fù)以及終止標(biāo)志,擴(kuò)展塊等。
MIDI文件:Musical Instrument Digital Interface(樂器數(shù)字接口)的縮寫。它是由世界上主要電子樂器制造廠商建立起來的一個(gè)通信標(biāo)準(zhǔn),以規(guī)定計(jì)算機(jī)音樂程序 電子合成器和其它電子設(shè)備之間交換信息與控制信號(hào)的方法。MIDI文件中包含音符定時(shí)和多達(dá)16個(gè)通道的樂器定義,每個(gè)音符包括鍵通道號(hào)持續(xù)時(shí)間音量和力度等信息。所以MIDI文件記錄的不是樂曲本身,而是一些描述樂曲演奏過程中的指令。
RMI文件:Microsoft公司的MIDI文件格式,它可以包括圖片標(biāo)記和文本。
PCM文件:模擬音頻信號(hào)經(jīng)模數(shù)轉(zhuǎn)換(A/D變換)直接形成的二進(jìn)制序列,該文件沒有附加的文件頭和文件結(jié)束標(biāo)志。在聲霸卡提供的軟件中,可以利用VOC-HDR程序,為PCM格式的音頻文件加上文件頭,而形成VOC格式。Windows的Convert工具可以把PCM音頻格式的文件轉(zhuǎn)換成Microsoft的WAV格式的文件。
AIF文件:Apple計(jì)算機(jī)的音頻文件格式。Windows的Convert工具同樣可以把AIF格式的文件換成Microsoft的WAV格式的文件。
DSP: 即Digital Signal Processing 數(shù)字信號(hào)處理.DSP技術(shù)在音調(diào)控制,失真效果器,Wah-wah踏板等模擬電子領(lǐng)域有廣泛的應(yīng)用。同時(shí),DSP在模擬均衡和混響等多種效果上也能大顯身手 。通過電腦CPU或?qū)iT的DSP芯片都可以處理DSP 動(dòng)作,不同的是,專門的DSP芯片處理要比電腦CPU處理更優(yōu)化,速度更快 。
采樣:把模擬音頻轉(zhuǎn)成數(shù)字音頻的過程,就稱作采樣,所用到的主要設(shè)備便是模擬/數(shù)字轉(zhuǎn)換器(Analog to Digital Converter,即ADC。與之對(duì)應(yīng)的是數(shù)/模轉(zhuǎn)換器,即DAC)。采樣的過程實(shí)際上是將通常的模擬音頻信號(hào)的電信號(hào)轉(zhuǎn)換成二進(jìn)制碼0和1,這些0和1便構(gòu)成了數(shù)字音頻文件。采樣的頻率越大則音質(zhì)越有保證.由于采樣率一定要高于錄制的最高頻率的兩倍才不會(huì)產(chǎn)生失真,而人類的聽力范圍是20Hz-20kHz,所以采樣頻率至少得是20k×2=40kHz以保證不產(chǎn)生低頻失真,這也是CD音質(zhì)采用44.1kHz(稍高于40kHz是為了留有余地)的原因。
信噪比:以dB計(jì)算的信號(hào)最大保真輸出與不可避免的電子噪音的比率。該值越大越好。低于75dB這個(gè)指標(biāo),噪音在寂靜時(shí)有可能被發(fā)現(xiàn)。AWE64 Gold聲卡的信噪比是80dB,較為合理。SBLIVE更是宣稱超過120dB的頂級(jí)信噪比。總的說來,由于電腦里的高頻干擾太大,所以聲卡的信噪比往往不令人滿意。但SBLIVE!提供了一個(gè)數(shù)字輸出口SPDIF,可繞過輸出時(shí)的模擬部分,極大地減少了噪音和失真,同時(shí)又極大地提高了動(dòng)態(tài)范圍和清晰度。
FM: Synthesis Frequency Modulation調(diào)配合成技術(shù)。FM發(fā)聲器的原理是先對(duì)音色本質(zhì)進(jìn)行研究計(jì)算之后再通過人工方式“模擬”(或合成)其頻率,使用調(diào)變波去調(diào)變載波,最終獲得不同的音色表現(xiàn)。該方法很難制出逼真的真實(shí)樂器音色,聽上去有很強(qiáng)的人工合成的痕跡。
GM:即通用MIDI標(biāo)準(zhǔn)系統(tǒng)第一級(jí)(General MIDI system Level1),制定于1991年。在GS標(biāo)準(zhǔn)基礎(chǔ)上,規(guī)定了MIDI設(shè)備的最大同時(shí)發(fā)音數(shù)不得少于24個(gè)、鼓镲等打擊樂器作為一組單獨(dú)排列、128種樂器音色有統(tǒng)一的排列方式等。GM的音色排列方式基本上沿襲了GS標(biāo)準(zhǔn).它一推出便得到了全球MIDI廠商的一致支持,實(shí)現(xiàn)了MIDI設(shè)備間的交流。
XG:YAMAHA于1994年提出了自己的音源標(biāo)準(zhǔn)——XG。XG在兼容GM的基礎(chǔ)上做了大幅度的擴(kuò)展,能夠進(jìn)行“音色編輯”和自由發(fā)展不同層次的器材.具有強(qiáng)大的可擴(kuò)充性。同過其“庫方式”可選擇共480種音色。
SMPTE(The Society of Motion Picture and Television Engineers)。它是目前在影音工業(yè)中得到廣泛應(yīng)用的一個(gè)時(shí)間碼概念.該碼用于設(shè)備間驅(qū)動(dòng)的時(shí)間同步,計(jì)數(shù)方式 ,主要參數(shù)格式是:Hours: Minutes : Second : Frames.其中SMPTE 24 Film Sync: 以每秒24幀的速度播放,通常用于電影工業(yè);SMPTE 30 Non-Drop: 該標(biāo)準(zhǔn)適用于音頻領(lǐng)域。
音頻壓縮(Audio Compression).是指降低信號(hào)動(dòng)態(tài)以濾除噪聲和避免動(dòng)態(tài)過大的失真。通過不同的計(jì)算方式、忽略人耳不易察覺的頻段、或通過制造聽覺上的錯(cuò)覺,從而大幅度降低音頻數(shù)據(jù)的數(shù)量,卻令音質(zhì)基本不變甚至更好。
標(biāo)準(zhǔn)的MIDI插頭:一般的MIDI設(shè)備背后都有3個(gè)5針插頭,分別是MIDI IN接受MIDI信息;MIDI OUT發(fā)送該設(shè)備自身的MIDI信息;MIDI THRU轉(zhuǎn)接輸出MIDI IN接受到的MIDI信息。
合唱(Chorus):最常用的音響效果之一。原理是將信號(hào)的調(diào)制延遲部分做copy,然后再與原信號(hào)合成。這種效果可產(chǎn)生多個(gè)相同聲音組合的感覺。MIDI應(yīng)用時(shí),與Reverb等效果適當(dāng)配合和滲透,作出意想不到的效果。
另外還有: 放大器(Amplifier),俗稱“功放”,用以增強(qiáng)電平信號(hào)。 Hz:同一頻率每秒振動(dòng)次數(shù)的單位. quantize: 量化。其作用是對(duì)音符或音頻以某個(gè)精確度進(jìn)行“對(duì)位”。
半雙工(half-duplex):計(jì)算機(jī)技術(shù)上可以在 兩個(gè)方向上進(jìn)行信息傳輸。但在同一時(shí)刻只可單向進(jìn)行。 EQ(Equalize)均衡效果器。其中Paragraphic EQ是參數(shù)圖形均衡器。Graphic EQ是圖示均衡器。用滑動(dòng)控制器作為參數(shù)調(diào)整的多段可變均衡器;瑒(dòng)控制器下的標(biāo)識(shí)與其頻率響應(yīng)所對(duì)應(yīng)。每一頻段的中心頻率與帶寬是固定的。