02 youtube to mp3 買粉絲 software是什么文件格式(各種后綴名稱分別表示什么類型的文件?)

时间:2024-06-01 15:18:25 编辑: 来源:

ise masking),不同的編碼器能夠在不同程度上實現這一點。

一些可能的編碼器:

* Mike Cheng在1998年早些時候首次開發的LAME。 與其它相比,它是一個完全遵循LGPL的MP3編碼器,它有良好的速度和音質,甚至對MP3技術的后繼版本形成了挑戰。

* Fraunhofer Gesellschaft:有些編碼器不錯,有些有缺陷。

有許多的早期編碼器現在已經不再廣泛使用:

* ISO dist10 參考代碼

* Xing

* BladeEnc

* ACM Procer Pro.

好的編碼器能夠在128到160kbit/s下達到可接受的音質,在160到192kbit/s下達到接近透明的音質。所以不在特定編碼器或者最好的編碼器話題內說128kbit/s或者192kbit/s下的音質是容易引起誤解的。一個好的編碼器在 128kbit/s下生成的MP3有可能比一個不好的編碼器在192kbit/s下生成的MP3音質更好。另外,即使是同樣的編碼器同樣的文件大小,一個不變位速的MP3可能比一個變位速的MP3音質要差很多。

需要注意的一個重要問題是音頻信號的質量是一個主觀判斷。Placebo effect is rampant, with many users claiming to require a certain quality level for transparency.許多用戶在A/B測試中都沒有通過,他們無法在更低的位速下區分文件。一個特定的位速對于有些用戶來說是足夠的,對于另外一些用戶來說是不夠的。每個人的聲音感知可能有所不同,所以一個能夠滿足所有人的特定心理聲學模型并不明顯存在。僅僅改變試聽環境,如音頻播放系統或者環境可能就會顯現出有損壓縮所產生的音質降低。上面給出的數字只是大多數人的一個大致有效參考,但是在有損壓縮領域真正有效的壓縮過程質量測試手段就是試聽音頻結果。

如果你的目標是實現沒有質量損失的音頻文件或者用在演播室中的音頻文件,就應該使用無損壓縮算法,目前能夠將16位PCM音頻數據壓縮到38%并且聲音沒有任何損失,這樣的壓縮工具有Lossless Audio LA、Apple Lossless、TTA、FLAC、Windows Media Audio 9 Lossless (wma) 和Monkey’s Audio 等等。對于需要進行編輯、混合處理的音頻文件要盡量使用無損格式,否則有損壓縮產生的誤差可能在處理后無法預測,多次編碼產生的損失將會混雜在一起,在處理之后進行編碼這些損失將會變得更加明顯。無損壓縮在降低壓縮率的代價下能夠達到最好的結果。

一些簡單的編輯操作,如切掉音頻的部分片段,可以直接在MP3數據上操作而不需要重新編碼。對于這些操作來說,只要使用合適的軟件(mp3DirectCut和MP3Gain),上面提到的所關心的問題可以不必考慮。

位速

位速對于MP3文件來說是可變的。總的原則是位速越高則聲音文件中包含的原始聲音信息越多,這樣回放時聲音質量也越高。在MP3編碼的早期,整個文件使用一個固定的位速。

MPEG-1 Layer 3允許使用的位速是32、40、48、56、64、80、96、112、128、160、192、224、256和320 kbit/s,允許的采樣頻率是32、44.1和48kHz。44.1kHz是最為經常使用的速度(與CD的采樣速率相同),128kbit/s是事實上“好品質”的標準,盡管192kbit/s在對等文件共享網絡上越來越受到歡迎。MPEG-2和[非正式的]MPEG-2.5包括其它一些位速:6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。

可變位速(VBR)也是可能的。MP3文件的中的音頻切分成有自己不同位速的幀,這樣在文件編碼的時候就可以動態地改變位速。盡管在最初的實現中并沒有這項功能,VBR現在已經得到了廣泛的應用。這項技術使得在聲音變化大的部分使用較大的位速而在聲音變化小的部分使用較小的位速成為可能。這個方法類似于聲音控制的磁帶錄音機不記錄靜止部分節省磁帶消耗。一些編碼器在很大程度上依賴于這項技術。

高達640kbit/s的非標準位速可以使用LAME編碼器和自由格式來實現,但是幾乎沒有MP3播放器能夠播放這些文件。

MP3的設計局限

MP3格式有一些不能僅僅通過使用更好的編碼器繞過的內在限制。一些新的壓縮格式如Vorbis和AAC不再有這些限制。

按照技術術語,MP3有如下一些限制:

* 位速最大是320 kbit/s

* 時間分辨率相對于變化迅速的信號來說太低

* 對于超過15.5/15.8 kHz的頻率沒有scale factor band

* Joint stereo 是基于幀與幀完成的

* 沒有定義編碼器/解碼器的整體時延,這就意味著gapless playback缺少一個正式的規定

然而,即使有這些限制,一個好好的調整MP3編碼器能夠非常有競爭力地完成編碼任務。

MP3音頻編碼

MPEG-1標準中沒有MP3編碼器的一個精確規范,然而與此相反,解碼算法和文件格式卻進行了細致的定義。人們設想編碼的實現是設計自己的適合去除原始音頻中部分信息的算法(或者是它在頻域中的修正離散余弦(MDCT)表示)。在編碼過程中,576個時域樣本被轉換成576個頻域樣本,如果是瞬變信號就使用192而不是576個采樣點,這是限制量化噪聲隨著隨瞬變信號短暫擴散。

這是聽覺心理學的研究領域:人類主觀聲音感知。

這樣帶來的結果就是出現了許多不同的MP3編碼器,每種生成的聲音質量都不相同。有許多它們的比較結果,這樣一個潛在用戶很容易選擇合適的編碼器。需要記住的是高位速編碼表現優秀的編碼器(如LAME這個在高位速廣泛使用的編碼器)未必在低位速的表現也同樣好。

MP3音頻解碼

另一方面,解碼在標準中進行了細致的定義。

多數解碼器是bitstream 買粉絲pliant,也就是說MP3文件解碼出來的非壓縮輸出信號將與標準文檔中數學定義的輸出信號一模一樣(在規定的近似誤差范圍內)。

MP3文件有一個標準的格式,這個格式就是包括384、576、或者1152個采樣點(隨MPEG的版本和層不同而不同)的幀,并且所有的幀都有關聯的頭信息(32位)和輔助信息(9、17或者32字節,隨著MPEG版本和立體聲或者單通道的不同而不同)。頭和輔助信息能夠幫助解碼器正確地解碼相關的霍夫曼編碼數據。

所以,大多數的解碼器比較幾乎都是完全基于它們的計算效率(例如,它們在解碼過程中所需要的內存或者CPU時間)。

ID3和其它標簽

“標簽”是MP3(或其它格式)中保存的包含如標題、藝術家、唱片、音軌號或者其它關于MP3文件信息等添加到文件的數據。最為流行的標準標簽格式目前是ID3 ID3v1和ID3v2標簽,最近的是APEv2標簽。

APEv2最初是為MPC 文件格式開發的(參見 APEv2規范)。APEv2可以與ID3標簽在同一個文件中共存,但是它也可以單獨使用。

音量歸一化(normalization)

由于CD和其它各種各樣的音源都是在不同的音量下錄制的,在標簽中保存文件的音量信息將是有用的,這樣的話回放時音量能夠進行動態調節。

人們已經提出了一些對MP3文件增益進行編碼的標準。它們的設計思想是對音頻文件的音量(不是“峰值”音量)進行歸一化,這樣以保證在不同的連續音軌切換時音量不會有變化。

最流行最常用的保存回放增益的解決方法是被簡單地稱作“Replay Gain”的方法。音軌的音量平均值和修剪信息都存在元數據標簽中。

可選技術

有許多其它的有損音頻編解碼存在,其中包括:

* MPEG-1/2 Audio Layer 2 (MP2),MP3的前輩;

* MPEG-4 AAC, MP3的繼承者,Apple的iTunes Music Store和iPod使用;

* Xiph.org Foundation的Ogg Vorbis,自由軟件和沒有專利的編解碼器;

* MPC,也稱作Musepack(以前叫MP+),由MP2派生出來;

* Thomson Multimedia的MP3和SBR的組合mp3PRO;

* AC-3,Dolby Digital和DVD中使用;

* ATRAC,Sony的Minidisc使用;

* Windows Media Audio(WMA)來自于微軟公司;

* QDesign, 用于低速QuickTime;

* AMR-WB+ 針對蜂窩電話和其它有限帶寬使用進行了優化的增強自適應多速寬帶編解碼器(Enhanced Adaptive Multi Rate WideBand 買粉絲dec);

* RealNetworks的RealAudio,經常用于網站的流媒體;

* Speex,基于CELP的專門為語音和VoIP設計的自由軟件和無專利編解碼器。

mp3PRO、MP3、AAC、和MP2都是同一個技術家族中的成員,并且都是基于大致類似的心里聲學模型。Fraunhofer Gesellschaft擁有許多涵蓋這些編解碼器所用技術的基本專利,Dolby Labs、索尼公司、Thomson Consumer Electronics和AT&T擁有其它一些關鍵專利。

在因特網上有一些其它無損音頻壓縮方法。盡管它們與MP3不同,它們是其它壓縮機制的優秀范例,它們包括:

* FLAC 表示’自由無損音頻編解碼(Free Lossless Audio Codec)’

* Monkey’s Audio

* SHN,也稱為Shorten

* TTA

* Wavpack

* Apple Lossless

聽覺測試試圖找出特定位速下的最好質量的有損音頻編解碼。在128kbit/s下,Ogg Vorbis、AAC、MPC和WMA Pro性能持平處于領先位置,LAME MP3稍微落后。在64kbit/s下,AAC-HE和mp3pro少許領先于其它編解碼器。在超過128kbit/s下,多數聽眾聽不出它們之間有明顯差別。什么是“CD音質”也是很主觀的:對于一些人來說128kbit/s的MP3就足夠了,而對于另外一些人來說必須是200kbit/s以上的位速。

盡管如WMA和RealAudio這些新的編解碼器的支持者宣稱它們各自的算法能夠在64kbit/s達到CD音質,聽覺測試卻顯示了不同的結果;然而,這些編解碼器在64kbit/s的音質明顯超過同樣位速下MP3的音質。無專利的Ogg Vorbis編解碼器的開發者宣稱它們的算法超過了MP3、RealAudio和WMA的音質,上面提到的聽覺測試證實了這種說法。Thomson宣稱它的mp3PRO 在64kbit/s達到了CD音質,但是測試者報告說64kbit/s的mp3Pro文件與112kbit/s的MP3文件音質類似,但是直到 80kbit/s時它才

搜索关键词: