東川印記

一本東川,笑看爭龍斗虎;寰茫兦者,度橫佰昧人生。

Exoplayer学习06 音频编码格式

2021年5月28日星期五



声音重放技术的发展路程,是沿着单声(Monophonic)、双声道立体声(Stereophonic)到4通道立体声,再到环绕立体声(Stereo surround),现在一般为5.1模式。其根本目的,就是更逼真地再现原声现场。

我国电视目前大量采用的单声道已远远跟不上人们生活的需要。如何以最低的数据率,最有效地传送多声道、高质量的声音,是数字化的发展方向。

所谓5.1模式,即录制、解码和放声中采用5个声道:

左(L)、中(C)、右(R)、左环绕(LS)、右环绕RS),再加上一个低频效果通道(LFE),就可以达到真正的立体环绕声效果——宽阔的场景深度感和总体真实感。

5.1模式为ATSC和DVB的标准声道。

声道配置:

单声道(中央)
双声道立体声(左、右),选择性地交叉应用杜比环回
三声道立体声(左、中、右)
双声道立体声加单环回(左、右、环回)
三声道立体声加单环回(左、中、右、环回)
四声道环回立体声(左前、右前、左后、右后)
五声道环回立体声(左前、中、右前、左后、右后)

本文只总结最近用到的,即21年常用格式。。。。

1,非压缩格式

声音之所以能够数字化,是因为人耳所能听到的声音频率不是无限宽的,主要在20kHz以下。按照抽样定理,只有抽样频率大于40kHz,才能无失真地重建原始声音。如CD采用44.1kHz的抽样频率,其他则主要采用48kHz或96kHz。

1.1)非线性脉冲编码调制(Pulse-code modulation,简称PCM)

一种非压缩的音频编码格式。此格式是CD-DA的标准。

在计算机中,使用 PCM 编码的音频可以直接以原始音频格式 储存。不过它们通常会被储存在容器中,如WAV、AIFF、AU等(但在技术上这并不是必须的)。

注意,有时 PCM 和 LPCM 都被笼统的称作 PCM,但实际上它们相似却不相同。

PCM(非线性脉冲编码调制)是一种将模拟语音信号变换为数字信号的编码方式。主要经过3个过程:抽样、量化和编码。

     抽样过程将连续时间模拟信号变为离散时间、连续幅度的抽样信号;

     量化过程将抽样信号变为离散时间、离散幅度的数字信号,编码过程将量化后的信号编码成为一个二进制码组输出。
 
    量化分为线性量化和非线性量化。

    线性量化在整个量化范围内,量化间隔均相等。非线性量化采用不等的量化间隔。量化间隔数由编码的二进制位数决定。例如,CD采用16bit线性量化,则量化间隔数L=65536。位数(n)越多,精度越高,信噪比SNR=6.02n+1.76(dB)也越高。但编码的二进制位数不是无限制的,需要根据所需的数据率确定。比如:CD可以达到的数据率为2×44.1×16=1411x2Kbit/s。

因为它们量化间隔不同,所以最后的二进制编码位数不同。

PCM为非线性量化、LPCM为线性量化;

编码过程是将量化后的信号编码成为一个二进制码组输出;

常用的编码码组有3种:自然二进制码组(NBC)、折叠二进制码组(FBC)、格雷二进制码组(RBC)。国际PCM标准主要使用FBC。

PCM中有时会使用相应的技术降低数字信号源的数据率,便于存储和数据传输方便;

1.2)线性脉冲编码调制(Linear Pulse-code modulation,简称LPCM)

一种非压缩的音频编码格式。这是一个 PCM 的变种。

普通CD规格为16bit/44.1kHz,DVD的规格则有多种,量化精度可分为16bit、20bit、24bit,采样频率分为48kHz、96kHz。

此外,LPCM信号中可录入杜比环绕声信息,供现有的杜比定向逻辑环绕声系统使用。

LPCM中通常使用了更多的杜比环绕立体声重放技术,更逼真地再现原声场。

1.3)脉冲密度调制(Pulse-density modulation,简称PDM)

一种非压缩的音频编码格式。

1.4)脉冲强度调制(Pulse-Amplitude Modulation,简称PAM)

一种非压缩的音频编码格式。

1.5)Waveform Audio File Format (简称WAV)

wav是一種無損的音訊檔案格式,WAV符合 PIFF(Resource Interchange File Format)規範。所有的WAV都有一個檔案頭,這個檔案頭音訊流的編碼引數。WAV對音訊流的編碼沒有硬性規定,除了PCM之外,還有幾乎所有支援ACM規範的編碼都可以為WAV的音訊流進行編碼。

Waveform Audio File Format(WAVE,又或者是因为扩展名而被大众所知的WAV),是微软与IBM公司所开发在个人电脑存储音频流的编码格式,在Windows平台的应用软件受到广泛的支持,地位上类似于麦金塔电脑里的AIFF。此格式属于资源交换文件格式(RIFF)的应用之一,通常会将采用脉冲编码调制的音频资存储在区块中。也是其音乐发烧友中常用的指定规格之一。由于此音频格式未经过压缩,所以在音质方面不会出现失真的情况,但文件的体积因而在众多音频格式中较为大。

2,无损压缩

关键词:lossless 劳斯莱斯 无损的

2.1)Dolby TrueHD

Optional lossless surround sound format used by HD DVD and Blu-ray, it uses MLP but adds higher sample rates, bit rates, and more channels

杜比TrueHD(Dolby TrueHD)由杜比实验室开发,是一个基于Meridian Lossless Packing的无损编解码格式。HD DVD光盘强制使用了这技术,蓝光光盘中是可选性的。杜比TrueHD支持24位、192 kHz采样率、14声道,最高比特率达18 Mbps(96 kHz采样率、8声道)或27 Mbps(192 kHz采样率、6声道),但HD DVD和蓝光光盘把最大声道数限制为8,192kHz采样率下为6。它亦支持元数据,包括对白归一及动态范围控制。

2.2)DTS-HD Master Audio (DTS HDMA)

Optional lossless surround sound format used by HD DVD and Blu-ray, it was previously known as DTS++ and DTS-HD

在Blu-ray Disc及HD-DVD新一代蓝光媒体下发表的音效格式。以无损耗方式压缩高达8声道、96kHz/24bit的LPCM声音信息。此格式的对手为杜比TrueHD。

2.3)Free Lossless Audio Codec(FLAC)

FLAC发音: /ˈflæk/,中文直译为自由无损音频压缩编码(注:这里"Free"指的是自由软件——而并不仅是免费)。

FLAC是一款的自由音频压缩编码,其特点是可以对音频文件无损压缩。不同于其他有损压缩编码(如MP3 、AAC等),压缩后不会有任何音质损失

2.4)Apple Lossless Audio Codec(ALAC)

苹果公司推出的无损音频压缩编码格式,可将非压缩音频格式(WAV、AIFF)压缩至原先容量的40%至60%左右,编解码速度很快。也因为是无损压缩,听起来与原文件完全一样,不会因解压缩和压缩而改变。

2.5)MPEG-4 Advanced Audio Coding

可扩展至无损Scalable to lossless(AAC-SLS, also known as HD-AAC)


3,有损压缩

        PCM虽然为无损压缩,但由典型的音频信号表示的信号特性没有达到最佳,也没有很好的适应人耳听觉系统的特定要求。PCM的数据量过高,从而造成存储和传输方面的障碍,因此必须使用相应的技术降低数字信号源的数据率,又尽可能不对节目造成损伤,这就是压缩技术。
 
  人耳的听觉心理有两个特性:频率掩蔽和时间掩蔽特性。人耳在安静的环境中有一个静听阈(门限),即对应于人耳能听到的频率范围能被感觉到的最低声音强度。频率掩蔽,即当一个单音单元出现时,产生一个新的听阈曲线(同听阈),在此频率附近的频段内,门限均有不同程度的提高,以中心频率为最高。时间掩蔽,即当一个强信号出现时,其前后一段时间内,业已存在的弱音可以被掩蔽不被听见。在听阈以下的音频信号不需要编码。

3.1)高级音频编码(英语:Advanced Audio Coding,AAC)

出现于1997年,为一种基于MPEG-2的有损数字音频压缩的专利音频编码标准,由Fraunhofer IIS、杜比实验室、AT&T、Sony、Nokia等公司共同开发。

3.2)Vorbis (ogg)

一种有损音频压缩格式,由Xiph.Org基金会所领导并开放源代码的一个免费的开源软件项目。该项目为有损音频压缩产生音频编码格式和软件参考编码器╱解码器(编解码器)。Vorbis通常以Ogg作为容器格式,所以常合称为Ogg Vorbis。

3.3)杜比数字(Dolby Digital)

又名杜比AC-3(Dolby AC-3),是杜比实验室开发的音频压缩技术的名称。最初命名为杜比立体声数字,直到1995年,除了杜比TrueHD,音频压缩是有损的,基于改进的离散余弦变换(MDCT)算法。

3.4)杜比数字Plus(Dolby Digital Plus)

又称为E-AC-3,是基于AC3的基础进行加强的编码系统。它把最高比特率提升至6 Mbps,支持14声道(13.1),增强的编码技术能够减少压缩对杂讯(artifact)。无法兼容于Dolby Digital器材,但是Dolby Digital Plus解码器可以将Dolby Digital Plus转码成Dolby Digital 通过光纤/同轴输出。

Dolby Digital Plus 是HD DVD和蓝光影碟的必选音频格式。在蓝光播放器中,Dolby Digital Plus是主音轨(Primary Audio)的可选格式,第二音轨(Secondary Audio)必选格式。

3.5)DTS Digital Surrorund (DTS)

DTS is related to the aptX audio coding format, and it is based on the adaptive differential pulse-code modulation (ADPCM) audio data compression algorithm.In contrast, Dolby Digital (AC-3) is based on the modified discrete cosine transform (MDCT) compression algorithm.。

可以通过 光纤、同轴、HDMI传输。

3.6)DTS-HD High Resolution Audio
与DTS-HD Master Audio一起发表,但却以有损耗式压缩。

3.7) MP3

动态图像专家组-1或动态图像专家组-2 音频层III(英语:MPEG-1 or MPEG-2 Audio Layer III),常简称为MP3,是当今流行的一种数字音频编码和有损压缩格式,它被设计来大幅降低音频数据量,通过舍弃PCM音频资料中对人类听觉不重要的部分,达成压缩成较小文件的目的。


应该覆盖了最近常用的格式了吧。。。。

参考https://zh.wikipedia.org/wiki/音频编码格式的比较


--
senRsl
2021年05月24日11:21:05

没有评论 :

发表评论