1 、音频采样率 常用的基础表示符号是fs 。通俗的音频讲采样频率是指计算机每秒钟采集多少个声音样本。采样频率与声音频率之间有一定的基础关系,根据奈奎斯特理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音,是衡量声卡采集、记录和还原声音文件的音频质量标准 。
2、基础采样精度 模拟信号的音频幅度轴进行数字化,它决定了模拟信号数字化以后的动态范围 。采样精度为24bit位即动态范围0~96dbfs。基础
3 、音频帧长 DSP一次处理的基础音频采样点数,决定处理延时。如帧长64,采样率为48Kbps,音频DSP一次计算延时至少0.001333333s.
4 、时钟 4.1、基础音频数据由I2S协议来传输,在I2S中,有很多时序都需要配置。音频 4.1.1 、基础BCLK:位时钟 (Bitclock,BCK,也称串行时钟SCK):确立数据流中两个相邻位之间边界的音频信号 4.1.2 、LRCK:左/右时钟 (LRCK)/字时钟 (Wordclock,也称WS):一个在采样速率下运行、占空比为 50% 的慢时钟,它确立数据流中两条相邻通道(左和右)之间的边界。 4.1.3、MCLK:主时钟,一般而言,DSP不需要音频主时钟,因为它们能够以一种完全不同的速率对数据进行处理, 例如: 设声音的采样频率为44.1 kHz,即声道选择信号(帧时钟)WS的频率必须也为44.1 kHz;左/右2个声道的量化深度均为16 bit,则I2S的SCK的频率为:44.1 kHz×16×2=1.4112 MHz,SCK = 采样率 * 位宽 * 通道数,WS = 采样率
4.2 、音频数据由TDM/PCM来传输,不像I2S有统一的标准,不同的IC厂商在应用TDM时可能略有差异,这些差异表现在时钟的极性、声道配置的触发条件和对闲置声道的处理等 。 TDM/PCM与I2S接口对应关系见下表:
4.2.1 、根据 SD相对帧同步时钟FSYNC的位置,TDM分两种基本模式: Mode A: 数据在FSYNC有效后,BCLK的第2个上升沿有效 Mode B: 数据在FSYNC有效后,BCLK的第1个上升沿有效
注:不同厂商对Mode A和Mode B定义可能有所差别 应用中,总是以帧同步时钟FSYNC的上升沿表示一次传输的开始。帧同步时钟的频率总是等于音频的采样率,比如44.1 kHz,48 kHz等。多数应用只用到FSYNC的上升沿,而忽略其下降沿。根据不同应用FSYNC脉冲宽度的差别,PCM帧同步时钟模式大致分为两种:长帧同步 Long Frame Sync,短帧同步 Short Frame Sync。长帧同步,如图所示,FSYNC脉冲宽度等于1个Slot的长度。Slot在TDM中表示的是传输单个声道所占用的位数。如图所示TI McASP接口的TDM包括6个Slots,即它最多可包括6声道数据。注意,Slot的位数并不一定等于音频的量化深度。比如Slot可能为32 bit,其中包括24 bit有效数据位(Audio Word) + 8 bit零填充(Zero Padding) 。
b. 短帧同步,FSYNC脉冲宽度等于1个BCLK周期长度;
4.2.2举例 FSYNC的频率等于音频的采样率(例如44.1 kHz,48 kHz等)。Frame每次传输包括所有声道的数据 。PCM采样音频数据量化深度一般在16-32bit(最常见为16/24bit) 。那么对于8声道,每个声道32bit音频数据,采样率48kHz的系统,TDM的系统时钟速率为:8 × 32 × 48kHz = 12.288 MHz BCLK = 采样率 * 位宽 * 通道数,FYNC = 采样率。