原始流(8k G711U 1声道 16位)转成目的流(48k AAC 2声道 16位 )

1.解码G711U音频成PCM

g711压缩率为2:1,如果G711U原始size为320,则解码后大小为:640。

2.PCM重采样:原始pcm(8k 1声道 16位)转成目的pcm(48k 2声道 16位) 
   比如原始size:640  目的size:640*2*8=7680  

   原始size可以维护一个缓存,定期从里面取出640字节

  8000/25=320,此处按照每秒25帧的采样率采样,每秒采集320个点,每个点:320*2(16位)*1(声道)=640


3.重采样后的数据编码
  aac采样点数为1024,一秒钟需要采样次数:48k/1024,每次采样需要时间(毫秒):1000/次数 = 21ms
  此处也维护了一个缓存,每次只编码一次采样的数据:1024(每次采样个数)*2(2声道)*2(16位) = 4096
  每次从服务器发一次采样后的编码数据。

ps:8k,48k都是针对pcm原始的采样。
Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐