音频重采样
原始流(8k G711U 1声道 16位)转成目的流(48k AAC 2声道 16位 )1.解码G711U音频成PCM2.PCM重采样:原始pcm(8k 1声道 16位)转成目的pcm(48k 2声道 16位) 比如原始size:640 目的size:640*2*8=7680 原始size可以维护一个缓存,定期从里面取出640字节 8000/25=32
·
原始流(8k G711U 1声道 16位)转成目的流(48k AAC 2声道 16位 )
比如原始size:640 目的size:640*2*8=7680
aac采样点数为1024,一秒钟需要采样次数:48k/1024,每次采样需要时间(毫秒):1000/次数 = 21ms
此处也维护了一个缓存,每次只编码一次采样的数据:1024(每次采样个数)*2(2声道)*2(16位) = 4096
每次从服务器发一次采样后的编码数据。
ps:8k,48k都是针对pcm原始的采样。
1.解码G711U音频成PCM
g711压缩率为2:1,如果G711U原始size为320,则解码后大小为:640。
比如原始size:640 目的size:640*2*8=7680
原始size可以维护一个缓存,定期从里面取出640字节
8000/25=320,此处按照每秒25帧的采样率采样,每秒采集320个点,每个点:320*2(16位)*1(声道)=640
aac采样点数为1024,一秒钟需要采样次数:48k/1024,每次采样需要时间(毫秒):1000/次数 = 21ms
此处也维护了一个缓存,每次只编码一次采样的数据:1024(每次采样个数)*2(2声道)*2(16位) = 4096
每次从服务器发一次采样后的编码数据。
ps:8k,48k都是针对pcm原始的采样。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐

所有评论(0)