“3kbps通话清晰如斯”的奇迹神器Lyra,现已开源!
Lyra,谷歌倾力打造的一款音频编,能够在低带宽环境下实现高质量的语音通话。
那什么是3kbps呢?换算成常见单位,它就等同于每秒0.375千字节的数据传输速度。
对比一下,你会知道Skype所标明的最低通话速度是30kbps,其带宽需求可是我们新晋朋友Lyra的十倍有余。
Lyra利用先进的机器学习模型,能将原始音频数据压缩至3kbps,即使在没有高速网络的环境中,依然能够还原出自然、清晰的语音。
其架构类似于传统编,由编码器和两部分组成:
编码器以40毫秒为单位,从语音中提取特征并进行压缩后传输。
而则运用机器学习模型,以最小的数据量重建语音,将特征转化为完整的音频波形。
在Lyra出现之前,若比特率越低,音频的清晰度往往就越差,且会带有更重的机械感。
而Lyra与传统编的不同之处在于其强大的信号重建能力。
无需逐个处理信号,Lyra在保持低比特率的依旧能提供高质量的音频输出。
谷歌还对Lyra与其他如Opus、Speex等编进行了对比测试。
结果显示:在仅3kbps的情况下,Lyra的性能超越了现有其他编;
而在8kbps的条件下,其性能又优于Opus,并降低了超过60%的带宽需求;
更值得一提的是,即使在3kbps的条件下,Lyra的语音清晰度也超过了6kbps情况下Opus的表现。
谷歌对Lyra的前景充满期待,它有望用于降低音频文件大小、节省手机电量以及缓解网络拥塞等场景。
目前,Lyra已在GitHub上开源共享。
其采用Bazel构建框架,使用C++编写代码,保证了其运行的速度、效率和操作的便捷性。
这一版本支持在Linux平台上进行开发和调试,同时针对64位ARM Android平台进行了性能优化,使其不仅适用于云服务器,更可在手机上实时运行和训练。
Lyra还为开发人员提供了编码和解码的必备工具。
谷歌工程师Andrew Storus和Michael Chinen表示:“我们非常期待开源社区的创意与贡献能在Lyra上得到体现,进而开发出更多独特且有影响力的应用。”
对Lyra感兴趣的读者可通过下方链接深入了解。
参考链接:[1]/google/lyra [2]/... [3]ai./... [4]opensource./...
—— 完 ——
量子位QbitAI·头条号签约