精准学将公布中国首个语音端到端大模型

芥末堆官网

2个月前

心流知镜-s(V02)”使用端到端语音结构，避免了级联ASR+LLM+TTS方式额外延迟，同时也更好的改善纯文本模型损失的情感节奏等丰富信息，接近人类的语音交互体验。

教育科技公司精准学宣布，公司已在AI语音交互技术上取得领先性的突破，成功训练了中国首个语音端到端大模型“心流知镜-s(V02)”，可直接实现语音输入-语音输出的交互，使其更适配辅学场景，使大模型达到“真人老师”级别的自然对话交流体验。

“心流知镜-s(V02)” 使用端到端语音结构，避免了级联ASR+LLM+TTS方式额外延迟，同时也更好的改善纯文本模型损失的情感节奏等丰富信息，接近人类的语音交互体验。

精准学也提供时间表开放基础模型供学术和非商用使用，致力于为中文AI社区的科研和技术探索作出贡献。

“心流知镜-s(V02)”的发布，不仅将在高质量中文语音Codec和中文自监督预训练Encoder基础设施上填补中文开源社区的空白，还将在全球范围内成为首个开放给技术社区的语音端到端大模型。

精准学将于近期对外展示这项技术的应用成果。5月，公司获得了阿里2亿元投资，目前其AI辅学机Bong系列已在天猫京东上线。不久后用户也可以在精准学AI辅学机上体验到这项技术突破成果。

1、本文是芥末堆网原创文章，转载可点击芥末堆内容合作了解详情，未经授权拒绝一切形式转载，违者必究；
2、芥末堆不接受通过公关费、车马费等任何形式发布失实文章，只呈现有价值的内容给读者；
3、如果你也从事教育，并希望被芥末堆报道，请您填写信息告诉我们。

来源：芥末堆

芥末堆商务合作：王老师 18710003484

精准学也提供时间表开放基础模型供学术和非商用使用，致力于为中文AI社区的科研和技术探索作出贡献。

来源：芥末堆

芥末堆商务合作：王老师 18710003484

展开

打开“财经头条”阅读更多精彩资讯