快连VPN:速度和安全性最佳的VPN服务
字节跳动旗下豆包app或将推出全新实时语音大模型,并以此为基础升级语音通话功能。据悉,该功能已进入小范围测试阶段,目前提供“灵魂歌手”、“夸夸大师”、“受气小包”、“戏精本精”等多种个性化语音选项。
虽然字节跳动和豆包官方尚未对此消息作出回应,但此前关于豆包将推出全新情感语音大模型,且测试效果超越GPT-4o的传闻,很可能指的就是这款实时语音大模型。
据了解,该模型采用统一建模的方式处理语音生成和理解,不同于以往的ASR+LLM+TTS级联模式,显著提升了对话效果。它不仅实现了低延迟实时交互,还支持用户随时打断对话。
消息人士称,该模型在情感表达的自然度方面实现了突破性进展。“与大多数模型仅在语气上进行粗略调整不同,豆包的全新实时语音大模型在语音表现和智力拟人化方面有了质的飞跃。” 此外,该模型还预计支持多种方言,并具备语音模仿能力。
值得注意的是,豆包AI的编程功能也进行了近期升级,优化了代码导入流程、交互效率和解答方式。 现在,用户可以通过一键上传多个本地代码文件或直接引入GitHub开源仓库,快速获取项目完整上下文信息。此功能已在豆包电脑版和网页版上线。
以上就是豆包App目前或已开始测试实时语音通话功能的详细内容,更多请关注本站其它相关文章!