连续6年不跑路的安全速度最适合国人VPN
字節跳動旗下豆包app或將推出全新實時語音大模型,並以此爲基礎升級語音通話功能。據悉,該功能已進入小範圍測試階段,目前提供“靈魂歌手”、“誇誇大師”、“受氣小包”、“戲精本精”等多種個性化語音選項。
雖然字節跳動和豆包官方尚未對此消息作出回應,但此前關於豆包將推出全新情感語音大模型,且測試效果超越GPT-4o的傳聞,很可能指的就是這款實時語音大模型。
據瞭解,該模型採用統一建模的方式處理語音生成和理解,不同於以往的ASR+LLM+TTS級聯模式,顯著提升了對話效果。它不僅實現了低延遲實時交互,還支持用戶隨時打斷對話。
消息人士稱,該模型在情感表達的自然度方面實現了突破性進展。“與大多數模型僅在語氣上進行粗略調整不同,豆包的全新實時語音大模型在語音表現和智力擬人化方面有了質的飛躍。” 此外,該模型還預計支持多種方言,並具備語音模仿能力。
值得注意的是,豆包AI的編程功能也進行了近期升級,優化了代碼導入流程、交互效率和解答方式。 現在,用戶可以通過一鍵上傳多個本地代碼文件或直接引入GitHub開源倉庫,快速獲取項目完整上下文信息。此功能已在豆包電腦版和網頁版上線。
以上就是豆包App目前或已開始測試實時語音通話功能的詳細內容,更多請關注本站其它相關文章!