豆包App引领创新，灰度测试全新端到端语音模式，抢先GPT-4o实现唱歌功能

来源：科技信息2025-01-21 15:46:59

导读 2025年1月20日，豆包App发布了最新的“端到端”语音大模型，并更新了实时语音通话功能。这一更新将语音识别、理解和生成整合到一个模型中，...

2025年1月20日，豆包App发布了最新的“端到端”语音大模型，并更新了实时语音通话功能。这一更新将语音识别、理解和生成整合到一个模型中，实现了更自然的语音交互。新的语音模型亮点在于能够复刻人类的表达形式和情感输出，对话流畅度和智商情商均有大幅提升。豆包还推出了“灵魂歌手”和“百变大咖”等语音通话模式，实现了唱歌和角色扮演功能，超越了GPT-4o的能力范围。

豆包通过采用端到端方案，在降低延时、提升自然度和情感表达方面取得了显著进步。这一变化使得AI语音交互的落地场景从教育、客服等领域扩展到情感陪伴、心理咨询、配音等更广阔的场景。在AI情感陪伴和角色扮演领域，豆包的创新已经展现出强大的市场潜力。通过提升语音层面的角色扮演、情绪感知和表达能力，豆包丰富了AI与人的交互形式，提升了沉浸感，进一步推动了技术向“拟人”方向发展。

关键词：

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

首页 > 速递 > 科技信息 > 正文

豆包App引领创新，灰度测试全新端到端语音模式，抢先GPT-4o实现唱歌功能

猜你喜欢

最新文章

点击排行

DNF中哪些职业最适合新手操作

空调界价格战王者奥克斯电气冲刺港股IPO

招商蛇口豪掷34.8亿，力夺亦庄X24黄金地块

中国互联网：挥别青春，迈入成熟新篇章

淘天集团革新多模态对齐技术，有效缓解视觉大模型幻觉难题

游戏主播逆战烧饼哥：另类鸡娃法，考不好就上战场

韩国前防长金龙显将列席23日尹锡悦弹劾案宪法法院公开辩论会

TikTok服务逐步恢复，但美区应用下载仍受限

意图识别：促进人类与智能体高效沟通的关键技术

丰田纯电车型bZ3终端售价大跳水，裸车惊爆仅需9万余元

热门文章

碧桂园债务重组取得新突破：有望2月与债权人达成共识

天龙八部2手游：丐帮门派深度解析与培养价值探讨

公主连结深度解析：黑骑与偶像，谁先培养更胜一筹？

这次CES展会上，NVIDIA荣膺五大奖项，令对手艳羡不已！

苹果App Store限时充值特惠：充值即享10%加成，上限1000元！

低成本智驾技术虽诱人，用户体验才是制胜法宝

2025年半导体市场前景展望：AI成为核心驱动力

万亿级PE巨头注资，国产手术机器人康诺思腾迎来新飞跃

大窑饮品据传正酝酿5亿美元香港IPO计划，目标2025年下半年上市

四川省政府工作报告聚焦：科学调控房地产土地供应，加速商品房库存消化