分类:行业新闻
2025-06-08 10:19:35
74
技术实现路径
1. 大模型驱动:基于生成式AI的语音合成技术突破传统播音腔限制,实现多风格、多情感的拟人化表达。如标贝科技已上线20余种客服音色,并扩展至泰语、法语等语种。
2. 快速克隆方案:百度文心一言支持用户2秒录制声音样本,通过朗读文字即可生成个性化音色,适用于智能体对话和数字分身场景。微信订阅号助手APP也推出类似功能,创作者可录制专属音色朗读文章。
核心应用场景
行业发展趋势
1. 技术融合:宇树科技等企业结合机器人动作与音效定制,打造沉浸式交互体验
2. 场景下沉:从专业领域向消费级市场渗透,如微信文章朗读、智能健身指导等
3. 实时交互:百度文心一言已实现用户与数字分身的实时语音对话
当前技术仍存在功能局限性,如文心一言的定制音色暂不支持复杂语调调整,但随着多模态技术发展,音色定制有望与虚拟形象、肢体动作形成更自然的协同表达。
Copyright Your agent-dapaihang.Some Rights Reserved.求知大排行网备案号: 津ICP备2023000475号-9
留言(●'◡'●)