Microsoft AI (MAI) Voice-1
高度表现力且自然的语音生成模型
2025-08-29

MAI-Voice-1 是一款极速语音生成模型,能在单个 GPU 上不到一秒内生成长达一分钟的音频,使其成为当今最高效的语音系统之一。
Microsoft AI (MAI) Voice-1 是一款表现力强且高效的语音生成模型,仅使用一个 GPU 就能在不到一秒的时间内生成一整分钟听起来非常自然的音频。它为 Copilot Daily 和 Podcasts 等功能提供支持,并已在 Copilot Labs 中上线,供用户尝试个性化故事讲述和引导冥想等应用。该模型专为单人和多说话人场景设计,提供高保真语音输出,定位为未来 AI 伴侣的关键接口。微软还在预览 MAI-1,这是一款多功能的基于文本的模型,作为其更广泛努力的一部分,旨在创建可访问、负责任的 AI,以满足全球多样化的用户需求。
Artificial Intelligence
Audio