微软推出全球最精准转录 AI 模型 MAI-Transcribe-1，平均字错误率 3.9%

来源：IT家人工智能 | 2026-04-03 12:00:08

IT之家 4 月 3 日消息，微软昨日（4 月 2 日）发布公告，持续扩充自研 AI 模型版图，继 MAI-Voice-1 和 MAI-Image-2 之后，推出第三款自研模型 MAI-Transcribe-1，以 3.9% 的字错误率号称全球最精准转录模型。在行业公认的 FLEURS 基准测试（涵盖中文、英文、法语等全球 25 种主要语言）中，MAI-Transcribe-1 模型平均字错误率仅为 3.9%，宣称这是目前全球最精准的转录模型。在 11 种核心语言上，该模型直接登顶榜首；在其余 14 种语言对比中，它击败了 OpenAI 的 Whisper-large-v3，并在其中 11 种语言上超越了谷歌最新发布的 Gemini 3.1 Flash。微软强调该模型能在所有支持语言间保持一致的高准确度，适用于多样化的语音转文字场景。除了精准外，微软 MAI-Transcribe-1 模型的另外两大优势是速度与成本。在转录速度上，该模型批量转录速度达到现有 Microsoft Azure Fast 服务的 2.5 倍；在成本定价方面，该模型每小时仅需 0.36 美元，微软称在大型云厂商中，该模型性价比最优。该模型目前已在 Microsoft Foundry 平台开放使用。值得注意的是，首发版本暂不支持实时转录、说话人分离和偏见调整功能，但微软计划在后续更新中提供这些能力。广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。