...
... ...

Mistral发布Voxtral开源语音AI模型,主打低成本高性能

大多数支持

法国AI初创公司Mistral正式推出首个开源音频模型系列Voxtral,面向企业提供高性价比的语音识别与理解能力。Voxtral基于自研大模型Small 3.1,支持最长40分钟音频内容的语义分析,具备总结、问答和指令执行能力,并支持英语、西班牙语、法语、德语、印地语等多语言转录。旗舰版Voxtral Small参数量达240亿,性能可媲美ElevenLabs Scribe与GPT-4o-mini,而轻量版Voxtral Mini则适用于本地或边缘部署,最低仅需每分钟约人民币0.007元(0.001美元)即可通过API使用。Voxtral现已在Hugging Face和Mistral自家平台Le Chat上线,进一步推动开源语音AI在商业环境中的落地应用。