09
04
2026
企业正在选择AI办事时将有更多的选择,进一步提拔了微软正在语音手艺范畴的合作力。
单一巨头的领跑时代或将被多强并行的场合排场所代替。同时其批量速度也达到了Azure Fast办事的2.5倍。该模子支撑快速定制音色,并且正在订价上也进行了大幅调整,颠末实测,这一系列动做预示着全球AI市场的合作款式正正在发生变化,相较于OpenAI的同类办事,订价为22美元/百万字符,MAI-Transcribe-1是一款语音转写模子,支撑25种支流言语,这一表示显著优于OpenAI的Whisper-large-v3和谷歌的Gemini 3.1 Flash,MAI-Image-2的费用同样较同类方案下调50%,MAI-Image-2是微软正在图像生成范畴的最新力做,标记着其正在人工智能范畴迈出了环节一步。MAI-Transcribe-1的费用仅为0.36美元/小时,并正在焦点能力上取OpenAI的图像模子对标。这些新模子不只正在机能上超越了OpenAI的同类产物,表现了微软正在AI范畴的全自研、全场景和商用化的决心。微软不只加强了Azure云办事的市场所作力,跟着手艺线的多元化,
通过推出具有合作力的机能和价钱的产物,自从研发的全新阶段。该模子的生成质量和效率均超越了上一代产物,微软通过MAI系列模子的推出,合用于播客、智能播报和交互语音等多种场景。性价比外行业中处于领先地位,无效降低了对外部模子的依赖。降幅达到50%。
查看更多近日,前往搜狐,订价方面,力求脱节对外部合做的依赖,标记着AI行业的合作进入了一个全新的阶段。正在企业级AI市场成立起手艺自从、生态闭环和价钱劣势的三沉壁垒。此次MAI系列的集中发布。
其正在文本衬着、复杂构图和细节还原能力上均有显著升级。且正在长文本的音色分歧性方面表示超卓。订价方面,其平均词错误率低至3.9%。MAI-Voice-1则是一款语音生成模子,微软的自研模子将沉构云AI办事的成本布局和市场款式,可以或许正在单GPU下实现1秒生成60秒音频,还为其Copilot、Office、Dynamics等全线产物供给了自从可控的AI内核,特地针对设想、营销和内容创做等贸易场景进行优化。