今天,我们正式发布 MiniMax Music 2.5:全维度突破,指挥细节,定义真实。
AI 音乐始终面对两个挑战:可控性与真实度。前者决定了创作者能否表达真实意图,后者决定了作品是否具备专业质感。
过去,从粗糙的 Demo 到具有明星质感的作品之间,隔着昂贵的录音棚、复杂的混音设备以及多年的专业训练。
相较于上一代模型,Music 2.5 在「段落级强控制」与「物理级高保真」两大技术难题上实现突破——让创作更准,让音乐更真。
Direct the Detail. Define the Real.
这道门槛,正在被打破。格莱美级的音乐创作,从此触手可及。

01
Direct the Detail:
段落级精准控制
真正的创作自由,始于对每一段的精准掌控。
Music 2.5 开放全段落标签控制,精准支持包括 Intro(前奏)、Bridge(桥段)、Interlude(间奏)、Build-up(情绪铺垫)及 Hook(副歌)在内的 14 种结构变体,能够承载高复杂度音乐的创作表达。
这意味着,你可以像专业编曲人一样,在创作之初就设计好整首歌的情绪曲线、高潮位置、乐器配置,而不是生成后再碰运气。

02
Define the Real:
人声、风格、混音的物理级保真
可控之外,是保真度的突破。Music 2.5 通过对人声生成、风格建模、混音处理的系统性优化,让 AI 音乐在听感上达到专业制作水准。
🎵 从 C-Pop 到 C-Rap,最懂华语的 AI 音乐:
Music 2.5 针对华语流行音乐进行深度优化,覆盖从慢歌到说唱、从纯中文到中英文混搭的各类场景,在可听性与传播性上实现了系统级提升。
- 贴合流行趋势的旋律设计:我们优化了旋律走向与情绪推进的逻辑,使其深度贴合当下华语乐坛的流行趋势,节奏与情绪转换更自然,作品具备传播感染力。
- 清晰咬字与中英文无缝衔接: 极大程度减少了吞字、糊音或乱唱问题。无论是纯中文、纯英文,还是中英文混杂,Music 2.5 都能保持流畅切换。

🎵 人声真实自然,具备生命力:
通过优化人声合成,Music 2.5 实现了连续细腻的转音、自然起伏的颤音,以及胸腔与头腔共鸣的灵活切换,声音表现力显著增强。在男女对唱中,声线也不再是简单叠加,而是具备自然的协同感,问答交替、和声层次分明。

🎵 风格化混音,自动适配音乐风格:
针对不同音乐风格,Music 2.5 能够自动调整混音策略。摇滚的力量感和失真、80 年代的复古质感、经典爵士的低通温暖感,都能被准确还原。模型通过识别风格特征,在声音厚度、空间感、动态范围等维度实现差异化处理。

🎵 100+ 种乐器,录音室级混音:
Music 2.5 扩充音色库至 100+ 种乐器,并优化了混音处理,能够保持人声与伴奏的清晰分离,解决了 AI 音乐中常见的声音混叠问题,即使在乐器密集场景下也能保持各声部清晰。

此外,Music 2.5 深度适配专业工作流。在叙事感的影视配乐、沉浸式游戏动态声场、录音室级流行工业成品,以及为品牌设计的风格化声效等场景下,均能胜任专业交付标准。
过去需要录音棚、设备和训练才能做到的事,现在只需要你的想法。专业与业余的界限,正在被技术重新定义。
开始你的创作吧!
产品体验:
minimaxi.com/audio/music
API 接口:
platform.minimaxi.com/docs/api-reference/music-generation
文章来自于微信公众号 “MiniMax 稀宇科技”,作者 “MiniMax 稀宇科技”

