指南
如何撰写真正有效的AI音乐提示词
复制粘贴提示词公式和十几个实际使用案例的示例,优秀提示词的结构,以及弱与强的前后对比表。
简而言之
强AI音乐提示的结构
每个有效的提示都是由一小组成分构建而成的。你不需要每次都使用所有成分,但指定的成分越多,结果就越接近你想象的效果。
- 流派——基础:lo-fi,电影,流行,EDM,嘻哈,氛围,摇滚,爵士。
- 情绪——感觉:平静,史诗,忧郁,振奋,黑暗,梦幻,激进。
- 乐器——你听到的:温暖的Rhodes,808s,丰富的弦乐,指弹吉他,模拟合成器。
- 节奏和能量——缓慢而宽广,中速律动,快速而有力,或明确的BPM。
- 人声和主题——对于歌曲:演唱风格,语言,以及歌曲的主题(或你自己的歌词)。
- 结构和用途——“构建到一个高潮”,“可循环”,或“烹饪视频的背景音乐”。
填空提示公式
当你不确定从哪里开始时,使用这个模板并替换括号中的内容:“[情绪] [流派],使用[乐器1],[乐器2]和[乐器3],[节奏/能量],[用途/结构]。[对于歌曲:演唱风格+主题。]”
例如:“梦幻的合成波,带有模拟垫层,门控鼓声和明亮的主旋律,中速且怀旧,构建到一个宽广的合唱。男性人声,充满希望,关于夜间开车回家。”模型现在有一个流派,一个情绪,三个乐器,一个能量,一个结构提示,以及一个清晰的人声简介——它需要的一切来确定方向。
按用途提供的可复制示例提示
这些是你可以粘贴和调整的起点。每个都遵循上述公式,适用于常见的创作者需求。
- Lo-fi学习节拍:“放松的lo-fi嘻哈,温暖的Rhodes和弦,柔和的摇摆鼓声,黑胶唱片噼啪声和雨声,缓慢而舒适,可循环用于学习。”
- 电影预告片:“史诗般的电影构建,低音弦乐和braams,太鼓,紧张感上升到结尾的巨大打击,戏剧性和英雄感。”
- 带人声的欢快流行:“明亮的现代流行,冲击力强的鼓声,拨弦合成器和贝斯,充满活力和快乐,关于夏日恋情的朗朗上口的女性人声,大合唱。”
- 播客开场:“自信的独立电子开场声,干净的吉他和温暖的合成器,中速且友好,15-20秒,干净地结束以便配音。”
- 游戏循环:“氛围感的游戏音乐,柔和的垫层,遥远的铃声和微妙的脉冲,平静而神秘,探索场景的无缝循环。”
- 广告背景:“欢快的企业流行背景,拍手声,拨弦合成器和稳定的四拍,乐观且干净,为旁白留出空间。”
弱与强提示:前后对比
大多数人可以做出的最大改进是增加具体性。以下是相同意图的弱写和强写。
| 用途 | 弱提示 | 强提示 |
|---|---|---|
| 学习节拍 | 制作一个放松的节拍 | 放松的lo-fi,温暖的Rhodes,柔和的摇摆鼓声,黑胶唱片噼啪声,缓慢而舒适,可循环 |
| 预告片 | 史诗音乐 | 史诗般的电影构建,低音弦乐,太鼓,升到一个巨大打击,戏剧性和英雄感 |
| 流行歌曲 | 一首带人声的快乐歌曲 | 明亮的流行,冲击力强的鼓声和拨弦合成器,快乐,关于夏天的女性人声,大合唱 |
| 游戏音乐 | 游戏的背景音乐 | 平静的氛围垫层,遥远的铃声,微妙的脉冲,神秘,探索场景的无缝循环 |
破坏AI音乐提示的常见错误
大多数令人失望的结果来自一些可以避免的习惯。
- 过于模糊——“好音乐”没有给模型任何方向。
- 堆叠矛盾——“平静的激进爵士EDM”将模型拉向四个方向。
- 忘记人声简介——如果你想要一首歌,请说明,并描述声音。
- 过度堆砌——十种乐器和五种情绪会使混音混乱;选择三个重要的。
- 试图克隆一个命名艺术家以冒充他们——除了伦理问题,它产生的输出比描述你想要的实际声音更差、更模糊。
高级提示:参考、结构和歌词
一旦基础工作完成,你可以更精确地引导。参考一种风格而不是一个人——“90年代boom-bap”,“柏林科技”,“意大利西部”——以唤起一种声音而不模仿特定艺术家。添加结构语言,如“开场,两段,高潮,桥段,然后是最后的高潮”以塑造编排。
对于歌曲,你可以描述一个主题,让模型写歌词,或者粘贴你自己的文字并让它们表演。如果你写歌词,请清楚地标记部分(段落,合唱,桥段),以便旋律遵循形式。保持歌词可唱——简短、有节奏的短语胜过密集的段落。
迭代:提示是一个起点
AI音乐生成是概率性的,因此相同的提示会产生不同的结果。这是一个特性。生成几个变体,保留最强的,然后一次改变一个元素——更换乐器,提高能量,收紧结构——并重新生成。两到三轮的小编辑通常会让你从一个好的结果到达你想要的确切曲目。当接近时,导出音轨并在你自己的软件中完成它。
常见问题
一个好的AI音乐提示是什么样的?
具体性。命名一个流派和情绪,添加两到三种乐器,设定能量或节奏,并且——对于歌曲——描述人声和主题。具体的提示为模型提供了明确的方向;模糊的提示让它猜测。
AI音乐提示应该有多长?
足够长以涵盖流派、情绪、乐器和能量——通常是一到两句话。如果每个细节都增加了方向,写得更长也没问题,但堆叠十种乐器和五种情绪会使结果混乱。目标是清晰,而不是最大化。
我需要了解音乐理论才能写提示吗?
不需要。简单的描述性语言即可:“温暖”,“有力”,“宽广”,“怀旧”。了解一些术语(节奏、调、BPM、段落/合唱)可以帮助你更精确,但这是可选的——描述你能想象的感觉和乐器即可。
我应该包括BPM或节奏吗?
如果你有目标,是的——“90 BPM”或“快速而有力”都很有帮助。节奏强烈影响感觉,因此即使是粗略的提示(慢,中速,欢快)也能改善结果。如果你不指定,模型会选择一个适合流派的节奏。
我可以在提示中命名特定的艺术家吗?
描述风格而不是人物——“90年代boom-bap”或“梦幻卧室流行”代替真实艺术家的名字。这会产生更好、更可控的输出,并避免模仿真实表演者以欺骗听众,大多数工具禁止这样做,并可能引发法律问题。
如何从提示中获得人声和歌词?
说明你想要一首带人声的歌曲,描述人声风格和语言,并给出一个主题让AI写歌词或粘贴你自己的。标记部分(段落,合唱)有助于旋律遵循你想要的结构。
为什么每次使用相同的提示时我都会得到不同的歌曲?
生成是创造性和概率性的,因此每次运行都是一次新的诠释。利用这一点:生成几个版本,保留最好的,然后优化提示并重新生成以趋向于你想要的结果。
如何为背景音乐写提示?
添加用途并要求留出空间:“欢快的企业背景,拨弦合成器和拍手声,乐观,为旁白留出空间,可循环。”告诉模型音乐是背景床可以防止它干扰你的旁白或视频。
改善一个不起作用的提示的最快方法是什么?
一次改变一个变量。如果太繁忙,移除乐器;如果太平淡,提高能量;如果感觉不对,替换情绪词。小的、单一的编辑加上重新生成比从头重写整个提示更有效。