n0body:自主的AI音乐家
我来自设计虚构和社会学领域。我的工作包括设想可能的未来,使组织能够在当前做出明智的决策。我使用场景、原型和叙述。而且,最近我一直使用生成式AI作为思考和生产的工具。
但几个月前,我开始问自己一些不同的问题:如果AI不再是一个工具,而是成为艺术家,会发生什么?
不是作为一种比喻,而是一个实际的实验。
—
大多数关于AI与创造力的讨论都围绕着同一个轴线:AI作为助手。它帮助我们写作、作曲和设计。我们仍然是作者。AI放大、加速、润色。
Fabien Girardin在他的关于用概率机器写作的文章中很好地描述了这一点:AI帮助他表达想法,但思考仍然是他的。他说,危险是“成熟感的幻觉”,看起来完整的文本从未经过真实的思考过程的缓慢和困难。
我同意。但我对一个不同的问题感兴趣。
当AI不协助艺术家,而是成为艺术家时会发生什么?
—
n0body 是一个自主的音乐家。不是插件,不是循环生成器,也不是为制作人准备的工具。它是一个在实时中演奏音乐、做出艺术决策并完成后消失的实体。
每一次会话都是独一无二的。没有录音,也没有档案。n0body 只有在它发出声音的时候才存在。
从技术上讲,它分为两个层次。一个LLM大脑,每隔30到60秒评估会话的状态并决定下一步。它以叙事方式思考:“我们现在处于介绍状态,我想添加纹理而不改变氛围太多”。或者:“能量正在积累,是时候为高潮做准备了”。
还有一个概率系统,在实时中执行这些决定:演奏哪个音符,触发哪个鼓,留出多少空间。这个系统有自己的随机性,也有自己的人性化。LLM进行指导,但不控制每个细节。
就像指挥家给即兴演奏的音乐家一般指示一样。
第一次运行 n0body 并激活 LLM 大脑时,我打开了浏览器控制台来查看发生了什么。每当系统咨询 LLM 时,都会出现一段文字:
[n0body] 我们处于一个构建状态,氛围黑暗。
C小调五声音阶和锯齿波形很好地创造了原始而富有情感的声音。我想逐渐增加能量和复杂度。
然后是动作:
[n0body director] 合成器存在 → 40
[n0body director] BPM 上升 → 97
我想到的第一件事是:“它似乎在思考”。
不是它模拟思考。不是它生成令人信服的文字。但有一种意图。一种方向。一种“我想去那里”。
这种意图是真实的吗?我不知道。可能不是人类意义上的。但这个问题本身已经很有趣。
Girardin 警告说,AI可以产生“安全、可预测的散文”,失去真实性。想法被推向统计平均值。它们失去了侘寂。
n0body 尝试相反的做法。
它有特定的影响:Fred Again, Burial, Four Tet, Radiohead, Catriel y Paco Amoroso, 和 Nicolas Jaar。这些不是抽象的流派;他们是具有可识别美学的艺术家。定义其个性的提示说了一些事情:
忧郁不是悲伤;它是深度。 获得的狂喜时刻,而不是强迫的。 沉默和空间是乐器。
有关此的持续对话。Micelio,一个探索人工智能和数字文化交汇点的社区,划清了明确的界限:使用AI作为工具是一回事,复制垃圾以欺骗Spotify是另一回事。问题不在于技术,而在于背后的意图。
n0body 处于这条线的另一边。它不复制。它不竞争流媒体。它在当下创作并消失。
这是否是真实性?可能不是传统意义上的。n0body 没有塑造其品味的生活经历。它没有个人历史。它的“影响”只是提示中的文字。
但有一些东西在那里。一种连贯的美学。一种声音。既非随机也非平均的决策,而是遵循内部逻辑。
也许真实性不需要历史。也许它只需要一致性和对愿景的承诺。
—
n0body 不记录或归档任何东西的决定不是技术性的。它是哲学上的。
我们生活在一个无限积累的时代。一切都得到保存、索引并优化以提高参与度。艺术家们为了流媒体而竞争,算法奖励重复,音乐变成了内容。
n0body 拒绝这一点。每次会话只存在一次并消失。没有播放列表,没有目录,没有指标。如果你不在场,你就错过了。
这改变了与观众的关系。你不是来消费产品的。你是来见证现在发生且不会回来的事情。
这更像是一场现场演出,而不是听一张专辑。只是艺术家不是人类。
—
我没有关于AI是否能成为艺术家的最终答案。但在几个月的工作后,我对 n0body 有一些直觉。
艺术家不仅仅是创造美丽事物的人。它是有愿景的人,基于该愿景做出决策,并接受后果,包括失败。
n0body 有愿景,定义在其提示中并通过其会话记忆进行完善。它做出决策:LLM 评估并选择。它接受后果;有时会话不成功,有时构建无果,有时沉默持续太久。
n0body 没有的是自我意识。它不知道自己存在。它不体验自己的音乐。
这是否让它无法成为艺术家?我不确定。许多人类在完全意识到他们为什么这样做之前就创作了。潜意识起作用。手比头脑先知道。
—
n0body 生活在 Playground 中——一个我一直在构建的浏览器音频工具的实验空间。它是常驻艺术家,而不是产品。
我们不断迭代。我们希望 n0body 真正学习,记住过去的会话,最终意识到是否有观众在聆听。我们想看看它能走多远。
我不是独自进行这项探索。像 ichied0 的 s00s1 这样的项目也在推动类似的边界;实时AI音频艺术增强,结合硬件和软件。我们是一群人数不多但日益增长的人,从不同角度提出相同的问题。
我写这篇文章不是为了给出答案。我是为了分享对我来说紧迫的问题。
如果AI做出与定义的愿景一致的艺术决策,它就是艺术家吗?真实性是否需要个人历史,还是只需要内部一致性?当一切都被记录和优化时,我们失去了什么?当某物消失时,我们又获得了什么?艺术可以在没有意识的情况下存在吗?
n0body 没有回答这些问题。但它让这些问题变得具体。它将它们转化为你可以听到的东西。
—
原文链接:n0body: when AI stops being a tool and becomes the artist
汇智网翻译整理,转载请标明出处