千高原艺术空间于2023年巴塞尔艺术展香港展会的展位中呈现的漆澜艺术品细节
“人工智能教父”杰弗里·辛顿(Geoffrey Hinton)最近预测,所谓的通用人工智能可能会在20年内出现。这个术语指的是一种设想中的未来人工智能,可以执行人类能够执行的任何认知任务。这个说法引发了一个问题:在我们看到通用艺术智能出现之前还需要多长时间?而这样虚构的通用艺术人工智能应该具备哪些能力?
目前使用人工智能创作艺术作品较为有限的范式被称为“生成媒体”(generative media)(不要与“生成艺术”【generative art】混淆)。通过对数千亿张图像及其文本描述进行训练,这种更有限的人工智能可以在给定文本时学习预测可能的图像。生成的图像在之前并不存在,并且根据你提供的口令,它们可以看起来是很老套刻板,也可以是非常独特的。如果艺术家正在使用目前最先进的AI图像工具Midjourney,生成的图像通常具有美学上的吸引力。它们可能具有完美平衡的构图、惊艳的色调以及形成有节奏的线条和形状。
左图:Lev Manovich,照片由Evgeniya Gorobets拍摄;右图:Galerie Greta Meert艺廊展位于2023年巴塞尔艺术展香港展会的艺术品细节
因此,尽管我们可以无休止地辩论人工智能是否具有“创造力”,但它已经完全具备了“专业水准”,在技术上比许多艺术学生和成年艺术家更出色。作为在大学艺术系任教20年的人,我可以确定拿着由人工智能生成的图像组成的作品集和由ChatGPT撰写的艺术家陈述的申请者能被大多数艺术课程项目录取。实际上,这已经成为担任招生委员会成员的艺术系教师面临的真正问题。
2022年,巴塞尔艺术展迈阿密海滩展会,照片由James Jackman为巴塞尔艺术展拍摄
古典主义与媚俗
尽管取得了这些惊人的成就,人工智能图像工具仍然有着显著的局限性。神经网络(一种人工智能方法)不理解它所生成的内容。它对世界、历史或当代文化一无所知。它无法评价自己的创作,也无法判断什么是有趣的、什么是平庸的。神经网络学会了从训练数据中提取惯性规律,并忽略罕见的人为现象,因此它更擅长制作常规作品而不是独一无二的杰作。通常情况下,当我描述奇怪、离奇、超现实或荒谬的构图时,人工智能生成的却是普通且可预测的场景。有时候我可以获得更接近我想法的图像,但通常情况下,我不得不放弃并尝试新的想法。
kaufmann repetto艺廊展位于2022年艺+巴黎:由巴塞尔艺术展呈献的艺术品细节
在艺术史的背景下,视觉人工智能工具生成的默认表征可以与古典主义相比。这些工具倾向于合成理想化和无缺陷的图像。对于解读人工智能图像工具的美学偏好,还可以使用“媚俗”这个词。媚俗在1860年代和1870年代的慕尼黑艺术市场上兴起,用来描述廉价且流行的图片。根据Tomas Kulka在他的著作《Kitsch and Art》(媚俗与艺术,1996)中的分析:“媚俗描绘了一个美丽或高度情感化的主题,所描绘的主题能够立即而轻松地被识别出来,媚俗并没有丰富我们与所描绘主题的相关联想。”换句话说,媚俗是夸张的,只展示了刻板印象,缺乏原创性。对我来说,这是对AI工具生成的默认图像的极好描述。虽然有可能使它们看起来不那么媚俗,但这需要时间和在绘图或摄影等领域的先前经验。
Fitzpatrick艺廊展位于2022年艺+巴黎:由巴塞尔艺术展呈献的艺术品细节
复制的艺术
人工智能图像生成可以被称为“复制的艺术”。这里存在着四种不同类型的复制。首先,你可以通过运行相同的文本口令来无限重复生成过程,希望看到基于原始图像的改进。许多艺术家表示会使用数千次相同的提示(prompt,即给AI模型的指令),直到得到他们想要的图像为止。其次,有些网站收集了数百万个口令和生成的图像,因此你可以直接复制任何此类提示,然后进行修改。第三,在Midjourney的默认模式下,你可以实时查看成千上万其他用户输入的提示和生成的图像,而其他人也可以看到你的提示和图像。最后,从某种意义上说,AI图像生成是“复制的艺术”,因为许多提示涉及流行的视频游戏、好莱坞电影、动画工作室以及受欢迎的插画师和艺术家。
施布特-玛格画廊展位于2022年艺+巴黎:由巴塞尔艺术展呈献的艺术品细节
这种基于人工智能的“复制的艺术”与成千上万的业余艺术家创建动漫角色副本并将其上传到ArtStation和DeviantArt上的情况有何区别?一个新的方面是复制的机制。与艺术家过去人手描绘现有图像的方式不同,现在你可以复制作为AI图像工具“代码”的文本口令,而不是像艺术家过去那样手动追踪现有图像。另一个新的方面是提示的模块化。你可以仅复制描述美学、构图、某个特征或角色、光线类型等的文字,然后与你自己的内容描述重新混合。
在我看来,那些通过现代主义视角呈现艺术历史,并强调独特性和原创性的博物馆并没有完全让我们意识到历史上复制的重要性。你可以进入一个专门展示特定时期和地域艺术的展厅,却看到众多具有鲜明对比风格和方法的作品。这种对独特性的抽样偏差并没有反映出复制品的文化和微小的差异。今天由业余爱好者创造的人工智能图像宇宙提醒着我们文化一直以来的运作方式:通过不断模仿和细微修改。
Faith Wilding和Greg Ito于2022年巴塞尔艺术展迈阿密海滩展会中的Anat Ebgi艺廊展位
最后,我想回到我开篇的问题:我们想在假想的通用艺术人工智能中看到什么?尽管图像生成工具将不断改进,但我想要一个不会自己创作任何艺术的人工智能。相反,这种人工智能将使用算法来分析艺术家的作品,并为他们提供见解和新思路。它可以将历经时间而变化主题和形式的艺术品可视化,并提供实验的可能方向。它可以识别艺术家经常和不经常使用的技术,并鼓励使用更不常见的技术。换句话说,尽管这样的人工智能不会自动化的去创造艺术(而且为什么我们要这样呢?),但它可以为艺术家提供更有价值的东西:智能反馈甚至对话。
这篇文章是巴塞尔艺术展的新系列内容中的第一篇,我们将通过该系列邀请思想家和理论学家分析新兴技术对当代艺术创作的影响。
本文作者Lev Manovich博士是一位视觉艺术家、作家,也是世界上最有影响力的数字文化理论家之一。他被列入“塑造设计未来的25人”(Complex,2013)和“构建未来最有趣的50 人”(Verge,2014)名单。Manovich还是纽约城市大学(City University of New York)研究生中心的荣誉教授,也是文化分析实验室(Cultural Analytics Lab)的主任。他发表了180篇文章和15本书,包括《AI Aesthetics》、《Cultural Analytics》、《Instagram and Contemporary Image》,以及被称为“自马歇尔·麦克卢汉(Marshall McLuhan)以来最具启发性和最广泛的媒体历史”的《The Language of New Media》。他的数字艺术项目曾在8个个人展览和120个国际团体展览中展出,包括蓬皮杜中心、伦敦当代艺术学院(ICA,Institute of Contemporary Art)、卡尔斯鲁厄艺术与媒体中心(ZKM)、奇亚斯玛当代艺术博物馆(KIASMA)及其他主要场所。