不久前,平面设计师和视觉艺术家,现任微软设计和人工智能副总裁前田约翰发布了《2024 Design in Tech Report》科技中的设计报告,今年主题为“Design Against AI(设计对抗人工智能)”。在这份报告中,前田约翰呼吁我们更多地关注如何拥抱AI,而非竞争或抗议。
正如报告中介绍,每当有新一波技术涌现时,AI总能在业界掀起一股热议。例如埃隆·马斯克于近日发布的大型语言模型Grok-1;2月中旬OpenAI推出的文生视频模型Sora;去年12月Google Deepmind发布的革命性视频生成模型VideoPoet。
Sora文生视频。提示词:A Chinese Lunar New Year celebration video with Chinese Dragon
VideoPoet模型概述
对于视觉设计师来说,值得兴奋的地方在于,新技术工具的出现意味着新设计浪潮的出现。相对的,设计师也会焦虑:我是否应该跟上这一波的设计浪潮?我应该选择怎样的工具,以及哪些AIGC的方向?
虽然Sora、Midjourney、ChatGPT分别代表着AI模型在不同领域的应用,但他们的使用逻辑,都是基于文本来创作作品。或许随着AI技术的日渐成熟,这些模型会汇聚成一个多模态的模型,即文本、图像、视频、声音等不同类型的数据可以混合处理并相互融合。
文生图
对于设计师来说,想要开始涉及AIGC的领域,可以先尝试文生图模型,作为入门AIGC的尝试。本篇文章,我们将为设计师们介绍10款AI工具,包括文生图以及常用的模型。除此之外,视觉设计师王萌还为读者们展示了相同的描述词下5款文生图模型的特点与区别。从更为直观、立体的角度为设计师们提供参考。
DALL·E
https://openai.com/dall-e
DALL·E 是一个由OpenAI出品的文生图人工智能系统。这是一种被称为GAN(生成对抗网路)的神经网络,可以根据自然语言的描述创造逼真的图像和艺术作品。实际上,Sora的技术就是建立在OpenAI对DALL·E和GPT模型的研究之上。
《剧透命运(Spoiling Fate)》:跨国创意机构Base Design与布鲁塞尔歌剧院La Monnaie合作为其推出AI宣传项目,用设计演绎“命运”——把图像完全交给AI的双手。工具用到了DALL·E 2和Runway。
《阿凡达 2》
《音乐之声》
《怪兽史瑞克 2》
《美国丽人》
《蝙蝠侠》
《101斑点狗》
Robomojo:由新媒体艺术家Vincenzi创建的AI项目,借助AI重构经典电影海报。工具用到了DALL·E 2。
提示词:一位骑着马的宇航员,以照片逼真的风格绘制(DALL·E 2)
Midjourney
https://www.midjourney.com/
Midjourney是一款基于深度学习算法的文生图AI工具。通过输入提示词,用户可以生成可以艺术和创意内容。Midjourney是在DALL·E的基础上进行改进的,它增加了一个类似于注意力机制的模块,该模块可以在生成图像的过程中根据文本描述动态地调整图像生成过程中不同位置的注意力。使其可以更好地控制图像的生成过程,使其更加准确地反映出输入的文本描述。Niji·Journey则是Midjourney的微调模型,更专注于动漫领域。
Monotype 2024 字体趋势报告:以AI+黑胶的形式作为本年度的主视觉设计
古驰
古驰
雷朋
高露洁
优步
Ad Intelligence:由伦敦创意机构10 Days发起的AI广告项目
《Artificial Typography》:由Pentagram合伙人Andrea Trabucco-Campos创作,通过AI探索排版和字体设计的可能性
Stable Diffusion
https://stablediffusionweb.com/
Stable Diffusion是一种潜在的文生图、视频扩散模型,能够在给定任何文本输入的情况下生成逼真的图像和视频。
Growth Cycle:艺术家Infinite Vibes用Stable Diffusion创作的动画
《Stable Digest》:Stable Diffusion推出的艺术家访谈栏目,每期邀请艺术家用AI绘制封面
艺术家Tom Furse的作品
Adobe Firefly
https://www.adobe.com/sensei/generative-ai/firefly.html
Firefly是Adobe产品中的创意生成AI模型的新系列,最初专注于图像和文本效果生成。Firefly将提供新的构思、创作和交流方式,同时显着改进创意工作流程。除了文生图功能,Firefly还可以给生成的结果重新着色,并在结果的任何一处增加新的生成或删除不想要的部分。
用Adobe Firefly生成的字母
Adobe Firefly的生成式重新着色
Adobe Firefly的生成式填充
Khroma
https://www.khroma.co/
Khroma是一款人工智能驱动的调色板生成器,旨在帮用户匹配适合他们的颜色。该工具使用机器学习算法来分析数百万张图像,并根据您的喜好创建独特的调色板。该工具还允许用户调整调色板的亮度、饱和度和对比度并保存它们以供将来使用。
Khroma提供的配色方案
←向左滑动查看更多
←向左滑动查看更多
Remini
https://remini.ai/
Remini是一款AI图片工具。它可以修复照片的各种问题,让模糊、褪色、损坏、高噪点。低解析度等的图片获得更清晰、更美的色彩的结果。此外,它还可以根据用户上传的照片,生成看起来像专业设计师拍摄的各种风格和姿势的照片。
LookX
https://www.lookx.ai/pc/muse/list?channel=timfu
LookX是一款用于建筑领域的AI生成工具。它可以将草图或用纸捏成的模型转换为建筑的3D模型。它受多模态和其自主开发的深度学习算法所训练,使其生成的模型更具有进一步落地的可能性。
提示词:现代、公共建筑、 市中心、城市景观、汽车、人、街道、现实、简单的天空、苍白。
基于此图进行智能生成
←向左滑动查看更多
提示词:坐落在沙漠景观的户外餐厅,背景是岩石和山脉。该设计遵循极简主义风格,灵感来自勒·柯布西耶。休息区与天然石材融为一体,提供独特的用餐体验。阳光明媚的天气增添了氛围,营造出宁静祥和的氛围。
基于此图进行智能生成
←向左滑动查看更多
提示词:建筑渲染、建造、景观、现实、透视、街景、公共建筑中层、公共建筑活动中心、商业建筑群、现代风格、极简风格、几何形式、玻璃幕墙、金属板、灯光细节、商业氛围、广场、景观、阳光明媚。
基于此图进行智能生成
Fontjoy
https://fontjoy.com/
Fontjoy是一款用于字体配对的AI工具,可以根据用户的输入生成自定义的字体配对。该工具使用机器学习算法来分析用户的偏好并创建相互补充的字体配对。
Phygital+
https://library.phygital.plus/about
Phygital+是一个面向艺术、设计、技术和Web3初创公司和创作者的AI工作区。它不需要你输入代码,对硬体也没有要求,包含20多种神经网络,能发挥无限的创造力。用户还可以在它的AI Library上所收录的1500多个AI工具中,寻找最合适的工具。
Plug AI
https://hp.package-ai.jp/
Plug AI是一款由人工智能驱动的包装设计评估工具。根据其资料库,该工具可以预测消费者对所输入的设计图的好感等级,这些好感度等级还会按性别和年龄组呈现。在没有足够资金和时间做消费者调查时,公司可以以其评估作为包装设计推出市场后的反馈参考,从而更全面客观地作后续的修改。
如今,市面上已经有着许多的文生图模型及工具。基于技术逻辑和训练数据的不同,它们生成的结果也会有所差异。在Design360°第104期杂志中,放射能视觉工作室创始人王萌还做了一次有趣的小实验——“相同的描述词在不同AI工具中的结果”的图像测试。这项实验旨在对比Midjourney、niji·journey、DALL·E、Stable Diffusion、Disco Diffusion这5种工具的视觉呈现,给设计师们做一个风格上的参考。
王萌
王萌是一位音视觉艺术家、放射能视觉工作室创始人、web3.0艺术品牌A/V GALLERY联合发起人、王萌+于淼音视觉组合成员。王萌在音乐舞台多媒体设计领域享有盛誉,曾与李宇春、李志等多位艺人合作。王萌与著名电子音乐家SHAO合作的音视觉项目曾在德国Worldtronics Festival、瑞士Electron Festival、美国SXSW 2018等世界各地知名音乐节、艺术节演出。在话剧领域,王萌曾担任马俊丰导演《前哨》的多媒体设计和孟京辉导演《柔软》的多媒体制作等。
“这个测试可能很容易让人产生误解,所以我们必须从一开始就强调,这并不是为了测试哪个生成工具更优秀,每个生成工具都有自己的特点。”
这组描述词最初是王萌在Midjourney V4版本中生成的,当时的效果让人感到十分惊喜。作品里的人物不是那种“标准”的美丽网红脸,更像是普通人,让人感觉好像世界上真的有一个这样的人。
Midjourney V4
在Midjourney V5上线的时候,他用同样描述词生成了一张测试,也是他生成的比较火的一张图。当时他主要想测试它是否已掌握画手的技能。显然,它在手的生成上有了质的飞跃,人物形象也还是鲜活的,但是画质感觉比V4版本多了一点点“油腻”。
Midjourney V5.2
Midjourney V5
niji·journey模型是专门生成二次元风格的,但是在描述词里创作者明确写了“摄影作品”和“lomo”,所以生成的图片并不二次元,并且结果让他很惊喜。因为很多时候他写了“闪光灯”也不会生成出相机上开了闪光灯的效果。
niji·journey 5
DALL·E模型虽然是一张糊糊的图,但是非常有“lomo”的感觉。
DALL·E
Stable Diffusion其实是可以生成非常逼真的人物,但因为这组词并不是针对Stable Diffusion写的,所以并没有特别出色的效果。
Stable Diffusio 2.1
Stable Diffusion XL
Disco Diffusion v5.7
《方舟》是王萌的一个系列创作,其中一系列建筑和巨型人像(神像)雕塑结合“方舟”。这组作品的描述词是在Midjourney中反复测试成型地,同样的描述词在其他算法中就很难将雕塑、船和建筑结合的比较合理,其中DALL·E模型是他为了这次测试才尝试的,结果非常出人意料的有意思。
Midjourney V5.2
niji·journey 5
DALL·E
Stable Diffusion 2.1
Stable Diffusion XL
Disco Diffusion v5.7
《印象城市》是王萌刚接触AI生成工具的创作系列。当时最火的是Disco Diffusion,而这个算法生成的结果虽然也有一些视觉上规律,但是总的来说还是非常出人意料的,有惊喜有惊吓。
后来他开始用Stable Diffusion的时候,同样的描述不管是早期的模型还是现在新出的XL都有非常惊人的效果,而Midjourney和niji·journey的生成结果都“没什么问题”,但是显得有些平庸了。在描述词中,他其中写了一个“dark”,在不同算法中有的被理解成为黑白色调,有的被理解成黑暗的气氛。
Midjourney V5.2
niji·journey 5
Stable Diffusion 2.1
DALL·E
Stable Diffusion XL
Disco Diffusion v5.7
我们曾经看到的机器人主题的创作往往是机械的、精致的、反光的、3D的。在这组作品中,王萌想通过《Love of AI Robots》创作一系列更充满人性的机器人,有人的表情,有绘画的笔触。Stable Diffusion 2.1和DALL·E 的结果是他所喜欢的。
Midjourney V5.2
niji·journey 5
DALL·E
Stable Diffusion 2.1
Stable Diffusion XL
赛博朋克是非常流行的一种风格,只要描述里写了赛博朋克每一种算法出来的结果都不会太差。其中Midjourney可能是更接近描述词的结果。