3秒,用AI生成高质量图片
人工智能(AI)涵盖的范围非常广泛,包含了机器学习、深度学习、图像识别、自然语言处理等多个领域。近期热度不断攀升的人工智能生成内容(AIGC),则是指利用人工智能技术自动生成新的程序、内容,如文本、图片和场景等。当红的ChatGPT、Stable Diffusion、Midjourney等,都属于AIGC工具。
在AIGC工具的不断发展中,GPT3的商业化和Stable Diffusion模型的开源更是为文本生成、文本到图像产品化开启了新一波浪潮。
如果说,ChatGPT已经在自然语言领域具备通过图灵测试的能力,那么有了ControlNet等新工具的加持,Stable Diffusion等在图像领域突破图灵测试,将不再是遥不可及的梦想。
于是我们在赞奇云工作站上,尝试运行了几个生成式模型,测试了这些模型的生成效果以及对运行此类模型所需的算力。下面就跟着小编一起来看看吧——
测试环境及配置
测试环境
赞奇云工作站
具体配置
内存:64GB
显卡:NVIDIA RTX A4000
显存:16GB
使用场景及效果测试
01、建筑领域
建筑设计的早期,在Stable Diffusion中,用建筑词汇和关键字来描述材料、纹理、照明和空间质量等元素,助力设计师生成意向图,激发灵感进行参考。
文字描述:
sci-fi airport in view from above oily gloss specularity reflection with organic forms on the coronation of napoleon painting, on moon with medium size man walking with black background and digital billboard in the middle. unreal engine 5, keyshot, octane, artstation trending, by Zaha Hadid architects, by Matrix film color, high contrast pinterest black plastic, dark atmosphere pinterest tilt shift, 4k, 8k, 16k.
生成结果:
以建筑大师Zaha Hadid的风格来描述住宅元素时,生成结果也是非常具有Zaha非线性的个人风格。具体生成图片如下:
在测试的过程中,还有一些质量比较高的生成图片如下:
02、二次元、三次元领域
用文字描述生成二次元、三次元人物,目前这个领域在网络上的相关应用已经非常成熟,甚至有大量现成的prompt可以直接拷贝。
文字描述:
girl with iridescent black hair, beautiful highly detailed face, complementary lighting, backlit, eyeshadow, divine, dramatic lighting, landscape background, beautiful painting by artgerm and greg rutkowski and raymond swanland.
生成结果:
测试过程中,生成的其他图片如下:
通过自定义图片并调整prompt和原图的loss,还能对AI生成结果的形态、构图等进行引导和控制。示例如下:
小编的沉默震耳欲聋
03、原画领域
使用文字描述,由AI生成生成特定氛围的场景画面参考后,再进行3D场景建模,能够大大提高动画电影、游戏等领域的工作效率。
04、平面设计领域
除了三维领域外,在平面设计行业中,可以直接将业主的文字描述提供给AI,由AI生成初版设计方案,设计师只需在此基础上优化迭代,直到AI提供客户喜欢的概念。
05、产品设计领域
对于产品设计师来说,借助AI生成也可以将自己的创意快速可视化,简化创作过程,使工作流程更快。
运行配置推荐
想要在本地体验Stable Diffusion,硬件标准可以参考:
内存:16GB及以上
显卡:推荐NVIDIA GPU
硬盘:10GB硬盘空间
AI生成图片需要大量的计算资源来进行图像处理和合成,因此需要重点关注显卡的显存大小。
Stable Diffusion官方的最低标准是2GB显存空间,但在实测中发现生成的图片即使设置成默认分辨率(512×512),占用的显存也高达4~5GB;设置成最高分辨率(2048×2048)时,显存占用更是达到8GB。因此,在同时运行多软件的情况下,想要确保运行流畅,显存尽量超过8GB。
而在赞奇云工作站(显存16GB)的整个测试过程中,图片生成的过程都很顺利。使用默认分辨率时,一张图片生成时间不超过3秒钟,大大提高图片优化迭代的效率。
赞奇云工作站是赞奇科技与华为云联合共创,基于公有云的SAAS产品,所有机型均配备NVIDIA专业级显卡,具有高达153.4 TFLOPS的Tensor Performance参数性能,对深度学习中的计算性能和效率有着更高的支持度,更有能力处理AI任务。
同时,赞奇云工作站(www.zanqicloud.com)还能整合打通设计者前端生态应用和设计业务全流程,全面调用云计算资源运用于AI(人工智能)的应用场景。高性能算力机器按需使用,灵活租赁,稳定性强。基于域控的安全策略,还可以免受病毒攻击,并且提供自动多副本可靠性机制。
还在等什么?想体验AI生成工具效果的小伙伴,赶紧上赞奇云工作站SHOW起来~