看完AI画画,我的插画师朋友挺急的(2)

首先,大家需要知道一个关于自然语言大模型的背景知识,如果不知道的可以复习我的上一篇文章我和AI聊了一下午被气哭了,没看过或者看过忘了的都可以去与预习或者复习下,加深记忆。

看完AI画画,我的插画师朋友挺急的

「AI画画」原理网络架构(能力强的读者尝试理解,主要看文字描述)

我们提到了AI想要理解人,或者能和人们对话,需要上亿的参数、超大模型再加上海量的数据,才能回答一些人们常规的问题或者理解人们某些话背后的含义。

自然语言大模型是第一步,相当于把人们说的话(文字)转换为机器能理解的语言或者是参数(或者是一个公式)。但是这个表示对于人类是完全看不懂的,对于机器却包含了非常丰富的信息。

机器拿着这个表达+一个混合着随机添加的高斯噪声的图片(大家理解成电视机的马赛克图片,混沌状态),一起送到一个网络中训练,这个训练的目标就是得到一个交叉熵最小值,相当于就是解一个非常复杂的很多元的函数(这个过程需要计算机不断地计算,不断的迭代)。

求解完函数后,机器再把这个函数的未知数求得的值送到一个编解码器中,类似电视台发射电视节目信号进行编码,最终家里电视再接收解码输出画面。你家里就不再是噪声的雪花点了,逐渐出现了电视节目的画面。

看完AI画画,我的插画师朋友挺急的

AI画画(diffusion扩散模型原理)大仙河版解释

最后就能把这个图像生成出来了,这个图就是计算机/AI理解的人类描述语言的画面。以上就是白话版AI画画的原理(专指diffusion扩散方法,包括上文提及的各种竞品)。

看完了上述原理,你还觉得自然语言大模型是无用的吗?你还觉得人工智能是人工智障吗?正是因为有了各种自然语言大模型(无论是英文的、中文的),才能让「AI画画」成为可能。

如果说大家觉得各种AI虚拟聊天助手智商堪忧的话,可以尝试AI画画,真正可以感受到科技的力量,因为毕竟“一图胜千言”。

至少对于我来讲,一个AI行业的非技术从业者,也在体验了「AI画画」之后,觉得“大模型”真香。

今年是text-to-image(文字到图像)蓬勃发展的一年,我们看到了AIGC逐步出圈,不再是学术圈一小撮人自娱自乐的狂欢,而变成了真正民治、民享的产品。

前不久知名网络作家「和菜头」专门写了一篇专栏分享他使用AI画画软件的心得,想来AI画画的影响已经逐步扩散至插画师们、数位艺术家们、游戏画师以及广大的内容创作者们了。

因为AI画画确实画得更好了、更好用了、更方便了,其速度和质量已经超过大部分人类,所以AI画画才能出圈,才可以实现AI全民化。

三、AI会不会取代创意类工作?有什么影响?

最后聊聊所有人都会关心的问题,AI画画全民化了,那我们怎么办?所有内容创作者、数位艺术家们怎么办?我们会被取代吗?

首先,我们要肯定技术进步带来的社会进步,整体来说我们大部分人会因此受益。因为画画的门槛变低了,或者说人们获得一张好看的、自己脑海中的画面的成本很低。我们不用再去像是达·芬奇画鸡蛋那样,一张一张地重复打磨基础也可以获得一张很漂亮的画作。

比如说,对于前面提到的产品经理或者是文字作家,完全就可以通过「AI画画」能力,直接文字描述获得想要的画面,穿插于自己的作品中,提升创作效率,也增加读者和用户的可读性,提高内容表达丰富性。

内容生产力效率提升还能带来什么呢?往大了说,能加速人类文明蓬勃发展。举个例子,放在古代,没有造纸术的时候,人们靠牛车拉满车竹简刻的书上所包含的信息量和你今天手机上的内容量,哪个更多?

而且现在人们每个人都能获得这些信息,每个人都可以创作更好的内容,「AI画画」为人类文明加载了助推器也不为过。

其次,AI画画促进了相关产业的发展,同时也创造了与之相关的新的岗位。比如现在很多科技大厂都在重金投入智慧创作,而智慧创作的核心就是“AI创作”,除了AI画画、AI写诗、AI剪辑视频、AI驱动虚拟头像、AI换背景等等,AI创作还能做什么呢?如何让用户更喜欢用,更好用呢?

看完AI画画,我的插画师朋友挺急的

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zgdyfz.html