Open AI 公司开放 ChatGPT 接口以来,各大跑在行业前面的人,敏锐察觉到了 AI 这一新的风口,互联网公司围绕大数据语言模型开启了各种垂直领域的产品研发。其中,AIGC 领域显然成为了「跑」在最前面的一个梯队。从去年 2022 年 11 月 AI 绘画引发网络争议,到现在 GPT-4 实现多模态语言分析,处在风口浪尖的 AIGC 将会往何处去?设计行业从业者又能如何利用 AI 提高生产力?
近日,多鲸邀请了专注于将 AI 转化为生产力的实践者,GPT-5 降临派,即将在 AIGC 方向创业的现任投资总监林杰先生,与大家共同探讨 ChatGPT 时代下 AIGC 的生产力变革。
(资料图)
以下,是来自林杰的分享(经多鲸编辑删减)
大家好,很荣幸在这个生产力变革的时间节点,重新与旧友相聚,与新朋友分享关于 AI 时代的认知与理解。我现在在一个中等规模的游戏公司担任投资总监。作为一个创意行业的从业者,我观察到游戏厂商也时刻追踪 AI 技术前沿发展动向,以期通过过人工智能技术获得生产力效率的指数级增长。
从我的角度出发,我支持周鸿祎在联名公开信中提到的问题,要认清 AI 使用的潜在风险, 但应该在修正中去解决。我是一个坚定的降临派,不希望 GPT5 的训练受到影响。但我同时认为,在 AI 工具席卷行业的时候, 不存在所谓被动接受的躺平派,我也不希望各位持有这样的立场。
在 AI 降临的过程中,谁选择「躺平」,谁就会陷入被动的境地,继而被削弱,甚至最后被替代。能取代掉人的不是 AI,而是「会使用 AI 的人」,这个「会使用」指的不仅是 ChatGPT 这样的单一产品,而是一整套根据 AI 逻辑而推出的颠覆性的系列组合工具。
在我的行业实践中,我已经目睹了 AI 所产出的有商业价值潜能的产品,以此赋予工具改变行业规则和低成本创业的机会。我将在后文一一跟大家分享。
我接触到 ChatGPT 是在去年 12 月的时候,尽管 GPT3 的功能跟现版本相比稍显逊色,但也足够惊艳众人。除了超越行业语音助手的响应速度,ChatGPT 创造了一个新的评价维度。如果类比移动互联网时代的苹果公司,2007 年乔布斯发行的第一代 iphone 重新定义了手机,那么 Open AI 公司则重新定义了大语言模型 AI。
而 ChatGPT3.5 在此前的基础上,已经能够胜任一般文职工作的能力。尽管偶尔出错,但可以通过 API 接入进行调校,作为一个优良的定向工具使用。同时,ChatGPT 3.5 价格低廉,是一个极好的生产力驱驱动引擎。
到了 GPT-4 时代,AI 辅助办公已经成为了一个未来办公的必然趋势,不会使用 GPT-4 的人和企业必然会被淘汰。我对此情况总结了以以下三个观点:
第一,众生平等的契机。 在目前的教育体系驱动下,一个细分领域的顶级人才培养需要消耗大量的时间、金钱和资源进行培养和沉淀,是一个家庭、学校和社会政府的心血和资源消耗的集成体。这也导致了一种情况,「寒门再难出贵子」,导致社会分化加剧。此外,学生的精神压力和社会衔接也会给人才自身带来心理问题的困扰,并不是一个可持续的人才发展模式。
第二,减少职场无效沟通。 对于职场而言,公司利用 AI 可以「集中力量办大事」,做到人才精英化培养,省去「996 文化」、「开会文化」等低效工作模式对公司带来的「拖后腿」。以游戏行业为例,以前 UI 制作需要一天的时间,如今一个小时。两天才能整理好数据,写好代码半天即可。产品迭代的速度也前所未有的加快了。我相信在 AI 辅助的产品上线之后, 产品数据会成为那些从不深入行业一线而指手画脚的所谓高管的「照妖镜。」
第三,行动成本大幅降低。 从前碍于创业资金缺乏、对口人才缺位、岗位结构缺失的问题,如今可以向 ChatGPT 问答案。无论是代码还是设计,都可以从 ChatGPT 那里获得帮助。再找一些志同道合的伙伴,就能够很快推出一个完整的产品。
我了解到目前有很多人没有使用过 ChatGPT 原版。也有部分人使用套壳的程序机器人或者提供会员制的 ChatGPT 账户作为幌子来挣快钱。尽管我不反对赚信息差的钱,但我觉得应以更加良心的方式。一方面,可以通过社群分享形成体系化传播。另一方面,促成知识付费的良性循环。我认为我们有责任,尤其是教育界的同仁们,有责任将 ChatGPT 向大众推广和普及,就像将移动互联网普及到广大乡村那样,推动全社会加入到这个生产力的大变革中来。
下面,我将基于游戏行业分享三个感悟。
第一,难以预测的时代发展速度。 我觉得三体人说的很对,人类的发展是在加速的,特别是每一次工业革命的发展间隔时间在缩短。从持续 100 年的蒸汽机、内燃机的工业革命,到持续 50 年的电气化革命,再到信息化技术革命——至今也不过 20 多年。如今,AI革命带来的成果,我觉得很可能会超过历次工业革命的总和。
第二,AI 纪元没有旁观者。 哪怕是纯体力的劳动者,也不可能再这次变革当中独善其身。微软已经将 ChatGPT 与实体机器进行了一个链接,具有了改变物理世界形态的能力。如此演化下去,就意味着所有人都必须要适应新的生活环境。
第三个,历史经验不能再预测未来。 以游戏行业为例,AI 工具的出现对游戏生产的工作流程和原先的人员分工进行了彻底的颠覆。刘慈欣在小说《赡养世界》中描写的全能型机器人管家,或许即将成为几个世纪后的真实世界。
首先要明确,ChatGPT 对于新型的绘画流程必不可少,同时绘画工具也是必要的。我所有的观点都是围绕着这个以多种工具组合的方式去推动某一个细分的行业,它的整个工作流程都会发生巨大的变化。
为什么要关注绘图? 绘图作为人类重要活动之一,从历史上来看已经有 200 万年的历史,从一些史前的人类活动中就可以找到这种原始的艺术形式。而在当今社会中,图形是一个很重要的元素。商业广告、产品包装、游戏设计、建筑装修甚至跨国际交流,都需要图形来「说话」。图形无处不在。另一方面,培养设计绘画的专业人才培养成本较高,流程较长,而单一画师的产能是有限的,产出成果也会有所波动。种种原因造成了明显的供给不平衡,市场的需求远远大于供给的产出。在游戏行业,画师薪酬很高,能力强的画师在国内的公司非常吃香,动画公司留人成本也很高。
所以我们现在看到市场上面最优秀的两个绘图的工具,一个是 Midjourney,一个是 Stable Diffusion,这两个工具已经深入垂直到各自的产品方向,可以说是「独步天下」的 AI 的王者。
从工作流的角度来看,Midjourney 偏意识流。就比如说,我现在有一个朦胧的创意,那它可能包括了 A、B、C、D、E 5 个要素,但是我对这五个要素集合到一起的匹配程度不够确定。在这个情况下,用 Midjourney 就能够做到快速成图,随后选择调整或者放弃。
我昨天拿到一个还不错的一个 Promot,然后多次调整之后,就获得了一个奥黛丽赫本style的女性,站在 2023 年日本街头的一个照片。整个的风格已经达到了我最初的预期效果。
Midjourney,使用这个工具在制作创意评选还有海报宣传的时候,可以基于我个人的创意去做一些定量、定性或者定向的事情。而当我们进行批量化生产的时候,就要进入到 Stable Diffusion 的领域。它的特点是能够快速批量的出图,随后精确控制角色动作。还可以根据一代的角色的信息库,迅速生成下一代角色,这是 SD 的强项。而且使用越久,效率越高,因为模型可以在使用者的手中不断迭代。
在游戏这个行业,美术占游戏开发的成本接近六成。当投入 AIGC 工具之后,画师就不需要再埋头画画,首先通过调整提示词和插件获得相对满意的效果,然后再进一步去手动精修。我们做过实践,原本三天的工作量可以缩短到一天之内完成。
给大家举一些具体的例子。比如下面这张图在角色设定中,属于最常见的三视图。
接下来这张,是原创角色插画。我们在买量做 AB 测试(对比测试)的时候,会做宣传性的海报去获取用户反馈。
接下来这个例子,也是游戏中一种比较常见的工作流。模型角色,或者说角色的原画一般不苛责画面的精细度,仅是一种概念性的粗糙表达。而借助 AI 工具,可以迅速生成表现力更加强的完整性的图片形态。
至于贴图,也是游戏设计必须的环节。这里是一个 2D 贴图,现在也已可以做到 3D 贴图。通过一些插件,AIGC 可以完美呈现超越人工效果的 360 度 3D 模型。
接下来这个就是所谓游戏内的资源,就是各种小的道具、图标、以及小的角色,是可以在游戏当中跟玩家之间发生交互或者提供玩家使用小资源。
这个是所谓技能的 UI。比如说我们玩 MOBA(多人在线战术竞技)、RPG(角色扮演) 游戏,经常需要画师手绘技能图标。现在也可以用 AIGC 的工具快速生成,而且修改迭代特别方便。
以上这些工具,并非是一个单纯的应用,目的是向 AI 工具体系的整合化靠拢。
以我从前的经验来看,我原先以为这个行业会相对保守,变革进度相对缓慢。由于建筑师对于建筑美学和风格的把握也需要多年从业经验的沉淀,建筑行业会有一种「精英感」的无形壁垒。而当 AIGC 出现的时候,这道壁垒也被一夜间的变革打破了。部分从事建筑的人,主动走在了 AI 纪元的最前列。
举几个简单的例子,从建筑的角度向大家介绍我认为 AI 绘图成为变革行业规则的生产力的原因。
这是我用「办公室毛坯」关键词在百度上随意找的一张图片。
一个毛坯办公场所。我用一些SD模型将原图进行加工,仅花了两分钟的时间。它就变成了这接下来的几种样子。
这三种图,是我用最粗糙的方式,刻意忽略一些细节的参数,使用一些简单的提示词,达成了已经成熟的效果。这张图片考虑到了房间白天和夜晚不同的光线状态,对光照的投影做了细节化的处理,同时呈现了远处的景深——以此达到通透的效果。画面足以以假乱真到是「现场拍摄」的。
还有有趣的一点是,AI 还把原图中的楼房改掉了,改成了一些 AI 认为远处楼房应该有的样子。
如果这个模型再继续精修的话,我可以做出一些适当的调整来完善这个办公室的全貌,包括桌椅、人物,而这些变量元素的也是都可以调整的。
类似的方式,我可以做出一些其他风格的。比如说接下来这张,就主打工业风、极简风。
接下来这张,我可以自由定义窗外的风景和室内的陈设。
如果想要复杂的装修风格,比如说新中式、新中式的风格,只需要在提示层面稍微做一些修改,用一些特定的模型就可以把一个新中式的办公室给做出来,搭配种类繁多。
同样可以要求 AI 制图换一种网红小清新的风格,AI 的作品甚至可以作为网络社交平台的宣传图片。
即使是完全没有接触过建筑行业的业主,也可以通过简单的笔画与建筑师进行沟通。
室外设计,或者说整个建筑的规划设计,同样呈现了飞快的迭代速度。
几周前我拿到一个模型的时候,这个模型连外立面的直线都画不好。几周之后,我再用迭代后的模型去重新跑一遍的时候,模型已经展现出非常完美的效果了。而制作这个东西花的时间,其实也就几分钟的时间。
更让我震撼的事情是,当我发现 Stability AI 上线的体验官网时,那套未公开模型制作出建筑的效果足以让我惊讶得说不出话。
AI 的发展,必须投身进去,才能够感知到。 ChatGPT 等工具需要官方进行版本的升级,而像 Stable Diffusion 类的插件功能,背后是无穷无尽的发展空间。
相比之下,现在的可以被称为「原始」的生产流程在 AIGC 强大的生产力面前显得无比乏力。AIGC 能够省出大量的时间和资源成本去匹配用户的需求,与传统生产力之间差的不止一个数量级。与此同时,已经有一部分人跑在前面,如饥似渴地想要踏足 AI 的新时代。以下是我准备分享内容时,凌晨三点在一个建筑师 AI 模型共享文档的截图。凌晨三点,还有 95 人在看。
所以我这里给各位一个建议,可以去囤一块 RTX 4090 的 24G 的显卡。不管是大语言模型的计算,还是 SD 的炼模型以及出图,算力都是要需要 GPU 的浮点运算。但凡跟 AI 有关的,都逃不出高显存显卡的手掌心。
最后总结一下,我觉得人生当中难得遇到几次重大的变革,如果上一次移动互联网的一个时代,各位没有抓住的话,这一次就千万不要再错过。
AI 降临之后,这个时代再也没有旁观者。