邮箱 :news@@cgcvc.com
文章来源: 发布日期:2022-12-02
AI-generated content(AIGC,即“AI生成内容”),被认为是颠覆现有内容生产方式的新一代技术,2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,参赛者Jason Allen提交了一幅使用Midjourney完成的AI生成绘画作品《太空歌剧院》,他没有绘画基础但却获得了“数字艺术/数字修饰照片”类别一等奖,引发了全球科技界对AIGC的议论狂潮。
应用层快速爆红的背后则是预训练大模型的突破性发展。2020年5月OpenAI发布了GPT-3 语言模型,1750亿参数的GPT-3在问答、摘要生成、文本生成上展现出极强的通用能力;2021年,OpenAI为致敬《WALL-E》以及超现实主义画派达利,推出了新型人工智能模型 DALL-E,并快速优化到第二代。2022年9月20日,百度首次发布“2022十大科技前沿发明”,跨模态AIGC上榜。(编者注:跨模态通用可控AIGC提出语言与视觉统一的理解与生成模型,创新提出融合知识的生成,实现了文本生成、图像生成、视频生成、数字人生成的实用化跨越。可应用于图文转视频、高精度数字人生成、文生图等创新领域,大幅提升内容生产效率。)
随着海外迅速进入商业化和VC热捧的AIGC应用公司Jasper AI、Copy.ai、Stability AI等受到真实热烈的用户好评,以及被称为“模型届的Github”的Hugging Face的开发者生态崛起,AIGC正在逐步探索性地进入真实工业生产链条,应用到营销、游戏、代码、生命科学等多个领域。
11月19日,「创·享」CGC-XView AIGC专场线下闭门会,来自大厂、创业公司、学界以及投资机构的朋友们齐聚一堂,围绕“生产力的范式转移:一场AIGC带来的奇幻革命“进行了热烈的讨论。
本文摘取了当天讨论部分精彩内容,分享如下:
Outline:
Q1. 中国会诞生自己的OpenAI 吗?
黄民烈:聆心智能创始人。自然语言生成、对话系统领域专家、清华大学计算机科学与技术系长聘副教授
中国和北美的商业和科技环境不一样,OpenAI这种技术见长的公司需要很多特别牛的工程技术人才,同时也非常烧钱。Open AI 现在收入应该比较少,远远覆盖不了支出,需要雄厚资本的支撑,这样的资本投入在中国还是挺难复制的,需要有远见的资金方支持。从技术层面来讲,中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面,我们甚至某些方面领先。
钟凯祺:某大厂数据科学家
AI技术的创新本质上是开创性的工作,背后一定要有一家大型的公司做资金支持,因为它是烧很多钱却看不到明确短期收益的事。如果要在国内做,问题就是谁来出钱。目前国内大厂暂时都更在乎经济上的表现。AI技术需要短期内用大的资本投入去引领未来开创型的模型,用短期的投入换10年后千倍收益的事。我理解大厂们现阶段很难是引领者或规划者,可能更多是技术追随者。当技术相对明确后,大厂的优势是能够快速跟上,找到落地场景,做大规模的落地,从而转变为企业内部价值和用户价值。
胡家康:就职于某大厂,负责AIGC/大模型相关的战略和投资
在我们的2C应用里,已经有不少内容是AI生成的了,甚至有一些广告的文案的撰写已经在大规模落地使用AIGC技术。我理解我们做这事的一个优势就是,投入资源做出来的一个大模型,它在内部是可以带来价值的。对外的价值点在于,一是,面向创作者或者广告主提供生产力工具;二是,技术引领;三是,开放API接口给应用层。不管做GPT-3还是DALLE2,其实都是开放了一个API 接口,让大家做应用。
Q2.当下是否到了应用大爆发的阶段?
陈雨恒:rct AI创始人&CEO
我在硅谷,接触的大部分投资人都很看重商业化落地,非常看重项目的metric,以及是否有很好的应用场景切入。例如,jasper.ai是具有标杆性的,它的增量做得非常好,一年收入做到了9000多万美金。我觉得未来5~6个月的时间,甚至是明年下半年,市场上才能迎来在产品侧或者商业侧的小高潮。大家还需要时间和资本来持续投入,总得来说行业都在追求实际的商业价值。
闫俊宇:计算机在读博士,北航 VR 国家重点实验室
从去年开始,学术界在多模态和AI生成方面有了比较大的突破,并且开始迅速迭代,一步步向业界演化渗透,今年上半年国内外很多比较好的案例和产品被快速推出,年中伴随着红杉美国的报告,AIGC在资本界迅速爆红,这里有明确的过程的演化。同时,如果我们横向看,去年底开始AI generative mode在不同的领域中也同样迅速发展,比如在蛋白质设计和电路设计等等都有了彻底超越传统方法,并且可以应用于实践的AI based mode。但在迅速发展的同时,我们也能看到这些尚处于相对早期,技术扩展是需要时间的。从理论、学术领域向其它领域拓展需要时间,从一个学术领域向其它服务领域的拓展的过程,也需要时间。现在最能够容易看到和离产品最近的,比如娱乐产业方面。向更深的工业领域渗透,塑造更大的变革不会是一蹴而就的。从现在开始算,明年下半年以及往后是一个持续扩张的浪潮,这个浪潮同时伴随着横向领域和纵向深度(和模式)的拓展,大家还是要从两个方面都进行关注。
王思捷:启元世界战略副总裁
AIGC应用的场景拓展,可能跟unity/Unreal有点类似,先在某一个比较直接的场景落地,比如游戏,再拓展到其他相似的数字孪生领域。启元提供的游戏策划端离线工具,可以用深度强化学习技术辅助策划生成游戏关卡、数值,也已经用到生成式大模型生成对话和做剧情创作。我们也在研究现在最火的文生图,如何真正地跟游戏美术结合在一起。文生图看上去很好,但可能对游戏美术画师来说没有多大价值。在整个生产流程中的前10%,即创意阶段,会有一定的参考作用,但仍无法嵌入到游戏美术生产流程,完整替代某一个环节。举个例子,比如线稿透视笔触,现在的技术根本无法在这个维度上去做调整,AIGC还理解不了。所以我目前感觉文生图大规模商业应用并不会那么快,未形成和场景的深度耦合。
Q3.真实生产环境中模型落地的问题是否有解决方案?
黄民烈:过去两三年,技术得到了很大的发展。AI模型在对话、智能写作、图像生成等领域已经接近甚至超过人类的水平。今天我们已经具备了做商业落地的可能性,找到比较好的场景。我们处在一个非常好的起点和时机,跟一些特定应用场景结合起来落地,商业路径上也会比较顺利一点。
闫俊宇:从商业的角度来看,关键是用好现有的技术水平解决需求,解决市场需求是第一位的。模型不能落地说明这个PMF是伪拟合的,这根本上不只是技术的问题,是商业逻辑就有问题。技术的发展是连续的,是一步步积累的,把需求的解决,寄希望于新技术的突然爆发是比较冒险的事。但整体而言,AI在越来越多的领域展现了可喜的进步,一个阶段的技术可以做出一个阶段的产品,满足一个阶段的需求,如果目前落不了地,那就去看看能用哪些落地的模型去解决其他问题。目前大型的工程,虽然使用了大量的数据,每个模块做了很多精巧的调整,看起来能解决很多通用问题,但是模型的作用、意涵、能解决哪些问题都是非常明确的,不能指望模型变大了,解决的问题更多更综合了,就更好落地了,落地不落地也不能单纯从技术侧去讨论。而且创业公司也不是要解决模型层的问题,是要解决技术和需求匹配的问题。
Q4:所以下游具体的场景和用户的数据是非常重要的。大厂的数据优势是否有助于解决方案?
钟凯祺:我理解当下AIGC的模型,创业公司也好,大厂也好,做的都是用产品去适配,让 AI 和人类之间能更好地互相理解,包括有很多 Prompt Engineering 的库,其实也试着在人类和 AI 之间搭桥,短期之内的突破肯定是来自于产品上的演进。
技术侧可以突破的点有两个,一个是可控性,一个是可解释性。当下的 AIGC 还有一定的黑盒性质,可控性决定着在工业的生产下,更加精准和稳定。可解释性,可以部分帮助解决版权问题。AIGC有一个很重要的关键点,就是版权和确权很多时候会出问题。过去的5 年,研究深度学习的人越来越多,如果把数据资产和数据的确权的问题给解决好,是一个比较重要的方向。
胡家康:我们去年年底已经发布了文生图,还有文本生成的demo,但当时用户量不及现在。今年4月份这一波火了之后,大家的应用场景越来越多。这个领域技术迭代的加速度非常之快,吸引了更多的创业者进入,相信大家会碰撞出更多的想法。
这个领域是一种全新的应用形态,对产品经理是个非常大的考验。整个创业生态一起探索创新,会给技术一个加速度。从技术迭代到应用玩法的加速度,这两波叠加在一起,我们是非常看好这一波机会的。