(报告出品方/分析师:浦银国际研究 赵丹 杨子超)
序幕揭开:ChatGPT 将 AIGC 推向 “平民化”时代
关于 AI,早在各类科幻作品中,人类就已探讨了有关它的种种终极幻想。
电影《她》中,AI 可以浪漫得像一首情诗;而《克拉拉与太阳》里,石黑一雄甚至让 AI 机器人教会人类何为“人心”;更有 55 年前的《2001 太空漫游》,HAL 带给我们的无尽震撼与思辨。
2022年末,ChatGPT的诞生,无疑让人们再一次开始思考,我们离曾经的想象,究竟还有多远?

ChatGPT 是由 OpenAI 在2022年末发布的全新的 AI 聊天机器人,因其高质量的回答而迅速出圈,其内容涵盖写诗、检查代码和提出建议方案等,而借助 ChatGPT 而生成的内容,在一定程度上可以取代部分“初级内容生产者”。
12 月 5 日,ChatGPT 上线不到一周,已达到百万用户。推出仅两个月,ChatGPT 月活用户突破 1 亿,成为史上用户增长速度最快的消费级应用程序。而 ChatGPT(AI 问答)只是 AIGC,即 AI Generated Content(人工智能自动生成内容)的一个分支应用,在此之前,AI 绘画已经走红……
在继 PGC 和 UGC 之后,AIGC 时代已经悄悄来临,甚至有人将 AIGC 的出现比作当年 iphone 的诞生,或成为互联网发展史又一重要里程碑。而 ChatGPT 火爆的最大意义,则是将 AIGC 进一步推向“平民化时代”,正式揭开 AIGC 时代序幕。
AIGC 或成为未来十年最值得关注的投资方向之一。
2022 年之前,我国人工智能技术更多地集中在“分析式人工智能”,而“生成式人工智能”在 2022 年才逐渐迎来爆发。AIGC 则代表着人工智能技术应用从“理解分析”到“生产创作”的进一步升级,开启人工智能的新时代。
互联网行业不断创新,持续影响并改变着用户获取信息和内容产出方式。而 AIGC,作为新一代的内容生成方式,或将极大地降低内容生产的创作门槛,并提升内容供给的生产效率,可以覆盖文字、图像、视频、音频以及虚拟人等领域。
2022 百度世界大会上,百度创始人李彦宏表示,“未来十年,AIGC 将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成 AI 原创内容。”
和其他热词一样,AIGC 后期必然会经历短期“热炒”之后的自然降温,但从长期趋势来看,AIGC 或将进在各个生活场景中进一步渗透。

应用创新
AIGC 或将颠覆传统内容生产方式,降低内容创作门槛。对于企业端而言,AIGC 有助于推动企业进一步实现降本增效。对于用户而言,由于 AIGC 进一步降低了内容创作门槛,内容供给或呈现爆发式增长。根据 Gartner 测算,当前 AIGC 占所有生成数据小于 1%,预计该数字到 2025 年或上升至 10%。

AIGC 不仅改变内容创作方式,或将改变用户获取信息的方式。ChatGPT 在部分问题的寻找答案效率上已经超越了传统的搜索引擎,ChatGPT 或许在未来会改变我们获取信息、输出内容的方式。在互联网的 PGC 时代,生产的内容质量高,但产能受限。而 UGC 降低了生产成本,但整体内容参差不齐。
AIGC 既能帮助提升生产效率,又有助于提升内容的专业性。此外,Web 3.0 时代对于高质量的数字内容有着极大需求,AIGC 有望呈现爆发式增长,成 为元宇宙时代的基建内容的重要组成部分。
AIGC 仍处在发展早期阶段,未来潜力巨大。百度创始人李彦宏在 2022 年百度世界大会上曾判断,AIGC 将迎来三个发展阶段:第一阶段是“助手阶段”,AIGC 辅助人类进行内容生产;第二阶段是“协作阶段”,AIGC 以虚实并存的虚拟人形态出现,形成人机共生的局面;第三阶段是“原创阶段”,AIGC 将 独立完成内容创作。

AIGC 不再局限于文字、语音,进一步覆盖图像、视频和代码等多种形态。
在 2021 年之前,AIGC 还主要集中于文字和语音生成, 而目前已可以扩展到多种形态,包含文案、图像、代码、视频等等。
随着 AI 技术的不断发展,AI 已从辅助工具逐渐演化成创作工具。生成式 AI 能够基于训练数据和算法自主生成新的文本、图像、音视频、3D 交互内容,在多个领域展现出巨大应用潜力,未来有望成为“基础设施”,与各行业进行更深入的融合。
AI 能做什么?
1. ChatGPT 的回答

2. 我们的观点
文字
AI 在文字创作方面发展迅速且相对成熟,能够实现聊天,生成文案,写诗,修改代码等任务,部分创作水平已取得不错的效果。《CNET》旗下CNET Money 团队利用 AI 已刊登了数十篇文章,并表示未来持续探索 AI 以协助研究编辑等工作。
ChatGPT 是文字 AI 领域的典型代表,自 2022 年 12 月 1 日开放以来,用户数已突破 1 亿。与普通的 AI 机器人相比,ChatGPT 拥有更强的语言理解能力,能够结合上下文语境进行回复,根据用户指令持续优化创作内容,猜测用户意图,承认错误并拒绝不适当的请求。

我们认为 ChatGPT 在交互方式的突破意义大于在技术层面的创新:
易于操作,用户门槛低,进而成为真正意义上的消费级应用。ChatGPT 可以对提出的问题给出相对完整的分析框架,逻辑清晰,更适合用来搭建分析问题的初步框架,但目前还难以解决相对具体或即时性的问题。
ChatGPT 是否会替代搜索引擎?
短期来看,还存在差距,可信度有待提升。目前的 ChatGPT 答案参差不齐,既可以给出准确答案,也会出现“一本正经地胡说八道”。而且 ChatGPT 知识库的时效性也一定程度上限制了提供实时信息的能力,有待进一步优化。
长期来看,ChatGPT 或许和搜索引擎进一步融合,或将成为未来搜索引擎的新形态。微软已经在 Bing 搜索引擎中添加了 ChatGPT 功能,并开展测试;谷歌也会推出类似 ChatGPT 的大型语言模型,一款由 LaMDA 提供支持的对话 AI 服务 Bard;百度计划在 3 月推出新功能,在搜索引擎中加入类似 ChatGPT 的对话式机器人“文心一言”。

图像
2022 年 9 月,AI 作品《太空歌剧院》获得了美国科罗拉多州举办的艺术博览会的数字艺术类别冠军,引发了人们对 AI 创作的广泛关注。该作品是由游戏设计师 Jason Allen 使用 Midjourney 模型生成,并通过 Photoshop 润色而来。Midjourney 是一个 AI 绘画工具,通过输入图片的关键字,就能得到 AI 生成图片。AI 创作的画作已能达到专业水平,能够帮助内容创作者激发灵感和提升效率。

音视频
AI 音视频创作相对处于早期阶段,但发展迅速。市场上已有许多音视频创作工具能够实现图文生成视频的能力,极大降低了音视频内容创作门槛。
QuickVid 将多个生成式 AI 系统进行整合,用于自动创建短视频内容。用户只需输入一个单词,QuickVid 就能从库中选择一个背景视频,编辑脚本和关键字,并添加合成配音和背景音乐,最终生成视频。

AI 视频工具或成为下一个迎来爆发的细分领域。
随着 Tiktok 在全球火爆,短视频应用占据用户大量时长且仍在持续上升。AI 视频工具也更容易受到追捧。全球科技巨头也都看好这一方向,纷纷布局:Meta 曾推出 Make-AVideo,可以通过文本、图片或者视频来生成一个全新的视频内容;Google 也发布了 AI 视频扩散模型 Imagen Video。
不过,目前整体质量仍有很大改进空间,仍存在画面变现变形、动作卡顿等问题。AIGC 视频是一个相对前沿的领域,技术上仍有待突破,涉及到时序建模、图像和文本的联合建模等问题。除此之外,我们也看好数字人方向,数字人制作流程更为繁琐,涉及算力、算法的要求也会更高,数字人的大规模推广有望打破元宇宙内容供给侧的瓶颈。
AIGC 如何赋能传统互联网?
1. ChatGPT 的回答

2. 我们的观点

广告:创意素材生成,实现“千人千面”
当前 AIGC 在图文领域已能够产生较为满意的结果,广告行业将是直接受益者,或较容易实现规模化落地。
在广告素材方面,AIGC 工具能够协助生成宣传文案、图片和视频,能够有效降低人力成本并提高内容生成效率。而 AIGC 的快速海量内容生成能力,使得营销内容能够根据用户画像生成定制化内容,进而实现千人千面。

电商:打造虚拟人形象,赋能直播带货
品牌方可根据自身需求设计出符合品牌调性的虚拟人形象,与用户建立情感联系。
与真人主播相比,虚拟人主播拥有无负面新闻,低成本运营等优势,同时能够填补真人主播的直播空挡期,实现直播间的全天候直播,为商家持续创造流量。
目前,受限于 AI 虚拟主播较弱的交互能力,主流虚拟主播仍需要真人辅助进行互动。而随着 AI 能力的不断突破,虚拟人最终或能达到像真人主播一样实现自主与用户进行实时互动。

游戏:降低游戏开发成本,提高游戏可玩性
游戏作为数字内容产业或许是 AIGC 发展过程中最大的受益领域之一。AIGC 能够在降低游戏美术成本,提升游戏设计,创造新玩法等方面提供帮助。
降低游戏美术成本。
过往游戏美术师可能需要数小时来生成高质量图片,而 AI 可以通过学习游戏美术师的艺术风格,在人物、场景、关卡等方面快速生成大量内容,能够显著降低美术成本及提高创作效率。
提高游戏的可玩性。Cyber Manufacture 推出的 AI 产品 Quantum Engine 能够将纯文本输入转化成交互环境和动态角色的可玩性叙事。在其发布的演示中,玩家可以扮演黑客帝国中的角色,与 NPC 进行交互,AI 会根据故事设定的世界观进行相应的回答并推动剧情的发展。目前仍处于较为早期的阶段,第一步基本实现了用户与 AI 对话驱动游戏剧情发展,然后是要实现 AI 游戏实时交互与视觉画面的结合,最终发布游戏成品。
AI 赋能下的 NPC,可以根据玩家行动而做出不同的反应,提高游戏的可玩性和游戏体验。

技术驱动
1. ChatGPT 的回答

2. 我们的观点
AIGC 核心要素包括算力、算法和数据,而目前技术创新主要体现在模型算法。
算力,包括计算机、芯片等基础设施,为其提供基本的计算和存储能力;海量数据为训练并优化算法提供基础素材;算法是推动技术升级的核心驱动力。
深度学习模型的不断完善以及开源模式的推动,为 AIGC 的发展奠定了基础。基础生成算法模型创新、预训练模型和多模态技术加速推动行业的爆发。
基础生成算法模型创新推动行业发展。生成对抗网络(GAN)是早期重要的生成模型,被广泛用于生成图像、视频、语音、三维物体模型等方面。随后扩散模型、Transformer 等深度学习算法在各个领域得以应用并优化。尤其是到 2022 年,Stable Diffusion 扩散化模型的出现与正式开源,直接推动了 AIGC 技术的突破性发展。

预训练模型提供通用解决方案,推动 AIGC 迎来爆发。
预训练模型按基本类型可分为自然语言处理(NLP)、计算机视觉(CV)和多模态。以 OpenAI 为例,核心预训练模型包括聊天机器人 ChatGPT、图像生成工具 DALL-E(多模 态)、自回归语言模型 GPT-3(NLP)、文本生成代码工具 Codex(NLP)等。
生成模型的训练通常需要大量数据和高成本技术投入,进入门槛较高,因此目前的预训练模型主要由头部科技企业和科研机构负责研发。随着预训练模型不断成熟,市面上已有针对不同需求的多种解决方案,形成了模型即服务(Model-as-a-Service, MaaS)模式,同时也有如 Stable Diffusion 的开源模式,共同催生出了各类二次开发的 AIGC 应用,为 AIGC 的下游应用提供了解决方案。


而具体到 ChatGPT 产品,其核心优势在于自然语言理解能力、丰富的知识储备和强大的学习能力,极大地提升了交互体验。
本质上,ChatGPT 是一款基于人工智能技术的聊天机器人软件,它能够与用户进行智能化的聊天对话,帮助用户解决日常生活中的问题,并为用户提供丰富的信息和服务。
ChatGPT 架构主要包括三部分:自然语言处理模块、知识库模块和学习模块。
自然语言处理模块是 ChatGPT 的核心部分,它主要负责理解用户的言语表达,并根据用户的语境和场景来推断用户的需求,从而生成合适的回答内容。
知识库模块是 ChatGPT 的辅助部分,它主要负责存储大量的知识信息,包括日常生活中的常识性问题、新闻资讯、娱乐资讯等,并能够根据用户的需求提供丰富的信息服务。
学习模块是 ChatGPT 的重要部分,它主要负责不断地学习用户的语言表达方式和交流习惯,并以此为基础来构建对话模型,从而不断优化自身的对话能力。相比传统搜索引擎或 Siri 而言,一方面,ChatGPT 可以联系上下文,实现连续完整对话;另一方面,ChatGPT 的回答具备一定逻辑条理,更加全面,语言也更加专业化。当然,由于训练样本相对有限,ChatGPT 目前某些具体领域的知识准确度以及时效性方面还有很大提升空间。
发展趋势
虽然 AIGC 较此前已取得重大突破,但目前还处在早期阶段,仍有许多地方需要持续完善,包括在生成内容质量,版权确认保护以及商业化探索等方面。
我们认为随着 AIGC 逐渐走入大众视野,训练素材数据库愈加丰富,有助于进一步优化模型算法和提升内容创作水平,与之相关的法律制度也有望得到进一步完善,未来商业模式也将逐步清晰。
内容质量有待优化
1. ChatGPT 的回答

2. 我们的观点
整体而言,目前大部分 AIGC 产品内容更偏重娱乐属性,如果以商业化角度来看,仍然存在一定差距。由于 AIGC 产生的内容与此前训练的素材数据库存在很大关系,生成内容具有不稳定性和局限性。
AIGC 的火爆,也不可避免地造成短时期内赛道产品同质化严重。此外,以当下最火爆的 ChatGPT 为例,其时效性略差,对于某些数学计算和基础常识性问题,有时也会给出荒谬的答案。未来或连接网络搜寻信息并提供来源,将很大程度上补充实时信息源,优化答案。
我们相信,随着越来越多的用户加入到 AIGC 互动中,会不断丰富其数据库,将进一步完善算法并提高内容质量,从而避免批量生产“工业垃圾”。
版权问题尚存争议
1. 我们的观点
目前,AIGC 生成内容在版权方面仍存在很大争议,相关法律制度也仍需在后期持续完善。以 AI 作画为例,关于 AI 作品的版权确认及归属尚不明晰。同时,AIGC 作品也具有较强的随机性,也为版权归属及确认带来一定挑战。除此之外,关于如何合理利用 AIGC 目前也备受争论,比如教育界担忧学生利用 ChatGPT 在写论文时作弊,呼吁加强防范。

2. ChatGPT 的回答

商业模式仍在探索中
1. ChatGPT 的回答

2. 我们的观点
关于 AI,如何实现商业化,是市场最关心的问题之一。
近十年来,人工智能赛道的投资浪潮起起伏伏,但市场关注点仍然是围绕商业化落地。
由于 AIGC 仍处于早期,行业仍在持续加大研发投入,包括在算力、算法等方面,而商业化处于探索阶段,因此绝大多数 AIGC 公司处于亏损状态。
AIGC 毫无疑问是 2023 年开年最大的风口,受到资本市场追捧,但目前尚未出现的清晰的 商业模式。
AIGC 能否在商业化实现重大突破,主要取决从“玩具”到“工具”的升级,进而提升付费意愿。目前大部分 AIGC 厂商的商业模式并不成熟,还停留在免费引流阶段,商业模式仍在探索中。AIGC 应用产品有望随着用户数的爆发迎来可观的变现空间。
我们认为,商业化探索的路径主要包括:
采取订阅制或付费会员模式,类似于 SaaS 服务。近日,OpenAI 周三推出订阅服务 ChatGPT Plus,月费为 20 美元。该公司表示,即使是在免费用户必须等待的高峰期,收费服务能够提供更快地响应时间和可靠性。
OpenAI 表示,会在未来几周向美国和等候名单上的用户发出这项服务的邀请,并在未来将收费服务推广到其他国家和地区。
目前,大部分 AIGC 平台也都采用类似收费模式:“一定数量的免费使用次数+付费会员”的模式,按产出内容量收费。但目前整体来看,C 端用户的付费意愿较低,主要由于尚未体现出刚性需求。
打造一体化解决方案,提供增值服务。提供增值服务或成为 AIGC 未来新的探索模式,在不影响基础功能使用体验的前提下,推出增值功能,进行个性化收费,用户可以按需选择性购买,如技术授权、运维服务以 及专属素材等,进而为企业提供一体化解决方案。
依靠用户流量进行广告变现。无论是在 PGC 还是 UGC 时代,通过流量进行广告变现始终是最常见的变现模式,对于主打 C 端的 AIGC 平台而言,也不例外。随着 AIGC 用户高速增长,AIGC 或逐渐成为广告主青睐的新的媒介平台。
行业标的
海外企业在 AIGC 领域较为领先,业务生态也相对成熟。除了传统科技巨头微软,谷歌,英伟达,Meta 之外,还涌现出一批新的独角兽,比如 OpenAI,Stability AI,Jasper 和 DeepMind 等。国内公司也在奋起直追,产业链在逐步完善中。
由于预训练模型的高壁垒,我们认为,未来 AIGC 基础设施研发仍将集中于行业头部企业,目前国内自研的大模型包括百度的文心大模型、阿里的 M6 大模型、腾讯的混元大模型。但由于 AIGC 的通用能力能够赋能各行各业,预计下游垂直领域或将百花争鸣,依靠开源的模型,或将涌现大量应用类企业。





——————————————————
报告属于原作者,仅供学习!如有侵权,请私信删除,谢谢!
报告来自【远瞻智库】
原创文章,作者:add,如若转载,请注明出处:https://wd88wan.com/152686.html