2023-12-19

《AIGC人工智能生产内容行业分析报告》与智顶科技合作编制。AIGC对资本寄予厚望,AIGC产业迎来了新的发展机遇,但在政策、商业、法律等方面仍存在很大风险。
序言:
2022年8月,在科罗拉多举行的新数字艺术家大赛中,一名没有艺术基础的选手提交了AIGC艺术作品《太空歌剧院》,并获胜“数字艺术/数据装饰照片”类型一等奖,导致行业相关“人工智能会取代艺术家吗?”一场争执。
从2022年下半年开始,“AIGC”接力“元宇宙”在AIGC的帮助下,各行各业正在积极探索相关行业的新发展方向,成为全球关注的焦点和热点话题。国内外大型企业纷纷布局AIGC行业。与此同时,大量新的技术初创企业涌现在该行业。在资本的帮助下,AIGC行业迎来了新的发展机遇。
AIGC引起了各行业的高度关注。如何将AIGC与各行业紧密结合,创新商业模式,如何避免可能出现的政策、商业和法律纠纷,已成为业内人士关注的问题。
本研究报告借鉴了AIGC行业众多组织的科研成果,以及AIGC杰出从业者的观点和社会经验。
本研究报告借鉴了AIGC行业许多组织的科研成果,以及AIGC优秀从业者的观点和社会经验。考虑到AIGC领域的发展,系统梳理了AIGC与各行业业务融合的诸多情况和运营模式,总结了AIGC领域仍有待处理的一些问题。本研究报告预计将为读者打开触摸AIGC实践的窗口,推动新经济领域的实践探索。
第一章:AIGC定义及国内外发展概况1、AIGC概念与发展史
AIGC,全称是:“AI Generated Content”。即人工智能生产内容是继专业生产内容之后(PGC)、用户制作内容(UGC) 新的生产过程是利用人工智能技术一键生成内容的。
人工智能可以灵活地应用于创作、编曲、绘画、视频制作等创意领域。到2025年,人工智能生成数据的比例将达到10%。依据《Generative AI:A Creative New World》AIGC有潜力造成数万亿美元的经济价值。
(图:PGC、UGC、AIGC比较)
AIGC还处于起步阶段,其精确定义范围和业务落地方式尚未达成行业共识,其发展可分为以下三个环节:
初始萌芽阶段:从20世纪50年代到90年代中期,AIGC仅限于局部试验。
积累链接:从20世纪90年代中期到21世纪10年代中期,AIGC从实验转变为易于使用,受算法限制,无法直接形成内容。
积累链接:从20世纪90年代中期到21世纪10年代中期,AIGC从实验转变为易于使用,受算法限制,无法直接形成内容。
快速发展阶段:自20世纪10年代中期以来,深度学习算法不断迭代,人工智能生成的内容种类繁多,效果真实。特别是近年来,AIGC的蓬勃发展已经从以公司和组织为边缘的角色转变为C端零基础客户可以使用的创意工具。在重点发展方面,AIGC也从最初用于翻译、语音合成和重复工作转变为更加注重应用,用户可以方便操作方向。
近年来AIGC的大发展主要来自三个机遇:
1)更多模型
数据显示,至少在文本生成行业,更多的模型有很好的效果。在过去的五年里,随着计算能力和算法的提高,模型参数增加了三个量级。2017年第一版生成模型只有1亿参数,最新模型有1000多亿参数。
2)高质量图像生成引起的持续发展
文本生成模型gpt3用了2年半,里程碑相同,代码生成模型copilot用了半年,图像生成模型dalle用了2.5月,另一个图像生成模型stable Diffusion用了不到一个月。
3)更多的数据形状
在2021年之前,AIGC通常生成文本,新一代模型可以处理任何内容格式,如文本、语音、编码、图像、视频、3D模型、游戏机按钮、机器人姿势等。在不断抽象不同类型的数据与相同的想法,并取得了良好的效果后,我们隐约看到一个可能通向通用人工智能(AGI)的路。
2022年,AIGC的增长速度惊人,年初仍处于陌生的工艺环节。几个月后,它达到了专业水平,很难区分真假,这让花了一生学习创作的从业者感到恐惧和紧张。同时,AIGC的迭代速度呈指数级爆发,其中深度学习模型逐步完善,开源模式推广,大模型探索商业化的可能性成为AIGC的发展“加速度”。
近年来,金融市场一直是一个严冬,但AIGC行业正利用全球趋势,人工智能智能初创公司不断获得新一轮融资的重大消息。目前,国内外知名科技公司已完成AIGC布局,谷歌、Meta、微软、百度、阿里、字节等国内外科技巨头都在AIGC行业投资。流行的AIGC行业独角兽公司多种多样,各种各样“AI炫技”声名鹊起,迅速实现了初始客户积累和品牌影响力传播。因此,2022年被称为“AIGC年间”,AIGC有望接力元宇宙成为2023年科技与资本圈最热门的定义。
(AI制图实例)
2、国外AIGC的发展状况在科罗拉多州举行的新数字艺术家大赛中,2022年8月,一位没有艺术基础的参赛者提交了AIGC艺术作品《太空歌剧院》“数字艺术/数据装饰照片”类型一等奖导致业内相关奖项“人工智能会取代艺术家吗?”所有的争论都将AIGC定义引向了新的。
随着公众对AIGC关注度的不断增加,AIGC领域的融资规模最近也在迅速扩大。目前,有许多估值超过10亿美元的独角兽公司。
随着公众对AIGC关注度的不断增加,AIGC领域的融资规模最近也在迅速扩大。目前,有许多估值超过10亿美元的独角兽公司。
10月19日,AIGC公司Jasper主要推文字生成.Ai宣布完成A轮融资1.25亿美元,估值15亿美元。几乎同时,Stability 人工智能宣布获得1.01亿美元,公司将继续开发人工智能生成模型,用于生成图片、语言、声音、视频和3D,投资后估值10亿美元。
(AI制图实例)
谷歌是海外AIGC行业的科技巨头META、AIGC的新独角兽Stability也不乏微软等 AI、Jasper、OpenAI等,此外,科技公司很快将人工智能绘画的知名度延伸到人工智能形成视频等行业。Makee从Meta发布从文本到视频的软件-A-Video,在谷歌宣布的Imagen中,超清视频可以从简单的文本提醒中形成 Video和Phenaki,AIGC在海外市场发展迅速。目前具有参考意义的海外公司主要包括:
1)Zyro :整合业务围绕垂直需求场景 knowhow 组织相关 AIGC 水平
根据电子商务场景 AIGC 在网站建设过程中形成所需的各种材料,具体业务包括公司介绍的形成,企业价值,Slogan、自动提高图片清晰度,一键生成 logo 等。
2)NVIDIA:建立技术矩阵,最终以创造性工具平台为基础
在视觉形成的研究方向上始终处于前沿,经典作品包括 CycleGAN、GauGAN、EditGAN、GANverse3D、Instant NeRF 等。
3)OpenAI:扩大其底层模型的开放业务,开辟基础设施商业模式
GPT-3 现在开始对外提供外提供 API,根据用量对外收费分为四种模型。
4)Gliacloud:拼接视频生成代表
输入文本链接,软件可以自动区分标题和文本,并根据不同层次的智能匹配材料和汉字的转移和格式,然后形成显示视频。
4)Gliacloud:拼接视频生成代表
输入文本链接,软件可以自动区分标题和文本,并根据不同层次的智能匹配材料和汉字的转移和格式,然后形成显示视频。根据公共数据,可以添加此方法 10 双视频输出。
类似的公司还包括:Gliacloud、Synths.video、lumen5、Pencil。
5)Rosebud.ai:无版权图像可以结合营销数据形成
Rosebud.ai 非真实人脸图像可以形成,相关衣物等所需材料可以在图像中匹配。此外,模型脸可以根据相应受众的相关数据进行调整。该公司声称,其生成模型可以将活动点击量提高22%。
类似的公司还包括:Generated Photos。
6)Persado:整合精准用户肖像,完成个性化文本营销Persado 该平台将营销创意分为叙述、情感、叙述、呼吁术语、格式和文本定位六个核心要素。该网站可以根据各种元素的组成,为每个客户明确交流个性化术语。为了提高品牌参与度和转化率,该网站已被多家公司用于营销电子邮件、社交媒体广告、店铺展示横幅甚至广播内容等。
3、我国AIGC的发展状况
数据显示,百度、腾讯优图、阿里巴巴、快手、巨型引擎、网易、商汤、美图等中国大厂都在AIGC行业投资。2022年,中国信通研究院还与京东探索研究院合作发布AIGC,对行业进行了深入分析和研究。
2022年11月9日,百度创始人兼首席执行官李彦宏表示,在过去的一年里,人工智能在技术和商业应用方面都有了很大的进步,有些甚至角度也发生了变化。AIGC体现了人工智能应用方向的变化。
分辨AIGC的李彦宏将有三个发展阶段:
“助手环节”,AIGC协助人们进行内容制作;
“合作环节”,AIGC以虚实并行的虚拟人形状发生,人机共生形势;
“原创环节”,AIGC将及时完成内容制作。
腾讯在中国其他大型工厂推出的写作机器人“唯美写手”;Lubanner是阿里巴巴的AI在线制作平台,协助销售人员生产Banner;字节跳动剪辑及其快手云剪辑可提供人工智能形成视频;网易发布的一站式人工智能歌曲创作平台“网易天音”等。
随着AIGC的普及,我国也涌现出一批快速成长的初创企业,代表企业如下:
1)小冰科技
2021年进行 A 轮融资,该轮融资由高淳领投,五源,Neumann、IDG、GGV 北极光和网易公司跟随纪源资本和上一轮投资者。投资者未公布2022年B轮融资10亿元。
主要方向:小冰是世界领先的人工智能技术公司,其小冰架构是世界上最完美的人工智能架构之一,在开放领域会话,多模式交互,非常当然 世界领先的声音、神经网络渲染和内容形成行业。
AIGC 亮点:做 "AI being" 派虚拟人。小冰的商品总是人 互动 内容。主要包括虚拟人(夏语冰等等) somebody instance、虚拟男友等 nobody instance 在垂直场景下工作的虚拟人员,如国家队人工智能裁判和教练系统观军)、音频生成(主要是非常语言和歌唱,在线歌曲形成平台和歌星 歌唱合成软件 X studio)、视觉创作(毕业作品集《或世界》、为国家纺织开发中心、万事利等机构提供图案和图案设计)、文字造就(2017 年即发布小冰诗集)、虚拟社交、Game AI(Xiaoice Game Studio)等。
商业客户已经覆盖了金融、智能汽车、零售、体育、纺织、房地产、文化旅游等十多个垂直行业,并给出了它 " 人力 " 虚拟人商业模式的商业报价理念。
2)合作伙伴客户数据
2022年,数百万来自W&M的战略融资。
2)合作伙伴客户数据2022年,数百万来自W&M的战略融资。
主要方向:合作伙伴客户数据是一家致力于根据数字技术为人们释放无限潜力的技术公司。核心产品是基于TBanic数字员工的基本平台“DARD”技术(数据-Data、人工智能-AI、自动化设备流程-RPA、数字人-Digital Human)数字员工开发套件,客户根据不同的需求场景构建具有相应工作技能的数字员工。合作伙伴解决方案涵盖数据蓝领、数据白领和数字金领三个层次,主要包括AIGC数字员工、数据洞察数字员工、RPA数字员工、金融投资数字员工、人力提升数字员工等产品类别。目前,全球500强企业、大型国央企、知名高校、科研院所已建立在200多个客户的基础上。
AIGC的亮点:直接为客户提供强大的AIGC机器人,包括绘图、文本写作、视频编辑等相关功能,并集成PRA、可为客户提供完整的解决方案,如数据处理和虚拟人等技术。目前,作为一种教学设备,合作伙伴的AIGC机器人在大学教育市场具有多个客户沉淀和绝对竞争优势。同时,它也被应用于世界500强企业和大型中央企业。
3)DeepMusic(动感音技术)2018年,TMEE进行了数百万A轮融资 领投。
主要方向:公司专注于从写作、编曲、编曲、歌唱、混响等方面应用人工智能技术,降低歌曲创作和制作的门槛,为音乐行业提供新的产品体验,提高效率。
AIGC亮点:产品包括视频生成配乐的配乐猫、适合非音乐专业人士撰写的口袋歌曲、可以由人工智能形成歌词的配乐猫 LYRICA、LAZYCOMPOSERAI作曲软件。目前已与国内多家音乐平台厂商达成合作。其歌曲表明,该团队已经形成了世界上最准确的言语歌曲音乐数据库。
4)倒影有音2021年Pre-A轮融资,投资机构为“中文在线”,温石企业顾问集团是本轮融资的独家财务顾问。
主要方向:以技术为核心的创新公司和无人推广数据分离技术解决方案供应商,根据自主研发的神经渲染技术和TTSA技术,立即形成高质量的语音(声音)和动画(视频),致力于构建人工智能数字人神经渲染引擎。
AIGC的亮点:倒影有音将其虚拟人高的自然性归因于神经渲染(Neural Rendering)、TTSA(音频和视频是根据文本和语音合成即时形成的)、ETTS(富情绪语音合成)、Digital Twin。人工智能数据分体是根据神经渲染技术快速构建的,通过语音 图像生成技术,生成和促进唇型、表情、姿势和身体姿势的数据分离,创造出高度拟真的数据分离IP,表情当然,姿势流畅,语音充满情感。2021年3月倒影有声和声频客户端「云听」签署战略合作协议。
5)超参数超参数技术宣布完成1亿美元的B轮融资。这一轮融资由红杉中国牵头,老股东五元资产和高荣资本跟进。
主要方向:超参数技术是一家专注于人工智能领域的技术公司「创造有生命的人工智能」,创造一个10亿人和100亿人一起生活的虚幻世界。超参数围绕L1-L4技术路径创造终极AI Bot,逐渐给广大客户带来全新的虚幻世界感受。AIGC的亮点:超参数技术提供的AI bot适合玩家玩(AI猎户座3D生存游戏)α)、多人团队竞技(球球大战)、博奕AI(斗地主、德扑、麻将等。)非极端信息。已经有了游戏AI平台“Delta”采用全新的“AI 游戏”开发管道,创新开发侧和感觉侧两侧的方式。
6)影谱科技
2018年,D轮融资13.6亿元,投资者包括商汤科技Sensetimee,、软银中国,东方明珠的产业投资基金,PAC、前海梧桐并购基金、朗盛资本等。
AIGC相关亮点:结构视觉分析、图像自动合成技术(短视频、照片、音轨按规定效果批量自动拼凑)适用于视频生成相关行业。、智能视频编写(根据视频中多模态信息的特点进行学习,根据气氛、心态等高级词义限制,检验并生成合格的片段)、视频内容制作(选择不同的生成方式来制作视频中的镜头、元素和场景,学习元件的组合,完成视频的智能制作)、行为动作分析、场景信息恢复、跨模态变换等。
第二章:AIGC产业发展分析
1、AIGC核心算法
AIGC 技术主要包括两个方面:自然语言理解 NLP 和 AIGC 形成算法。随着 NLP(Natural Language Processing,自然语言理解)技术和扩散模型(Diffusion Model)随着人工智能的发展,人工智能不再仅仅是内容创建的辅助软件,而是可能形成内容。

近年来,AIGC的快速发展得益于算法产业的技术积累,包括生成对抗网络(GAN)、变微分为自动编码器(VAE)、标准化流模型(NFs)、自回归模型(AR)、动能模型和扩散模型(Diffusion Model)。可见,大模型、大数据、大算率是未来的发展趋势。算法模型的创新是AIGC近年来迅速取得突破的催化剂,最常见的两种方法是生成对抗网络和扩散模型。
形成对网络GAN的抵抗(Generative Adversarial Networks)
2014年,Ian J.Goodfellow GAN是一种深度神经网络架构,由生成网络和识别网络组成。网络的产生“假”数据并试图欺骗识别网络;识别网络识别生成数据的真实性,并尝试正确识别所有数据“假”数据。网络的产生“假”数据并试图欺骗识别网络;识别网络识别生成数据的真实性,并尝试正确识别所有数据“假”数据。在实践迭代过程中,两个网络不断进化和抵抗,直到达到稳定状态,无法识别网络“假”练习完数据。
GAN广泛应用于广告、游戏、娱乐、媒体、制药等领域。它可以用来创造虚构的角色和场景,模拟面部老化、图像风格转换和化学分子。
优点:可以更好地建模数据。不需要使用马尔科夫链不断取样,不需要在学习中推断,不需要复杂的变分下界,绕过近似计算的难题。
缺陷:练习困难,不稳定。生成器与判别器之间需要很好的同步,但在实践中很容易判别器收敛,生成器扩散。两者的练习必须精心设计。可能缺乏方法(Mode Collapse)难题。GANs 学习过程中可能缺乏方法,生成器逐渐衰退,样本点一直形成,无法继续深造。
(AI制图的细节还是很粗糙的)
Diffusion扩散模型 Model
扩散模型是一种新型的生成模型,各种高分辨率图像都可以生成。Nvidia和OpenAI Google试图练习大模型后,引起了很多关注。Nvidia和OpenAI Google试图练习大模型后,引起了很多关注。根据扩散模型的实例结构,包括 GLIDE,DALLE-2.Imagen和完全开源的平稳蔓延。扩散模型有潜力成为下一代图像生成模型的代表。以 DALL-E 例如,图像可以根据文本叙述直接形成,使计算机也具有人类的想象力。
与其他模型相比,扩散模型的生成逻辑更接近人们的思维模式,这就是为什么AIGC最近有开放的想象力。本质上,扩散模型的工作原理是通过连续添加高斯噪声来破坏训练数据,然后通过翻转噪声过程来学习恢复数据。训练结束后,我们简单地将随机采样的噪音传递到学习除噪过程中,生成数据。
与其它模型相比,扩散模型的优点是形成的图像质量更高,不需要根据对抗进行训练,从而提高了其运动效率。同时,扩散模型也具有可扩展性和并行性。
当AIGC应用扩散模型生成内容时,高斯噪声是一种符合正态分布的概率密度函数 最终的目标作品是通过在一副纯白色的画板(任何白色噪音)上逐渐去噪来生成的。也就是说,用户获得的文本叙述修饰词从一个模糊的概念逐渐具体。可以简化为多个正态分布函数的叠加,模型选择重叠段导出,这也是一个逐渐缩小范畴的过程。这与人类的思维方式非常相似。简而言之,在人工智能实践中,我们将数据集中在1亿多组图形中进行实践,以获得特征值;在生产过程中,通过添加文本描述,引入不同的特征值进行噪声去除,然后在人工智能理解中制作一对内容作品。例如,当我们在脑海中想象一幅画时,例如:一只柯基通过一个新号码玩火焰。每个人的思维模式也是先有柯基,去想象新号和火焰,然后把这些元素积累在柯基身上。
在概述了原理之后,我们用DALL-E2来讨论目前非常先进的人工智能图像生成 具体工作流程:将文本提醒输入训练有素的文本编码器,可以将提醒映射到表示空间;通过一个被称为“先验”(Prior)将文本编号映射到图像编码器中的模型。图像编码器捕捉文本编号中包含的信息和意义;图像编码器随机生成语义信息的视觉表达图像。这个过程类似于人类的思维模式。在形成过程中,它涉及到文本编码器的概念。目前,主流的文本编码器来自OpenAI的Clip模型根据4亿组文本-照片进行练习。自然,模型训练是围绕英语完成的,语言差异会给AIGC带来另一个考验。
除了上述AIGC形成算法模型外,超级计算机和算率等硬件作为基础设施也是必不可少的。在机器学习的过程中,我们必须通过大量的实践来得出更准确的结论。这种计算量是普通计算机无法实施的。目前,它主要由英伟达A100构建的计算集群进行,国内外初创企业也将通过云完成。
2、AIGC数据和算率数据、算率、算法是促进AIGC发展的三驾马车,要实现AIGC的发展,这三驾马车是必不可少的。目前,融合自然语言的大模型和数据已经成为 AIGC 软件基础的开发,OpenAI 的 Clip 模型是根据4亿组高质量的英文图文对应数据进行训练的;计算率意味着权利在AIGC数字时代会更加突出,Stable 目前,Diffusion取决于4000个英伟达A100GPU集群,运营成本超过 5000万美元。为了使效果更加准确,未来将根据语言开发更多的垂直使用,以便更有终点地练习特定的效果。
然而,AIGC的算法、计算能力和数据都要求公司投入大量资金,这使得AIGC初创企业的运营成本居高不下。Stability,当红独角兽企业 以人工智能为例,该公司维护了4000英伟达A100元 由GPU组成的算率组,累计费用超过5000万美元。
前期投资较高,规定AIGC企业客户规模可快速扩大。因此,只有当行业用户规模达到一定规模时,才能平衡成本,扭亏为盈。过去的经验表明,为了在短期内实现用户数量的持续增长,有必要提交标准化的服务内容。毕竟,标准等于公众和大规模用户的需求。
而且,AIGC本身的特点,实际上也限制了服务标准化的过程。由于AIGC内容不稳定,视频质量水平不均匀,无法形成统一的质量标准,在一定程度上阻碍了用户数量的扩大,也限制了AIGC公司赚钱水平的提高。
不仅如此,由于AIGC跑道正处于探索阶段,公司的战略主要是提高技术实力,调查客户需求。大多数技术在生产中没有得到足够的实际应用,少数相对成熟的应用也处于免费使用期,以吸引客户。这意味着AIGC技术本身缺乏实现能力。随着投资的增加和收入的不足,很多AIGC公司都处于亏损状态。此外,由于用户数量的增加,这种损失状态在很长一段时间内无法改善。因为一旦行业用户规模达到一定规模,大厂商必然会加快进入市场,行业竞争加剧,一方面会促进企业增加成本投入;另一方面也会降低公司收入。当时,面对AIGC实现能力有限,再加上持续的成本投入,必然会给AIGC公司带来很大的经营压力。
第三章:AIGC应用分析
1、总结AIGC应用领域
根据AIGC的发展逻辑,主要可分为三个阶段:一是AIGC内容制作工艺的完善,可实现文本、视频、图片生成及其三者的跨模态转换;二是聚合应用多模态生成技术——虚拟人;三是AIGC内容生态聚合体;——元宇宙。
未来,AIGC将成为数字内容改革创新的新引擎。未来,AIGC将成为数字内容改革创新的新引擎。
1)AIGC能够承担信息挖掘、材料启用、还原编写等基本机械工作,比人类的制造能力和认知水平更好,从技术层面完成低边际效益、更高效的方法,以满足大量的个性化要求。
2)AIGC可以通过应用数字内容与其他行业的多维互动和渗透相结合,创造新的商业模式和新模式。
3)助推“元宇宙”发展。加快物理世界恢复,根据AIGC进行无穷无尽的内容生产,实现自发有机生长。
从长远来看,AIGC与各行业的结合有望创造更大的应用领域,大大提高各行业的内容生产效率。
1)AIGC 传媒:
写作机器人、访谈助手、视频字幕形成、语音提示、视频收藏、人工智能生成主播。
2)AIGC 电商:
产品3D模型,虚拟主播,虚拟货场。
3)AIGC 影视:
人工智能剧本创作、人工智能生成面部和声音、人工智能写作角色和场景、人工智能一键生成影视预告片。
4)AIGC 娱乐:AI变脸应用(如FaceAPP)、ZAO)、AI编曲(如初音未来虚拟歌姬)、人工智能合成音视频动画。
5)AIGC 教育:
人工智能生成虚拟教师,人工智能根据教科书制作历史故事情节,人工智能将2D教科书转换为3D。
6)AIGC 金融:
根据AIGC完成金融信息和产品介绍视频的智能制作,并根据AIGC创建虚拟数字客户服务。
7)AIGC 诊疗;
AIGC为失声者生成语言声频,为残疾人生成身体投射,为心理疾病患者生成护理等待。
8)AIGC 工业:
在工程设计中重复基层任务,根据AIGC生成衍生设计,为工程师提供灵感。
(图:PGC、UGC、AIGC比较)
2、AIGC商业模式分析分析
从商业模式来看,目前,AIGC公司主要有以下商业模式:
1)根据数据请求量和实际计算量,作为连接同类产品的底层平台扩大开放:GPT-3提供API插座,四种模型选择不同的按量收费方式。
2)按产出内容收费:包括DALL·E、Deep Dream 大多数AI图像生成平台,如Generator,都是按照图像页数收费的。

3)立即向外界提供软件:例如,个性化营销文字写作工具AX Semantics以约1900元/月的价格出售,并以约4800欧元/月的价格支持定制电子商务版本。
3)立即向外界提供软件:
例如,个性化营销文字写作工具AX Semantics以约1900元/月的价格出售,并以约4800欧元/月的价格支持定制电子商务版本。大多数C端AGC工具以约80元/月的价格出售。
4)模型训练费用:适用于个性化定制需求强的行业,如NPC培训。
5)按实际收费:
例如,版权授予(适用于具有设计图案的短期所有权、长期所有权、排他所有权和使用权)、是否支持商业行为(本人用途、企业用途、品牌用途等)。).、透明框架和分辨率等。
在商业障碍方面,虽然AIGC是一个重技术领域,但由于许多开源平台的出现,以及其软件技术,纯技术算法,很难成为AIGC行业的主要竞争障碍。AIGC相关行业要想创造持久的竞争优势,就必须在综合解决方案、领域深度绑定、业务闭环等行业不断培育。可以说,理论是AIGC企业成功的先决条件,但不是充分条件。对业务能力的控制将是未来AIGC轨道上相关企业的竞争焦点。
1)打造综合解决方案服务水平:AIGC本质上提供了与传统内容协助编写逻辑相同的内容形成工具。视频的整个生命周期,如收集、制作、媒资管理、分发和交易,通常需要覆盖内容形成的整个生命周期。
2)与行业的深度绑定关系:
根据与行业的深度绑定关系,连接相关平台或底层,与原内容媒体建立良好的合作关系,消除场景可行,注意系统架构中对方的合作意向。
3)构建业务闭环:如何反映创造性工具,必须在新模式下形成闭环。必须从“拼凑式”(需要大量的人工标记数据,只有具体内容不会自我提升)“演变式”(创造特殊条件和核心能力,使其能够完成一般任务并自我完善),并与客户提高会话轮数,创建情感链接。
第四章:AIGC发展预测

1、AIGC发展前景
目前,科技界和资本界对AIGC的发展有着广泛的期待,AIGC有望接力元宇宙,成为2023年科技界的热点。
2022年7月,李彦宏在百度世界大会上推测:“未来十年,AIGC(人工智能独立生产内容)将颠覆当前的内容生产模式。能以十分之一的成本,以百倍千倍的生产速度,形成人工智能高质量的内容。”2022年9月,红杉资本联合GPT-3发表了一篇题为《生成式AI》的文章:创造新世界的帖子立即引爆了AIGC跑道。“每个人的愿望:生成人工智能将创造和知识工作的编辑成本降至零,产生巨大的劳动效率和经济价值,以及相应的市场价值。”根据其理解,人工智能可以有效地提高当前技术标准的上限。未来,企业的增长不会停止前进和成本,企业的经营效率也会逐渐发生定量变化。
在移动互联网时代,对未来的想象已经进行了很多次,从最初流行的元宇宙和Web 3.就像一个科技幻想,跳出时间和空间的层面,充满对未来的无限期待,这是许多极客的终身愿望。台本是如此的相似,只是这次主角变成了AIGC。随着文本、照片、视频和技术的不断突破,我们熟悉的人工智能领域正试图重建人们生产力和生产关系的转型。这是昙花一现还是一片新的韩海,仍然需要行业和时间的考验。
目前AIGC仍处于初步探索期,发展水平有限,导致当前应用场景有限。也许未来技术的突破可以不断扩大AIGC的使用场景,但企业短期内所能做的就是优化模型,提高其与应用场景的适应性。
公开数据显示,未来2-3年,AIGC的初创企业和商业着陆计划将继续增加;到2030年,AIGC的市场容量也将超过万亿元。
从PGC到UGC, AIGC,AIGC可以提高内容生产力的约束力,有效地形成高质量的内容,让人类进入真正的元宇宙。如果AIGC能够满足元宇宙的需要,及时完成高质量、高性能的内容,AIGC技术也需要一定的发展,我们可以分为软硬件两个方面,软件主要包括自然语言理解技术、AIGC形成算法模型和数据,硬件通常是计算率、通信系统。
从业务层面看,结合国内外发展,AIGC知识产权所有权仍存在法律差距,写作伦理问题尚未得到有效解决。因此,高质量、整洁的数据集对模型培训和内容形成有着至关重要的影响。同时,随着AIGC的逐步实施,其计算能力需求将急剧增加。考虑到英伟达A100,未来相关行业将建立现有的计算能力集群,除云计算外。、 H100出口有限,国内计算率芯片将有机会获得增量市场。
从主题投资的角度来看,区块链、元宇宙、Web3 它们都描述了数字经济时代的宏伟使用场景,而虚拟人和NFT只是去年资本市场关注的实际应用之一。未来,AIGC可能会从Web2推动数字经济 Web3提升的关键生产力工具:一方面,它对现有的杀手级应用——小视频、游戏等都有颠覆性的危害,或者进一步扩大内容量,增强成瘾,为社交和广告提供新的工具;另一方面,Web3 在开放共建的价值观下,UGC、AIGC内容将更具吸引力,二次创作和开放想象力的浪潮即将到来。目前,AIGC已成为硅谷新的热门方向,国内一级市场和互联网制造商对AIGC应用的认知度也在迅速提升。
(人工智能制图例)
2、AIGC待处理问题
AIGC虽然发展前景广阔,但也存在许多难以解决的问题,影响了其商业化进程。
1)技术不成熟从技术上讲,虽然目前生成的照片和文本已经可以用于商业行为,但仍有一些问题导致无法满足更高的质量要求。AIGC在不太注重细节的大场景图片生成中表现良好。但对于更具体、更详细的内容,效果并不令人满意。这主要是因为当然,对语义的理解在处理一些空间关系方面仍然存在一定的偏差。同时,业内大多数机构都在选择开源 OpenAI 的 Clip 模型。它的函数是开源的,但是练习的数据集是封闭的,会决定数据集的质量、合规性和风格。
2)版权不清楚
AIGC本质上是一种机器学习,因此不可避免地会使用大量的数据集进行练习,这也会损害图片版权所有者的权益。对于艺术家来说,虽然他们认为这些平台侵犯了他们的权益,但仍然没有完整的法律法规,即使在一些法律法规中,这种做法也是合理的。
一方面,AIGC很难被称为“作者”。根据《作权法》的一般规定,作者只能是自然人、法人或非法人组织。很明显,AIGC不是法律承认的权利主体,因此不能作为作权的核心。然而,AIGC的应用对图片版权问题有不同的看法。照片属于平台,完全开源或形成者,没有统一的意见。
另一方面,AIGC产生“著作”仍存异议。真正意义上的作品是指在文学、艺术和科学领域具有原创性和有形方式的智力成果。AIGC作品具有较强的任意性和算法核心,能及时证明AIGC作品侵权的可能性较低。同时,目前还不能一概而论AIGC是否具有原创性,个例差异很大。
即使现在把自己的作品从数据集中删除,也无法阻止自己风格作品的形成,首先,AI 模型已经练习,相应的风格已经掌握。而且,由于OpenAI的CLIP模型(在Stable练习 Diffusion 为了了解文本图像之间的关系),客户仍然可以使用特殊的艺术风格。
对于人工智能项目方来说,如果这种法律依据是这样的话,让每张数据照片都受权是不现实的。 AI 市场的发展将受到极大的阻碍,这可能是一场巨大的灾难。
3)堡垒不高
AIGC 产业链涉及多个阶段。上游算法形成阶段在一定程度上改善了海外开源模型。渲染、模型训练等环节也大多依赖海外GPU。
目前各种各样 AIGC 大多数方法都是在国外论文和开源模型上创建的。基于开源模型的AIGC没有关键技术要求。即使是辛苦做出的小小提升,也往往会被开源方公布的新版本刮平。
此外,在应用领域,AIGC只是工具链中某个环节的增强,初创企业很难与详细的工具链和生态市场竞争。例如,尽管中国有许多与新一代Figma相比的项目、Canva或短视频创作工具,但Figma已经配备了Stable Diffusion的生成模型,巨型引擎等企业在短视频AIGC方面也有着深刻的积累和创新。即使在游戏领域,游戏引擎也是一个非常复杂的工具链系统,而不仅仅是一个渲染器。
目前,中国正朝着独立可控的方向发展,要求AIGC领域的创新型企业在提高原创研究的同时,尽快将技术转化为专利权,产生行业壁垒和竞争力。
4)业务不清楚 虽然AIGC为人们描绘了一个美好的明天,但其商业方式还不够清楚,客户的付费意愿也不是很清楚。目前,为了抢占客户,很多公司都采用了免费试用的方式。目前,AIGC提供的图纸、文本和视频都难以准确满足客户的需求,更多的是为专业设计师提供思路和实用价值。事实上,实际的商业价值仍然让客户怀疑。 与此同时,更多的工具属于强大的技术,AIGC在UGC时期还没有出现大平台、杀手级应用程序和优秀的项目。虽然AIGC赢得了资本的青睐,但尚未看到商业模式清晰、现金流长期稳定、竞争壁垒强的新兴公司。更重要的是,大企业在新技术行业不惜一切代价的前沿布局。因此,AIGC技术的发展和商业化进程仍然没有预期的那么危险。 参考文献: AIGC十大前沿创新 孙思明 量子位是国内外最值得关注的AIGC组织 《AIGC:宋嘉吉和金郁欣是Web3时代的生产力工具 突然爆红的AIGC到底是泡沫吗?》顾煜 杨江凯,AIGC产业链全面整理 人工智能生成内容(AIGC)(2022年)中国信通院