《虚拟数字人行业分析.docx》由会员分享,可在线阅读,更多相关《虚拟数字人行业分析.docx(12页珍藏版)》请在第一文库网上搜索。
1、虚拟数字人行业分析一、虚拟人的市场规模、产业链、发展趋势1.1 虚拟人的定义及分类根据“量子位”发布的虚拟数字人深度产业报告,虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物,也被称为虚拟形象、虚拟人、数字人等。虚拟数字人的发展经过了多个发展阶段,其最早起源于影视行业,之后其应用逐渐拓展至游戏、电商、金融、文旅等多个领域。近年来人工智能技术的突破使虚拟数字人的发展开始进入发展正轨,但产业仍然处于初期阶段。如果从驱动的方式来对虚拟数字人进行分类,可分为真人驱动型和智
2、能驱动型。一真人驱动型虚拟数字人:主要原理是真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。一智能驱动型虚拟数字人:通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,然后驱动人物模型生成相应的语音与动作来使数字人跟用户互动。该人物模型是预先通过A1技术训练得到的,可通过文本驱动生成语音和对应动画。未来随着人工成本的逐渐攀升、以及人工智能技术的持续进步,智能驱动型的虚拟数字人预计将成为行业趋势。2:人的量1tt人ID劭里人的垣作SMff14VSViIMiaBTAieftM图S
3、I1人劫田拒数学人也作我收而从商业化和应用场景来区分,可以分为:内容/IP型、功能服务型、虚拟分身型3类。内容/IP型主要应用于影视、文娱、市场营销等场景,功能服务型主要应用于行业服务场景(电商、金融、教育、医疗、文旅等行业),这两种类型虚拟数字人更多是面向B端;虚拟分身类型数字人除了面向B端的应用,C端用户也会有制作虚拟形象的需求,用于虚拟空间中的形象分身和代理(例如在虚拟社交平台)。1.2 数字虚拟人市场规模及产业链2030年我国虚拟数字人市场规模有望达到2700亿元。根据“量子位”的测算,在2030年我国虚拟数字人整体市场规模将达到2700亿,细分市场包括:身份型虚拟数字人,主要来源于虚
4、拟IP的巨大潜力,以及虚拟第二分身的发展;服务型虚拟数字人,多模态A1助手有进一步发展空间,多种对话式服务也有望升级至虚拟数字人形态。虚拟数字人产业的发展进程主要取决于:1)虚拟数字人相关技术的进步。技术进步一方面可以改善虚拟人的呈现、交互效果,使虚拟人拥有更加接近真人的外形和沟通交流能力,因此虚拟人替代真人服务的场景会进一步拓宽;另一方面,可以降低虚拟人的制作和运营成本(和真人用工成本的差距扩大)和难度,使用门槛降低会吸引更多的企业和用户。2)基础设施的改善:例如VR/AR等显示设备的普及。3)用户/企业的心智:用户和企业对产业的认知度和需求,但这也和虚拟数字人的技术进步程度相关。虚拟人的产
5、业链一般分为基础层、平台层、应用层。其中:一基础层:即为虚拟数字人提供基础硬件、软件支撑。基础硬件包括显示设备(即数字人呈现载体,包括手机/电视/投影/1ED显示等2D设备,也包括裸眼立体/AR/VR等3D设备)、光学器件(用于视觉传感器、用户显示器的制作)、传感器(用于数字人原始数据、用户数据的采集)、芯片(用于传感器数据预处理、数字人模型渲染、A1计算)等。基础软件包括建模软件(对数字人的人体、衣物进行三维建模)、渲染引擎(对灯光、毛发、衣物等进行渲染)。一平台层:集成上游的硬件和软件为虚拟数字人的制作和开发提供技术能力。参与者较多,包括A1厂商(微软小冰、商汤、科大讯飞等),各互联网大厂
6、(腾讯、字节、百度、网易等在虚拟数字人生态均有布局)、垂直ISV厂商(独立软件开发商,提供一站式虚拟数字人解决方案产品/服务,将数字人能力封装成快速、轻量、标准化的SaaS产品)。一应用层:目前虚拟数字人的应用企业众多,遍布影视、传媒、游戏、电商、营销、金融、政务、医疗等行业。二、AI赋能,进入“数智人”新阶段A1等技术快速突破,虚拟数字人的发展进入新阶段,由“数字人”变成“数智人”。近年来,A1技术快速发展,尤其是A1GC技术(包括自然语言、图像、声音等多模态处理)近期的突破,虚拟数字人也进入了发展新阶段。A1技术覆盖虚拟数字人建模、视频生成、驱动等全流程。一方面A1技术使数字人的制作成本降
7、低、制作周期缩短、门槛降低,并获得和真人更加相似的外形、动作效果,例如在3D数字人的建模环节,A1建模相比人工建模所需时间大幅缩短、效率提升,A1建模目前已经初步实现产品化,可以开放程序接口对接各种应用,使用范围较广,也可以实现C端应用(上传图片即可生成3D数字人面部模型)。另一方面,多模态A1使得虚拟数字人的交互能力更上一个台阶,随着A1技术的不断完善,数字人的感知能力(例如现在数字人对语言的理解主要以文本为主,未来有望实现多模态输入)、思维能力、内容输出能力都将得到显著改善,在思想、语言、行为上和人更加接近、更加智能化。2.1 各平台及相关厂商已经推出智能化数字人解决方案目前国内各A1厂商
8、、互联网大厂、垂直ISV厂商均可提供较为成熟的具有AIGC能力的“数智人”产品及解决方案。下文我们将以微软小冰、腾讯云、火山引擎(抖音集团)、百度智能云提供的产品为例:1)小冰公司(前身是微软小冰团队)提供,A1数字员工”产品:基于人工智能小冰框架,推出了数字专家和数字员工等完整产品线。在形象定制方面,仅需20分钟的有效数据即可生数字人形象,支持多服装,多表情,多动作;内容生成方面,基于小冰框架的人工智能创造能力(A1GC),数字人可实现对业务数据的快速学习,获得相应技能,稳定输出文本、图片、音频、视频等内容;交互能力方面,拥有情感对话能力和多模态交互能力,可人声定制,支持多语种、多方言。2)
9、腾讯云智能数智人腾讯云智能数智人采用语音交互、虚拟形象模型生成等多项A1技术,实现唇形语音同步和表情动作拟人等效果,广泛应用于虚拟形象播报(根据文本内容快速合成音视频文件,落地于媒体、教育、会展服务等场景)和实时语音交互(实时语音交互支持即时在线对话,可赋能智能客服、语音助理等场景)两大场景。平台提供虚拟真人2D形象、3D写实数字人形象,基于腾讯云小微的平台能力,为客户提供配套的生成界面,方便客户自主操作。目前在多行业落地,覆盖行业含金融、传媒、交通、政务、文旅等。3)火山引擎虚拟数字人在2023春季火山引擎FORCE原动力大会上,火山引擎正式发布“善听”、“会说”、“能想”的虚拟数字人创新产
10、品。火山引擎依托2D/3D数字人技术,结合语音识别、语义理解、对话控制、语音合成等多项全自研能力构建多模态交互体系,提供3大数字人产品方案:交互型数字人、播报型数字人、直播型数字人。晨5:火山矶“供的3大字人产品方案产品方米诺交互盟数字人全自研语交互技术:塔域全自研语音交互技术,多轮交互精装短X用户配期;可捌化流程支持布可视化流程妣疆,以节点及掰状结构0观体现会话流转;提供丰富的2D/3D形象;H1报型数字人TMt人住产平台;海形象色多形款、BRM、姿态、言色可选,动作衰情丰富自然;多冷排创作功脩:支持词条精修、文加言荻驱动、多S混编、画中苣等多项功恁;BiHi型数字人7*24hWMM:甘能剧
11、本灵活配,实现A1d0主H7x24h自动开H;实时互动评论塔It超W腹对话问答系统,AI虎双主羯可实时回短评论;丰*的主J形象色:S1供2D/3O数字人风格化形供相国自定制,实现NI场景品腐化;4)百度智能云曦灵智能数字人平台面向金融、媒体,运营商、MCN,互娱等行业,提供服务型数字人、演艺型数字人解决方案,降低数字人应用门槛,实现人机可视化语音交互服务和内容生产服务,有效提升用户体验、降低人力成本。百度智能云提供的数字人服务可应用在手机APP端、云屏端,可扮演智能客服、数字理财经理、数字商品导购、数字培训师、数字讲解员等角色。5)其他世优科技:公司为虚拟人技术解决方案服务商,为政府、企业、品
12、牌等提供虚拟技术解决方案,覆盖应用场景包括广电媒体、品牌营销、电商直播/短视频、政府文旅、教育娱乐、影视番剧等。23年4月份推出新一代A1数字人产品“世优BOTA”,其基于世优自研的快速训练小模型能力,与数字人形象结合,让A1从聊天窗口升级成人与“人”的直接交流,可成为企业的A1员工。天娱数科:子公司元镜科技的虚拟二次元网红CiCi已经在今年2月份开始的部分时段直播替换成A1GC互动直播,在测试应用期间粉丝居然未看出异样,同时粉丝量稳步提升。23年4月份,基于MetaSUrfing元享智能云平台,天娱数科旗下的虚拟数字人“月出月出”已完成ChatGPT模型接入,并完成直播首秀,目前常见的机器人
13、客服和语音助手大多只能从顾客的问题中分析出预设的关键词,并给出固定的回答,而月出月出不仅能够实时响应顾客的提问,还能根据不同问题进行自主回答。综合上述平台提供的解决方案,可总结出虚拟数字人后续的落地形态:1)播报型数字人:数字人可以基于文字、基于关键词生成播报视频、音频,可大幅提升内容产出效率(可应用于影视、营销、电商等领域);2)交互型数字人:基于语音交互技术,可实现和人的实时互动;交互型数字人的应用场景较广,既可以是t。B的场景(例如作为虚拟主播、导购、客服、导览员等),也可以是t。C的场景(例如应用于虚拟社交社区);3)智能语音助手:可以搭载于IoT设备,作为A1语音助手,成为人和IoT
14、设备的联通桥梁。2.2 标准化数字人解决方案成本大幅降低,覆盖群体变广此前,数字人的制作、运营成本较高(项目预算几十万至上千万不等),因此主要的受众客户为大型的企业、品牌或者政府机构。而随着技术的不断成熟和进步,数字人的生成和使用技术实现标准化、模块化,除了面向大型客户的定制化项目及服务之外,面对小型商户的相对标准化的数字人解决方案也逐步出现,使用价格大幅降低,甚至在某些领域已经低于真人员工成本(例如低于真人电商主播的成本),预计目标用户群体会大幅增加。以腾讯旗下产品“腾讯智影”为例,已提供低成本数字人播报SaaS工具(数字人直播解决方案即将上线)。“腾讯智影”是一款集成了A1创作能力的智能创
15、作工具,提供虚拟数字人、文本配音、文章转视频、模板创作、在线视频剪辑等功能,“智影数字人”是其中的核心功能,可提供数字人播报、数字人直播(即将上线)解决方案。针对数字人相关解决方案,腾讯智影针对数字人播报的收费模式主要有两种:一付费会员(月份或年费):面向定制化需求不强的基础需求用户。用户只需开通付费会员就可以使用数字人播报功能,并在付费会员的2D/3D数字人模板库中选择形象,不支持定制化。现阶段(截至23/04)的收费为高级会员48元/月、398元/年,专业会员88元/月,698元/年(高级版和专业版每月可生成的数字人视频时长不同)。一定制服务:如果用户需要生成和特定真人类似的数字人或数字分
16、身,可以采购其定制服务,用户只需上传照片、视频、音频即可实现定制。目前收费是以年为单位,除了32K音色定制服务,其他服务的首次定制的年费都在1万元以下(30008000元/年不等),次年续费价格仅为首年价格的1/4。另外,根据腾讯智影官方公众号,数字人直播解决方案预计于4月上线,提供的服务和功能包括:7x24小时无人直播节目制作、实时真人音频接管直播间、获取用户评论智能回复解答。其定价为也是千元级别,包月使用,低于真人主播成本。以万兴科技的“万兴播爆”APP为例,平台通过AIGC技术助力海外电商营销,平台提供超逼真的60多个国籍数字人模板,以及丰富的视频模板和素材,用户只需要输入文字,即可自动转化成配音和短视频;同时也支持输入关键词,A1生成多语言的营销脚本。可以大幅减少电商短视频制作的周期和成本。而“万兴播爆”目前的