虚拟数字人行业分析.docx

资源描述

《虚拟数字人行业分析.docx》由会员分享，可在线阅读，更多相关《虚拟数字人行业分析.docx（12页珍藏版）》请在第一文库网上搜索。

1、虚拟数字人行业分析一、虚拟人的市场规模、产业链、发展趋势1.1 虚拟人的定义及分类根据“量子位”发布的虚拟数字人深度产业报告，虚拟数字人指存在于非物理世界中，由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用，并具有多重人类特征（外貌特征、人类表演能力、人类交互能力等）的综合产物，也被称为虚拟形象、虚拟人、数字人等。虚拟数字人的发展经过了多个发展阶段,其最早起源于影视行业，之后其应用逐渐拓展至游戏、电商、金融、文旅等多个领域。近年来人工智能技术的突破使虚拟数字人的发展开始进入发展正轨，但产业仍然处于初期阶段。如果从驱动的方式来对虚拟数字人进行分类，可分为真人驱动型和智

2、能驱动型。一真人驱动型虚拟数字人：主要原理是真人根据视频监控系统传来的用户视频，与用户实时语音，同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上，从而与用户进行交互。一智能驱动型虚拟数字人：通过智能系统自动读取并解析识别外界输入信息，根据解析结果决策数字人后续的输出文本，然后驱动人物模型生成相应的语音与动作来使数字人跟用户互动。该人物模型是预先通过A1技术训练得到的，可通过文本驱动生成语音和对应动画。未来随着人工成本的逐渐攀升、以及人工智能技术的持续进步，智能驱动型的虚拟数字人预计将成为行业趋势。2:人的量1tt人ID劭里人的垣作SMff14VSViIMiaBTAieftM图S

3、I1人劫田拒数学人也作我收而从商业化和应用场景来区分，可以分为：内容/IP型、功能服务型、虚拟分身型3类。内容/IP型主要应用于影视、文娱、市场营销等场景，功能服务型主要应用于行业服务场景（电商、金融、教育、医疗、文旅等行业），这两种类型虚拟数字人更多是面向B端；虚拟分身类型数字人除了面向B端的应用，C端用户也会有制作虚拟形象的需求，用于虚拟空间中的形象分身和代理（例如在虚拟社交平台）。1.2 数字虚拟人市场规模及产业链2030年我国虚拟数字人市场规模有望达到2700亿元。根据“量子位”的测算，在2030年我国虚拟数字人整体市场规模将达到2700亿，细分市场包括：身份型虚拟数字人，主要来源于虚

4、拟IP的巨大潜力，以及虚拟第二分身的发展；服务型虚拟数字人，多模态A1助手有进一步发展空间，多种对话式服务也有望升级至虚拟数字人形态。虚拟数字人产业的发展进程主要取决于：1）虚拟数字人相关技术的进步。技术进步一方面可以改善虚拟人的呈现、交互效果，使虚拟人拥有更加接近真人的外形和沟通交流能力，因此虚拟人替代真人服务的场景会进一步拓宽；另一方面，可以降低虚拟人的制作和运营成本（和真人用工成本的差距扩大）和难度，使用门槛降低会吸引更多的企业和用户。2）基础设施的改善：例如VR/AR等显示设备的普及。3）用户/企业的心智：用户和企业对产业的认知度和需求，但这也和虚拟数字人的技术进步程度相关。虚拟人的产

5、业链一般分为基础层、平台层、应用层。其中：一基础层：即为虚拟数字人提供基础硬件、软件支撑。基础硬件包括显示设备（即数字人呈现载体，包括手机/电视/投影/1ED显示等2D设备，也包括裸眼立体/AR/VR等3D设备）、光学器件（用于视觉传感器、用户显示器的制作）、传感器（用于数字人原始数据、用户数据的采集）、芯片（用于传感器数据预处理、数字人模型渲染、A1计算）等。基础软件包括建模软件（对数字人的人体、衣物进行三维建模）、渲染引擎（对灯光、毛发、衣物等进行渲染）。一平台层：集成上游的硬件和软件为虚拟数字人的制作和开发提供技术能力。参与者较多，包括A1厂商（微软小冰、商汤、科大讯飞等），各互联网大厂

6、（腾讯、字节、百度、网易等在虚拟数字人生态均有布局）、垂直ISV厂商（独立软件开发商，提供一站式虚拟数字人解决方案产品/服务，将数字人能力封装成快速、轻量、标准化的SaaS产品）。一应用层：目前虚拟数字人的应用企业众多，遍布影视、传媒、游戏、电商、营销、金融、政务、医疗等行业。二、AI赋能，进入“数智人”新阶段A1等技术快速突破，虚拟数字人的发展进入新阶段，由“数字人”变成“数智人”。近年来，A1技术快速发展，尤其是A1GC技术（包括自然语言、图像、声音等多模态处理）近期的突破，虚拟数字人也进入了发展新阶段。A1技术覆盖虚拟数字人建模、视频生成、驱动等全流程。一方面A1技术使数字人的制作成本降

7、低、制作周期缩短、门槛降低，并获得和真人更加相似的外形、动作效果，例如在3D数字人的建模环节，A1建模相比人工建模所需时间大幅缩短、效率提升，A1建模目前已经初步实现产品化,可以开放程序接口对接各种应用，使用范围较广，也可以实现C端应用（上传图片即可生成3D数字人面部模型）。另一方面，多模态A1使得虚拟数字人的交互能力更上一个台阶，随着A1技术的不断完善，数字人的感知能力（例如现在数字人对语言的理解主要以文本为主，未来有望实现多模态输入）、思维能力、内容输出能力都将得到显著改善，在思想、语言、行为上和人更加接近、更加智能化。2.1 各平台及相关厂商已经推出智能化数字人解决方案目前国内各A1厂商

8、、互联网大厂、垂直ISV厂商均可提供较为成熟的具有AIGC能力的“数智人”产品及解决方案。下文我们将以微软小冰、腾讯云、火山引擎（抖音集团）、百度智能云提供的产品为例：1）小冰公司（前身是微软小冰团队）提供，A1数字员工”产品：基于人工智能小冰框架，推出了数字专家和数字员工等完整产品线。在形象定制方面，仅需20分钟的有效数据即可生数字人形象，支持多服装，多表情，多动作；内容生成方面，基于小冰框架的人工智能创造能力（A1GC）,数字人可实现对业务数据的快速学习，获得相应技能，稳定输出文本、图片、音频、视频等内容；交互能力方面，拥有情感对话能力和多模态交互能力，可人声定制，支持多语种、多方言。2）

9、腾讯云智能数智人腾讯云智能数智人采用语音交互、虚拟形象模型生成等多项A1技术,实现唇形语音同步和表情动作拟人等效果，广泛应用于虚拟形象播报（根据文本内容快速合成音视频文件，落地于媒体、教育、会展服务等场景）和实时语音交互（实时语音交互支持即时在线对话，可赋能智能客服、语音助理等场景）两大场景。平台提供虚拟真人2D形象、3D写实数字人形象，基于腾讯云小微的平台能力，为客户提供配套的生成界面，方便客户自主操作。目前在多行业落地，覆盖行业含金融、传媒、交通、政务、文旅等。3）火山引擎虚拟数字人在2023春季火山引擎FORCE原动力大会上，火山引擎正式发布“善听”、“会说”、“能想”的虚拟数字人创新产

10、品。火山引擎依托2D/3D数字人技术，结合语音识别、语义理解、对话控制、语音合成等多项全自研能力构建多模态交互体系，提供3大数字人产品方案：交互型数字人、播报型数字人、直播型数字人。晨5:火山矶“供的3大字人产品方案产品方米诺交互盟数字人全自研语交互技术：塔域全自研语音交互技术,多轮交互精装短X用户配期;可捌化流程支持布可视化流程妣疆，以节点及掰状结构0观体现会话流转；提供丰富的2D/3D形象；H1报型数字人TMt人住产平台；海形象色多形款、BRM、姿态、言色可选，动作衰情丰富自然；多冷排创作功脩：支持词条精修、文加言荻驱动、多S混编、画中苣等多项功恁；BiHi型数字人7*24hWMM:甘能剧

11、本灵活配,实现A1d0主H7x24h自动开H；实时互动评论塔It超W腹对话问答系统，AI虎双主羯可实时回短评论；丰*的主J形象色：S1供2D/3O数字人风格化形供相国自定制,实现NI场景品腐化；4）百度智能云曦灵智能数字人平台面向金融、媒体，运营商、MCN,互娱等行业，提供服务型数字人、演艺型数字人解决方案，降低数字人应用门槛，实现人机可视化语音交互服务和内容生产服务，有效提升用户体验、降低人力成本。百度智能云提供的数字人服务可应用在手机APP端、云屏端，可扮演智能客服、数字理财经理、数字商品导购、数字培训师、数字讲解员等角色。5）其他世优科技：公司为虚拟人技术解决方案服务商，为政府、企业、品

12、牌等提供虚拟技术解决方案，覆盖应用场景包括广电媒体、品牌营销、电商直播/短视频、政府文旅、教育娱乐、影视番剧等。23年4月份推出新一代A1数字人产品“世优BOTA”，其基于世优自研的快速训练小模型能力，与数字人形象结合,让A1从聊天窗口升级成人与“人”的直接交流，可成为企业的A1员工。天娱数科：子公司元镜科技的虚拟二次元网红CiCi已经在今年2月份开始的部分时段直播替换成A1GC互动直播，在测试应用期间粉丝居然未看出异样，同时粉丝量稳步提升。23年4月份，基于MetaSUrfing元享智能云平台，天娱数科旗下的虚拟数字人“月出月出”已完成ChatGPT模型接入，并完成直播首秀，目前常见的机器人

13、客服和语音助手大多只能从顾客的问题中分析出预设的关键词，并给出固定的回答，而月出月出不仅能够实时响应顾客的提问，还能根据不同问题进行自主回答。综合上述平台提供的解决方案，可总结出虚拟数字人后续的落地形态:1）播报型数字人：数字人可以基于文字、基于关键词生成播报视频、音频,可大幅提升内容产出效率（可应用于影视、营销、电商等领域）；2）交互型数字人：基于语音交互技术，可实现和人的实时互动；交互型数字人的应用场景较广，既可以是t。B的场景（例如作为虚拟主播、导购、客服、导览员等），也可以是t。C的场景（例如应用于虚拟社交社区）；3）智能语音助手：可以搭载于IoT设备，作为A1语音助手，成为人和IoT

14、设备的联通桥梁。2.2 标准化数字人解决方案成本大幅降低，覆盖群体变广此前，数字人的制作、运营成本较高（项目预算几十万至上千万不等），因此主要的受众客户为大型的企业、品牌或者政府机构。而随着技术的不断成熟和进步，数字人的生成和使用技术实现标准化、模块化，除了面向大型客户的定制化项目及服务之外，面对小型商户的相对标准化的数字人解决方案也逐步出现，使用价格大幅降低，甚至在某些领域已经低于真人员工成本（例如低于真人电商主播的成本），预计目标用户群体会大幅增加。以腾讯旗下产品“腾讯智影”为例，已提供低成本数字人播报SaaS工具（数字人直播解决方案即将上线）。“腾讯智影”是一款集成了A1创作能力的智能创

15、作工具，提供虚拟数字人、文本配音、文章转视频、模板创作、在线视频剪辑等功能，“智影数字人”是其中的核心功能，可提供数字人播报、数字人直播（即将上线）解决方案。针对数字人相关解决方案，腾讯智影针对数字人播报的收费模式主要有两种：一付费会员（月份或年费）：面向定制化需求不强的基础需求用户。用户只需开通付费会员就可以使用数字人播报功能，并在付费会员的2D/3D数字人模板库中选择形象,不支持定制化。现阶段（截至23/04）的收费为高级会员48元/月、398元/年，专业会员88元/月，698元/年（高级版和专业版每月可生成的数字人视频时长不同）。一定制服务：如果用户需要生成和特定真人类似的数字人或数字分

16、身，可以采购其定制服务，用户只需上传照片、视频、音频即可实现定制。目前收费是以年为单位，除了32K音色定制服务，其他服务的首次定制的年费都在1万元以下（30008000元/年不等），次年续费价格仅为首年价格的1/4。另外，根据腾讯智影官方公众号，数字人直播解决方案预计于4月上线，提供的服务和功能包括：7x24小时无人直播节目制作、实时真人音频接管直播间、获取用户评论智能回复解答。其定价为也是千元级别，包月使用，低于真人主播成本。以万兴科技的“万兴播爆”APP为例，平台通过AIGC技术助力海外电商营销，平台提供超逼真的60多个国籍数字人模板，以及丰富的视频模板和素材，用户只需要输入文字，即可自动转化成配音和短视频;同时也支持输入关键词，A1生成多语言的营销脚本。可以大幅减少电商短视频制作的周期和成本。而“万兴播爆”目前的

展开阅读全文