下面这篇记录,来自 2020 年 8 月的内部分享会,介绍了顺为团队在虚拟人方向的研究和认知,即“虚拟人是虚拟世界核心的交互方式”,以及当时已经投资的标的次世文化。
在当时,Metaverse 还不是一个热门词汇,更不是一个热门的方向,我们还要用“头号玩家“来指代这个虚拟世界的愿景。现在看来,当时的研究仍不过时,分享给大家。
今天,虚拟人赛道的热度在持续的增长,越来越多的人看到,虚拟人是虚拟世界核心的一部分,我们也在这个判断下,持续寻找标的,并于 2021 年投资了一家非常优秀的 AI 驱动虚拟人技术公司,初步完成了在这个赛道的布局。这两家公司,也在 2021 年获得了超预期的成长。
在下文中你将了解:
为什么我们选择于 2019 年开始关注「数字人」领域?
数字人的「定义与代表」有哪些?
数字人赛道有哪些「发展阶段」?
在投资人眼中,数字人赛道有哪些「创业切入点」?
我们为什么会投资虚拟人生态公司「次世文化」?
数字人从 2D 到 3D 的转变将会在什么时候到来?
……
我们距离《头号玩家》中的Metaverse还有多远?
顺为资本副总裁 冯铮
一、为什么于2019年开始关注数字人?
现在我们已经看到,VR、AR 领域可能存在巨大机会时,很多人可能会问,这项技术是不是距离我们的现实生活有点远,距离真正在现实生活中应用这一技术,还有这很长的时间?
所以,作为一位 VC 行业的投资人,我们除了需要分析未来,还需要着眼现在——在未来可能出现的巨大机会里,有哪些技术是在当下可以实现的。
今天我与大家分享的,是我们目前观察到的能够在当下运用 XR 技术实现的机会,“数字人”。
数字人,就是应用 AI 和 3D 渲染技术在虚拟世界中创造的人,简单理解,就是一个“能跟你说话的假人”。数字人这个概念可能看起来很新,但是运用的并不是新兴的技术,相反,它是两个非常成熟的技术互相结合的产物。
这两种技术,一是计算机图像技术。
简单来说就是在屏幕里创作一个非常好看的形象,这项技术已经在影视和游戏中得到了非常广泛的应用。例如迪士尼电影《冰雪奇缘》中的 Elsa、小黄人、以及最经典的米老鼠形象等等。另外,还有被认为是达到影视 3D 渲染技术新高峰的战斗天使阿丽塔。在游戏里,3D 渲染也是一项非常重要的技术,例如在今年疫情期间非常火爆的一款 Switch 游戏:《动物森友会》,其中所设计出的所有非常可爱的人和小动物形象等等。
另外一项技术是 AI。
具体来说,就是我们平常经常提到:语音识别、语义理解、语音合成、图像感知等等。这些技术是让计算机能够听得懂、看得懂我们的语言和行动,并且能够表达出来。AI 技术在现实中的应用也已经比较常见了,例如:小米的小爱同学、苹果的 Siri,亚马逊助手 Alexa 等。
那么,融合了计算机图像技术和 AI 技术的数字人,就是把做好一个形象并让他能够很聪明地与人进行互动相结合起来的一个新的方向。在下面,我列举出了一些比较有代表性的数字人。
二、具有代表性的数字人
首先是数字人中的“奶奶辈儿选手”初音未来,她最早其实是一个可以做电音音乐的软件,后来配合她的声音打造出来一个形象。第二个,绊爱是日本目前最火的 virtual YouTuber,在 YouTube 上做一些虚拟的表演,获得了很多人的喜爱。接下来是 Bilibili 孵化出来的泠鸢,形象比较中国风,算是对标绊爱的一个形象。可以看出,前三个形象都比较二次元、动漫风。
再后面是一家美国洛杉矶的公司制作出的 Lil Miquela,是一位超写实风格的虚拟偶像,她从 Instagram 出道,内容包括图片、视频、访谈等等,塑造的是一个超级模特的形象。此外,超写实风格的虚拟偶像还有来自日本的 IMMA,这个形象会更符合亚洲的审美,IMMA 还曾经和窦靖童一起拍过一支 MV。
后面三个形象会更接近现实,首先这个身穿蓝色西服的,是由新华社与搜狗合作推出的 AI 女主持人“新小微”,她可以根据新闻稿的内容自动播报新闻,能够直接生成一个动态的视频,效果也非常接近于现实中的播报员。再后面是 Gatebox,是一家日本公司做出来的带有全息屏幕的数字音箱虚拟人,音箱中有一位全息投影出来的二次元的女生。用户一回家,音箱中的女生就能够即时与他交互、对话,例如播报天气、日常问候等等。最后一位身穿白大褂的,是三星在去年 CES 大会中发布的一系列数字人中的其中之一,Neon,他主打的理念就是数字人可以逐步替代人们日常生活中很多有趣的角色。
接下来我想与大家分享的一个非常重要的概念是:数字人将成为 3D 世界中的 App。这与当前很多媒体稿件、行业分析中的理念有所不同。
三、数字人将成为3D世界中的App
回顾历史可以看到,人和机器的交互方式是在不断改变的,本质上是因为我们交互的技术在不断地发生变化。比如大家最早在用电脑的时候,交互方式是通过看显示器上浏览器中的网站、网页,通过鼠标点击和键盘按键传达出来的指令实现运转。
到了移动互联网时代,我们所使用的终端设备变成了智能手机,智能手机与电脑最大的区别在于触摸屏,触摸屏里的核心技术叫多点触控,这个大家都已经非常熟悉了。所以通过这样的交互技术,我们的交互方式就不再是使用键盘、鼠标和浏览器了,而是手机中的一个个 App。大家的交互方式变成了手指的触控,并且衍生出了一系列排列组合,包括现在大家都非常痴迷的“抖音”的上滑下滑等操作。
我们相信,3D 技术的世界里,人们所使用的终端设备会变成 VR 和 AR,那么这样的世界里实际上就没有了屏幕的概念。我们看交互技术方面,我们所能看到的所有形象都是 3D 渲染出来的,而在与这些形象交互的过程中,他们背后所支持的技术就是刚刚我们提到的 AI。
所以我们认为,在 3D 的世界里,将来的 App 会变成一个个数字人,我们会通过与数字人进行交互去获取信息,交互方式也就不再是按鼠标、敲键盘或者是点击屏幕了,而是直接用我们最自然的语言和动作。
因此可以说,数字人是我们在 3D 世界中,最重要的交互媒介,将成为下一代的人机交互方式。我们在移动互联网时代不断寻找的超级独角兽 App,在未来就会成为一个个数字人。与数字人进行交互的方式其实是更贴近人类自然习惯的,所以会是一种更便捷、更舒适的体验。
四、数字人赛道的创业切入点
接下来,我们来谈谈数字人的创业切入点。
首先,当前已经有非常多很有理想的创业团队,选择用“一步到位”的方式,直接创造出一个由无数数字人组成的未来世界,在这其中最热门的创业方向就是数字人社交。但同时也能看到,大部分这样的公司都难以为继。
其中做得比较好的创业公司有 2014 年成立的 VR Chat,截至目前仍有一些忠诚用户在这个应用中创造虚拟形象进行交互、聊天。此外还有 2013 年成立的 Altspace,目前已经被微软收购了,现在微软会选择在这个平台上举办一些虚拟活动。最后还有 Facebook(现已更名为“Meta”)在去年与硬件设备 Oculus 一起发布的 Horizon 项目,目前是 Facebook 里一个非常重要的业务。此外还有不少创业公司选择在智能手机上进行数字人尝试,例如前一段时间大火的应用 Zepeto 等等。
目前这些应用尚未得到非常充分的验证,究其原因,我们认为:“一步到位”的数字人社交世界需要在 VR/AR 设备中才有较好的体验,发展速度受制于 VR/AR 设备的普及。然而当前的情况是,VR/AR 设备的普及率还远远不够,所以我们认为这一方向并不是创业公司最好的切入点。
与其做在 3D 世界中做非常多的数字人,目前来看,更好的创业方向是从 2D 屏幕中开始的。
创业公司可以先选择在 2D 屏幕中,打造出一个或多个深受用户喜爱的数字形象,例如我刚刚介绍过的 Instagram 网红 Lil Miquela,他背后的运营公司 Brud 位于美国洛杉矶,目前已经收获了美国红杉等机构的投资,最新一轮估值 1.25 亿美元。
公司主要的收入来源是通过 Lil Miquela 的虚拟超模形象,来给时尚品牌等做联名与推广,从而收获品牌的广告赞助。
另外一家比较具有亚洲特色的公司是来自日本的彩虹社,它在 2020 年完成了 19 亿日元的巨额融资,其收入模式与 Brud 完全不同。彩虹社主要利用公司创造的二次元形象进行线上直播,通过直播打赏的方式来获得收入。
因此,从创业公司的角度来看,我们认为先从手机或电脑的 2D 屏幕创造并展现数字人,其实是个非常有效且接地气的切入方式。
五、第一发展阶段:
虚拟偶像改善内容行业的利润分配机制
那么,在数字人的赛道中,将分为哪些阶段?
第一阶段:“虚拟偶像”改善内容行业的利润分配机制。
制作“虚拟偶像”的流程大致可以分为以下几步,首先创业公司需要先制作出一个 3D 模型,风格可以是偏二次元也可以偏写实。虚拟偶像做好后,要找一个所谓的“中之人”(词汇来源于日本),由中之人来扮演这个虚拟形象。通过摄像头来捕捉中之人的动作,从而完成拟人化、虚拟化的制作。因此虚拟偶像可以理解为由中之人驱动表演的形象。
那么为什么现在虚拟偶像的热度会持续增长,创业公司都热衷于去创作一个虚拟偶像呢?
首先在这个阶段里,虚拟偶像虽然看起来并没有那么智能,但它却解决了当前内容行业中困扰大家的一个问题:利润分配机制。
举例来说,我们都以为很多经纪公司表面看起来很光鲜,但其实过得很苦,原因就是在于收入的大部分都被明星拿走了。同时我们也能看到以迪士尼为首的另一类公司,他们的营收与财报都非常出色,因为米老鼠永远不会跟迪士尼老板要求涨工资。所以虚拟偶像的第一个优势就在于,它改变了内容行业的利润分配机制,公司能够完全控制这个形象,拥有虚拟偶像的全部使用权和收益权。
下面我将介绍这个行业的几条发展主线。
首先是最基础的硬件及软件供应商,来提供底层的技术支持:例如软件方面做 3D 渲染的 Unity 和 Unreal;还有硬件方面的诺亦腾和 Vicon,我们在看影视剧花絮的时候能看到在对演员进行动作捕捉时他们身上穿戴的设备,就是来自这些硬件公司。
再往上,是技术服务商,他们能够整合上述的基础技术来帮助其他公司制作出并驱动自己的数字人形象。
这一层面的代表公司包括:Facerig,他们使用的可以说是目前最低门槛、最接地气的技术方案,有很多的网上的主播都在用,我们可以在 Steam 平台上可能花几十块人民币就可以下载到这个软件。Facerig 主要支持用户用 PC 端的摄像头捕捉自己的人脸动作,从而驱动 Facerig 内置的一些数字形象,作出半身的虚拟数字人表演。实现这一效果的门槛比较低,属于入门级别。
此外还有来自广州的“超次元”,公司会给用户提供软件,让用户可以自行购买动作捕捉设备,自行导入模型,因此能够支持用户制作出更专业的由动作捕捉设备驱动的虚拟偶像。
来自上海的 XMOV,也叫魔珐科技,这家公司的技术实力会更强一些,能够支持用户去制作一些超写实的、更高精度的虚拟偶像。为什么高精度是一个很重要的衡量指标?大家对于虚拟偶像的拟人化要求程度越高,就意味着更高的精度的要求。这一领域的代表企业还有偶邦和 Facegood。
在技术服务商之上的是运营商。下列图中第一个形象是抖音上原生的、影响力最大的虚拟偶像“MOMO酱”,这里的原生是指:MOMO酱在第一天就是被按照虚拟偶像的方式创造出来的,她背后的运营商是一家做视频大数据分析的公司孵化出的一个项目,目前在抖音上有几百万粉丝,日常内容主要由视频与直播形式来呈现。第二个是“一禅小和尚”,他其实是一家 MCN 机构的头牌,是一个非常有影响力的 IP。因为他本体是按照影视动漫的方式制作出的 IP,所以属于“半路出家”的虚拟偶像。目前一禅小和尚会和上述提到的一些技术服务商进行合作,从而实现互动的直播、表演。乐元素是一家非常知名的游戏公司,他们制作了自己的虚拟偶像综艺和网剧。上海禾念也是一家比较老牌的虚拟偶像制作公司了。
虚拟偶像制作出来了,他们该去哪里表演呢?
最顶一层,是展示平台。我们能看到在当前以 2D 屏幕为媒介的阶段,出现了众多展示平台:Bilibili、抖音、爱奇艺、快手……这些都是大家耳熟能详的企业。他们目前也都开展了虚拟偶像相关的项目,例如 Bilibili 专门成立了一家制作、运营虚拟偶像的公司;爱奇艺也制作了一支虚拟偶像乐队。这些平台在虚拟偶像领域也都进行了比较大的投入。
总结看来,目前虚拟偶像行业有四条主线:基础硬件及软件供应商、技术服务商、运营商和展示平台。
从投资上来看,我们则会抓住中间的两条主线:
第一,是围绕虚拟偶像的制作层面,即 3D 模型生成和驱动技术,核心是能够实现更快、更低成本的制作与驱动 3D 模型;
第二,是围绕运营商这条主线,成功的 IP 创作和运营,即如何成功地创作出一个大家喜爱的 IP 形象,因此也可以概括为是一条“艺术”的主线。
所以虚拟偶像的投资思路可以简单概括为:技术和艺术两条主线。以迪士尼为例,迪士尼的技术是在不断迭代的,但它最核心的能力是不断创作出能够深受观众喜爱的形象。因此可以看出,技术和艺术是相互并行,互作支撑的。
六、第二发展阶段:
数字人替代简单的人与人交互
下面我们来说说“数字人”的第二个阶段:数字人替代简单的人与人交互,核心是提高效率。
为了更加直观,在这里我做了一个类比:目前智能制造是一个非常火的领域,究其原因主要是我们认为“机器人”本质上是替代了简单的人和机器的交互工作。
那么类比在“数字人”领域,就是数字人能够替代简单的人与人的交互。例如数字人能够替代简单的客服工作、销售的咨询工作、医疗的简单咨询等等。
搜狗,它做的新闻 AI 主播,只要有文字稿,它就能自动生成无限量的节目内容;搜狗还和其他公司合作做出了一些数字人客服,例如视频面试官等等。魔珐科技,在做银行大堂的数字接待员,这也是我们观察到在这个行业里,需求量逐步提高的一个切入点。
那么要想实现这些场景,其背后的技术是什么?就是我们刚刚所说的:
语音识别、语义理解:让数字人听到并理解用户的需求;
语音合成:让数字人通过语言的形式表达出来;
图像识别:让数字人知道用户在做什么;
3D 驱动:帮助数字人在发出声音以外,驱动身体做出一些肢体语言和表情动作,让数字人看起来更加真实。
在这个赛道里,我们看好的创业公司需要能够做出好用的数字人 App。首先是技术层面:需要公司研发出一套高效的技术方案,让数字人足够“聪明”,能做到听懂并解决我的问题。其次就是艺术层面,数字人需要有一个吸引人的形象。
七、次世文化
接下来我要介绍一家顺为早期投资的虚拟偶像运营商:次世文化。(顺为资本曾于 2020 年领投次世文化 Pre-A 轮融资,并在后续的多轮融资中给予持续支持。)
次世文化的核心能力是设计并运营好一个 IP 虚拟形象,并利用明星来扩展它的影响力,同时也能帮助明星承接更多的商务合作。次世文化制作的第一个明星虚拟人是为迪丽热巴打造的虚拟形象“迪丽冷巴”。
最初次世文化对这个项目的期待,主要是提升公司的案例知名度,以及获得资金流上的补给。但在过程中逐渐发现,明星虚拟形象的市场比预想中大,明星、粉丝与品牌三方都存在诉求:
对明星而言,虚拟形象可以跳脱艺人身份与活动时间的限制,展现更多想法。对粉丝而言,可以从虚拟形象上看到明星的不同面向,与 52TOYS、十二栋等合作推出的虚拟形象产品,也满足了衍生品消费诉求;对品牌而言,相比真人,明星的虚拟形象可以高频、便捷地配合营销活动,在视觉与内容层面做创新,受到的限制也更小。
目前明星虚拟形象已经是次世文化最成熟的一条业务线,也有着相对明确的变现场景。从前期的概念设计、形象制作,到后期的运营策划,次世文化已经形成一套较为稳定的流程。
次世与明星的合作,也从早期的单纯提供解决方案,发展出共创 IP 的模式。
继迪丽热巴后,次世文化还与黄子韬一同打造了他的虚拟兄弟“韬斯曼”。而在最新发布的与艺人合作中,次世文化不再简单设计艺人虚拟形象,而是配合欧阳娜娜个人特质,打造了一支虚拟乐队。这些共创项目的版权收益将由次世文化与明星团队共享。
今年次世文化和魔珐科技合作,推出了国风超写实虚拟形象“翎-Ling”,她被设定为中国京剧梅派爱好者,外形上平衡了东西方对中国人相貌的审美偏好,是一个丹凤眼、高挑瘦削的年轻女孩。目前国内 18-30 岁的市场中,相对缺乏有鲜明国风气质,且具有国际质感的年轻文化传承人,翎就是瞄准这一细分市场的空白,对标的就是国外 Instagram 上的虚拟超模网红 Lil Miquela。
此外,次世文化还推出了专攻电音、潮流品牌与未来科技的虚拟 DJ“Purple”,她已经与包括Owhat、Wonderland 新视线杂志等达成合作,并参与了爱奇艺的虚拟选秀《跨次元新星》,未来将更多出现在线下音乐节与 livehouse 的舞台上。
总结来看,次世文化的核心竞争力就是创造出一些有趣、多层次、好看的形象,并且通过综艺、视频等形式,扩大影响力。
八、第三发展阶段:
每个人都有一个自己的数字形象
接下来,我将与大家分享“数字人”的第三阶段:每个人都有一个自己的数字形象。之所以把这一阶段放在案例分享后面,是因为目前看来,这一阶段还是一个非常美好、非常遥远的未来愿景。
前几年非常火爆的电影《头号玩家》就是对数字人、对 VR/AR 技术的未来场景的具体阐释。在未来的世界,会是一个 3D 的世界;每个人都有一个数字虚拟化的社交替身;我们会与许多智能数字人,也可以说是 NPC(Non Player Character),进行信息上的交互;最后一点,就是游戏与社交相结合。
《头号玩家》剧照
在当前对于 5G 的讨论中,有一个非常热门的概念是云游戏,它的核心就是在云端驱动 3D 渲染,来生成画面。我们目前看到的很多的游戏是许多玩家在云端一起打游戏,但从数字人的角度来看,云游戏可能会发展为在云端与数字人进行交互。所以我们认为,云游戏这个概念只说对了一半,未来真正的应用可能是云数字人。
大家可以想象一下,未来我们在餐厅点餐的时候,可能会是一个云端驱动来的数字人,到你的桌边问你需要点什么帮助等等。
电影《失控玩家》剧照
最后总结一下,目前数字人在 2D 屏幕中已经有了非常广泛的应用,同时在未来的 3D 世界中,数字人也将成为一个非常重要的角色。
最有趣的是,数字人技术在当前 2D 媒体的发展过程中,所逐渐积累起来的技术和经验,是能够完全迁移到 3D 世界的。当未来 VR/AR 设备逐步代替智能手机的时候,数字人也将完成由 2D 向 3D 的转变。因此我认为,数字人是一个类似“滚雪球”的赛道,即:在 2D 媒体中有应用,在 3D 世界中有未来,并且其技术和形象可迁移。
期待未来 3D 世界的到来。