实时

您的位置:首页>企业 >

世界新资讯:Meta这套生成式AI,专为全身Avatar而来

一提起Meta Avatar虚拟化身,常常有人吐槽它只有半截身子,看起来不自然。的确,尽管Quest整体VR体验优秀,但出于对硬件设计、成本的考虑,技术上依然有限制,比如不能准确追踪下半身,而这种限制也影响了早期的一些VR社交应用,比如《Rec Room》。


(资料图片仅供参考)

Quest不能追踪下半身,是因为头显不具备相应的传感器,而Meta也没有推出官方的体感追踪套件(比如PC VR头显可使用Vive Tracker)。Meta的策略,是尽可能简化VR的使用流程,如果为头显配备定位模块,无疑让设置过程更复杂,且硬件成本更高。为了满足用户对全身Avatar的需求,Meta不久前为Avatar加入了模拟的腿部运动,并通过Body Tracking API开放给开发者。

据了解,Meta Avatar将通过头、手三点的定位信息来推算下半身动作,这显然并不精准。拿《VRChat》来讲,虽然该应用中的虚拟化身有下半身,但并不能跟随用户下半身运动而变化,,意味着Avatar不能模拟自然下蹲、躺下等动作,如果用户在开启VR应用时摘下头显放在桌上或地上,VR内的Avatar可能会呈现奇怪的姿势,具有一定恐怖谷效应。

为了完善Avatar下半身模拟的效果,Meta研发了一种基于MLP架构的条件扩散模型:AGRoL(Avatars Grow Legs),该模型宣称可根据稀疏的信号生成全身姿态,由于其运行速度足够快,因此也适合VR社交等在线多人应用。

关于AGRoL

Meta指出,随着AR/VR用户群增长,越来越多的人渴望能自然、精准控制的全身Avatar。然而,VR一体机在下半身追踪上具有一定局限,因为它只通过头显、手柄来定位,只能捕捉到少量、稀疏IMU的信号,而且通常仅用于定位和重建上半身部位,比如头部和手腕。想要定位下半身,通常需要额外的IMU模块,缺点是成本高、使用不方便。

简单来讲,Quest系统不能通过头显捕捉的信息准确的追踪下半身,而只能通过追踪上半身关节运动来提取有限的信息,用于合成下半身运动。也就是说,用算法来预测和模拟Avatar的下半身动作。通常,从头、手三点预测全身动作的算法依赖于生成模型,比如标准化流(Normalizing Flow),或是变分自编码器(VAE)。而在各类生成模型中,扩散模型开始在图像、视频生成方面取得不错的成果,尤其是条件扩散模型。

因此,Meta科研人员提出了一种全新的条件扩散模型:AGRoL(全称为“Avatar长腿”),该模型由简单的多层感知器架构(MLP)、运动数据调节方案组成,专门以稀疏信号为条件,根据上半身定位来生成全身姿态。据了解,这种只利用稀疏定位信息重建全身姿态的扩散模型,为市面上首例。

据称,AGRoL是专门为条件运动合成任务量身定制的,可预测出准确、流畅的全身运动。与常见的扩散架构相反,它基于紧凑型架构,可实时运行(在单个NVIDIA V100 GPU上运行时,计算过程仅6毫秒),因此可用于在线身体追踪应用,比如VR社交软件、多人VR游戏等等。

此外AGRoL提升了MLP网络性能,并超越了此前的方案,明显降低了抖动误差,因此和AvatarPoser等其他模型相比,ARGoL生成的动作更加平滑。此外,在追踪信号丢失的情况下,ARGoL的准确度下降不多,因此在追踪信号稀疏的情况下也能较准确的模拟运动。

不过,目前ARGoL方案可能出现地板穿透伪影,后续或许可以通过额外的物理约束,来改善该问题。

其他VR全身定位方案

除了预测算法外,VR也可以使用其他的全身动捕方案,比如:光学Marker、深度相机、RGB相机骨骼动作识别等等。相比之下,AGRoL虽然依靠预测而非准确追踪,但它的优势是成本低,用户无需购买甚至设置额外的硬件,因此用起来很方便。

除了AGRoL外,此前也有将人体运动数据与机器学习模型结合的方案,比如Standable。这是一种无摄像头全身追踪方案,主要是通过算法来模拟VR追踪不到的下肢(如骨盆、膝盖、腿部或关节处),其特点是校准流程轻量化,只需要确认眼部位置即可,此外支持复杂的动作模拟,比如蹲下、躺下、趴下、走路、慢跑等等。相比于Standable,AGRoL的优势是专为Quest打造,与硬件配合更好,尤其是实时运行能力强。

此前青亭网也曾报道多种VR全身定位方案,比如卡内基梅隆大学,在VR手柄上配备广角相机来追踪下半身,或是Meta此前提出的基于电磁原理的6D姿态追踪方案。值得注意的是,索尼在去年也推出了便携式全身动捕产品:Mocopi(售价360美元),未来也许和VR可以有很好的结合。

参考:

https://research.facebook.com/file/887324682720918/Avatars-Grow-Legs-Generating-Smooth-Human-Motion-from-Sparse-Tracking-Inputs-with-Diffusion-Model.pdf

关键词:

推荐阅读
可实现高质量人体运动数据

2023-03-27 20:59:59

3月27日,北方大部地区天气晴好,南方降水进一步减弱,春光正好,春耕备耕正当时。各地纷纷抢抓农时、播种育苗、强化田间管理,为今年粮食丰产

2023-03-27 19:19:37

旭日企业(00393)发布截至2022年12月31日止年度业绩,该集团取得收入10 61亿港元,同比增加6 3%;归属于公司权益持有人的溢利3922 9万港元,

2023-03-27 18:05:50

电动车价格还得降宁德钠离子电池今年量产:高寒地区突出优势

2023-03-27 16:57:01

1、1 准备工具2、或者纯净水和矿泉水,绝对无油器皿,干海参里有的。3、2、冷水泡4、为了使干海参变软,需要将常温的纯净

2023-03-27 15:40:05

报道称,苹果在其开发过程的后期改变了iOS17的策略,添加了几项新功能,这表明该更新可能比之前想象的更重要。当苹果着手开发iOS17时,最初的

2023-03-27 14:30:29

1、打开手机中的I主题,选择一种字体,点击带背景色的自由字体。2、当前字体有背景色。点击下载。3、成功下载字体后,单击应

2023-03-27 12:45:48

中国首座深远海浮式风电平台将投用

2023-03-27 11:12:54

3月26日,以“‘荆歌’铁马,奔向未来”为主题的中国体彩2023荆州马拉松在荆州体育中心北广场鸣枪起跑,20103名选手

2023-03-27 09:09:38

1、第二单元(分数乘法)测试卷一、看图列式用加法算:()+()+()+()+()=()用乘法算:()×()=()2、用加

2023-03-27 07:54:50

定增新规实施之后,更厚的安全垫、更短的锁定期和更低的参与门槛,提高了投资者参与定增的收益率和资金周转率。在大盘震荡的背景下,具备发行

2023-03-27 03:50:23

1、一怎样删除页眉页脚双击文档里的页眉或页脚,就可以进入页眉页脚的编辑状态,可以再次编辑,改变页眉页脚的样子。

2023-03-26 23:01:56

2023年科普短视频创作联合行动启动仪式。 中国科协供图中新网北京3月26日电(记者孙自法)中国科协科学技术传播中

2023-03-26 20:45:11

1、网上买不到烟,但是可以通过饿了么跑腿买烟。2、点击跑腿购买。3、点击给我买。4、输入香烟的类型,然后点击以订购干净的

2023-03-26 18:08:42

1、每侧最少放两个引擎速度最快。2、《木筏生存(Raft)》是由RedbeetInteractive制作的一款生存游戏

2023-03-26 16:16:51

山西文化中的饮食部分,著名的小吃简阳羊肉汤,肉质细嫩、肥而不腻、温而不火,尤其是那奶一般白的汤,其味鲜香浓烈、余味悠长,是任何一道菜

2023-03-26 15:55:54

北京时间3月26日,NBA常规赛,费城客场不敌太阳。此役,费城球星乔尔-恩比德全场遭遇严密包夹,投篮19中8,三分球4中

2023-03-26 13:47:30

余姚市气象台发布霜冻黄色预警【Ⅲ级 较重】【2023-03-26】

2023-03-26 11:03:52

1、崇实学校要好你应该看下晋城一中的前身是哪个学校——崇实学校只不过现在的崇实学校是原来晋城一中创始人的后人你

2023-03-26 08:52:48