还在玩只限于人脸的AR玩法吗?一键美体塑形、视频体感游戏、用手机就能玩虚拟形象全身驱动……随着5G即将全面普及以及智能图形技术的不断创新,原本受限于高端硬件的全身AR技术,现在用智能手机就能玩,视频AR玩法也将全面进入了全身时代。
相芯科技此次对人体AI技术进行全面升级,在视频AR特效的功能基础上进行玩法升级,同时新增开放7大功能的算法接口,分别是2D人体关键点、3D人体骨骼、人像分割、头部分割、头发分割、动作识别、手势识别。每项技术革新背后都能带来新的应用层的火花,相芯更新的技术效果到底如何,一起来看下吧。
打开APP 阅读最新报道一、2D人体关键点
通过2D人体关键点算法接口,实现人体全身2D关键点的跟踪效果,点位准确性高,即使做大幅度动作、遮挡以及转身的情况下,也能准确稳定跟踪。同时针对用户在短视频、直播拍摄时的自拍场景,2D人体关键点还提供半身模式的点位跟踪,这样用户在单手持手机自拍的情况下,也能准确定位人体数据。
在高精度的人体关键点模型的基础上,对视频中的人物实现全身美体功能,是这项技术比较热门的应用场景。相芯的技术,可以从瘦身、长腿、细腰、美肩、美臀、小头、瘦腿等七个美化维度,对人物的身体进行精细化调整,从而达到一件瘦身塑形的作用。
二、3D人体骨骼
相芯科技开放的3D人体骨骼的算法接口,主要应用于基于3D关键点和3D骨骼,实现3D虚拟形象的全身驱动。这项技术不依赖于深度摄像头,只需要手机的普通摄像头就能获得视频中的人体3D骨骼数据,即使人物做大幅度的动作、有动作遮挡、转身等情况都能稳定跟踪。除了身体躯干动作,在手指细节上,也能识别和跟踪常见的14种手势。让3D虚拟形象能够更细腻地复原人物的动作。同样针对他人拍摄和自拍两种拍摄场景,相芯提供全身和半身两种模式,支持3D人体骨骼数据的输出。
三、人像分割
通过人像分割的算法接口,可对输入的视频进行内容理解,将人物进行高精分割解析,将人像区域分离出来,并实时追踪。例如视频直播过程中,识别用户的人体轮廓,为人物实时替换各种背景特效。也可以与各具创意的人体AR贴纸相结合,让贴纸实时跟随人体移动,贴纸素材与人体的前后位置关系可灵活定义,可以充分发挥运营者的互动创意,为用户带来更加丰富的娱乐体验。
四、头部分割
通过头部分割接口,企业和开发者可以对人物头部区域做更多的特效创意。例如搞笑大头玩法特效,可以实现视频中的人物头部放大的萌态效果。这项技术还能和其他技术进行组合实现更加新颖的玩法效果。比如将头部分割和表情系数结合,即可用特点的表情,触发大头效果,并用表情的夸张程度来实时控制头部的放大程度。用头部分割+哈哈镜+AR贴纸这样的技术组合,就可以实效恶搞版的效果,充分发挥脑洞创意。
五、头发分割
通过头发分割接口,可以在视频和照片中人物的头发区域高精度地分离出来,可以给头发切换各种各样的颜色,可以是纯色,也可以是渐变色,实现一键换发色的特效。同时头发的色值支持自定义,并可以进行上色程度的调整,实现想要的发色,想换就换。
六、动作识别
相芯科技的动作识别接口,能够支持15种全身动作的识别。将动作识别和匹配算法相结合,可以开发出各种体感小游戏,比如“尬舞机”游戏,跟着屏幕的动作提示即可开始跳舞了。同时动作识别也可以与AR贴纸相结合,用特定动作来触发贴纸特效,充分发挥体感互动的娱乐性。
七、手势识别
通过手势识别接口,可精准识别常见的14种手势动作。在短视频直播领域,用户在拍视频和拍照过程中,可以通过手势动作来触发各种贴纸特效,从而衍生出创意视频的各种玩法。同时,在智能设备领域,比如智能家电、智能机器人、可穿戴设备、智能互动大屏等智能硬件,可以实现用手势控制对应的功能。用户在不接触设备的情况下,通过简单的手势,就能实现对设备的交互和控制,让人机交互方式更加智能化、自然化。
相芯科技专注于人工智能和计算机图形学的融合与创新,致力于为消费级应用提供内容创作工具、平台和解决方案。相芯科技的人脸人体AI解决方案目前已累计服务700多家B端客户,产品被广泛应用于短视频、直播、社交、游戏、智能家居、在线教育、广告营销、新零售等领域,月均调用量达40亿。
此次的人体AI SDK大更新,相芯针对不同体验需求推出了两个版本的体验demo,分别是特效版和算法版demo。
【特效版demo】模拟真实的用户应用场景,提供技术的功能演示和体验,可以在这个demo里面直观体验美颜、美妆、道具贴纸、Animoji、美发、轻美妆、AR面具、搞笑大头、海报换脸、表情识别、音乐滤镜、哈哈镜、美体、全身Avatar、动作识别、人像分割、手势识别等功能。
同时针对开发者用户,为了能更好地体验各个功能接口在算法层的效果,相芯全新推出【算法版demo】,使用这个demo就能直观地看到各种人体关键点、人体骨骼、mask类功能的算法效果,便于进一步开发使用。目前开放的接口为2D人体关键点、3D人体骨骼、人像分割、头部分割、头发分割、动作识别、手势识别。