0571-89774660
EN
  • 试用申请
  • 带屏音箱渐成行业主流,相芯科技为AI助手注入灵魂
    相芯2020.06.22

    2013年,《触不到的她》上映。电影描述了都市男子西奥多和仅能语音交流的虚拟AI助手萨曼莎发展出一段奇异爱情。2017年,《银翼杀手2049》中的虚拟AI助手乔伊惊艳一时。相比仅存在于声音中的萨曼莎,乔伊拥有娇俏外形和鲜活情绪,更能引起观众的共鸣。

    电影《银翼杀手2049》中的虚拟AI助手乔伊

    事实上,这些曾经仅存在于科幻电影中的虚拟助手,正随着智能音箱的日益普及而逐渐成为现实。得益于相芯科技的STA语音动画合成技术,曾经只有声音的虚拟助手,也开始像《银翼杀手2049》的乔伊一样,拥有自己的形体,为用户带来更强的情绪共鸣和陪伴价值。

    带屏音箱渐成行业主流

    AI助手“呼之欲出”

    国外有Amazon Echo、Google Home和HomePod三雄争霸,国内也有天猫精灵、小爱同学和小度在家三足鼎立。据Strategy Analytics 的《2019 年第四季度智能音箱出货量报告》指出,2019 年全球智能音箱销量达到 1.469 亿部,同比增长 70%,创历史新高。

    除了出货量屡创新高,智能音箱的家庭渗透率也相当可观。欧美市场对于智能音箱的需求相对成熟,早在2018年家庭普及率就达到40%,而国内的家庭普及率也在2019年超过了10%。考虑到还有待进一步发掘的家庭市场,以及智能音箱作为入口所能撬动的商业可能性,也就不奇怪为什么有那么多行业巨头在智能音箱上下了重注。

    值得注意的是,智能音箱的发展历程也正如萨曼莎到乔伊的形象转变——最初的智能音箱是传统音箱设计搭载智能语音助手,如今带屏智能音箱后来居上。

    在Amazon和百度领导厂商带动下,带屏智能音箱渗透率从2017年的2%一路成长至2019年11%。带屏智能音箱将语音讯息透过可视化方式,让消费者能确认操控是否正确,而信息的显示也更快速与直接。从只能靠声音沟通,到可以直接面对面交流,拥有虚拟形象的AI助手正收获更多消费者的青睐。

    可见形象,人性交互

    让AI变成可陪伴的“家人”

    会说话的音箱或许只是一个音箱,但当它拥有一个可视化的形象之后,在情感陪伴和用户粘性上会得到质的升级。和传统的智能音箱不同,拥有虚拟形象的智能音箱,更像一个虚拟生命体。它可以和用户直接面对面交流,它不仅仅只是与用户进行对话与完成任务,而更像是一个人去跟用户交流,也会有自己情绪与肢体反馈,正是这样的形象化的情感引擎,让AI不再冰冷而更像家人一样,陪伴在用户身边。

    相芯科技的STA语音动画合成技术,就赋予了AI的形象拥有自动开口说话并给予情绪、动作反馈的能力,让用户在与AI助手的互动中更容易产生情感连接。

    这一技术将深度学习神经网络和计算机图形学结合,让计算机能够理解语音的内容,并精细驱动虚拟形象的口唇动作、面部表情、肢体姿态,做出更加丰富的表情与动作,生成极具逼真感的虚拟互动助手。

    它会在晚上讲故事哄孩子入睡,辅导孩子做作业,会唱歌会跳舞;它能为老人播放新闻和戏曲解闷,随时陪老人聊天,哪怕老人絮叨健忘,也能始终保持充分的温柔与耐心。

    其实早在数十年前,虚拟形象的AI助手就存在于各类科幻作品中。随着技术日益成熟,又逢智能物联网浪潮下智能音箱的快速普及,拥有虚拟形象的AI助手将会越来越常见。

    不只是可视化

    更要为AI助手注入灵魂

    从最初的文字交互,到早期智能音箱的语音交互,再到如今音箱屏幕上生动鲜活的虚拟形象,AI助手每一次升级都意味着信息承载量的跃升。某种程度上,这也是AI助手不断注入灵魂的过程。相芯科技的STA技术正是从细微处让虚拟助手更加真实、亲切,为用户带来更强的情绪价值。

    为可视化AI助手注入灵魂的相芯科技(FaceUnity),是一家专注于智能图形技术的创新与应用的科创企业,为移动互联网、VR/AR等领域提供3D内容生成与互动的行业解决方案,致力于将好莱坞电影级的特效技术在消费级应用中的普及,带屏智能音箱就是典型的消费级应用之一。

    未来,可视化的虚拟AI助理不会仅存身于带屏智能音箱上,随着技术发展,曾经仅存在于科幻电影中的全息投影AI助手,也会逐渐出现在消费级市场上,这也正是相芯科技持续发力的领域。相芯科技拥有业内重量级科学家领衔的研发团队,在3D图形、计算机视觉、VR/AR领域有超过20年的研发经验,STA只是它丰富技术储备中的一项。

    可视化的AI助手未来会给人类生活带来多大改变,相芯科技又将在其中扮演怎样的角色,一切都值得期待。