9月17日,记者从云栖大会获悉,天猫发布首个全场景人机交互系统AliGenie5.0,将视觉、语音、触觉等多种形态的交互方式融合在一起,能更精准地感知物理世界,深入理解使用者的意图。当天发布的三款新产品也全部搭载了AliGenie5.0,提供了唇动唤醒、挥手唤醒等多种“拟人化”的唤醒方式。
天猫精灵事业部总经理库伟表示,从AliGenie5.0开始,天猫精灵将开始以服务为中心,应用微内核、多模态交互等技术,构建全场景智能化。据悉,该系统同步面向开发者、智能家居合作伙伴开放。此前,多模态交互技术多停留在学术层面,阿里是业内首个把“多模态唤醒”技术大规模应用在消费电子产品上的公司。
据介绍,AliGenie5.0是天猫精灵开发的多模态人机交互系统,首次将唇动、手势、语音语义等多种形态的信息输入融合在一起,可通过多模态感知的方式理解人类的交流意图,并直接给出反馈。同时支持分布式的微内核操作系统,能够覆盖更广阔的的应用场景。此外,AliGenie5.0还支持“云应用”技术,能够突破硬件的配置和性能限制,跨平台、跨终端,流畅使用Windows、Linux、Android等系统的丰富应用,用户甚至可以在天猫精灵上玩电脑游戏、上网课、体验3D渲染等。
目前,这一系统已率先应用在此次发布的三款新品上,使天猫精灵具备了自然唤醒的能力。例如,用户在音箱端开启设置“自然唤醒”后,在1米左右的距离下,当机器识别到有人开始盯着它说话时,不用再喊出唤醒词,就能直接自然对话。
天猫精灵此次发布的三款新品分别为配备了10吋智能屏及大容量电池的天猫精灵CC10电池版、4吋智能屏产品天猫精灵CC MINI,以及第二代IN糖,上述新品全部搭载全新的AliGenie5.0系统。其中,CC MINI还集成了阿里自研的微内核操作系统,也是全球首个搭载微内核系统的智能音箱,能够在小屏的产品上实现触屏交互,把追求高效生活常用的闹钟、日程、家居控制等功能进行整合,开发了晨起、睡眠等核心场景的极简模式,让生活中的微小需求也能被智能化。
据悉,这一系统很快也将面向天猫精灵的合作伙伴开放,今年内会陆续支持汽车、房产、智能健康、儿童教育等领域的联合定制产品,覆盖80多个终端品类。未来在生态内的智能场景中,天猫精灵的用户只要使用同一个账号登录,就可以进入个人界面,无差别的使用智能助手。
库伟表示,智能终端的设备量正处于快速爆发期,随身穿戴、车载、智能家居、智慧社区、酒店、养老院等需要终端设备来服务消费者的领域,都将逐步被智能化改造。他认为,智能音箱的形态,已经完成了“AI智能助手”第一阶段的市场普及,未来将出现更多具备多种交互形态、提供AI助手能力的产品形态,天猫精灵也正在研发具备视觉交互、语音交互甚至行动能力的全场景智能设备。“当智能场景越来越繁杂时,就需要一个可动态适配所有场景的人机交互系统,来确保消费者体验的一致性,AliGenie也将不断升级,为机器赋予认知、理解和行动力,让每个人、每个家庭都拥有一个专属的智能助手。”
上游新闻·重庆商报记者 韦玥