唇動、揮手等多模態可喚醒!天貓精靈釋出首個全場景人機互動系統
9月17日,記者從雲棲大會獲悉,天貓釋出首個全場景人機互動系統AliGenie5.0,將視覺、語音、觸覺等多種形態的互動方式融合在一起,能更精準地感知物理世界,深入理解使用者的意圖。當天釋出的三款新產品也全部搭載了AliGenie5.0,提供了唇動喚醒、揮手喚醒等多種“擬人化”的喚醒方式。
天貓精靈事業部總經理庫偉表示,從AliGenie5.0開始,天貓精靈將開始以服務為中心,應用微核心、多模態互動等技術,構建全場景智慧化。據悉,該系統同步面向開發者、智慧家居合作伙伴開放。此前,多模態互動技術多停留在學術層面,阿里是業內首個把“多模態喚醒”技術大規模應用在消費電子產品上的公司。
據介紹,AliGenie5.0是天貓精靈開發的多模態人機互動系統,首次將唇動、手勢、語音語義等多種形態的資訊輸入融合在一起,可透過多模態感知的方式理解人類的交流意圖,並直接給出反饋。同時支援分散式的微核心作業系統,能夠覆蓋更廣闊的的應用場景。此外,AliGenie5.0還支援“雲應用”技術,能夠突破硬體的配置和效能限制,跨平臺、跨終端,流暢使用Windows、Linux、Android等系統的豐富應用,使用者甚至可以在天貓精靈上玩電腦遊戲、上網課、體驗3D渲染等。
目前,這一系統已率先應用在此次釋出的三款新品上,使天貓精靈具備了自然喚醒的能力。例如,使用者在音箱端開啟設定“自然喚醒”後,在1米左右的距離下,當機器識別到有人開始盯著它說話時,不用再喊出喚醒詞,就能直接自然對話。
天貓精靈此次釋出的三款新品分別為配備了10吋智慧屏及大容量電池的天貓精靈CC10電池版、4吋智慧屏產品天貓精靈CC MINI,以及第二代IN糖,上述新品全部搭載全新的AliGenie5.0系統。其中,CC MINI還集成了阿里自研的微核心作業系統,也是全球首個搭載微核心系統的智慧音箱,能夠在小屏的產品上實現觸屏互動,把追求高效生活常用的鬧鐘、日程、家居控制等功能進行整合,開發了晨起、睡眠等核心場景的極簡模式,讓生活中的微小需求也能被智慧化。
據悉,這一系統很快也將面向天貓精靈的合作伙伴開放,今年內會陸續支援汽車、房產、智慧健康、兒童教育等領域的聯合定製產品,覆蓋80多個終端品類。未來在生態內的智慧場景中,天貓精靈的使用者只要使用同一個賬號登入,就可以進入個人介面,無差別的使用智慧助手。
庫偉表示,智慧終端的裝置量正處於快速爆發期,隨身穿戴、車載、智慧家居、智慧社群、酒店、養老院等需要終端裝置來服務消費者的領域,都將逐步被智慧化改造。他認為,智慧音箱的形態,已經完成了“AI智慧助手”第一階段的市場普及,未來將出現更多具備多種互動形態、提供AI助手能力的產品形態,天貓精靈也正在研發具備視覺互動、語音互動甚至行動能力的全場景智慧裝置。“當智慧場景越來越繁雜時,就需要一個可動態適配所有場景的人機互動系統,來確保消費者體驗的一致性,AliGenie也將不斷升級,為機器賦予認知、理解和行動力,讓每個人、每個家庭都擁有一個專屬的智慧助手。”
上游新聞·重慶商報記者 韋玥