楠木軒

那個最不像 AI 的語音助手,剛剛離開微軟創業了

由 納喇曉枝 釋出於 科技

作為獨立公司運營的小冰,有了更多商業化的空間。

傳聞近一個月的微軟小冰分拆終於敲定。

7 月 13 日一早,微軟中國發布官方公告,宣佈將人工智慧小冰業務分拆為獨立公司運營,並委任沈向洋博士為新公司董事長,「小冰之父」李笛為執行長,日本和印尼兩地 Rinna(小冰)的負責人陳湛為日本分部總經理,微軟將保持對新公司的投資權益。

誰是小冰?

小冰誕生於 2014 年,是微軟旗下的對話機器人。和普遍意義上的問答機器人不同的是,小冰從誕生之初就瞄準「有情感、會閒聊」的方向,主打情感計算。近年來小冰出現在公眾視野中,常常是因為其繪畫、詩歌、音樂等藝術方面的創作。在剛剛閉幕的上海世界人工智慧大會上,小冰還和小米小愛同學、百度小度、虛擬主播泠鳶共同演唱了主題曲。

小冰是一個國際化的「AI being」。誕生於中國,2015 年推出日本小冰(りんな),2016 年推出美國小冰(Zo)。2017 年,在第五代微軟小冰產品釋出會上,微軟宣佈已分別於 2 月和 8 月推出了印度小冰(Ruuh)和印度尼西亞小冰(Rinna)。如今,小冰已經進化到第七代。

官方資料顯示,全球範圍內,小冰已覆蓋 6.6 億線上使用者、4.5 億臺第三方智慧裝置和 9 億內容觀眾。更為重要的是,小冰以其閒聊的特質,與使用者的單次平均對話輪數(CPS)達到 23 輪,這對於當下的語音人工智慧來說,是非常高的數字。

小冰的使用者覆蓋主要來自合作伙伴的裝置搭載及應用搭載,其中包括華為、OPPO、vivo、小米等手機或音箱等硬體裝置,以及 QQ、微博、今日頭條等應用程式。另外,小冰也曾嘗試進入垂直產業。去年,其發言人曾表示,微軟小冰已經完成了金融、地產、紡織、服裝、出版、媒介等十個行業的商業化落地和佈局。

2019 年 7 月 14 日 北京 中央美術學院美術館舉辦微軟人工智慧小冰「個人繪畫展」《或然世界》這是國內首

企查查資訊顯示,拆分後的新主體名為「北京紅棉小冰科技有限公司」,法定代表人李笛,大股東李明佔股 70%,他僅有「紅棉小冰」一家關聯公司。沈向洋任董事長,在工商資訊中體現為執行董事,目前並不佔股。

和小冰從微軟「解綁」類似,6 月,位元組跳動旗下 Tiktok 也在接受類似的挑戰。在美國的持續監管壓力下,位元組跳動正一步步將海外業務剝離中國母體,以完全獨立的方式運營。對小冰而言,脫離母體,拿掉「外籍」身份,或許是小冰在中國及東亞進行本土商業化的前提。

語音是不是未來

在微軟內部,並行著兩個對話人工智慧團隊,一個是小冰,一個是 Cortana。2019 年底,微軟曾發表宣告稱,將於 2020 年叫停 Cortana 語音助手在中國區的使用。不過,該宣告中提到的撤出國家除中國外還包括英國、澳大利亞、德國、墨西哥、西班牙、加拿大和印度。

一邊大範圍關停 Cortana,另一邊拆分小冰品牌,微軟對語音人工智慧助手的態度可見一斑。在人工智慧技術的三個主要方向——語音語義、影象,以及決策中,語音是最早落地的一個,在小冰誕生後一兩年,產業中出現了智慧音箱熱潮,這主要來自於語音技術的成熟。

對於一個語音人工智慧助手來說,與人類的交流需要經過四個階段。語音識別,即將聲音轉換成文字;語義理解,也即 NLP 技術,理解人類的意圖;結果生成,即搜尋答案,生成回覆;以及語音合成,即 TTS 技術,將答案轉化為聲音。

在上述四個步驟中,一和四已經成熟,二和三還需時日。NLP 技術被稱為人工智慧皇冠上的明珠,對於漢語這樣複雜的語種來說,更是難上加難。目前想要人工智慧助手像真實人類一樣與人交流,效果仍舊不能令人滿意。這也是為什麼很多人工智慧被稱為人工智障的原因。

儘管業內聲音持續向好,但語音人工智慧的商業化程序卻非常緩慢。最廣泛的聲音是,語音是未來的人機互動入口,使用者的訴求將透過聲音與智慧裝置互動,甚至一度湧現出「語音辦公」的熱潮。這在潮水退去的今天看來,是一件非常荒謬的事。

文字交流在承載資訊之上具有保密的特性,而語音天然嘈雜。包括 Siri 在內的語音助手長期承擔著「被調戲」和簡單輔助功能的角色,使用率低、場景有限制等等問題一直難以解決。在這樣的大背景下,微軟對語音人工智慧助手的判斷是否仍像 2014 年當時一樣充滿熱忱,答案大機率是否定的。

不過儘管語音不會成為廣泛的人機互動入口,在陪伴機器人以及服務機器人等特定場景下,仍舊是剛需。語音語義作為人機互動的基石,其不可替代性不言自明,只是在其中進行多少投入,是微軟作為商業公司需要計算的事。

拆分後的公司董事長沈向洋 他是美國國家工程院外籍院士 前微軟全球執行副總裁 2019年辭職後受聘清華大學高等研究院雙聘教授 | 極客公園

小冰脫離象牙塔

在微軟內部,小冰是一個無需負擔營收 KPI 的存在,科研屬性大於商業屬性,這也是為什麼團隊將小冰的市場推廣重點放在「琴棋書畫」而非落地場景的原因。

此次分拆之後,小冰需要以一個獨立的商業公司的形式運營,對於團隊來說將會構成一個挑戰。NLP 技術難,小冰之所以成為小冰所需要的情感計算技術更是處在初級階段。對於客戶來說,這樣一個能陪聊會唱歌的聊天機器人是否是剛需,需要畫一個問號。這樣一來,對於拆分後的團隊來說,融資至關重要。

拆分前,小冰團隊分佈在北京、蘇州、東京三個辦公室,約 200 餘人,拆分後保留 50 餘人,在人工智慧領域,是一個小型初創公司的規模。剛剛離開微軟的沈向洋坐鎮,李笛領銜,團隊依舊星光熠熠。對於這家科研型的小型初創公司來說,有世界一流的人才和技術,他們需要的是資金入場,和它一起等待人機互動的新未來。

據財新網報道,分拆後的小冰已經吸引到一批投資人,新公司估值在 7 億美元。接受財新網採訪的投資人表示,是否入股仍在考慮,主要是在衡量其商業化效率。

但從另一個層面來說,脫離龐大體系的小冰,或許能夠以更自由的姿態成長。

本文作者:在野