觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  8月8日電 語音記錄,是記者、編輯、作家等文字工作者們常用的記錄方式。但是,對於記錄者來說,語音並不方便後期的整理、分享和追溯,這也導致聽語音記錄的過程耗時耗力,影響資訊的溝通。近日,搜狗推出語音實時變文字的速記工具“搜狗聽寫”,解決會議、採訪、寫作等場景下長語音內容轉寫難題。

觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  搜狗語音互動技術中心總經理 王硯峰

  為了保證在各種複雜場景下都能精準轉寫,搜狗聽寫採用了大量的前沿技術。在轉寫方面,搜狗聽寫使用了搜狗知音獨家研發的長時語音轉寫技術,並與業內領先的端到端深度神經網路技術深度整合,使得語音識別準確率保持在較高水平。據瞭解,搜狗聽寫的功能相當強大,可以支援寫文章、採訪錄音、會議記錄、筆記整理 、日常記事等場景,幫助使用者實現高效記錄和資訊輸入。而且針對不同場景和需求,搜狗聽寫可以支援“聽寫”和“轉寫”兩種模式。在“聽寫”模式下,錄音的同時即可實時給出識別結果,話音落文字出,幾乎沒有時間差;而“轉寫”模式下則可以離線錄音,錄音完成後一次性獲取文字結果。同時,為了提高文字整理效率,搜狗聽寫還貼心的加入了邊聽邊改、無線標重點、多端同步、資訊分享等人性化功能,大幅度提升記錄效率,讓文字編輯更輕鬆。此外,在針對圖書館、咖啡廳等不便於大聲說話而又有使用語音的場景,搜狗聽寫提供耳語識別技術,在人的說話音量低至30分貝時,依然可以準確識別。

  搜狗公司語音互動技術中心總經理王硯峰表示:“搜狗聽寫作為一款多場景的語音聽寫工具,其產品的關鍵在於語音識別準確率,而透過大規模的優質語音訓練資料和深度學習的技術能力積累,搜狗也將這種語音識別的技術優勢轉化到了更多的適用場景中。”

  目前,搜狗已經建立了強大的語音自研團隊,擁有網際網路規模最大的語音資料。每天超過2.6億次的語音請求,為搜狗智慧語音系統提供了海量的真實語料資料,使得機器不斷學習,識別準確率越來越高,可應用的場景也越來越廣泛。此次推出搜狗聽寫產品,是搜狗語音深入使用者垂直場景下的又一個全新探索,透過更加專注於特定的場景和人群,去理解使用者需求、解決實際問題,從而讓語音技術為更多人所用。綜合搜狗在人工智慧上的產品佈局,我們可以清晰的發現,讓人工智慧更“接地氣”,已經成為搜狗在人工智慧領域的獨特標誌。


觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  亞馬遜智慧音箱Echo Dot

  據AndroidAuthority北京時間4月14日報道,隨著三星Bixby入局,AI語音助手大戰戰況再次升級,為了鞏固自己的現有地位,亞馬遜也是豁出去了,它們直接向第三方開放了Echo音箱用到的語音識別技術。

  不過,雖說對第三方廠商開放,但稽核還挺嚴的,亞馬遜甚至用上了邀請制。如果第三方OEM廠商有興趣,就能向亞馬遜申請接入它們的Alexa七麥克風遠場開發套件。亞馬遜會評估第三方OEM廠商遞交的申請,它們覺得有潛力的才會發給執照。雖然比較嚴格,但有個好訊息,那就是拿到授權的OEM廠商不用向亞馬遜交錢。

  如果拿到了授權,很輕鬆就能將Alexa“塞”進產品中了,因為亞馬遜會讓你使用Echo的麥克風陣列,這套硬體拾音能力很強,即使是在吵雜的屋裡。同時,亞馬遜還會一併將喚醒口令軟體授權出去,該軟體同樣擁有降噪能力。

  在晶片支援列表中,亞馬遜提供了英特爾x86、ARM Cortex和樹莓派,這基本能囊括大部分裝置了,相信在不遠的將來會有大量新的類Echo裝置出現,進一步鞏固Alexa在AI語音助手市場的地位

  (2017-04-23)


觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  1988年出生的印奇成為中南海一場會議中最年輕的與會者。這是三週前,在國務院總理李克強主持召開的經濟形勢座談會上,印奇以中國人工智慧公司“曠視科技(Face++)”CEO的身份,與另外5位經濟學家和企業家一同被邀請。

  7月19日,在曠視科技位於中關村的總部,印奇和澎湃新聞(www.thepaper.cn)回憶起了這場他讓感到“幸運”的高規格會議。

  在發言環節,印奇提到曠視科技在深度學習上的核心技術系統Brain++,引起了李克強的關注。他和印奇再三確認:“我們中國年輕人有志氣這很好,但你一定要很誠實地告訴我,這是不是咱們中國自己原創的?”

  在聽到印奇正面的回答和詳細的介紹後,李克強表示讚許。“克強總理很高興說中國的技術公司有自己原創的東西,而不是把國外的東西拿來改一改。”印奇回憶說。

  依靠以人臉識別為核心的技術和商業佈局,2011年才成立的曠視科技僅用6年時間,躋身中國人工智慧領域的“獨角獸”公司。人臉識別技術是基於計算機影象處理技術的生物識別手段,在金融、商業、安防等領域有諸多應用。在2016年底完成1億美元的C輪融資後,曠視科技的估值已至20億美元。

  在與澎湃新聞記者的一小時對話中,作為聯合創始人之一的印奇分享了一個關於清華“極客”如何創業的故事。他愛提“聰明”二字,在曠視科技成立的前幾年,員工多半是來自清華園,不乏計算機競賽出身的“大牛”。

  印奇多次提到,他們對人工智慧是有使命感的。在曠視科技的辦公室裡,白牆上貼了公司的口號:為了人工智慧終將創造的所有美好(Power Human with AI)。

  身為一家技術派的人工智慧初創公司,一方面,印奇說曠視在一路上沒有太多戲劇化和故事性的困難,另一方面,這家公司正在感應著行業周遭的激烈競爭,想在大公司也熱衷的人工智慧大潮中,奪得更多先機,跑得更快。

  談起人臉識別,有人擔憂,這會引向隱私資料的洩露和無縫不入的監控。對此,印奇說,技術是中性的,它應該是一個善良的東西,當然,真正掌握技術之人如何使用是更重要的。

  “聰明的人”

  2011年夏天,正值印奇和同班同學唐文斌的畢業季,他們都就讀於“清華姚班”,一個由圖靈獎得主姚期智主導創立的計算機精英班。

  印奇說,就在本科散夥飯上,他向唐文斌“表白”,提出了一起創業的想法。都是技術出身的印奇和唐文斌各有所長,一個偏科研,一個則擅長工程化,這在印奇看來很互補。

  “表白”順利成功,他們開始搭夥創業,還拉上了同在姚班的學弟楊沐。至此,曠視科技的創始“三劍客”到位,都是“87後(1987年及以後出生的人)”。

  但很快,印奇遠赴美國哥倫比亞大學攻讀3D 相機方向的博士。“相當於剛結婚就分離了。”印奇打趣說。

  軟體和硬體是人工智慧的兩翼,軟體背景出身的印奇希望能補全硬體方面的知識。他一邊學習,一邊還要和大洋彼岸的唐文斌、楊沐處理公司事務。

  這終究不是長久之計。2013年,印奇做了輟學的決定,全職回國創業。回來後,如何規劃公司的商業化路徑直愣愣地擺在三人面前。那時,人工智慧的應用市場還沒有被充分培育起來。

  在一段時間裡,印奇說,他們揣著人臉識別技術,就像榔頭找釘子一樣,沒有太多清晰方向地“敲打”在很多業務上。比如,美圖秀秀是他們最初的種子客戶,透過人臉識別技術來滿足女性對美顏的剛需。

  娛樂化的方向沒有走得太久。2014年成了曠視的分水嶺,在“摸著石頭過河”中,他們發現用人工智慧為傳統行業賦能具有商機,從而認定了toB(對企業)的商業模式,在網際網路、金融、安防、智慧樓宇、智慧零售等領域鋪開業務。

  談起是如何達成這一共識的,印奇說,聰明人之間其實挺容易達成共識,在做了很多嘗試後,能感覺到對的大方向。不過,他也說,公司內部實行“民主集中制”,若真遇到分歧,還是會有決策流程,他也會做拍板決定。

  從三人的公司擴張到幾百人的公司,印奇說,每一位核心成員的加盟都投射著“海盜文化”。創業是艘風險與機會共存的船,拉任何一位優秀者上船,在印奇看來都是“對的時間遇到對的狀態的人”。

  2016年7月,前微軟亞洲研究院首席研究員孫劍加入曠視,引起業內熱議。事實上,孫劍曾是印奇本科時期在微軟實習時的老師。彼時,正是印奇與人臉識別的初次“親密碰面”。

  成為“獨角獸”公司後的曠視科技並非沒有競爭對手。在曠視科技獲得1億美元融資之後,今年7月,同以人臉識別為主營業務的商湯科技宣佈完成4.1億美元融資。

  激烈的競爭在印奇看來是好事。“有時候聰明人需要有一些外界的刺激,可能跑得才更快。”他說。

  “跑得更快”

  “我們雖然從時間上算,可能還比較是一個初創公司,但在一個大的賽道里,我們還是一個比較領先的公司。”印奇的話透露著自信。和他們比賽的,不只是有創業同行,還有含著金湯匙出生的大公司專案。

  “這是一個經典問題,你會覺得眼前看得到的機會都被大公司佔去了。”印奇說。但慶幸的是,他們站在了人工智慧的風口上,技術和商業模式的變革帶來行業洗牌的機會。

  在微軟工作過的印奇心裡很清楚,大公司有優勢,但也有因業務包袱帶來的劣勢。一個專案如果無法帶來與大公司體量相匹配的收入額,可能會被認為是不值得做的。而創業公司,它雖然沒有得天獨厚的資源優勢,但因為“個頭嬌小”而更為靈活。

  “有些機遇,其實當大公司覺得它真是機遇的時候,你可能已經跑得比較靠前了。”印奇說:“所以這永遠是個時間差,你要跑得更快。”

  在曠視內部,有一個負責基礎研發的研究院,也是和學界接觸最為緊密的部門。帶有濃濃極客味道的曠視科技將技術視為核心競爭力。而技術壁壘的堆高同樣需要遵守“快”的要則。

  人臉識別的背後技術是深度學習,在印奇看來,深度學習的本質是做標準化。“那就一定要把標準化這件事推進得比行業快,比行業徹底。”印奇說。

  一起比賽誰快的,還有黑色產業。在金融業,有人依靠偽造身份資訊或盜取他人身份資訊來騙貸。曠視為金融企業提供人臉比對和活體檢驗的技術,免不了和黑色產業的正面較量。

  曠視科技的市場總監謝憶楠和澎湃新聞說,他們經常會潛伏在黑色產業的群裡。在這些群,總會有人叫賣,說“1000塊錢破一次人臉識別,有沒有人要”。這時候,謝憶楠的同事就會主動接下。他們想看看黑色產業到底用了什麼辦法來破解,以便針對性地補上漏洞。

  過去,3D假體面具、播放人臉影片等冒充手段或許可以騙過人臉識別系統,但現在,謝憶楠說,無法得逞了,“道高一尺,魔高一丈”。

  一開始,曠視科技做人臉識別簽到機時,使用的是五點識別,用兩個瞳孔、鼻尖、兩個嘴角來確認身份。但問題是顯而易見的,因為識別點少,要是換個髮型、戴個鏡框眼鏡,系統可能就無法識別了。

  幾年過去,曠視的演算法已經可以透過使用者面部83個特徵點來進行身份識別,也不再需要使用者配合看鏡頭。

  “壞人不會想看攝像頭,攝像頭其實是個‘上帝視角’,很難讓人配合。”謝憶楠提到的,是人臉識別中一項最令人感到神秘的應用:安防。

  “無處遁形”

  印奇知道,很多人提到人臉識別時聯想到的“天網”是什麼。

  他進入人工智慧行業創業的初衷,和美國科幻電影《終結者》有很大關係。在《終結者》裡,“天網”是以計算機為基礎的人工智慧防禦系統,後期有了意識,而視人類為敵。正因為這部上世紀80年代的影片,印奇意識到,人工智慧在未來有不同的方向,讓人工智慧增強還是削弱人類的能力,這是可以選擇的。

  印奇和曠視並不排斥分享那些透過他們的系統,幫助抓捕“三逃”人員的案例。

  去年,他們的系統就曾成功幫助當地警察,在兩分鐘內將一位逃了7、8年的罪犯準確定位。這位罪犯頻繁地出入國境,但由於他持有國外護照,已經“漂白”了原有身份,此前並未被傳統的公安手段所發現。

  曠視的“天眼”系統和公安部門合作,搭建了“三逃”人員的身份證圖片庫,依靠在公共場所的監控攝像頭,進行實時比對。一旦系統識別到攝像頭中的人臉與資料庫相匹配,會瞬間報警提示。而公安則會立刻響應,進行盤查,進一步確認是否是逃犯。

  確認的過程並非是一步到位的。除了人臉特徵之外,系統還會根據身高、體重、體態、步態、穿著來綜合識別,做出判斷,有時臉上的一顆痣也會成為判斷的重要證據。

  不僅是抓捕在逃犯,印奇說,在人臉識別系統的幫助下,安防體系會逐漸向事前、事中推進。比如,常來的陌生人可能值得警惕。在車站,如果一個人的出現頻率超乎正常旅客的範圍,又非車站工作人員,那麼要考慮是扒手的可能性。

  人臉識別技術和遍佈的智慧化監控攝像頭相結合,使得一個7X24小時監控的龐大系統成為可能。

  “美國警匪片裡的,其實現在大家還都沒達到。可以想象是一個大的天網體系,這裡,壞人無處遁形。”印奇預測說,這個天網體系所需要的核心技術可能在3年內就可成熟,但仍需要之後多年在計算力和覆蓋面積上做完善。

  不可避免的,“天網”的設想引發對隱私洩露的擔憂。在有些國家,連十字路口智慧抓拍違規行為都會因為涉及隱私,無法推廣。

  作為開發者,印奇堅持的是主流的“技術中性論”,他認為需要社會價值觀、法律法規來監管如何使用原本中性的技術。

  他傾向於相信,技術本身是可以解決這些關於隱私的顧慮,進行約束的。首先,除了公開場所的資料,一切私人場所的個人資料都需要被當事人授權後,方得被採集和使用。“你有權利說Yes or No。如果有這樣的一個開關,對大家的影響就會非常小。”他說。

  此外,印奇介紹說,個人資料會經過脫敏處理後入庫,一張有姓名的照片會被隱去名字,以內部ID代號儲存。對於公開資料,印奇說主要是用於系統自身的訓練和提升。

  “如果攝像頭後面真的有個人在那看著,是挺嚇人的。但它後面就是一套系統。這個系統就像我們每天上網時用的搜尋引擎一樣,非常中性。它應該是一個善良的東西。”印奇說,真正掌握技術的人所選擇的方向其實更重要。

  (2017-07-29)


  [PConline 資訊]在移動網際網路發達的今天,順應時代潮流才能獲得成功與輝煌,作為中國的老牌公司,國美現在開始涉及新的領域:智慧手機行業。7月27日,國美全網通手機GOME S1新品釋出,以“人臉識別”為核心技術的GOME S1正式上市。

觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  新品採用5.2英寸1080P螢幕,搭載MTKMT6737四核處理器,配備500萬+1300萬畫素攝像頭,以及4000mAh電池。與國美手機K1和U1主打虹膜識別技術不同,GOMES1主要有三個核心特點:人臉識別、長續航、精緻外觀。

觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  在GOME S1全場釋出會中,最驚豔全場的莫過於人臉識別技術了,除了可以人臉解鎖以外,還能對應用程式加密、擁有自己的專屬空間等等,這些都不需要密碼了,刷臉即可。數字化時代下,使用者在資訊保安、通訊安全、應用安全、信用安全、財務安全、娛樂安全、系統安全等場景應用方面將有著潛在的巨大需求。人臉識別技術豐富了技術維度,為國美手機馳騁商務安全市場增添了一把殺手鐧。

觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  4000mAh的長續航電池搭配功耗最佳化省電技術,使得GOME S1通話時長可達28個小時,外出一整天電量無憂,大電池長續航已經成為高品質旗艦機型的標配。同時GOMES1支援全網通,6模20頻的通訊模式,讓你隨時隨地暢享高速網路。

  在外觀上面,GOME S1採用500+mm冷鐳射處理和表面紫光旋轉鐳雕,精緻大方,別開生面,該設計榮獲2017年iF德國工業設計大獎,用工藝打造藝術,這是對GOME S1最好的詮釋。另外,5.2英寸的機身無疑是大屏橫行時代的一股清流,使人單手就可以輕鬆操控。

觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  而對於國美手機而言,這只是萬里長征的第一步, 在今年上半年,國美手機建立了自有渠道、社會代理商和運營商三大核心渠道,基本實現了全渠道建設,並設立了覆蓋22個省市的14個銷售辦事處。在售後網路上,已在全國建立國美手機售後服務商,覆蓋到全國一、二線城市,部分覆蓋三線城市(西藏除外)。在自主研發方面,從產品設計到生產製造已完全自主獨立。國美將不斷打磨自己的產品,從而增加品牌的影響力。

  這樣一款支援人臉解鎖、超級續航和精緻外觀的手機打動你了嗎?

  (2017-08-03)


  近年來,國產手機廠商紛紛崛起,擴充套件國外市場,因此網上出現了很多論調,那就是抵制三星、抵制日本。但是在這繁榮的背後是核心零部件技術的缺失。

觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  小胖今天就給那些抵制的人講一講手機多少核心零部件能實現國產?

  核心處理器

觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  這是手機的核心零件之一,目前國內有華為麒麟系列、小米澎湃S1以及展訊CPU,目前也只有華為麒麟系列用在了高階旗艦機上,而且還只給自己供貨。小米S1CPU目前也還是中低端CPU,展訊基本也只有360曾經用過。

  螢幕

觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負”

  (2017-06-26)

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 6581 字。

轉載請註明: 觀劇報告:搜狗推出速記工具“搜狗聽寫” 用人工智慧為文字工作者“減負” - 楠木軒