今天是臘月二十九,讀者朋友們有沒有放假回家過年呢?首先給大家拜個年,祝大家新春快樂!假期一定要嗨起來呀~
近幾年春節,支付寶掃福集五福卡似乎成了一項保留節目,今年同樣也沒例外,支付寶已經打出了“集齊五福,拼手氣分5億”的口號,通過AR掃福獲得福卡,集齊五福後即可獲得抽獎的機會,2月11日22:18開獎。讀者朋友們有沒有集齊五福呢?
也許有些朋友在掃福的時候會有這樣的好奇心:為什麼手機掃一掃福字就可以識別出福卡呢?手機也有看懂事物的能力了?實際上,這就是智能手機的視覺能力。也許讀者朋友們不知道的是,這樣的視覺能力已經在手機上有着各種各樣的體現了。
01手機是如何看懂事物的?
視覺是生物獨有的技能,讓手機能夠看懂事物,從某種意義上來説也是一種仿生學,其方式與生物視覺大致相同。
比如我想從收納盒中找到手錶,首先需要眼睛獲取圖像,由大腦對圖像進行處理讓我們看到畫面。然後大腦對畫面進行分析,識別出手表,於是我就找到了目標。想要讓手機看懂事物,也需要大致相同的一個過程:首先對畫面進行採集,之後對採集的畫面進行識別,最終識別到的關鍵要素觸發對應指令,看上去手機也就“看懂”了事物。
實際上,視覺功能在手機上的應用已經非常廣泛,只不過是功能不同所需的視覺能力也不同。現在已經實現普及的手機人臉識別實際上就是一種視覺功能,其實現原理並不複雜:功能觸發時,手機前置相機採集用户的人臉圖像,採集到的圖像與之前錄入的圖像進行特徵點比對,當達特徵相似點到一定比率時,手機即可觸發解鎖。
我們在文初説到的AR掃福實際上也是一樣的,手機掃描的圖像通過網絡傳至雲端服務器,該服務器會對圖像進行特徵點抓取。當抓取的特徵點與其“認知”的福字信息相匹配時,系統就成功掃描到了福字。相信其中非常關鍵的一點讀者朋友們也注意到了:計算機的認知。
拍攝中的場景識別
計算機本身不具備辨識的能力,但擁有計算能力的計算機就像一個牙牙學語的孩子一樣,需要通過學習來掌握辨識的能力。不同的視覺功能需要學習的內容不同,難易程度也不同。比如剛才提到的人臉識別,在信息錄入時學習到充分的人臉信息就可以;當前比較流行的手機拍照AI場景識別,就需要對場景分別進行學習,之後才能識別出對應的場景。
02手機上的視覺功能都有哪些應用?
剛才我們提到了手機的AR掃福、面部識別、拍照場景AI識別,其實這只是手機視覺功能的一些入門級應用。隨着手機AI技術的發展,越來越多實用、有趣的視覺功能被開發出來。
1、 實用類:代替手動輸入大大提升效率
這樣的場景相信不少讀者朋友都遇到過:想搜個字,但是這個字不認識,筆畫還挺多;想翻譯牆上或者書上的一段外文,但用翻譯軟件的話得一個字母一個字母輸入非常麻煩;想搜個實體物體的信息,但不知道這東西叫啥……
簡單的説,這樣的場景就是需要用户用自己的視覺功能將信息轉化成手機可以識別的形式,但這樣的轉化過程容易出現障礙,或者操作起來比較麻煩。
但手機如果有了視覺能力,需要用户用自身視覺轉化信息的過程就省略掉了,障礙和麻煩自然就不存在了,比如——
丨文本識別
手機視覺具備文本識別能力後,只需要手機識別就可以將書上、圖片上的文字轉化成文本,大大提升了輸入效率。
丨翻譯
手機“看見”外文後,就直接翻譯成用户可以看懂的文字了,再也不用字母一個一個地輸入了。
丨物體識別
前不久垃圾分類成了熱門話題,但怎麼分類卻難倒了不少朋友。如果手機能夠看到垃圾並且幫我們分類是不是就簡單很多了?
垃圾分類只是物體識別應用的一種,另一種應用就是掃描購物。我們無須再手動輸入產品品牌和名稱,手機掃一下就可以識別出商品了。
丨場景識別
比較典型的場景就是出行。比如一些新手司機們可能看不懂儀表盤上的故障燈,只需要用手機掃一下就可以分辨故障燈信息,幫助用户便捷快速瞭解車輛潛在風險。
當前主流的地圖軟件已經支持了AR導航。手機可以實現對道路場景的識別,並且直接在實際的路線畫面中給出導航指示。
此外,AR測量也是典型的場景識別應用。我們可以直接通過手機視覺能力來測量現實中的物體長度,而且可以做到較高的精度。
2、 趣味類:手機還可以這麼玩
就跟文初提到的掃福一樣,手機視覺除了實用價值以外,還有趣味類的應用——
也許有些朋友會説,這個我知道,動畫表情就是。沒錯,通過AR技術實現的動畫表情目前已經非常常見了,我們來説點不常見的:對人體進行建模然後進行動作控制。比如踢個瓶蓋、來段尬舞……
現在很多遊戲都支持了AR拍照,即將遊戲中的角色與攝像頭採集到的現實畫面結合進行拍照,我們可以通過這項功能與遊戲角色進行合影。
另外就是AR遊戲了,比如幾年前爆火的《Pokemon Go》就是典型的例子。
寫在最後
是不是沒想到,手機視覺功能原來已經有這麼多了?實際上,以上列舉的還並不是當前全部的功能支持,比如還有紅酒識別、食物熱量識別、美妝試妝等等。當然,手機視覺在未來還有着更加廣闊的發展空間,比如AR試穿衣服、AR試放家居等等。
從更長遠的角度來説,未來會有更多的視覺輔助功能進入到我們的生活中,比如當前就已經具備雛形的AR眼鏡,它可以為我們創造一個不僅能看到,而且可以進行交互的、切合真實場景的數字世界。當前的手機視覺功能無疑正是建立這個數字世界的開端。怎麼樣,是不是突然就有些期待了呢?
(7613096)