搜尋引擎30年,影片搜尋在崛起

搜尋引擎30年,影片搜尋在崛起

圖片來源@視覺中國

文 | 極點商業,作者 | 楊銘,編輯 | 黃槍槍

“影片搜尋這種更具畫面感、個性化的搜尋方式,會成為未來搜尋引擎新趨勢嗎?”

這是2月17日,位元組跳動CEO張楠透露,抖音影片搜尋月活使用者超5.5億,日均影片搜尋量已達4億,抖音將加大對搜尋的投入力度之後,在知乎,由官方“知乎科技”發起,已有400來人參與的熱門問答。

搜尋引擎30年,影片搜尋在崛起

在移動端積極佈局搜尋業務的不止抖音,其早已成為所有巨頭佈局方向。2021年微信公開課上,微信搜一搜首次完整亮相。更早之前,位元組跳動等網際網路巨頭也公開宣佈發力搜尋業務。區別在於,無論是微信搜一搜,還是其他網際網路巨頭,重點發力方向都是通用搜索,而不是影片搜尋。

搜尋,英文名Search。過去30年來,作為使用者需求、依賴最多的領域,搜尋對網際網路發展有天翻地覆的影響,如果沒有搜尋,那麼大機率不會有如今的網際網路。

從文字搜尋到整合搜尋、圖片搜尋、音訊搜尋,乃至現在的影片搜尋,搜尋成為網際網路進化最快的領域之一。直到如今,智慧裝置和資訊科技大爆炸仍持續影響著搜尋方式,推動搜尋變得越來越更聰明。

這也讓過去多年來,眾多業界人士,甚至谷歌搜尋產品和使用者體驗副總裁瑪麗莎.梅耶爾(Marissa Mayer),在十多年前的《搜尋的未來》中發出相同提問:

搜尋引擎會成為過去時嗎?未來的搜尋,又會是什麼模樣?

毋庸置疑。也許谷歌、百度會沒落,但搜尋引擎不會過時,它本就是一部在技術不斷革新中變得更好的搜尋簡史——面對日益複雜的各種內容,越來越懂得使用者的查詢需求,並迅速為使用者提供更精準的資訊和答案,本就是搜尋引擎誕生以來一直致力的前進方向。

歸根結底,無論百度、谷歌、微軟、雅虎、Pintrest,還是YouTube、抖音、微信搜尋,儘管各大搜索引擎獲取資訊的方式已不盡相同,但其目標都一致:誰更準確理解使用者想找什麼,誰就將引領下一代搜尋潮流。

01 PC時代:從萌芽到百度谷歌爭霸

搜尋引擎原理,很大程度源於傳統檔案檢索技術。它的簡史,要從30多年前網際網路萌芽並興起時代說起。

1990年以前,全球資訊網還未出現,沒人能搜尋網際網路。這一年,加拿大麥吉爾大學的三位學生髮明瞭Archie。Archie是第一個自動索引網際網路上匿名FTP網站檔案的程式,它沒有機器人(Robot)程式,還不是真正的搜尋引擎。

搜尋引擎30年,影片搜尋在崛起

時代巨輪,正悄然啟動。1993年,美國副總統戈爾提出“資訊高速公路計劃”,並由此爆發了網際網路超常規發展的黃金十年。

資訊高速公路網,也許就是搜尋引擎。1994年,Lycos推出基於人工分類目錄的搜尋引擎,使用者輸入關鍵詞就可根據內容需要查詢網頁,在此之前,使用者需要透過人工收集和整理“網址索引”才能進入網頁,雅虎正是這方面的代表。

早期的搜尋引擎百花齊放,雖然功能都不完善、命運多舛,但為後來跨時代發展奠定了基礎。

跨時代變革在1998年到來。這一年,拉里·佩奇和謝爾蓋·布林在斯坦福大學學生宿舍開發了谷歌,他們發明了叫做PageRank的連結分析技術,使得搜尋結果相關性大大增強,並且在介面等實現了革命性創新。

谷歌搜尋引擎的出現,標誌著全民網際網路時代的來臨。從此,世界網民都認識到,搜尋是一個簡單動作,輸入關鍵詞,就能在一頁頁藍色連結中尋找到結果。

在國內,李彥宏攜120萬美元風險投資回國,成立眾裡尋他千百度的“百度”,透過建立在海量網站基礎上的“超鏈分析”技術,走到了舞臺中央。

此後,更多公司受搜尋市場前景和谷歌神話吸引,積極進入搜尋引擎市場,謀求一席之地。但也因為瀏覽器劫持、惡意捆綁等行為,在備受爭議後寂然無聲。

2004年9月,谷歌推出簡體及繁體兩種中文版本的搜尋引擎,與百度在內地市場分庭抗禮,加上360、搜狗、網易有道等的出現,搜尋引擎大戰在國內爆發。

2010年穀歌退出內地市場,百度開始在國內一家獨大無人撼動,一度在國內PC搜尋市場佔據83%以上市場份額。儘管它與谷歌佔據全球90%以上市場份額相比,從全球來看依然是小眾搜尋。

回頭看去,雖然外界對谷歌、百度迄今仍有諸多爭議,但歸根結底,他們能在PC時代佔據統治地位,是透過技術讓搜尋質量有了質的飛躍,使用者獲得資訊更快更準確,讓搜尋引擎真正成為網際網路的第一流量入口。

在這個基礎上,還誕生了搜尋廣告、搜尋引擎最佳化(SOE)、搜尋引擎營銷(SEM)等技術與商業化形式。而知識圖譜、個性搜尋、雲計算、乃至人工智慧等技術的發展,某種程度上也被搜尋技術的進步所影響和推動。

這是谷歌、百度在搜尋歷史中所起到的巨大重要作用,也是谷歌、百度能成為科技巨頭的根本原因,如同李彥宏所說:“搜尋是百度成功的所有秘密”。

無論是谷歌,還是百度,他們仍然一直沿用的是上世紀的關鍵詞來生成網址索引的模式——在網際網路內容日益複雜、龐雜後,通用搜索越來越難以滿足使用者的搜尋細分意圖,導致大把時間都被消磨殆盡了。

這就是過去多年來,搜尋引擎是否過時說法的主要原因。2011年,時任微軟Bing的主管就如此批評:“在過去12年裡,搜尋本質上沒有什麼改變,傳統搜尋正在走向失敗。搜尋的概念不再有效,在網頁上、在反向連結上、在所有一切上尋找文字不再管用了。”

02 移動十年:三大搜索方式潛力未兌現

潮起潮落,隨著移動網際網路興起,PC端逐漸向移動端流量轉移,搜尋也開始進入移動時代。

移動搜尋與傳統搜尋有著很大不同,搜尋訴求、搜尋方式、輸入方式、輸出結果,都因為各種移動裝置而變得更自然、更廣泛和更智慧——人們不僅可以隨時隨地透過 Siri搜尋,還可以在跑步時用可穿戴裝置搜尋,也可以懶洋洋地躺在沙發上用Alexa搜尋。

文字搜尋遠遠滿足不了億萬網民需求後,語音搜尋、圖片搜尋、視覺搜尋,是過去移動網際網路10年三大最有代表性的搜尋方式。

2011年開始,在智慧手機、可穿戴裝置、智慧語音助手、智慧音箱等助推下,語音搜尋讓眾多巨頭興奮不已。不過,幾年發展後,儘管大多數語音識別技術識別率已達到了一個較高水準,但識別並不等同於理解,演算法速率和準確率需要進一步提升,同時無法排除嘈雜的環境干擾,對使用者的說話語氣、語速、口音等要求頗高。

從諮詢公司Roast2018年一份研究22個垂直行業的語音搜尋情況來看,Google智慧助理能回答的問題不足一半,即使是能回答的問題,答案型別也是千差萬別。

語音搜尋在某些人士看來,目前還是雞肋的同時,圖片搜尋、視覺搜尋又開始興起。

圖片搜尋和視覺搜尋背後的技術邏輯相通,比如都是基於演算法和資料,與資料庫中的特徵照片進行對比,識別和搜尋目標圖片中的語義標籤。因此無論是谷歌、百度、Facebook、微軟、亞馬遜,還是Pinterest(圖片版的推特),他們都早早進入了上述領域並投入了大量的研發資金。

兩者在輸入上卻完全不同。前者是一種以反饋影象有效資訊結果的搜尋模式,只需輸入文字、關鍵字或者圖片就可以得出結果,門檻相對較低;後者是用智慧手機或其他攝影頭來識別物理世界所有物件資訊的模式,再使用發展近30年曆史的影象識別技術,結合使用者特徵和搜尋場景得出相關資訊。

谷歌在2011年推出圖片搜尋,這個功能的意義是,讓網際網路資訊共享跨入新時代。不過,基於單幅圖片來進行搜尋,相對有侷限性。

業界持有更大希望的是視覺搜尋。2009年,谷歌為安卓手機開發的Google Goggles可以說是最早的視覺搜尋應用。Goggles目的在於搜尋識別現實世界中拍攝物件的圖片資訊,並且能夠使用物品的條形碼進行產品搜尋。

但Goggles技術非常基礎,本質上是一個搜尋引擎公司的Pinterest也在2015年就推出了它的視覺搜尋功能,並取得了技術上的重大突破,比如如何更有效將影象識別和視覺搜尋功能結合起來,包括能夠在更廣的可視範圍內中逐個建立單個識別物件,並在視覺應用上顯示搜尋資訊。

搜尋引擎30年,影片搜尋在崛起

2019年2月,Pinterest推出了圖片搜尋功能Lens。經過1年探索,Pinterest使用者每月至少進行6億次視覺搜尋,且搜尋總數在不斷上升。其受歡迎原因在於,它能夠為每一位使用者建立一個獨特的“品味圖譜”,激發使用者購買慾。

谷歌也在2017年透過影象識別和OCR技術推出了Lens功能,讓機器學會“看圖說話”,並且用它正式取代了Goggles。不過,直到2020年6月,谷歌才宣佈可以在所有穩定版本中使用Google Lens。

03 內容壁壘:搜尋引擎多元化和差異化

和傳統搜尋相比,使用者在使用圖片搜尋、視覺搜尋時,尋找的是圖片而不是關鍵詞,進一步滿足了使用者的搜尋需求和體驗需求。

這並不能宣告,搜尋引擎已從文字搜尋進入了圖片或視覺搜尋時代。

因為哪怕影象識別技術已有很大進步,比如利用深度學習來訓練視覺搜尋並從影象中提取資訊,但由於裝置問題,加上對圖片中各種元素的識別、標記效率不夠、互動不夠自然,以及隱私保護等原因,都是視覺搜尋模式已經出現多年,卻很少在日常生活中使用它們的原因。

必須承認,20多年來,一直在努力變得更聰明的搜尋引擎,圖文搜尋依然佔據搜尋主要份額——其根本原因,是網際網路上內容都是以HTML圖文方式呈現,搜尋圍繞圖文為重點,是時代必然,也是圖文搜尋很難被完全取代重要原因。

但時代終究不同。移動互聯時代,APP成為各自領域內容重要入口,也讓每一個APP都成為一座資料孤島。傳統通用搜索引擎難以搜到APP優質內容,無論是國外的Facebook、YouTube,還是國內的抖音快手、攜程美團中的內容,傳統通用搜索引擎都很難搜尋到。

這讓搜尋引擎市場格局開始發生變化。比如百度,由於內容壁壘加深,以及使用者注意力被分散到短影片、電商、垂直應用等各個移動埠,搜尋及相關業務也被其他不同搜尋業務和平臺緩慢蠶食。

搜尋引擎30年,影片搜尋在崛起

從市場份額來說,百度搜索在國內獨佔鰲頭格局雖暫時無人撼動,但搜尋業務正呈現出多元化與差異化發展的趨勢——如同知乎答主“PANSZ”所說,人們用淘寶搜商品,用知乎搜問題,用美團搜團購,用哈羅搜腳踏車,用滴滴搜快車,用高德搜地點,同樣也會用抖音搜影片。

可以說,這些網際網路巨頭和平臺都有同一的目的:在最擅長領域內,做自己的搜尋引擎,以縮短搜尋和服務目標之間的鏈條。

但放在更宏大歷史背景中,上述絕大部分搜尋,不過是基於自身APP內部的使用者需求行為,其對網際網路的改變和推進意義,遠遠小於谷歌、百度帶來的圖文搜尋。

那麼,當通用搜索到更豐富內容越來越難的時候,有沒有一種搜尋方式,可能在圖文搜尋之後,代表著未來趨勢和方向?

04 未來需求:影片搜尋與圖文搜尋終極對決

詹姆斯·格雷克在《資訊簡史》一書中說:資訊僅僅存在是不夠的,它還必須為人所知。

事實上,無論是哪種搜尋模式,最重要的,仍是以所有使用者為中心,精準提供其他渠道沒有的、更有價值的資訊和服務。

目前來看,滿足上述搜尋核心價值理念,並且符合人類文明、網際網路未來發展趨勢的,只有影片搜尋。

當前,伴隨5G、大資料、雲計算、物聯網、人工智慧等技術的飛躍,人類文明記載方式,正從圖文到影片演變——儘管以圖文為媒介的內容,在短時間內依然還會是主體,但在感官、現場、個性化、直觀等全面碾壓圖文內容的影片,早在各領域井噴。

CNNIC資料就顯示,截至2020年12月,我國網路影片使用者規模達9.27億,較2020年3月增長7633萬,佔網民整體的93.7%。其中短影片使用者規模為8.73億,較2020年3月增長1.00億,佔網民整體的88.3%。影片化表達將成為接下來內容領域的重要方向,這一點早在業內達成共識。

影片需求的井噴,一方面意味著影片的形式,可以降低專業內容的受眾門檻,吸引更多大眾使用者;而另一方面,意味著使用者對答案直觀、有效資訊的搜尋追求、體驗需求與日俱增,這同樣是一場不輸於短影片崛起的變革。

影片搜尋有著和短影片技術融合的天然性。論是國外的YouTube,還是國內的抖音,都早已經搭建好了基礎的搜尋架構,能透過對演算法的提高,和搜尋引擎技術相融合,去改善搜尋質量和搜尋體驗——抖音崛起過程中,備受推崇的核心技術正是基於智慧推薦引擎。

從技術角度而言,以使用者興趣推薦驅動搜尋,其結果會更加個性化、精準化。這意味著,在進行影片搜尋時,搜尋結果相比圖文搜尋的內容豐富度、匹配準確度有了相當大提升(這也是搜尋的兩大核心需求重點),使用者體驗會更好。這也是影片搜尋,與傳統搜尋最大的區別。

比如,在抖音搜尋“紅燒肉”,縱向資訊流裡是推薦與“紅燒肉”相關的熱門影片和頭部主播影片,“紅燒肉”的話題入口等。橫軸上則提供“影片”、“直播”和“商品”等一些細分入口。

搜尋引擎30年,影片搜尋在崛起

這就是影片搜尋的最大好處,不用高度抽象的文字、不用靜態的圖片,透過短短几分鐘直觀影片,一種接近於人和人之間的真實溝通交流,照葫蘆畫瓢就能燒出一份紅燒肉。從創作者角度來說,這樣的搜尋演算法,也降低了內容競爭門檻,提高內容曝光,增加粉絲黏性。

某種程度上,這正是YouTube成為全球最大短影片平臺的同時,也早在2008年就成為全球第二大搜索引擎的關鍵原因——注意,YouTube的基礎設施,是搜尋引擎而不是社群。

抖音也是同樣如此。2018年5月,抖音上線了第一個搜尋入口,不到三年的時間,抖音影片搜尋的月活就達到5.5億。這個數字,甚至超過百度APP在2020年9月份的月活資料5.44億。

對抖音來說,影片搜尋能在三年內時間裡就達到5.5億日活,與推薦形成互補,其空間可以想象。由此可以理解,為何影片搜尋會成為抖音在2021年,甚至更長未來大力發展的重要戰略級動作。

和通用搜索全網檢索結果不同,影片搜尋難度顯然更大。比如,內容豐富度的前提,是平臺自身儲備有內容池,才能快速找出並推薦使用者想要的內容。而匹配精準度,則依賴於平臺對更豐富影片內容的理解。

事實上,無論是YouTube,還是抖音,目前距離終極形態的“影片檢索”,也就是影片語義層面的多模態檢索,都還有一段距離——目前的影片搜尋,仍比較依賴文字檢索,透過關鍵詞匹配影片的標題、介紹、關鍵詞、以及字幕資訊(OCR),得到答案。

搜尋引擎30年,影片搜尋在崛起

位元組跳動CEO張楠承認:“把影片搜尋做好很難。”但她仍對影片搜尋寄予厚望。張楠表示,如果抖音希望成為人類文明的影片版百科全書,那影片搜尋就將是這部書的索引,是尋找答案,收穫新知的入口。

現階段看,作為一種全新搜尋方式,影片搜尋目前與圖文搜尋仍是互為補充階段,無論是今日頭條發力搜尋,還是微信對話方塊全量上線搜一搜功能,可以看出通用搜索仍是當前搜尋領域競爭重點。

但在不久的未來,伴隨文明資訊載體的演變,影片和圖文需求的此消彼長,影片搜尋趨勢同樣無法逆轉,註定會成為更多網際網路巨頭又一個爭奪的戰場——到那時,影片搜尋,也就會凸顯出它的更大價值所在。

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 5898 字。

轉載請註明: 搜尋引擎30年,影片搜尋在崛起 - 楠木軒