搜索引擎30年,視頻搜索在崛起

搜索引擎30年,視頻搜索在崛起

圖片來源@視覺中國

文 | 極點商業,作者 | 楊銘,編輯 | 黃槍槍

“視頻搜索這種更具畫面感、個性化的搜索方式,會成為未來搜索引擎新趨勢嗎?”

這是2月17日,字節跳動CEO張楠透露,抖音視頻搜索月活用户超5.5億,日均視頻搜索量已達4億,抖音將加大對搜索的投入力度之後,在知乎,由官方“知乎科技”發起,已有400來人蔘與的熱門問答。

搜索引擎30年,視頻搜索在崛起

在移動端積極佈局搜索業務的不止抖音,其早已成為所有巨頭佈局方向。2021年微信公開課上,微信搜一搜首次完整亮相。更早之前,字節跳動等互聯網巨頭也公開宣佈發力搜索業務。區別在於,無論是微信搜一搜,還是其他互聯網巨頭,重點發力方向都是通用搜索,而不是視頻搜索。

搜索,英文名Search。過去30年來,作為用户需求、依賴最多的領域,搜索對互聯網發展有天翻地覆的影響,如果沒有搜索,那麼大概率不會有如今的互聯網。

從文字搜索到整合搜索、圖片搜索、音頻搜索,乃至現在的視頻搜索,搜索成為互聯網進化最快的領域之一。直到如今,智能設備和信息技術大爆炸仍持續影響着搜索方式,推動搜索變得越來越更聰明。

這也讓過去多年來,眾多業界人士,甚至谷歌搜索產品和用户體驗副總裁瑪麗莎.梅耶爾(Marissa Mayer),在十多年前的《搜索的未來》中發出相同提問:

搜索引擎會成為過去時嗎?未來的搜索,又會是什麼模樣?

毋庸置疑。也許谷歌、百度會沒落,但搜索引擎不會過時,它本就是一部在技術不斷革新中變得更好的搜索簡史——面對日益複雜的各種內容,越來越懂得用户的查詢需求,並迅速為用户提供更精準的信息和答案,本就是搜索引擎誕生以來一直致力的前進方向。

歸根結底,無論百度、谷歌、微軟、雅虎、Pintrest,還是YouTube、抖音、微信搜索,儘管各大搜索引擎獲取信息的方式已不盡相同,但其目標都一致:誰更準確理解用户想找什麼,誰就將引領下一代搜索潮流。

01 PC時代:從萌芽到百度谷歌爭霸

搜索引擎原理,很大程度源於傳統文件檢索技術。它的簡史,要從30多年前互聯網萌芽並興起時代説起。

1990年以前,萬維網還未出現,沒人能搜索互聯網。這一年,加拿大麥吉爾大學的三位學生髮明瞭Archie。Archie是第一個自動索引互聯網上匿名FTP網站文件的程序,它沒有機器人(Robot)程序,還不是真正的搜索引擎。

搜索引擎30年,視頻搜索在崛起

時代巨輪,正悄然啓動。1993年,美國副總統戈爾提出“信息高速公路計劃”,並由此爆發了互聯網超常規發展的黃金十年。

信息高速公路網,也許就是搜索引擎。1994年,Lycos推出基於人工分類目錄的搜索引擎,用户輸入關鍵詞就可根據內容需要查找網頁,在此之前,用户需要通過人工收集和整理“網址索引”才能進入網頁,雅虎正是這方面的代表。

早期的搜索引擎百花齊放,雖然功能都不完善、命運多舛,但為後來跨時代發展奠定了基礎。

跨時代變革在1998年到來。這一年,拉里·佩奇和謝爾蓋·布林在斯坦福大學學生宿舍開發了谷歌,他們發明了叫做PageRank的鏈接分析技術,使得搜索結果相關性大大增強,並且在界面等實現了革命性創新。

谷歌搜索引擎的出現,標誌着全民互聯網時代的來臨。從此,世界網民都認識到,搜索是一個簡單動作,輸入關鍵詞,就能在一頁頁藍色鏈接中尋找到結果。

在國內,李彥宏攜120萬美元風險投資回國,成立眾裏尋他千百度的“百度”,通過建立在海量網站基礎上的“超鏈分析”技術,走到了舞台中央。

此後,更多公司受搜索市場前景和谷歌神話吸引,積極進入搜索引擎市場,謀求一席之地。但也因為瀏覽器劫持、惡意捆綁等行為,在備受爭議後寂然無聲。

2004年9月,谷歌推出簡體及繁體兩種中文版本的搜索引擎,與百度在內地市場分庭抗禮,加上360、搜狗、網易有道等的出現,搜索引擎大戰在國內爆發。

2010年穀歌退出內地市場,百度開始在國內一家獨大無人撼動,一度在國內PC搜索市場佔據83%以上市場份額。儘管它與谷歌佔據全球90%以上市場份額相比,從全球來看依然是小眾搜索。

回頭看去,雖然外界對谷歌、百度迄今仍有諸多爭議,但歸根結底,他們能在PC時代佔據統治地位,是通過技術讓搜索質量有了質的飛躍,用户獲得信息更快更準確,讓搜索引擎真正成為互聯網的第一流量入口。

在這個基礎上,還誕生了搜索廣告、搜索引擎優化(SOE)、搜索引擎營銷(SEM)等技術與商業化形式。而知識圖譜、個性搜索、雲計算、乃至人工智能等技術的發展,某種程度上也被搜索技術的進步所影響和推動。

這是谷歌、百度在搜索歷史中所起到的巨大重要作用,也是谷歌、百度能成為科技巨頭的根本原因,如同李彥宏所説:“搜索是百度成功的所有秘密”。

無論是谷歌,還是百度,他們仍然一直沿用的是上世紀的關鍵詞來生成網址索引的模式——在互聯網內容日益複雜、龐雜後,通用搜索越來越難以滿足用户的搜索細分意圖,導致大把時間都被消磨殆盡了。

這就是過去多年來,搜索引擎是否過時説法的主要原因。2011年,時任微軟Bing的主管就如此批評:“在過去12年裏,搜索本質上沒有什麼改變,傳統搜索正在走向失敗。搜索的概念不再有效,在網頁上、在反向鏈接上、在所有一切上尋找文本不再管用了。”

02 移動十年:三大搜索方式潛力未兑現

潮起潮落,隨着移動互聯網興起,PC端逐漸向移動端流量轉移,搜索也開始進入移動時代。

移動搜索與傳統搜索有着很大不同,搜索訴求、搜索方式、輸入方式、輸出結果,都因為各種移動設備而變得更自然、更廣泛和更智能——人們不僅可以隨時隨地通過 Siri搜索,還可以在跑步時用可穿戴設備搜索,也可以懶洋洋地躺在沙發上用Alexa搜索。

文字搜索遠遠滿足不了億萬網民需求後,語音搜索、圖片搜索、視覺搜索,是過去移動互聯網10年三大最有代表性的搜索方式。

2011年開始,在智能手機、可穿戴設備、智能語音助手、智能音箱等助推下,語音搜索讓眾多巨頭興奮不已。不過,幾年發展後,儘管大多數語音識別技術識別率已達到了一個較高水準,但識別並不等同於理解,算法速率和準確率需要進一步提升,同時無法排除嘈雜的環境干擾,對使用者的説話語氣、語速、口音等要求頗高。

從諮詢公司Roast2018年一份研究22個垂直行業的語音搜索情況來看,Google智能助理能回答的問題不足一半,即使是能回答的問題,答案類型也是千差萬別。

語音搜索在某些人士看來,目前還是雞肋的同時,圖片搜索、視覺搜索又開始興起。

圖片搜索和視覺搜索背後的技術邏輯相通,比如都是基於算法和數據,與數據庫中的特徵照片進行對比,識別和搜索目標圖片中的語義標籤。因此無論是谷歌、百度、Facebook、微軟、亞馬遜,還是Pinterest(圖片版的推特),他們都早早進入了上述領域並投入了大量的研發資金。

兩者在輸入上卻完全不同。前者是一種以反饋圖像有效信息結果的搜索模式,只需輸入文本、關鍵字或者圖片就可以得出結果,門檻相對較低;後者是用智能手機或其他攝影頭來識別物理世界所有對象信息的模式,再使用發展近30年曆史的圖像識別技術,結合用户特徵和搜索場景得出相關信息。

谷歌在2011年推出圖片搜索,這個功能的意義是,讓互聯網信息共享跨入新時代。不過,基於單幅圖片來進行搜索,相對有侷限性。

業界持有更大希望的是視覺搜索。2009年,谷歌為安卓手機開發的Google Goggles可以説是最早的視覺搜索應用。Goggles目的在於搜索識別現實世界中拍攝對象的圖片信息,並且能夠使用物品的條形碼進行產品搜索。

但Goggles技術非常基礎,本質上是一個搜索引擎公司的Pinterest也在2015年就推出了它的視覺搜索功能,並取得了技術上的重大突破,比如如何更有效將圖像識別和視覺搜索功能結合起來,包括能夠在更廣的可視範圍內中逐個建立單個識別對象,並在視覺應用上顯示搜索信息。

搜索引擎30年,視頻搜索在崛起

2019年2月,Pinterest推出了圖片搜索功能Lens。經過1年探索,Pinterest用户每月至少進行6億次視覺搜索,且搜索總數在不斷上升。其受歡迎原因在於,它能夠為每一位用户創建一個獨特的“品味圖譜”,激發用户購買慾。

谷歌也在2017年通過圖像識別和OCR技術推出了Lens功能,讓機器學會“看圖説話”,並且用它正式取代了Goggles。不過,直到2020年6月,谷歌才宣佈可以在所有穩定版本中使用Google Lens。

03 內容壁壘:搜索引擎多元化和差異化

和傳統搜索相比,用户在使用圖片搜索、視覺搜索時,尋找的是圖片而不是關鍵詞,進一步滿足了用户的搜索需求和體驗需求。

這並不能宣告,搜索引擎已從文本搜索進入了圖片或視覺搜索時代。

因為哪怕圖像識別技術已有很大進步,比如利用深度學習來訓練視覺搜索並從圖像中提取信息,但由於設備問題,加上對圖片中各種元素的識別、標記效率不夠、交互不夠自然,以及隱私保護等原因,都是視覺搜索模式已經出現多年,卻很少在日常生活中使用它們的原因。

必須承認,20多年來,一直在努力變得更聰明的搜索引擎,圖文搜索依然佔據搜索主要份額——其根本原因,是互聯網上內容都是以HTML圖文方式呈現,搜索圍繞圖文為重點,是時代必然,也是圖文搜索很難被完全取代重要原因。

但時代終究不同。移動互聯時代,APP成為各自領域內容重要入口,也讓每一個APP都成為一座數據孤島。傳統通用搜索引擎難以搜到APP優質內容,無論是國外的Facebook、YouTube,還是國內的抖音快手、攜程美團中的內容,傳統通用搜索引擎都很難搜索到。

這讓搜索引擎市場格局開始發生變化。比如百度,由於內容壁壘加深,以及用户注意力被分散到短視頻、電商、垂直應用等各個移動端口,搜索及相關業務也被其他不同搜索業務和平台緩慢蠶食。

搜索引擎30年,視頻搜索在崛起

從市場份額來説,百度搜索在國內獨佔鰲頭格局雖暫時無人撼動,但搜索業務正呈現出多元化與差異化發展的趨勢——如同知乎答主“PANSZ”所説,人們用淘寶搜商品,用知乎搜問題,用美團搜團購,用哈羅搜自行車,用滴滴搜快車,用高德搜地點,同樣也會用抖音搜視頻。

可以説,這些互聯網巨頭和平台都有同一的目的:在最擅長領域內,做自己的搜索引擎,以縮短搜索和服務目標之間的鏈條。

但放在更宏大歷史背景中,上述絕大部分搜索,不過是基於自身APP內部的用户需求行為,其對互聯網的改變和推進意義,遠遠小於谷歌、百度帶來的圖文搜索。

那麼,當通用搜索到更豐富內容越來越難的時候,有沒有一種搜索方式,可能在圖文搜索之後,代表着未來趨勢和方向?

04 未來需求:視頻搜索與圖文搜索終極對決

詹姆斯·格雷克在《信息簡史》一書中説:信息僅僅存在是不夠的,它還必須為人所知。

事實上,無論是哪種搜索模式,最重要的,仍是以所有用户為中心,精準提供其他渠道沒有的、更有價值的信息和服務。

目前來看,滿足上述搜索核心價值理念,並且符合人類文明、互聯網未來發展趨勢的,只有視頻搜索。

當前,伴隨5G、大數據、雲計算、物聯網、人工智能等技術的飛躍,人類文明記載方式,正從圖文到視頻演變——儘管以圖文為媒介的內容,在短時間內依然還會是主體,但在感官、現場、個性化、直觀等全面碾壓圖文內容的視頻,早在各領域井噴。

CNNIC數據就顯示,截至2020年12月,我國網絡視頻用户規模達9.27億,較2020年3月增長7633萬,佔網民整體的93.7%。其中短視頻用户規模為8.73億,較2020年3月增長1.00億,佔網民整體的88.3%。視頻化表達將成為接下來內容領域的重要方向,這一點早在業內達成共識。

視頻需求的井噴,一方面意味着視頻的形式,可以降低專業內容的受眾門檻,吸引更多大眾用户;而另一方面,意味着用户對答案直觀、有效信息的搜索追求、體驗需求與日俱增,這同樣是一場不輸於短視頻崛起的變革。

視頻搜索有着和短視頻技術融合的天然性。論是國外的YouTube,還是國內的抖音,都早已經搭建好了基礎的搜索架構,能通過對算法的提高,和搜索引擎技術相融合,去改善搜索質量和搜索體驗——抖音崛起過程中,備受推崇的核心技術正是基於智能推薦引擎。

從技術角度而言,以用户興趣推薦驅動搜索,其結果會更加個性化、精準化。這意味着,在進行視頻搜索時,搜索結果相比圖文搜索的內容豐富度、匹配準確度有了相當大提升(這也是搜索的兩大核心需求重點),用户體驗會更好。這也是視頻搜索,與傳統搜索最大的區別。

比如,在抖音搜索“紅燒肉”,縱向信息流裏是推薦與“紅燒肉”相關的熱門視頻和頭部主播視頻,“紅燒肉”的話題入口等。橫軸上則提供“視頻”、“直播”和“商品”等一些細分入口。

搜索引擎30年,視頻搜索在崛起

這就是視頻搜索的最大好處,不用高度抽象的文字、不用靜態的圖片,通過短短几分鐘直觀視頻,一種接近於人和人之間的真實溝通交流,照葫蘆畫瓢就能燒出一份紅燒肉。從創作者角度來説,這樣的搜索算法,也降低了內容競爭門檻,提高內容曝光,增加粉絲黏性。

某種程度上,這正是YouTube成為全球最大短視頻平台的同時,也早在2008年就成為全球第二大搜索引擎的關鍵原因——注意,YouTube的基礎設施,是搜索引擎而不是社區。

抖音也是同樣如此。2018年5月,抖音上線了第一個搜索入口,不到三年的時間,抖音視頻搜索的月活就達到5.5億。這個數字,甚至超過百度APP在2020年9月份的月活數據5.44億。

對抖音來説,視頻搜索能在三年內時間裏就達到5.5億日活,與推薦形成互補,其空間可以想象。由此可以理解,為何視頻搜索會成為抖音在2021年,甚至更長未來大力發展的重要戰略級動作。

和通用搜索全網檢索結果不同,視頻搜索難度顯然更大。比如,內容豐富度的前提,是平台自身儲備有內容池,才能快速找出並推薦用户想要的內容。而匹配精準度,則依賴於平台對更豐富視頻內容的理解。

事實上,無論是YouTube,還是抖音,目前距離終極形態的“視頻檢索”,也就是視頻語義層面的多模態檢索,都還有一段距離——目前的視頻搜索,仍比較依賴文本檢索,通過關鍵詞匹配視頻的標題、介紹、關鍵詞、以及字幕信息(OCR),得到答案。

搜索引擎30年,視頻搜索在崛起

字節跳動CEO張楠承認:“把視頻搜索做好很難。”但她仍對視頻搜索寄予厚望。張楠表示,如果抖音希望成為人類文明的視頻版百科全書,那視頻搜索就將是這部書的索引,是尋找答案,收穫新知的入口。

現階段看,作為一種全新搜索方式,視頻搜索目前與圖文搜索仍是互為補充階段,無論是今日頭條發力搜索,還是微信對話框全量上線搜一搜功能,可以看出通用搜索仍是當前搜索領域競爭重點。

但在不久的未來,伴隨文明信息載體的演變,視頻和圖文需求的此消彼長,視頻搜索趨勢同樣無法逆轉,註定會成為更多互聯網巨頭又一個爭奪的戰場——到那時,視頻搜索,也就會凸顯出它的更大價值所在。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 5898 字。

轉載請註明: 搜索引擎30年,視頻搜索在崛起 - 楠木軒