楠木軒

貝爾薩們的人腦VS數據控的電腦,誰更懂球?

由 端木泰華 發佈於 體育

電腦再周到縝密的算法,終究還是替代不了人腦。

在現代足壇,所謂大數據的介入早已司空見慣。媒體現在報道比賽,都會援引相關數據圖表,而球迷也已習慣用各式各樣的數據來評判球隊,或某個球員的狀態。事實上,這最新一波的數據浪潮湧入足壇,僅僅是最近不到10年的事情。其結果是在短時間內,幾乎所有頂級聯賽的俱樂部都擁有了數據分析團隊。

這股浪潮之前,傳統足球領域同樣也有數據分析,不過主要依賴於比賽錄像,還有射門、犯規以及角球數等基礎數據。現在也仍有主帥堅持這一套傳統方法。比如利茲聯主帥貝爾薩,他在2018-19賽季因為“間諜門”和當時在德比郡執教的少帥蘭帕德鬧翻,媒體從雙方爭吵中得知,這位阿根廷老帥的團隊賽前研究了德比郡整整51場比賽,每個助教平均要花4小時在其中每場比賽的統計和數據分析報告上,這樣在對陣德比郡之前,利茲教練組總共要花費在統計分析上的人工總成本為360小時,而這僅是他們備戰的一場比賽。

而最近幾年興起的足球大數據熱,則跟架構在比賽錄像和基礎數據的傳統分析截然不同。貝爾薩的教練團隊雖然也會使用電腦,但那終究是助教在數據採樣的同時進行對比和統計的工具,最終決定分析算法和給出結論報告的仍是人腦。而新派的數據團隊,則不僅依靠更加海量的數據,更為重要的是各自的內部建模和算法,在這個過程中,作出分析和演算以至於最終生成報告的,相當程度上由電腦負責。

棒球和籃球更早進入了“大數據”戰術時代。

跟足球相比,棒球和籃球更早進入了“大數據”戰術時代,而足球領域的大數據革命過程也很有意思,“競技網”發現,不少現在供職於職業足球俱樂部,或是成為球隊諮詢公司的數據團隊,最初都在推特或“數據分析論壇”裏以類似自媒體的面目被外界所知曉。他們中的不少人在隨後都成立了自己的數據公司,除了跟球隊合作,也在媒體上普及數據分析的作用。經過最近10年的浸淫發展,從俱樂部高管,到球隊主帥,以至媒體和球迷,都開始對新派的數據分析愈發看重。

這些新派數據分析師的教育背景和傳統助教截然不同,他們很多擁有諸如經濟學、運動科學、哲學或跨領域方面的高等學位,甚至掛着博士頭銜的數據分析師也並不算罕見。因此他們不會像貝爾薩的教練組那樣事無鉅細地下“笨功夫”,而是通過自己設計的內部建模運算,自動生成更具分析價值的“比賽樣本”。

貝爾薩團隊備戰一場比賽要調看51場錄像資料,而新派的數據團隊,則在多數情況下只會分析對手最近5個主場,以及5個客場的比賽。而更早的那些比賽則在一定程度上會被捨棄,因為它們要麼太過久遠,參考價值有限;要麼在比賽中能獲得的信息跟最近10場比賽重複,不符合“優質樣本”的標準。

雖然這種大數據的分析在足壇已成為潮流,還是有媒體在質疑大數據對提升球隊表現的實際作用。它們被認為仍只是供主帥參考的一份數據報告,很多主教練並不會在備戰中完全倚重這種由建模和算法生成的報告,但這些現代的數據分析師仍認為,自己的角色不可或缺:“有時比分會掩蓋一方的場上表現,即便是‘預期進球數’這樣現在流行的加權數據也不能對場上局勢做客觀反映。而我們則會更多審視一支球隊在比賽中如何推進進攻,並分析他們進攻套路的成功率能達到多少。”

朗尼克此前就曾在萊比錫紅牛長期擔任體育總監一職。

在新數據熱潮興起的同時,類似“體育總監”的管理職位也在各聯賽開始普及。新數據團隊在俱樂部扮演怎樣的角色,一定程度上取決於總監。如果這位總監是“數據控”,在轉會操作中更關注目標球員的體能和技戰術數據,那麼俱樂部的數據團隊便將順理成章地在球隊構建中扮演更重要角色。而如果以總監為首的管理層更信任那些已成名球星,認為他們的經驗和創造力更能起到數據分析難以估量的貢獻,那麼數據團隊就多半隻在球隊競技團隊有需要時出具報告,以備諮詢。

查查數據你就懂球了?還能指揮比賽了?你被騙慘了!

英格蘭著名足球記者喬納森·威爾遜曾在著作中抱怨,英格蘭媒體對足球戰術缺乏鑽研精神。這一現象在最近10年明顯得到了大幅改善,報道英超的媒體正空前注重各種數據圖表,球迷似乎也覺得在大數據的加持下,這項運動正變得更加容易理解。

和戰術相關的數據圖表,是一種對比賽局勢的直觀表述。這一點正如一些戰術分析師所説,最終比分可能掩蓋了比賽的一部分真相,即便是射門、角球數和控球這樣的基礎數據,現在也無法滿足深度解析的需求,因此類似“預期進球數”這樣的加權數據近年頻繁被媒體引用。

所謂的“預期進球數(expected goals,被簡稱為xG)”是通過加權算法,對一支球隊射門數據的重新調整,以更加客觀地反映球隊的進攻質量和有威脅射門的數量。它降低了那些聊勝於無的脱靶遠射的權重,同時對那些命中目標的有威脅射門,則視情況不同,相應加強了權重。不過即便如此,你還是會通過跟不同數據的對比,得出並不太一致的結論。

以最近4場聯賽僅打進1記點球的阿森納為例,在傳統數據分析他們進攻的問題時,會首先檢視射門數。果然,該隊前8輪聯賽場均射門只有9次,在英超排在倒數第6。不過要是統計“預期進球數”,阿森納的排名則上升到第9位。而如果將預期進球數和射門數這兩項數據進行綜合對比,人們又意外地發現,槍手的進攻效率不僅並沒有想象中那麼低下,球隊平均每次射門的預期進球指數達到了0.12,這在英超居然名列第3,僅次於熱刺和埃弗頓。

這種數據之間的矛盾,體現了數據和現實之間關聯的不確定性,以及數據本身的侷限性。阿森納這3項在聯賽排名反差極大的數據,再加上具體的比賽錄像,揭示出的事實是,該隊進攻質量並不見得差,但發動進攻時過分謹慎小心,導致射門次數低下。當這些數據獨立被拿出來,人們往往會忽略其中的隱情。

對現在這些年輕教練而言,類似的數據統計究竟在執教中佔據什麼樣的位置,則是個複雜的話題。幾乎每名主帥都會在賽後盤點比賽時援引一些數據,但真正迷信這些數據、將其作為臨場指揮依據的,卻少之又少。隨着科技發展,有的教練甚至在半場比賽之內要求數據團隊更新兩次統計簡報,而問題是,一旦現場指揮依賴這些簡報,一場比賽就會被拆解得更加碎片化,一支球隊可能在90分鐘時間裏數度變換陣型。

有的教練便對這種唯數據論的執教方法進行反省,“每當球員在場上碰到一些備戰並未提到的突發事故時,就立刻集體失去了自己在場上便宜行事的能力,反而都在原地等待着我的重新部署。”每個主帥都會在這個時候感慨,電腦再周到縝密的算法,終究還是替代不了人腦。

文|劉川

編輯|肥貓