貝爾薩們的人腦VS數據控的電腦,誰更懂球?
電腦再周到縝密的算法,終究還是替代不了人腦。
在現代足壇,所謂大數據的介入早已司空見慣。媒體現在報道比賽,都會援引相關數據圖表,而球迷也已習慣用各式各樣的數據來評判球隊,或某個球員的狀態。事實上,這最新一波的數據浪潮湧入足壇,僅僅是最近不到10年的事情。其結果是在短時間內,幾乎所有頂級聯賽的俱樂部都擁有了數據分析團隊。
而最近幾年興起的足球大數據熱,則跟架構在比賽錄像和基礎數據的傳統分析截然不同。貝爾薩的教練團隊雖然也會使用電腦,但那終究是助教在數據採樣的同時進行對比和統計的工具,最終決定分析算法和給出結論報告的仍是人腦。而新派的數據團隊,則不僅依靠更加海量的數據,更為重要的是各自的內部建模和算法,在這個過程中,作出分析和演算以至於最終生成報告的,相當程度上由電腦負責。
跟足球相比,棒球和籃球更早進入了“大數據”戰術時代,而足球領域的大數據革命過程也很有意思,“競技網”發現,不少現在供職於職業足球俱樂部,或是成為球隊諮詢公司的數據團隊,最初都在推特或“數據分析論壇”裏以類似自媒體的面目被外界所知曉。他們中的不少人在隨後都成立了自己的數據公司,除了跟球隊合作,也在媒體上普及數據分析的作用。經過最近10年的浸淫發展,從俱樂部高管,到球隊主帥,以至媒體和球迷,都開始對新派的數據分析愈發看重。
這些新派數據分析師的教育背景和傳統助教截然不同,他們很多擁有諸如經濟學、運動科學、哲學或跨領域方面的高等學位,甚至掛着博士頭銜的數據分析師也並不算罕見。因此他們不會像貝爾薩的教練組那樣事無鉅細地下“笨功夫”,而是通過自己設計的內部建模運算,自動生成更具分析價值的“比賽樣本”。
雖然這種大數據的分析在足壇已成為潮流,還是有媒體在質疑大數據對提升球隊表現的實際作用。它們被認為仍只是供主帥參考的一份數據報告,很多主教練並不會在備戰中完全倚重這種由建模和算法生成的報告,但這些現代的數據分析師仍認為,自己的角色不可或缺:“有時比分會掩蓋一方的場上表現,即便是‘預期進球數’這樣現在流行的加權數據也不能對場上局勢做客觀反映。而我們則會更多審視一支球隊在比賽中如何推進進攻,並分析他們進攻套路的成功率能達到多少。”
在新數據熱潮興起的同時,類似“體育總監”的管理職位也在各聯賽開始普及。新數據團隊在俱樂部扮演怎樣的角色,一定程度上取決於總監。如果這位總監是“數據控”,在轉會操作中更關注目標球員的體能和技戰術數據,那麼俱樂部的數據團隊便將順理成章地在球隊構建中扮演更重要角色。而如果以總監為首的管理層更信任那些已成名球星,認為他們的經驗和創造力更能起到數據分析難以估量的貢獻,那麼數據團隊就多半隻在球隊競技團隊有需要時出具報告,以備諮詢。
查查數據你就懂球了?還能指揮比賽了?你被騙慘了!
英格蘭著名足球記者喬納森·威爾遜曾在著作中抱怨,英格蘭媒體對足球戰術缺乏鑽研精神。這一現象在最近10年明顯得到了大幅改善,報道英超的媒體正空前注重各種數據圖表,球迷似乎也覺得在大數據的加持下,這項運動正變得更加容易理解。
所謂的“預期進球數(expected goals,被簡稱為xG)”是通過加權算法,對一支球隊射門數據的重新調整,以更加客觀地反映球隊的進攻質量和有威脅射門的數量。它降低了那些聊勝於無的脱靶遠射的權重,同時對那些命中目標的有威脅射門,則視情況不同,相應加強了權重。不過即便如此,你還是會通過跟不同數據的對比,得出並不太一致的結論。
這種數據之間的矛盾,體現了數據和現實之間關聯的不確定性,以及數據本身的侷限性。阿森納這3項在聯賽排名反差極大的數據,再加上具體的比賽錄像,揭示出的事實是,該隊進攻質量並不見得差,但發動進攻時過分謹慎小心,導致射門次數低下。當這些數據獨立被拿出來,人們往往會忽略其中的隱情。
有的教練便對這種唯數據論的執教方法進行反省,“每當球員在場上碰到一些備戰並未提到的突發事故時,就立刻集體失去了自己在場上便宜行事的能力,反而都在原地等待着我的重新部署。”每個主帥都會在這個時候感慨,電腦再周到縝密的算法,終究還是替代不了人腦。
文|劉川
編輯|肥貓