本文轉自【光明網】;
過去幾十年,數據的總量完成了史無前例的增長。根據國際數據公司IDC預測,全球數據總量預計2020年達到44ZB(1ZB="1"萬億GB),中國數據量將達到8060EB,佔全球數據總量的18%。中國已經正式進入了一個“數據密集型”的時代,越來越多的數據資源在大量的領域變得可用。
而隨着疫情的影響和全球經濟面臨的衰退,以數字經濟為代表的新經濟在今年成為了中國經濟高質量發展的新動力。在疫情期間,遠程協同辦公、在線教育、在線招聘等眾多線上應用迅速普及,並逐漸滲透到了人們生產和生活方式之中,不可避免地加大了企業各個方面對於數據處理的需求。同樣,由人工智能等新興技術發展帶來的技術變革,也讓企業對數據的處理的能力不斷升級。
這些外界因素無疑是一劑“強心針”,加重了傳統產業及企業推進數字化轉型的迫切程度。隨着“加強新型基礎設施建設”和“加快培育數據要素市場”成為被相關政策及社會各界頻繁提到的關鍵熱詞,如何通過打造世界一流的數據科學團隊,促使企業更好地挖掘數據要素的價值,加速實現數字化轉型已成為業界探索的焦點。不可否認,在新形勢下各行各業對數據人才的技能需求、數據科學團隊所承擔的職能,以及需要應對的風險挑戰都提出了全新的要求。
數據團隊人才多元化、技能需求專業化
“數據科學家”真正成為一個職業還是比較近期的事,於2008年由時任LinkedIn數據產品團隊負責人的DJ Patil,和在Facebook任職的Jeff Hammerbacher第一次成立數據科學團隊,數據科學家才真正地作為職業開始起步,逐漸成為“21世紀最性感的職業”。在早期的時候,在數據領域工作的人都是“萬能手”,身兼多個任務,除了數據分析外,還包括建立基礎設施、研發數據儲存方式、編寫算法等等。但隨着數據量越來越大,需要處理的數據越來越多,數據科學在很多公司已經成為了不可或缺的團隊。據領英《2020年新興工作報告》顯示,過去5年招聘需求增速最快的職業中,數據科學家位列第三。
LinkedIn(領英)全球數據科學負責人許亞表示,“近兩年來,領英的數據科學團隊已經擴張了一倍,從150人增加到了300多人。隨着人數的擴張和需求的複雜性,數據科學團隊的人才構成更加走向多元化,對於不同領域人才技能的需求也趨於‘工程化’和‘專業化’。”
例如在領英的數據科學團隊,人才會主要涉及三個不同的領域併發揮專業技能:專注於構建數據管道、數據流等基礎設施的工程專家;負責進行A/B 測試、預測、打造差分隱私等算法模型的算法專家;以及有很強的業務屬性,將數據見解和公司戰略結合起來的業務專家。這三個專業領域的人才擁有不同的發展方向,但都在團隊裏都擁有舉足輕重的地位。在中國,領英同樣有一支精良的數據科學團隊,作為中國市場的專家,藉助全球的數據資源和工具,幫助領英中國更好地服務本地市場。
數據團隊參與更多決策過程,在企業內部最大化數據價值
許亞認為,數據驅動的企業文化已經得到廣泛的重視,在企業內部越來越多的決策過程開始引入數據分析的重要角色。如何在企業內部最大化數據的價值,也因此成為數據科學團隊的使命和重要職責。以領英為例,數據科學團隊將數據的價值注入到了公司的方方面面:
首先,秉承“用户第一”的價值原則,每一個產品細節都由數據充分證實。數據團隊跟產品團隊始終進行緊密的“嵌入式”合作,用數據來推動產品的每個細節的優化,吸引新的用户,提升用户體驗。根據許亞介紹,領英的每一個產品功能的設計和改進都會嚴格地進行A/B 測試。不管是看得到或看不到的地方,比如搜索欄、搜索算法、導航欄,甚至是整個APP的字號和字體,領英都是用實驗去衡量,用數據來決定產品的走向,以便提供最好的用户體驗。
除了產品,領英還會用數據科學去優化公司基礎設施的運行和維護。比如領英每年投資數百萬在數據儲存空間等硬件設施上面,怎樣充分利用這些硬件設施是一個複雜且意義深遠的問題。領英的數據科學團隊會通過數據分析和算法去衡量工程架構的建設是否有效率,更好地做時間規劃,讓硬件和GPU發揮更大的價值,有助於提升公司整體的效率。
第三,通過數據幫助企業明確戰略方向,比如在哪個方面去投資,或者決定下一步的產品或者市場意向。由於不同的數據科學家會有不同的側重方向,比如產品、市場,或者工程,因此衡量他們的工作成果的重要標準就是決策覆蓋率和直接商業影響,看他們如何賦能企業的商業決策和成果,對淨利潤造成影響,這樣也能夠更好地定位數據團隊在公司的位置,推動問題解決的流程。
第四,以數字化的方式來展現全球經濟,幫助勞動力市場中的每個人連接機會。領英“經濟圖譜”基於全球6.9億用户、5000萬家企業以及3.6萬個技能,並運用數據科學把這些數據轉化為有價值的洞察,實時展現全球勞動力市場的變化趨勢,賦能政府機構和組織,幫助他們更好地制定相應的人才發展計劃。
應對全新的挑戰:保證公平和用户隱私安全
當數據科學團隊通過技術手段和基礎設施從數據中挖掘出更多的價值,與此同時也必須面對隨之而來的全新挑戰與風險。
一是公平性。公平很難有一個準確的定義,但領英的願景是為全球勞動市場裏的每一位創造經濟機會,希望有着同樣才能的兩個人應該獲得相等的機會。為了實現這一點,領英在開發產品和功能的時候會確保產品對於每個人都是平等的,為所有求職者打造公平的環境,使招聘人員使用產品去做人才搜索、或者求職者找工作的時候,避免產生無意識偏見。
許亞認為,“促進公平的重點不僅僅在於算法,而在於產品設計的方方面面。”為此領英開展了一個稱為“Project Every Member”的項目,這個項目能讓數據科學家們藉助A/B 測試和算法來準確地評估和優化每一個新產品,從而縮小人脈差距,確保每個人都能夠獲得公平地去發現和連接機會。領英也在近期開源了Project Every Member裏有關Apache Spark的一段代碼,從而幫助更多公司準確地衡量產品帶來的影響,打造更加富有公平性的產品。
二是數據隱私安全。過去十年有大量的研究表明,很多公司在發佈數據的時候,都對數據進行了模糊處理,但實際上這樣遠遠不足以抵禦一些針對公司數據的攻擊,用户的個人信息依然被泄露了出來。
面臨這樣的問題,企業首先要做到為用户的數據隱私保駕護航,獲得用户的信任,才能更好地實現願景和使命。許亞介紹,領英在隱私保護技術上做了很大的投資,通過被認為是數據隱私保護的黃金法則——差分隱私,從而確保用户能夠安全、自由地使用平台,不管是內部員工調用數據,還是企業向外部分享數據的時候,都可以避免個人的數據隱私被泄露。
毋庸置疑,目前全球經濟復甦充滿了極大的不確定性,帶來的影響正在重塑全球格局,引發新一輪的數字化變革,為中國經濟發展帶來的前所未有的發展機遇。許亞表示,領英的願景是為全球勞動力市場中的每一位創造經濟機會,面對行業發展和勞動力市場的一系列新常態,領英將充分發揮數據的優勢,提供更精準的數據洞察和產品服務,幫助更多企業和個人在數字經濟、新基建引領的全新科技革命中,與更加高質量的經濟發展機會相連接。(王新)