7月29日,永不落幕的數博會2020系列活動之“數博對話:賦能實體經濟,推動產業創新——大數據與實體經濟融合發展”活動在貴州銅仁舉行,中國工程院院士譚建榮通過網絡連線,在題為《大數據思維與新基建發展:關鍵技術與發展趨勢》的演講中説,大數據的應用將對人工智能等其他技術有很大推動。
中國工程院院士譚建榮,來自浙江大學,最近主要從事數據建模等方面的研究。
新基建跟大數據有什麼關係呢?
譚建榮説,新基建跟老基建不一樣,老基建投入主要是土木工程、基本建設、高速公路等等,新基建也包括這些,但主要還是互聯網、大數據、人工智能、5G這些基本工程。
大數據和互聯網到底是什麼關係呢?
譚建榮説,大數據是從哪裏來的呢?前面的領導説,貴州、銅仁的大數據搞得非常好。“大數據”實際上不是個新詞,40年前有個叫阿爾文○托夫勒的人,美國華盛頓大學教授,在40年前寫了本書叫《第三次浪潮》,把人類整個發展歷史分為三個階段,第一階段的浪潮是農業階段,大概在一萬年前開始;第二階段是工業階段,是從14世紀末開始;而現在正處於第三階段,就是信息發展階段。40年前,阿爾文○托夫勒就預見到,互聯網是一個的舞台,唱戲的主角是大數據,大數據奏響第三次浪潮的華彩樂章。
譚建榮説,從1980年托夫勒提出大數據概念以來, 2006年,提出了人腦模仿機制的深度學習的概念。人工智能其實在60年前就誕生了,但是相當長時期人工智能發展緩慢。最近人工智能,比如阿爾法狗(下圍棋的機器人),就是利用了深度學習的概念。2008年維克托·邁爾—舍恩伯格等最早洞見大數據時代發展趨勢,出版了《大數據時代》。2008年Nature出版了大數據專刊,分析了大數據對科學的影響和意義,探討了大數據研究與應用的方向。2011年,Science推出《數據處理》專刊,從互聯網技術、超級計算、環境科學、生物醫藥等方面介紹了海量數據所帶來的技術挑戰。2013年,DeepMind將深度學習和強化學習兩者精髓合二為一,提出了深度增強學習。2016年人工智能與大數據結合,有了阿爾法狗深度學習的概念。
關於大數據的作用,譚建榮説,大數據給社會各行各業帶來了深遠的影響,推動了社會的巨大進步。首先大數據推動了科學技術的創新,包括分佈式存儲與計算、數據挖掘與分析、商業智能。其次大數據推動研究方法的改變,包括科學研究第四範式(數據密集型科學)、大數據協同創新、抽樣調研變為網絡海量行為分析。大數據提供了第四種範式,就是用數據來尋找科學路徑,通過數據挖掘、數據優化、數據應用來找到科學的路徑。這次新冠病毒防疫過程中,大數據的方法起了很大的作用。在杭州,阿里巴巴、支付寶率先提出了健康碼,利用大數據來判斷你是不是個危險的病人,你是不是來自危險的地區、危險的區域,健康碼迅速推向了全國,現在全國各地健康碼是我們重要的一個推斷依據。而大數據最重要的革命性的變革,是推動了思維方式的變革,這非常重要,我們由過去的業務驅動轉向現在的數據驅動,用大數據的方法來決策,而不是領導拍腦袋來決策,利用數據來支撐我們的決策。從經濟上看,數據就是最寶貴的資源,也有人説數據資源的價值超過實用的價值,所以數據驅動的決策使得我們整個思維方式起了深刻的變化。
什麼是大數據思維?
譚建榮説,第一,大數據資源是重要戰略資源。大數據能夠提供豐富的戰略資源,數據就代表了資源,大數據代表了資源的豐富,大數據思維就表明我們哪些是優勢、哪些不足,能夠找出自己的短板,能夠找到前進的動力。
第二,大數據是各類客觀規律反映。數據反映的規律是客觀規律。我們現在要用市場進行資源配置,市場如何反映出來,就要通過數據。市場的變化、工程技術的發展、人民生活的改善都要通過數據來反映。我們現在的目標是要實現小康社會,滿足人民不斷實現美好生活的追求。人民美好生活怎麼樣反映出來,就通過大數據反映。現在各地領導對GDP增長、税收增長、財政收入增長非常關注,但是我們更加要關注人民美好生活的增長,因為所有的努力、所有的GDP、所有的財政收入、所有的税收,最後集中反映在人民生活的改善、人民對美好生活的追求。
第三,大數據是創新轉型主要依據。現在實體經濟需要轉型升級,我們需要提供更多的創新產品、創新技術、創新實體。很多企業也很困惑,改革開放以來,我們國家也得到了長足發展,為人民生活提供了大量產品。但是最近幾年,由於國內外環境的變化,我們製造企業、實體企業相當一部分處於比較困難的階段,很多企業渴望轉型升級,但轉向哪裏、升向何方?我們就從大數據裏找方向,大數據來尋找市場機遇、尋找創新依據。
有人問,數據前面為什麼要加“大”字?很多人都回答不出來。“小數據”是不是可以?有時候也可以,有確定關係的“小數據”就可以。為什麼要“大數據”呢?主要是在數據裏面,尤其在統計學裏面有個“大數據”。隨着統計樣本趨向於無窮大,樣本的均值就等於平均數。所以大數據強調的是關聯關係。我們前面説人工智能自1956年提出以後相當長時間發展緩慢,為什麼這幾年發展很快呢,可以説是大數據挽救了人工智能。過去專家系統強調的是因果關係,這是比較困難的,體現在計算機的統計上。過去三十年以前,我學習人工智能用的語言,需要用幾千、幾萬句才能編好一個程序,這非常困難。現在的大數據在新的關聯中找出必然的關係,從整體的觀念、大局的觀念來看問題,來把握問題的癥結,這是大局觀。大數據強調了數據協同、數據匹配,要求協同觀。數據挖掘、數據聚合,最後要聚焦到某幾個結論上,這就要求我們聚集觀。大局觀、協同觀、聚集觀的三個思維方式,成了大數據思維的主要特點。
大數據跟新基建有什麼關係?
譚建榮説,目前,由於國內外的經濟環境發生了深刻變化,特別是今年以來新冠病毒疫情的發生,目前中國控制得比較好,可以説基本控制住了,儘管北京新發地、新疆、大連還有偶發的病例,我們還要嚴防死守,但整體上國內大部分地區人民的活動已經擺脱了新冠疫情的困擾,我們的國家採取了正確的防護,但國際疫情環境還在惡化和蔓延。浙江主要是外向型經濟,今年上半年GDP總增長是0.5%,這是非常不容易的,先是新冠病毒影響,後來又是外向型經濟影響,所以浙江現在大的環境需求和生產、投資、消費、出口都受到了影響,我們現在需要復工復產,現在對餐飲、旅遊、電影、教育、教育培訓等都受到了一定程度的衝擊,民營企業、小微企業等等都非常的困難。
譚建榮説,現在搞新基建,我認為在我們國家這樣的背景下是非常必要也非常重要的。新基建的主要內容包括5G新一代通信技術、高速鐵路、城市軌道、新能源等等,這幾個領域以技術創新為驅動,以信息網絡為基礎,達到融合創新。在新基建的七大領域中,最基礎的是5G和新一代通訊技術,能萬物互聯、賦能未來。5G將成為2020年和今後一段時間我們推廣的重點。看通訊技術的發展,跟科學技術的整個發展是同步的,在八十年代主要是語音通話。移動電話是美國摩托羅拉發明的,當時傳到中國叫大哥大,在深圳推出。傳到內地以後,高校、機關、事業單位的人還不敢用,因為當時有些領導對大哥大有些看法,當時三句話:頭理阿飛頭、腳穿喇叭褲、手拿大哥大,就認為這些人是不三不四的,觀念的變化也非常重要,現在每個人都用手機,已經習以為常了。
2010年喬布斯發明了智能手機,當時支持的網絡實際就是4G。到了2020年,我們要構建智慧城市、智慧工廠,要建立大數據為支撐的智能社會,這就需要5G的支持。5G最受益的技術就是大數據,5G將對大數據產生顛覆性的變化,5G以後數據量急劇上升,會產生質的飛躍。5G通過用户直聯設備,數據量上升非常明顯。5G增強移動寬帶、大規模物聯網、超高可靠低時延通信,這三方面都會使數據量急遽增加,這將對大數據提供了更加廣闊的資源,也對大數據提出了更高的要求。
數據中心的建設將是新基建的一個重要內容,數據中心通過全球網絡基礎設施上傳遞、加速、展示、計算、儲存。大數據中心不僅僅是傳統的數據中心及其承載的分佈式海量數據儲存和處理的能力,更重要的是運用大數據的思想和技術。我們每天產生的數據估計會以10倍數增長,估計會從10GB/天到4TB/天,這就需要挖掘、分類大數據。產業鏈很雜,包括服務器、路由器、交換機、光模塊、電源、網絡、機房等等。
譚建榮還説,大數據的應用將對人工智能等其他技術都有很大的推動。可以運用到工業上,智能IP網絡與工業互聯,工業互聯與精益設計,我的團隊結合工業互聯、智能製造,把大數據技術用到產品實際設計中做了很多工作,包括高檔數控機牀數字化設計的關鍵技術、電梯產品大批量定製與數字化智能化設計技術等等,為提高企業轉型升級提供了科學的基礎。