不知道大家有沒有聽說過“TPC-DS”,這是大資料領域,門檻最高、最權威的競賽,可以理解為大資料界的諾貝爾獎。
TPC-DS的冠軍頭銜,一直以來都是全球網際網路巨頭企業追求的目標。去年,阿里巴巴開源大資料技術團隊“阿里雲EMR團隊”首次打破該競賽紀錄,成為全球首個透過TPC認證的公共雲產品。
4月26日,TPC-DS公佈了今年的結果。阿里雲EMR團隊在去年的基礎上,將EMR的計算速度提高了2.2倍,重新整理自身紀錄,再次奪冠。
連續兩年打破了大資料領域最難競賽的世界紀錄,如此成就是阿里雲EMR團隊所有人共同努力的結果。但團隊中最閃閃發光的,還要數賈揚清,他是阿里巴巴副總裁,也是集團開源技術委員會負責人。
賈揚清可以說是沒有被埋沒的“仲永”。他在1歲時就喜歡聽故事,識字也早於同齡人,上學後成績更是一路開掛,以686分的高考成績進入了清華大學資訊科技自動化專業。研究生畢業後,賈揚清奔赴加州大學伯克利分校攻讀計算機科學博士。
讀博期間,賈揚清在谷歌研究院實習,擔任Google Brain的研究科學家。還曾在新加坡國立大學,微軟亞洲研究院,美國NEC實驗室實習。
之後,他創立並開源瞭如今業內耳熟能詳的深度學習框架Caffe,被微軟、雅虎、英偉達、Adobe等公司採用。
在業內打出名氣的賈揚清,在2016年,從谷歌順利跳槽到Facebook,擔任研究主任,主攻AI研究和平臺開發,Caffe也成為了Facebook重點部署的專案之一。
2019年,年僅36歲的賈揚清回國,正式加入阿里巴巴核心管理層。賈揚清曾在接受採訪時提及過選擇阿里巴巴的理由,他認為大資料和人工智慧本身就是緊密結合的,也是他本人未來的職業規劃方向,而阿里雲智慧計算平臺事業部是全球少數的幾個把大資料和人工智慧放在一起的部門,對他而言十分具有吸引力。
成為阿里開源技術委員會負責人後,賈揚清所帶領的團隊,獲得了相當驚人的成就。
2019年5月,自主研發的飛天大資料計算平臺MaxCompute,獲浙江省科技進步一等獎。
2019年9月,MaxCompute以100TB的資料規模創造TPCx-BB競賽世界紀錄。MaxCompute成為了全球首個TPCx-BB認證的公共雲產品,也是除Hive、Spark以外,獲TPCx-BB標準支援的第三個大資料引擎。
2019年9月,帶領阿里雲EMR團隊,打破TPC-DS世界紀錄。
2020年4月,帶領阿里雲EMR團隊,突破自我,再次重新整理TPC-DS世界紀錄。