楠木軒

掌握數據就能通曉未來:數據科學家何以成為公司的預言家?

由 端木泰華 發佈於 科技

全文共1858字,預計學習時長6分鐘

圖源:unsplash

我曾和父親有一次關於個人生活和職業規劃的深入交流。

他問我:“你在大學裏學習的專業就業前景怎麼樣?”

那時我正在修讀人工智能的學位,我回答道:“非常好。”

“人工智能究竟是什麼呢?”

我開始用一些簡單的短語來解釋人工智能,提到了機器的學習能力,決策制定能力等。

父親沒有就此打住:“像機器人那樣嗎?”

我回答到:“確實,就是可以學習的機器人。”

“那你以後會和機器人一起工作嗎?”

“嗯……也不完全是吧。”

父親顯然對這個答案感到不滿:“所以呢?”

那時我突然意識到,在父親看來,我對人工智能的定義和我作為數據科學家的工作內容沒有太大關係。突然我靈光乍現:“我會成為預言家——不過是從科學的角度預言。”但這個説法反而讓他更加困惑了。

許多年過去了,我一直在所處行業和學界中從事人工智能的諮詢、教學和研發工作。對於數據科學家而言,我長期以來自創的“預言家”頭銜並不全面,因為數據科學家的工作內容不只是預測未來。

然而,從公司的角度出發,將數據科學家稱為預言家並不為過。

提到預言家,很多人腦海裏恐怕都會浮出這樣的畫面:一位祭司(Oracle)面前擺着一個水晶球,他可以通過水晶球預知未來,宣讀神諭。

維基百科告訴我們:“Oracle就是能在神的啓示下對未來進行預測,提供智慧見解以及宣讀神諭的人或者中間場所,是進行占卜和預測的一種形式。”

數據科學家也能像祭司一樣使用神諭,他們的神諭就是數據。數據科學家們極度依賴實驗數據,無論數據源於過去還是現在。他們的最終目標就是制定出能影響未來的決策。

圖源:unsplash

總體來説,人工智能就是由機器展示的智慧,它們會模仿人類的認知能力,比如學習和決策制定。現如今,人工智能延伸至了很多領域,從圖像分析到機器人技術,幾乎沒有一個領域不會用到人工智能。

人工智能能完成很多任務,比如歸類,集羣,預測(迴歸分析),優化,強化學習等,這些最終都會幫助人類和機器做出更好的決定。

機器學習被視作人工智能下分的學科,其聚焦的領域更窄,但也被用於解決現實生活中的問題。同時,在數據科學中,機器學習也被用於分析數據以及預測未來。

數據科學將機器學習和其他學科結合在一起,比如大數據分析、研究分析以及其他領域知識。數據科學中包含了領域知識、計算機編程技巧、數學以及統計學,各大公司也在運用這些數據解決現實問題。

如今,數據科學已經成為了行業中最熱門的求職領域,數據科學家的薪資高於行業平均水平,擁有很高的聲望。通常,該職位最低的學歷要求是碩士。

公司也想僱傭越來越多的數據科學家,因為他們意識到數據科學家能通過機器學習和人工智能來分析數據,並在此基礎上提供一些有洞察力的見解。

圖源:unsplash

乍一聽太棒了,不轉行等什麼呢?但是要成為一名資深的數據科學家卻不是那麼簡單。數據科學家必須要精通很多領域,包括數學、機器學習、計算機編程、數據建模、數據工程、視覺化、模式識別、不確定性建模、數據倉儲、雲計算以及一般都需要掌握的大數據。

數據科學的就業市場波動較大,再加上該行業依賴於現代科技,因此數據科學家需要定期更新自己的知識。此外,數據科學家還要掌握他們公司所處行業的商業領域知識。

在面試這一職位的過程中,求職者們經常會被問到是否掌握了一些最近的新科技。不同領域的要求也完全不同。面試官的問題不僅僅侷限於技術方面,還會涉及到領域知識的相關事項以及概念分析。

圖源 Brian Godsey

許多人會將數據科學和數據完全掛鈎,而數據就意味着收益。現如今,各大公司都急於僱傭數據科學家和人工智能工程師,希望他們能通過分析數據來做出決策。

然而,他們大都忽略了一個重要的問題:數據質量。

人工智能只能從有價值的數據中提煉出有價值的見解。很多公司都擁有數據,但這些數據並不能對決策制定提供幫助,或者這些數據中包含了太多難以捉摸的無用信息。

從某種意義上説,數據科學家確實有“神通廣大”,但想要發揮出來,需要對科學和領域知識有很深的瞭解,專業技能和鑽研能力過硬。

在此基礎上,數據科學家們不僅可以利用公司的數據進行分析並且得出有價值的見解,他們還能幫助公司更好地利用數據,讓公司具備更準確的預測未來的能力。