同樣大學四年,為什麼有些同學畢業就能成為大廠 Offer 收割機,各種 SP、SSP 拿到手軟,有的同學明明在學校寫了好多網站,專案經歷滿滿,經歷春秋招,卻找到一份工作都很難。
不能說後者沒認真學習,或許是用力的方向不對。
話不多說,直接進正題吧。
人類的知識邊界一直在不斷的擴張,俗話說學無止境,這放在計算機領域也同樣適用,計算機本身是一個人造科學,不屬於自然科學。
每年,甚至每個月都不斷有新的程式設計框架推出,學到頭禿你也學不完,也沒有必要去挨個學。
並且你會發現,很多一二線大廠內部用的東西基本都是自己搞一套的,比如服務發現、RPC、KV、DB、訊息佇列、日誌、監控等等。
所以一般這些大廠招聘的時候基本不會因沒學過某種框架而掛你,反正很多東西都是要進來重新學的。
他們會更加關注你的基礎知識、解決問題的經驗以及聰明度這種更加通用的能力上。
反而是一些小公司,可能會要求你必須會 Spring、Vue、Redis... 這些框架或者元件。
上面分別是騰訊、阿里、某外包公司的招聘 JD(job description),顯然,騰訊阿里看重的是紮實的程式設計基本功和快速學習能力,這意味著有培養潛力。
而外包公司就要求你會 xx 資料庫、Spring 之類。不去評價哪個好,但是如果你想去 BAT,那是不是至少對照著它們的 JD 來提高自己的能力,不失為一種捷徑。
在這裡,我粗淺地把計算機程式設計領域的知識分為三個部分:
(1)基礎知識
(2)特定領域知識
(3)框架和開發技能
基礎知識是指不管從事任何方向的軟體工程師都應該掌握的,比如資料結構、演算法、作業系統。
特定領域知識就是你從事某個細分方向時需要掌握的知識,比如做遊戲引擎的需要掌握圖形學;做前端的需要掌握瀏覽器渲染原理、前端三大件;演算法工程師需要更多的數學知識。
畢竟計算機各種門類挺多的,需要選個細分方向專研下去,什麼都學只會什麼都不精(大佬除外啦。
現在大環境比較浮躁,很少有人願意花心思在基礎上,喜歡直接學 Python 搞機器學習、寫秒殺、做商城。
找工作的時候都是想看面經、總結速成。
但是作為優秀的計算機系學生的你怎麼能流於各種程式設計框架(造框架除外),糾結學 SpringBoot 還是 SSH 呢?
把時間花在演算法、基礎學科上他不香嗎?功利一點講,回報反而會更大。
況且在計算機領域,很多基礎的理論並不十分高深,我們努努力就可以掌握其中的核心知識。
1、數學
首先說明,這裡把數學列出來不是為了顯得高階,而是自己吃過數學的虧。
如果你是自學轉行當程式設計師,我當然不會推薦數學,因為轉行的大機率是去學 Java、前端這類,對數學基本沒啥要求。
但是這篇文章主要面向的是還在大學的科班學生,這部分同學以後也許會去做演算法(CV、NLP之類)、遊戲引擎、資訊保安編碼等
這些方向對數學要求就會偏高,在計算機領域,線代、機率論、統計學這些數學分支相對比較重要,計算機本質上還是離散的。
比如在機器學習或資料探勘中常常用線性代數來降低資料維度,很多問題最終都能化為求解線性方程組。
所以為了避免以後想走這些方向卻被數學卡住,在大一、大二上數學課的時候就好好的學一下。
書到用時方恨少,不要現在以為沒用處就不好好學,等你需要的時候,就知道後悔了。(默默流下了不學無術的眼淚┭┮﹏┭┮
什麼?你說以後肯定做開發方向?
那的確可以把數學優先順序放後面一點,用得確實不多,不過上數學課的時候總該認真聽下吧,拿個高績點也是百利無一害嘛。說不準哪天你又想加入演算法內卷大軍呢?
2、C語言
你也許會很疑惑,這裡明明說基礎知識,為什麼要把一門程式語言單獨列出來呢?
因為在我看來,沒有比 C 語言更適合用來理解計算機系統了。
我們後面將會提到的作業系統、體系結構 這些東西非常適合用 C 語言去理解或者去實踐。
並且 C 語言本身的語言特性非常少,但是想學好又是不容易,很多人都覺得 C 語言難,難在哪裡呢?回想了一下我大一時的感受:
簡陋的標準庫,幾乎沒有可用的資料結構和演算法,什麼都得自己來
指標很難理解和使用
需要了解彙編、連結、裝載、記憶體等才能把 C 語言用好
不巧的是,這些東西正是計算機系統知識的一部分,所以用 C 語言作為學習計算機系統知識是最有效率的方式。
真的很難想象用 Java 或是 Python 去給別人講解記憶體,因為這些語言抽象程度都比 C 語言高,意味著離計算機系統也就越遠。
在 TIOBE 程式語言排行榜上,C語言幾乎永遠佔據前三位,其地位自然毋庸置疑。
小編推薦一個學C語言/C++的學習裙【 一零九五 二九三 四九三 】,無論你是大牛還是小白,是想轉行還是想入行都可以來了解一起進步一起學習!裙內有開發工具,很多幹貨和技術資料分享!
TIOBE-2020排行榜
而且幾乎你開發中用到的很多東西都是用C語言編寫的,Linux、Nginx、Redis、MySQL、Git......或許你會想要探究下原理,閱讀點這些開源軟體的原始碼,那麼 C 語言也是你必備的瑞士軍刀。
深入學習 C 語言,能夠了解計算機底層的執行原理,是理解程式執行機制的絕佳語言,無出其右。
在這裡,不得不引用對C語言最經典的總結:
任何比C語言更低階的語言,都不足以完整地抽象一個計算機系統;任何比C高階的語言,都可以用C來實現。
這真是極高而中肯的評價!
所以對於計算機科班來說,不管你是做前端還是後端,演算法還是開發,C 語言都建議你好好學習。這是無關方向的一門語言,就是基礎!
3、作業系統
我們程式設計的 IDE、寫出來的程式全部都需要執行在作業系統上,說作業系統是計算機軟體的基石也不為過。
程式執行起來就需要建立程序,這涉及到作業系統的程序管理;寫程式需要定義變數、儲存資料吧,這又涉及到記憶體,對應記憶體管理;有時候我們還需要讀寫檔案,這又離不開和檔案系統打交道;你需要學習使用鎖、條件變數、臨界區來保證程式併發執行時不會錯亂。
而讀寫檔案、分配記憶體這些又離不開系統呼叫(System call)。
並且當你真正做起工程就會發現,很多問題是和作業系統緊密相關的,不理解作業系統,你連問題的原因都分析不出來。
比如前段時間我們出現的在基於協程(libco)的框架下,使用多執行緒的鎖去做同步互斥偶發死鎖,後來分析才發現原因:
由於協程是應用層實現的,一個執行緒內多個協程對於作業系統是感知不到的:
協程模型
那麼當一個協程 A 上鎖後發起網路 IO 請求,這個時候會被切換到另外一個協程B,而協程 B 又去請求這個鎖。
那麼這個時候作業系統會認為這個鎖已經被上了,因此會將協程 B 對應的執行緒掛起到等待佇列,這樣的話就導致協程 A 永遠無法執行,也就無法釋放鎖,導致死鎖。
解決的方法也很簡單,就是將鎖設定為可重入鎖,可重入意味著同一個執行緒多次去請求同一個鎖不會導致掛起。這樣當協程 B 再去請求鎖的時候,作業系統就會認為協程 B 所在的執行緒已經持有這個鎖了,直接返回,繼續執行。
總之,我們寫程式每時每刻都在和作業系統互動,沒有理由不學好。
4、編譯原理
編譯原理可能是我們平時接觸得最少的了,大家也許會覺得自己又不用去造新的程式語言,學編譯原理幹啥。
學好編譯原理有啥用?
你會站在更高的角度去審視這些程式語言,看到的不再是表面的語法,更會想到語法背後的實現。
這種感覺很透徹,就像搞懂了作業系統、體系結構你會明白一個程式從雙擊滑鼠開始,到底是如何被執行起來的,這種掌握一切細節,透徹的感覺,真的很奇妙,不信你去試試。
說人話!
那學了編譯原理你能幹啥?
當你學完有限狀態機以後,你會發現以前覺得很牛逼正則表示式似乎自己也能用 DFA、NFA 實現一下了。狀態機的思想在程式設計中很多地方都用得上。
比如解析 HTTP 協議,如果沒學過狀態機思想,你可能會一行行的 if/else 去做解析,這裡最麻煩的地方在於,if/else 需要提前將 HTTP 頭部欄位都接收到再來判斷,而我們知道 HTTP 基於 TCP,而 TCP 是流式傳輸,所以你很有可能是幾個字元一組組接收到的,這個時候用 if/else 寫出來就很難看了。
而用狀態機編寫起來程式碼就會非常優雅。狀態的轉移是由規則驅動的,接收到一個字元就判斷一個,非常的方便。
繼續學完語法分析,你會掌握遞迴下降分析這樣非常重要的思想,你可以使用遞迴下降快速的實現四則運算計算器。
如果不用遞迴下降你可能需要先中綴表示式轉字尾,然後求值,這是我們大一資料結構課寫的,當時用棧寫的,有點麻煩。後來學完編譯原理,又用遞迴下降重寫了一遍,區區幾十行程式碼遍搞定。
還有一類場景在實際開發中的用的很多,比如淘寶、京東這樣的電商,它們的營銷規則有很多,比如滿減、直減、跨店等等,這樣的規則是不可能寫死在程式碼裡的。
那是怎麼做的呢?
一般會實現一個配置系統,並設計一個DSL(領域特定語言)來表達這些規則,將規則直接配置到系統中,這樣可以非常方便的修改,那麼如何在程式碼裡去解析 DSL 定義的規則呢?這就需要為 DSL 寫一個語法解析器,這裡就會用到語法分析的方法。
DSL(Domain Specific Language),是一種用於某個特定領域的程式設計語言。這種特定於某個領域是相對於 C、C++、Python 這種通用語言而言的,通用語言可以在各個領域使用,我們熟悉的大多數程式設計語言都是通用語言,它們都是圖靈完備的。
像我們平常經常使用的 JSON、SQL、HTML 這些都算是一種 DSL,你甚至可以嘗試用遞迴下降去寫一個 JSON、XML 解析器,這比寫電商網站更有價值的。
繼續往下學你會了解到抽象語法樹 AST 如何生成、如何轉化為中間程式碼、如何對中間程式碼最佳化、最終又是怎麼生成機器指令的。
你會看到貪心演算法在暫存器分配中的應用,也會看到圖論中的可達性分析又是如何實現死程式碼消除。
IDE上面那個綠色的編譯按鈕對你不再是黑魔法。
為啥點一下就能生成可執行的程式?
你寫的英文字母又是如何變成一個個二進位制指令的?
學完編譯原理,這些通通不是問題,媽媽再也不用擔心你的學習~
當然完成一個像 GCC、Clang 這樣的編譯器難度太高太高,我們學習編譯原理的目的也不是去造這樣的輪子,而是為了更好的理解和運用程式語言。
5、體系結構&組成原理
上面說的都是軟體層面,體系結構則是關於計算機是如何工作的,你會了解到典型的儲存程式計算機是怎樣運轉的。
記得南大有個老師說過 “我們不是學習使用計算機的,而是學習如何造計算機”,雖然造計算機有點誇張,但是至少我們得了解下計算機的實現原理,瞭解下程式碼是怎麼被 CPU 執行的吧?不然其實你會很困惑,明明一堆英文字母,怎麼在 CPU 這種電路上跑起來的,我大一學 C 語言就百思不得其解,直到後來學了組成原理和數字邏輯。
我們說計算機中一切都是 0、1,0、1 又是透過高低電平來表達的,透過與、或、非等邏輯閘電路來表達二進位制的數值運算,再將這些簡單的電路整合在一起,就形成了 ALU 等具有運算能力的處理器。
你會看到一條指令是如何被CPU執行的,CPU 從記憶體或 Cache 中取出指令,放入指令暫存器,並對指令譯碼。譯碼就是按照指令的編碼規則,將指令拆分成一系列的微操作和運算元。然後發出各種裝置控制指令,執行微操作。這樣就完成一條指令的執行。
我們說學完編譯原理,能夠明白寫的英文程式碼是如何被變成二進位制指令的,學完作業系統能搞懂二進位制程式是如何被連結在一起,又是如何被作業系統載入、執行的。而組成原理則會告訴你二進位制指令是如何控制 CPU 跑起來的,我們的作業系統本質上也是一個二進位制的程式。
當你理解了計算機儲存層次結構,理解了多級 Cache,你就會透過最佳化資料訪問方式來編寫出速度更快的程式。
你會學到底層體系結構對 C 這些語言的棧幀和引數傳遞的支援,引數是如何被傳遞給另外一個函式的?函式的返回值又是如何拿到。
這是學習組成原理對於寫程式碼的意義。
學這些到底有什麼意義?
你會完整的看到寫的程式碼如何變成二進位制指令,又是如何去控制各種閘電路,最後變成螢幕上花花綠綠的程式的(當然這裡可能還需要學習顯示器的原理),這就是我們常說的“基礎”和“原理”。
並且計算機體系結構中的很多思想,是能夠廣泛運用於現代軟體開發的,比如 CPU 的多級 Cache 思想,就是我們現在伺服器開發中提高併發度常用的快取技術,包括快取的替換策略等等。
當計算機對你不再是黑盒,你瞭解寫下的程式碼到執行的每一步,而這也將成為你以後的核心競爭力,作為科班畢業生不應該只會使用 Java、Redis、Mysql、Spring 來寫各種網站。
如果讀者裡有半路轉行或者從培訓班出來的,也希望你們能夠抽出空餘時間去補補這些基礎課,這會讓你在程式設計這條路上走的更遠和更穩。
小編推薦一個學C語言/C++的學習裙【 一零九五 二九三 四九三 】,無論你是大牛還是小白,是想轉行還是想入行都可以來了解一起進步一起學習!裙內有開發工具,很多幹貨和技術資料分享!
6、資料結構與演算法
為什麼把演算法放到最後來講,是不重要嗎?相反,它太重要了,所以才讓它來壓軸。
如果要問我大學什麼最後悔?那肯定是沒有從大一就開始好好學演算法,去打 ACM。
現在還在大一、大二的同學還不抓緊機會,別等到以後來後悔。當然,不打 ACM,我們也是能夠學好資料結構和演算法的。
資料結構和演算法你能在任何計算機領域裡看到,比如在編譯原理中暫存器的分配會用到貪心,死程式碼檢測與消除會用到圖論裡不可達的知識;作業系統程序、執行緒排程會用到多級佇列和排程演算法;組成原理中 Cache 的替換會用到 LRU、FIFO 等演算法;開發必備的資料庫也離不開 B+ 樹、LSM 等資料結構和查詢演算法。
很多時候我們需要的演算法都被封裝到程式語言的基礎庫裡了,以至於很多同學會覺得演算法離我們太遠,其實不是的。
如果不學習演算法,連什麼時候用 Map(紅黑樹實現)、什麼時候用 HashMap 都分不清。
所以學習演算法有助於我們根據應用場景選擇最合適的資料結構。
日常開發中也一定離不開演算法,比如小北最近工作中涉及的某種巢狀 TLV(Tag-Length-Value)結構編碼的解析,就需要用到遞迴、多叉樹等知識。如果不學習演算法,那麼程式中只能見到大量的 if/else、while/for。。。
可以說不會演算法的工程師一定不是一個優秀的工程師。
7、為什麼我不說計網、資料庫等
很多人喜歡把計算機網路、資料庫原理這些也歸為計算機基礎來,我當然也認同,因為一個知識結構完整的計算機科班學生,應該瞭解這些知識。
但是我個人是覺得計算機網路、資料庫無非就是建立在作業系統、編譯原理、組成原理之上的應用層軟體。
什麼是資料庫?沒有資料庫之前你會用檔案去儲存資料,但是不方便查詢、修改等,資料庫只是提高了這個過程的效率。
網路幹什麼的?網路就是讓不在同一臺電腦上的程式互相通訊,本質上就是程序間通訊的手段。
如果你只是開發單機工業軟體,甚至真的可以不學網路,只是由於現在大多數程式設計師都是在網際網路公司工作,所以不管前後端,都離不開和HTTP等網路協議打交道。
再次重申:不是計網、資料庫不重要,只是我認為它們屬於構建在作業系統之上的軟體,不劃在基礎之列。
這個我不敢說太多,因為各個領域我也不太懂。只簡單提一點,拋磚引玉罷了。
如果你想去騰訊、網易做遊戲引擎開發,那麼圖形學一定是你繞不開的知識,此外你還得學習渲染管線、著色器、物理、光照等等。
如果你想去 PingCap 這樣的公司做分散式儲存,那麼分散式理論知識一定是你繞不開的關口,包括 CAP 定理、Paxos 演算法、Raft 演算法、ZAB 協議等等。
如果你想寫一個數據庫,那麼你需要去了解磁碟、索引實現、SQL 解析(編譯原理)、實務、如何用 MVCC 解決讀寫衝突等等一大堆的東西,還得了解一大堆程式語言層面的東西,比如鎖、訊號量、併發程式設計技巧,不得不說造資料庫是一個髒活也是一個累活。
更進一步你想去做分散式資料庫,那可能還得去學習資料分片的知識,查詢任務如何做,是集中做,還是將邏輯下推給各個節點,如何實現分散式事務等等。
你說你只想去大廠 CRUD?沒毛病,老鐵!
那你得熟悉一門編譯型語言(C/C++、Java、Go),理解語言部分底層原理,比如 C++ 你得看看 STL、看看物件模型吧,你不懂什麼虛擬函式表、智慧指標還想去騰訊寫 C++? Java 的你得背背 JVM,什麼垃圾回收演算法吧,你不看看ConcurrentHashMap 好意思說你是做Java的?
咱CRUD的物件是資料庫吧?那不得學學怎麼才能把資料庫用好。使用者透過 HTTP 訪問我們的服務,總得了解 HTTP吧?順帶著不看下 TCP 三次握手、四次揮手你好意思說是學計算機的?
使用者把錢、資訊放咱們這,總得保證使用者資料安全吧?那 XSS、SQL 注入、CSRF 這些常見的 Web 攻擊手段你總得了解吧?HTTPS、RSA、簽名、數字證書這些安全手段總得知道吧。
雙十一流量太大,老闆還讓你必須頂住,那你總得了解下快取、非同步、訊息佇列、NoSQL 這些千萬 QPS 必備的大殺器吧?
看看!要想做好CRUD也不是那麼容易滴。
(上面這段只是換一種方式把做後端的同學要學的知識寫出來,不是吐槽更不是調侃,純屬娛樂。
技能
這就很多了,包括 VSCode、Jetbrains 全家桶這些 IDE,文件編寫 Markdown、Git 等版本管理工具。SSH 遠端登入、埠轉發,Ngrok 內網穿透等等這些提高你開發效率的工具,都算是技能,這個沒啥好說的,平時用到多學習多積累就好了。
我只提一點,儘早使用 Linux、類 Unix(Mac)作為主力開發電腦。我大二的時候,就是看了王 ying 的那篇《完全用 Linux 工作》,直接買了個 SSD 套上 U 盤外殼,做了一個啟動盤,後來用了將近一年的 Ubuntu,只有在選課、提交作業等需要用的 IE 瀏覽器的時候才會開啟 Windows(這裡不得不吐槽學校老古董網站!)
當然了,我也不是狂熱的 Linux 愛好者,只是單純覺得做開發的話,離不開各種環境安裝、命令列的使用,這點上面類 Unix 系統帶有天然的優勢,誰用誰知道!
寫完才發現,這篇文章連篇幅都是「基礎 : 領域知識 : 技能」 接近 7 : 2 : 1。
這也是我推薦你在大學期間分配學習時間的比例,至少學習基礎知識的時間不少於 50%,當然,這些東西你都學完了那可以去找找感興趣的方向專研一下。
千萬不要大一、大二一上來就扎進 Java Web、Python 爬蟲這種東西,這些可以學,但不是重點。
這篇文章由於篇幅限制,沒有寫到具體該如何去學,有哪些好的資料,我準備把這個單獨再寫一個 《How 篇》,持續關注我喲~
那麼如何檢驗學得如何呢?
想必你一定聽說這個計網面試題:“從 URL 輸入到頁面展現到底發生什麼?“
這個問題換個表達就是「一個數據包是如何傳送到另外一臺電腦的」。
如果你能完整的說出整個過程,那麼計網你一定是學懂了!這就是為啥面試這麼喜歡問這個問題的原因。
那麼我們依葫蘆畫瓢提一個問題
“從程式碼被寫下到程式執行起來到底發生了什麼?”
這個問題回答得越詳細越好,基本上能說清楚了,你就理解了編譯原理、作業系統、組成原理這三座大三。
這個問題也放在這,後續發文總結,請持續關注程式設計指北哦。
唉,當年要是有這麼個貼心學長告訴我這些,也不至於在 Andorid 開發、Java Web、Python 爬蟲這些玩大半年啊。。。
不過還好後來自己意識到了基礎的重要性,開始學彙編、重學C、搞 mini os、看 Linux 核心實現原理,最後成功的把頭髮掉了一把。。。
最後想送給你一句我挺喜歡的話:
萬丈高樓高樓平地起,勿在浮沙築高臺。