準備程序員面試?你需要了解這 14 種編程面試模式
在面試程序員崗位時,我們往往需要經歷一個編程面試過程,僱主會藉此考驗面試者的技術實力。然而,這些技術問題有時候卻和我們的實際工作並無太大關係,也由此可能給我們的編程面試準備階段帶來很大的壓力。曾在 Facebook 和微軟工作過的 Educative.io 創始人 Fahim ul Haq 近日發文總結了編程面試所遇到的問題的 14 種最常見的模式,也許能幫你看清各種編程面試問題「背後的真相」。機器之心也在文末補充了我們曾經發布過的另外幾篇有關面試的文章,相信能給即將進入職場的程序員帶來幫助。
對很多開發者來說,編程工作的面試準備很容易讓人焦慮。面試要涉及的東西實在太多,其中很多還往往與開發者的日常工作無關,只會額外增添壓力。
這種現狀導致了一個後果:現在的開發者往往需要花費數周時間在 LeetCode 等網站上了解綜合數百個問題。與我談過的開發者在面試前的一個常見焦慮問題是:我是否已經解決過足夠多的實際問題?我本可以做到更多嗎?
這就是我想要幫助開發者了解每個問題背後的底層模式的原因——這樣他們就不必擔憂解決數百個問題以及被 LeetCode 整得疲憊不堪了。如果你理解面試的通用模式,你就可以將其用作模板,從而解決各種層級的稍有不同的問題。
這裡我將列出最常見的 14 種模式,它們可被用於解決任何編程面試問題。另外我還會說明如何識別每種模式,並會為每種模式提供一些問題示例。這些內容都只是蜻蜓點水——我強烈建議你看看課程《Grokking the Coding Interview: Patterns for Coding Questions》,裡面提供了全面的解釋、示例和編程實踐。
下面的模式說明假設你已經知悉了數據結構。如果你還不了解,可以通過這些課程複習一下數據結構:https://www.educative.io/m/data-structures
我們今天將說明以下 14 種模式:
1.滑動窗口
2.二指針或迭代器
3.快速和慢速指針或迭代器
4.合併區間
5.循環排序
6.原地反轉鏈表
7.樹的寬度優先搜索(Tree BFS)
8.樹的深度優先搜索(Tree DFS)
9.Two Heaps
10.子集
11.經過修改的二叉搜索
12. 前 K 個元素
13. K 路合併
14.拓撲排序
我們開始吧!
1.滑動窗口
滑動窗口模式是用於在給定數組或鏈表的特定窗口大小上執行所需的操作,比如尋找包含所有 1 的最長子數組。從第一個元素開始滑動窗口並逐個元素地向右滑,並根據你所求解的問題調整窗口的長度。在某些情況下窗口大小會保持恆定,在其它情況下窗口大小會增大或減小。
下面是一些你可以用來確定給定問題可能需要滑動窗口的方法:
- 問題的輸入是一種線性數據結構,比如鏈表、數組或字元串
- 你被要求查找最長/最短的子字元串、子數組或所需的值
你可以使用滑動窗口模式處理的常見問題:
- 大小為 K 的子數組的最大和(簡單)
- 帶有 K 個不同字元的最長子字元串(中等)
- 尋找字元相同但排序不一樣的字元串(困難)
2.二指針或迭代器
二指針(Two Pointers)是這樣一種模式:兩個指針以一前一後的模式在數據結構中迭代,直到一個或兩個指針達到某種特定條件。二指針通常在排序數組或鏈表中搜索配對時很有用;比如當你必須將一個數組的每個元素與其它元素做比較時。
二指針是很有用的,因為如果只有一個指針,你必須繼續在數組中循環回來才能找到答案。這種使用單個迭代器進行來回在時間和空間複雜度上都很低效——這個概念被稱為「漸進分析(asymptotic analysis)」。儘管使用 1 個指針進行暴力搜索或簡單普通的解決方案也有效果,但這會沿 O(n2) 線得到一些東西。在很多情況中,二指針有助於你尋找有更好空間或運行時間複雜度的解決方案。
用於識別使用二指針的時機的方法:
- 可用於你要處理排序數組(或鏈接列表)並需要查找滿足某些約束的一組元素的問題
- 數組中的元素集是配對、三元組甚至子數組
下面是一些滿足二指針模式的問題:
- 求一個排序數組的平方(簡單)
- 求總和為零的三元組(中等)
- 比較包含回退(backspace)的字元串(中等)
3.快速和慢速指針
快速和慢速指針方法也被稱為 Hare & Tortoise 演算法,該演算法會使用兩個在數組(或序列/鏈表)中以不同速度移動的指針。該方法在處理循環鏈表或數組時非常有用。
通過以不同的速度進行移動(比如在一個循環鏈表中),該演算法證明這兩個指針註定會相遇。只要這兩個指針在同一個循環中,快速指針就會追趕上慢速指針。
如何判別使用快速和慢速模式的時機?
- 處理鏈表或數組中的循環的問題
- 當你需要知道特定元素的位置或鏈表的總長度時
何時應該優先選擇這種方法,而不是上面提到的二指針方法?
- 有些情況不適合使用二指針方法,比如在不能反向移動的單鏈接鏈表中。使用快速和慢速模式的一個案例是當你想要確定一個鏈表是否為迴文(palindrome)時。
下面是一些滿足快速和慢速指針模式的問題:
- 鏈表循環(簡單)
- 迴文鏈表(中等)
- 環形數組中的循環(困難)
4.合併區間
合併區間模式是一種處理重疊區間的有效技術。在很多涉及區間的問題中,你既需要找到重疊的區間,也需要在這些區間重疊時合併它們。該模式的工作方式為:
給定兩個區間(a 和 b),這兩個區間有 6 種不同的互相關聯的方式:
理解並識別這六種情況有助於你求解範圍廣泛的問題,從插入區間到優化區間合併等。
那麼如何確定何時該使用合併區間模式呢?
- 如果你被要求得到一個僅含互斥區間的列表
- 如果你聽到了術語「重疊區間(overlapping intervals)」
合併區間模式的問題:
- 區間交叉(中等)
- 最大 CPU 負載(困難)
5. 循環排序
這一模式描述了一種有趣的方法,處理的是涉及包含給定範圍內數值的數組的問題。循環排序模式一次會在數組上迭代一個數值,如果所迭代的當前數值不在正確的索引處,就將其與其正確索引處的數值交換。你可以嘗試替換其正確索引處的數值,但這會帶來 O(n^2) 的複雜度,這不是最優的,因此要用循環排序模式。
如何識別這種模式?
- 涉及數值在給定範圍內的排序數組的問題
- 如果問題要求你在一個排序/旋轉的數組中找到缺失值/重複值/最小值
循環排序模式的問題:
- 找到缺失值(簡單)
- 找到最小的缺失的正數值(中等)
6.原地反轉鏈表
在很多問題中,你可能會被要求反轉一個鏈表中一組節點之間的鏈接。通常而言,你需要原地完成這一任務,即使用已有的節點對象且不佔用額外的內存。這就是這個模式的用武之地。該模式會從一個指向鏈表頭的變數(current)開始一次反轉一個節點,然後一個變數(previous)將指向已經處理過的前一個節點。以鎖步的方式,在移動到下一個節點之前將其指向前一個節點,可實現對當前節點的反轉。另外,也將更新變數「previous」,使其總是指向已經處理過的前一個節點。
如何識別使用該模式的時機:
- 如果你被要求在不使用額外內存的前提下反轉一個鏈表
原地反轉鏈表模式的問題:
- 反轉一個子列表(中等)
- 反轉每個 K 個元素的子列表(中等)
7.樹的寬度優先搜索(Tree BFS)
該模式基於寬度優先搜索(BFS)技術,可遍歷一個樹並使用一個隊列來跟蹤一個層級的所有節點,之後再跳轉到下一個層級。任何涉及到以逐層級方式遍歷樹的問題都可以使用這種方法有效解決。
Tree BFS 模式的工作方式是:將根節點推至隊列,然後連續迭代知道隊列為空。在每次迭代中,我們移除隊列頭部的節點並「訪問」該節點。在移除了隊列中的每個節點之後,我們還將其所有子節點插入到隊列中。
如何識別 Tree BFS 模式:
- 如果你被要求以逐層級方式遍歷(或按層級順序遍歷)一個樹
Tree BFS 模式的問題:
- 二叉樹層級順序遍歷(簡單)
- 之字型遍歷(Zigzag Traversal)(中等)
8.樹的深度優先搜索(Tree DFS)
Tree DFS 是基於深度優先搜索(DFS)技術來遍歷樹。
你可以使用遞歸(或該迭代方法的技術棧)來在遍歷期間保持對所有之前的(父)節點的跟蹤。
Tree DFS 模式的工作方式是從樹的根部開始,如果這個節點不是一個葉節點,則需要做三件事:
1.決定現在是處理當前的節點(pre-order),或是在處理兩個子節點之間(in-order),還是在處理兩個子節點之後(post-order)
- 為當前節點的兩個子節點執行兩次遞歸調用以處理它們
如何識別 Tree DFS 模式:
- 如果你被要求用 in-order、pre-order 或 post-order DFS 來遍歷一個樹
- 如果問題需要搜索其中節點更接近葉節點的東西
Tree DFS 模式的問題:
- 路徑數量之和(中等)
- 一個和的所有路徑(中等)
9. Two Heaps
在很多問題中,我們要將給定的一組元素分為兩部分。為了求解這個問題,我們感興趣的是了解一部分的最小元素以及另一部分的最大元素。這一模式是求解這類問題的一種有效方法。該模式要使用兩個堆(heap):一個用於尋找最小元素的 Min Heap 和一個用於尋找最大元素的 Max Heap。該模式的工作方式是:先將前一半的數值存儲到 Max Heap,這是由於你要尋找前一半中的最大數值。然後再將另一半存儲到 Min Heap,因為你要尋找第二半的最小數值。在任何時候,當前數值列表的中間值都可以根據這兩個 heap 的頂部元素計算得到。
識別 Two Heaps 模式的方法:
- 在優先順序隊列、調度等場景中有用
- 如果問題說你需要找到一個集合的最小/最大/中間元素
- 有時候可用於具有二叉樹數據結構的問題
Two Heaps 模式的問題:
- 查找一個數值流的中間值(中等)
10. 子集
很多編程面試問題都涉及到處理給定元素集合的排列和組合。子集(Subsets)模式描述了一種用於有效處理所有這些問題的寬度優先搜索(BFS)方法。
該模式看起來是這樣:
給定一個集合 [1, 5, 3]
1. 從一個空集開始:[[]]
2.向所有已有子集添加第一個數 (1),從而創造新的子集:[[], [1]]
3.向所有已有子集添加第二個數 (5):[[], [1], [5], [1,5]]
4.向所有已有子集添加第三個數 (3):[[], [1], [5], [1,5], [3], [1,3], [5,3], [1,5,3]]
下面是這種子集模式的一種視覺表示:
如何識別子集模式:
- 你需要找到給定集合的組合或排列的問題
子集模式的問題:
- 帶有重複項的子集(簡單)
- 通過改變大小寫的字元串排列(中等)
11. 經過修改的二叉搜索
只要給定了排序數組、鏈表或矩陣,並要求尋找一個特定元素,你可以使用的最佳演算法就是二叉搜索。這一模式描述了一種用於處理所有涉及二叉搜索的問題的有效方法。
對於一個升序的集合,該模式看起來是這樣的:
1.首先,找到起點和終點的中間位置。尋找中間位置的一種簡單方法是:middle = (start + end) / 2。但這很有可能造成整數溢出,所以推薦你這樣表示中間位置:middle = start + (end?—?start) / 2。
2.如果鍵值(key)等於中間索引處的值,那麼返回這個中間位置。
3.如果鍵值不等於中間索引處的值:
4.檢查 key < arr[middle] 是否成立。如果成立,將搜索約簡到 end = middle?—?1 5.檢查 key > arr[middle] 是否成立。如果成立,將搜索約簡到 end = middle + 1
下面給出了這種經過修改的二叉搜索模式的視覺表示:
經過修改的二叉搜索模式的問題:
- 與順序無關的二叉搜索(簡單)
- 在經過排序的無限數組中搜索(中等)
12. 前 K 個元素
任何要求我們找到一個給定集合中前面的/最小的/最常出現的 K 的元素的問題都在這一模式的範圍內。
跟蹤 K 個元素的最佳的數據結構是 Heap。這一模式會使用 Heap 來求解多個一次性處理一個給定元素集中 K 個元素的問題。該模式是這樣工作的:
1. 根據問題的不同,將 K 個元素插入到 min-heap 或 max-heap 中
2.迭代處理剩餘的數,如果你找到一個比 heap 中數更大的數,那麼就移除那個數並插入這個更大的數
這裡無需排序演算法,因為 heap 將為你跟蹤這些元素。
如何識別前 K 個元素模式:
- 如果你被要求尋找一個給定集合中前面的/最小的/最常出現的 K 的元素
- 如果你被要求對一個數值進行排序以找到一個確定元素
前 K 個元素模式的問題:
- 前面的 K 個數(簡單)
- 最常出現的 K 個數(中等)
13. K 路合併
K 路合併能幫助你求解涉及一組經過排序的數組的問題。
當你被給出了 K 個經過排序的數組時,你可以使用 Heap 來有效地執行所有數組的所有元素的排序遍歷。你可以將每個數組的最小元素推送至 Min Heap 以獲得整體最小值。在獲得了整體最小值後,將來自同一個數組的下一個元素推送至 heap。然後,重複這一過程以得到所有元素的排序遍歷結果。
該模式看起來像這樣:
1.將每個數組的第一個元素插入 Min Heap
2.之後,從該 Heap 取出最小(頂部的)元素,將其加入到合併的列表。
3.在從 Heap 移除了最小的元素之後,將同一列表的下一個元素插入該 Heap
4.重複步驟 2 和 3,以排序的順序填充合併的列表
如何識別 K 路合併模式:
- 具有排序數組、列表或矩陣的問題
- 如果問題要求你合併排序的列表,找到一個排序列表中的最小元素
K 路合併模式的問題:
- 合併 K 個排序的列表(中等)
- 找到和最大的 K 個配對(困難)
14. 拓撲排序
拓撲排序可用於尋找互相依賴的元素的線性順序。比如,如果事件 B 依賴於事件 A,那麼 A 在拓撲排序時位於 B 之前。
這個模式定義了一種簡單方法來理解執行一組元素的拓撲排序的技術。
該模式看起來是這樣的:
1.初始化。a)使用 HashMap 將圖(graph)存儲到鄰接的列表中;b)為了查找所有源,使用 HashMap 記錄 in-degree 的數量
2.構建圖並找到所有頂點的 in-degree。a)根據輸入構建圖並填充 in-degree HashMap
3.尋找所有的源。a)所有 in-degree 為 0 的頂點都是源,並會被存入一個隊列
4.排序。a)對於每個源,執行以下操作:i)將其加入到排序的列表;ii)根據圖獲取其所有子節點;iii)將每個子節點的 in-degree 減少 1;iv)如果一個子節點的 in-degree 變為 0,將其加入到源隊列。b)重複 (a),直到源隊列為空。
如何識別拓撲排序模式:
- 處理無向有環圖的問題
- 如果你被要求以排序順序更新所有對象
- 如果你有一類遵循特定順序的對象
拓撲排序模式的問題:
- 任務調度(中等)
- 一個樹的最小高度
接下來?
在 LeetCode 上殫精竭慮?學習過這 14 種模式之後,你能對各種問題的解決方案有一個更全面的認知。
如果你有興趣更深入地了解以上模式或各個模式下的示例,可以去看看課程《Grokking the Coding Interview: Patterns for Coding Questions》:https://www.educative.io/collection/5668639101419520/5671464854355968。這是 Grokking 面試系列的最新課程,已被兩萬多名學習者用於尋找頂級科技公司的工作崗位。
我能給出的最高推薦語是:我真希望我曾經在準備編程面試時就有這個課程。
※手機搖一搖測體積,2019菜鳥全球科技挑戰賽助力智能物流
※GLUE基準新突破:微軟多任務模型首次超越自然語言人類基準
TAG:機器之心 |