Python 爬蟲面試題 170 道
最近在刷面試題,所以需要看大量的 Python 相關的面試題,從大量的題目中總結了很多的知識,同時也對一些題目進行拓展了,但是在看了網上的大部分面試題都有這幾個問題:
有些部分還是 Python2 的代碼
回答的很簡單,關鍵的題目沒有點出為什麼
還有一些複製粘貼根本就跑不通
這種相信大家深有體會吧,這樣就導致我們可能需要去找其他人發出來的教程。所以我決定針對市面上大多的 Python 題目做一個分析,同時也希望大家儘可能的做到舉一反三,而不是局限於題目本身。
通過本場我分享的這篇文章,你將獲得如下知識點:
掌握 Python 的基礎語法
語法常見的 Python 應用場景
掌握 Python 閉包的使用以及裝飾器的使用
生成器和迭代器的使用
常見的設計模式的使用
深淺拷貝的區別
線程、進程、協程的使用
了解 Python 中的元編程和反射
常考的數據結構和演算法
爬蟲相關知識,網路編程基本知識等
限於篇幅,本文無法展示全部題答案
掃碼訂閱查看 170 道面試題
所有題目
語言特性
1.談談對 Python 和其他語言的區別
2.簡述解釋型和編譯型編程語言
3.Python 的解釋器種類以及相關特點?
4.說說你知道的Python3 和 Python2 之間的區別?
5.Python3 和 Python2 中 int 和 long 區別?
6.xrange 和 range 的區別?
編碼規範
7.什麼是 PEP8?
8.了解 Python 之禪么?
9.了解 docstring 么?
10.了解類型註解么?
11.例舉你知道 Python 對象的命名規範,例如方法或者類等
12.Python 中的注釋有幾種?
13.如何優雅的給一個函數加註釋?
14.如何給變數加註釋?
15.Python 代碼縮進中是否支持 Tab 鍵和空格混用。
16.是否可以在一句 import 中導入多個庫?
17.在給 Py 文件命名的時候需要注意什麼?
18.例舉幾個規範 Python 代碼風格的工具
數據類型
字元串
19.列舉 Python 中的基本數據類型?
20.如何區別可變數據類型和不可變數據類型
21.將"hello world"轉換為首字母大寫"Hello World"
22.如何檢測字元串中只含有數字?
23.將字元串"ilovechina"進行反轉
24.Python 中的字元串格式化方式你知道哪些?
25.有一個字元串開頭和末尾都有空格,比如「 adabdw 」,要求寫一個函數把這個字元串的前後空格都去掉。
26.獲取字元串」123456「最後的兩個字元。
27.一個編碼為 GBK 的字元串 S,要將其轉成 UTF-8 編碼的字元串,應如何操作?
28. (1)s="info:xiaoZhang 33 shandong",用正則切分字元串輸出["info", "xiaoZhang", "33", "shandong"](2) a = "你好 中國 ",去除多餘空格只留一個空格。
29. (1)怎樣將字元串轉換為小寫 (2)單引號、雙引號、三引號的區別?
操作類題目
49.Python 交換兩個變數的值
50.在讀文件操作的時候會使用 read、readline 或者 readlines,簡述它們各自的作用
51.json 序列化時,可以處理的數據類型有哪些?如何定製支持 datetime 類型?
52.json 序列化時,默認遇到中文會轉換成 unicode,如果想要保留中文怎麼辦?
53.有兩個磁碟文件 A 和 B,各存放一行字母,要求把這兩個文件中的信息合併(按字母順序排列),輸出到一個新文件 C 中。
54.如果當前的日期為 20190530,要求寫一個函數輸出 N 天后的日期,(比如 N 為 2,則輸出 20190601)。
55.寫一個函數,接收整數參數 n,返回一個函數,函數的功能是把函數的參數和 n 相乘並把結果返回。
56.下面代碼會存在什麼問題,如何改進?
57.一行代碼輸出 1-100 之間的所有偶數。
58.with 語句的作用,寫一段代碼?
59.python 字典和 json 字元串相互轉化方法
60.請寫一個 Python 邏輯,計算一個文件中的大寫字母數量
61. 請寫一段 Python連接 Mongo 資料庫,然後的查詢代碼。
62.說一說 Redis 的基本類型。
63. 請寫一段 Python連接 Redis 資料庫的代碼。
64. 請寫一段 Python 連接 MySQL 資料庫的代碼。
65.了解 Redis 的事務么?
66.了解資料庫的三範式么?
67.了解分散式鎖么?
68.用 Python 實現一個 Reids 的分散式鎖的功能。
69.寫一段 Python 使用 Mongo 資料庫創建索引的代碼。
高級特性
70.函數裝飾器有什麼作用?請列舉說明?
71.Python 垃圾回收機制?
72.魔法函數 __call__怎麼使用?
73.如何判斷一個對象是函數還是方法?
74.@classmethod 和@staticmethod 用法和區別
75.Python 中的介面如何實現?
76.Python 中的反射了解么?
77.metaclass 作用?以及應用場景?
78.hasattr getattr setattr的用法
79.請列舉你知道的 Python 的魔法方法及用途。
80.如何知道一個 Python 對象的類型?
81.Python 的傳參是傳值還是傳址?
82.Python 中的元類(metaclass)使用舉例
83.簡述 any和 all方法
84.filter 方法求出列表所有奇數並構造新列表,a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
85.什麼是猴子補丁?
86.在 Python 中是如何管理內存的?
87.當退出 Python 時是否釋放所有內存分配?
演算法和數據結構
122.已知:
(1) 從 AList 和 BSet 中 查找 4,最壞時間複雜度那個大?
(2) 從 AList 和 BSet 中 插入 4,最壞時間複雜度那個大?
123.用 Python 實現一個二分查找的函數
124.python 單例模式的實現方法
125.使用 Python 實現一個斐波那契數列
126.找出列表中的重複數字
127.找出列表中的單個數字
128.寫一個冒泡排序
129.寫一個快速排序
130.寫一個拓撲排序
131.python 實現一個二進位計算
132.有一組「+」和「-」符號,要求將「+」排到左邊,「-」排到右邊,寫出具體的實現方法。
133.單鏈表反轉
134.交叉鏈表求交點
135.用隊列實現棧
136.找出數據流的中位數
137.二叉搜索樹中第 K 小的元素
爬蟲相關
138.在 requests 模塊中,requests.content 和 requests.text 什麼區別
139.簡要寫一下 lxml 模塊的使用方法框架
140.說一說 scrapy 的工作流程
141.scrapy 的去重原理
142.scrapy 中間件有幾種類,你用過哪些中間件
143.你寫爬蟲的時候都遇到過什麼?反爬蟲措施,你是怎麼解決的?
144.為什麼會用到代理?
145.代理失效了怎麼處理?
146.列出你知道 header 的內容以及信息
147.說一說打開瀏覽器訪問 www.baidu.com 獲取到結果,整個流程。
148.爬取速度過快出現了驗證碼怎麼處理
149.scrapy 和 scrapy-redis 有什麼區別?為什麼選擇 redis 資料庫?
150.分散式爬蟲主要解決什麼問題
151.寫爬蟲是用多進程好?還是多線程好? 為什麼?
152.解析網頁的解析器使用最多的是哪幾個
153.需要登錄的網頁,如何解決同時限制 ip,cookie,session(其中有一些是動態生成的)在不使用動態爬取的情況下?
154.驗證碼的解決(簡單的:對圖像做處理後可以得到的,困難的:驗證碼是點擊,拖動等動態進行的?)
155.使用最多的資料庫(mysql,mongodb,redis 等),對他的理解?
點擊閱讀原文,訂閱本場 Chat 獲得 170 道 Python 面試題答案
※中國正式進入 5G 商用元年
※五大行業會古都 華為賦能全行業開發者
TAG:CSDN |