當前位置:
首頁 > 知識 > Python「八宗罪」

Python「八宗罪」

選自hackerfactor

作者:Neal Krawetz

機器之心編譯

本文作者有一群 geek 朋友,經常一起討論技術話題,有時候也會談到編程語言。「I hate Python」,作者表示。他對 Python 厭惡至極。即使有現成的 Python 代碼可用,他也寧願用 C 語言重寫。為了系統地吐槽 Python,作者專門寫了這篇博客,細數 Python 的「八宗罪」。

這個話題已經在 Hacker News 上引發了熱烈的討論(評論 400+),感興趣的讀者可以去圍觀或參與一下。

Hacker News 討論:https://news.ycombinator.com/item?id=18706174

1. 版本

如果要安裝一個默認的 Linux 操作系統,那你很有可能需要安裝多個版本的 Python:Python2、Python3 甚至是 3.5、3.7。原因在於:Python3 無法與 Python2 完全兼容。甚至一些用小數表示的版本(如 3.5、3.7)也明顯缺乏向後的兼容性。

我完全贊成往編程語言中添加新的功能,我甚至不介意淘汰一些舊的版本。但Python卻要分開安裝。我的 Python 3.5 代碼不適用於 Python 3.7 安裝版本,除非我特意將其導入 3.7。很多 Linux 開發者都覺得導出太麻煩,因此安裝 Ubuntu 的時候會一併安裝 Python2 和 Python3——因為有的核心功能需要前者,而有的需要後者。

向後兼容性的缺乏和各自為政的版本通常會為其敲響喪鐘。Commodore 創造了第一批家用電腦(比 IBM PC 和蘋果都要早很多)。但 Commodore PET 不能與後續的 Commodore CBM 兼容。CBM 又不與 VIC-20、Commodore-64、Amiga 等兼容。因此,你要麼選擇花很多時間將代碼從一個平台導到另一個,要麼選擇放棄這個平台。(Commodore 今天何在?早被用戶拋棄涼涼了……)

類似地,Perl 也火過一陣。但 Perl3 與 Perl2 的很多代碼也不兼容。社區罵聲一片,於是一些好的代碼導了出來,其他的則被拋棄了。Perl4 也是如此。等 Perl5 出來的時候,人們乾脆改用另一種更穩定的編程語言。如今,只有一小部分人還在頻繁使用 Perl 來維持之前的項目。但已經沒有人用 Perl 創建新的大項目了。

同理,Python 的每個版本也都存在穀倉效應。之前的版本還要留著,最終造成手裡有一堆舊的無用 Python 代碼,因為大家都不想花時間將其移到最新版上。據我所知,沒有人為 Python2 創建新代碼了,但我們還留著它,因為沒有人想將所需代碼移到 Python3.x 中。Python 2.7、3.5、3.6、3.7 的文檔都還在 Python 官網上積極維護著,因為他們無法下決心棄用之前的代碼。Python 就像一種殭屍編程語言——已經死掉的部分還在以行屍走肉的方式存在著。

2. 安裝

很多軟體包都可以幫你輕鬆地運行 apt、yum、rpm 或其他一些安裝庫,並獲得最新版本的代碼。但 Python 並非如此。如果用「apt-get install python」安裝,你都不知道自己安的是哪個版本,它可能也無法與你所需的所有代碼兼容。

因此,你要安裝你需要的那版 Python。我的其中一個項目用到 Python,但必須用 Python3.5。所以最後,我的電腦安裝了 Python2、Python2.6、Python3 及 Python3.5。其中兩個來自操作系統,一個用於項目,另外一個服務於出於其他原因安裝的無關軟體。雖然都是 Python,但此 Python 非彼 Python。

如果你想安裝 Python 包,你應該使用「pip」(Pip Installs Packages)。但由於系統上有一堆 Python,你要注意使用正確版本的 pip。否則,「pip」可能運行「pip2」,而不是你需要的「pip3.7」。(如果名稱不存在,你需要為 pip3.7 指定明確的真實路徑)

一位隊友建議我配置自己的環境,這樣的話每種軟體都可以使用 Python3.5 的 base 環境。在我需要用 Python3.6 開展另一個項目之前,這種做法是非常行得通的,但是需要 Python 3.6 就得創建另外一個環境。兩個項目,兩版 Python,一點都不會混,真的(用生命在假笑)。

pip 安裝程序將文件放置在用戶的本地目錄。安裝系統級的庫時不用 pip。Gawd 不允許你在運行「sudo pip」時出錯,因為那會毀了你的整個電腦!運行 sudo 可能會使一些軟體包在系統級別安裝,有些是為錯誤版本的 Python 安裝的,而你的主目錄中的一些文件可能最終歸 root 所有,因此未來的非 sudo pip 安裝可能會因許可權問題而失敗。不要這樣做。

這些 pip 模塊由誰來維護呢?當然是社區。也就是說,沒有明確的所有者,也沒有強制性的來源鏈或責任鏈。今年早些時候,PyPI 的一個版本中發現了一個竊取 SSH 憑證的後門。這也是意料之中。(出於同樣的原因,我不用 Node.js 和 npm;我不信任他們的社區項目。)

3. 句法

我非常主張代碼的可讀性要強。乍一看,Python 的可讀性似乎不錯。但當你開始創建大型代碼庫的時候你就不會這麼想了。

大多數編程語言使用某種符號來標識範圍——函數的開始和結束位置、條件語句中包含的操作、變數的定義範圍等。C 語言、Java、JavaScript、Perl 和 PHP 都用 {...} 來定義範圍,Lisp 使用 (...)。Python 呢?它用空格!如果你要定義複雜代碼的範圍,你可以縮進接下來的幾行代碼,縮進結束時,該範圍也截止。

Python 手冊說,你可以用任意數量的空格或製表符來定義範圍。但是,每次縮進最好使用四個空格!如果你想縮進兩次進行嵌套,使用八個空格!Python 社區已經對此進行標準化,即使 Python 手冊中並沒有明文規定。這個社區就喜歡用四個空格。所以,除非你不打算將自己的代碼向任何人展示,否則的話每次縮進最好用四個空格。

我第一次看到 Python 代碼時,覺得用縮進來定義範圍還挺好的,但這麼做有一個巨大的缺陷。你可以進行深度嵌套,但這麼做使得每一行都會很長,導致不得不在文本編輯器中換行。較長的函數和條件語句可能會使開始和結束範圍很難匹配。而且當你不小心把三個空格當成四個空格,還容易出現計算錯誤,進而花幾個小時來調試和追蹤。

對於其它語言,我已經養成了調試代碼不帶任何縮進的習慣。這樣,我可以快速瀏覽代碼,然後輕鬆地識別和刪除調試代碼。但 Python 呢?任何沒有適當縮進的代碼都會產生縮進錯誤。

4. includes

大部分編程語言都有辦法導入其它代碼塊。比如,C 語言用「#include」,PHP 語言可以用「include、include_once、require、require」。而 Python 用的是「import」。

Python 可以導入整個模塊、模塊的一部分或模塊中的特定函數。C 語言?你可以查看「/usr/include/」。Python 的話,最好用「python -v」列出所有路徑,然後從列表中搜索每個目錄和子目錄中的每個文件。我有些朋友很喜歡 Python,但我看到他們想導入東西時,總得瀏覽標準模塊。

導入功能還允許用戶重命名導入的代碼。它們基本上定義了一個自定義的命名空間。乍一看,你會覺得挺不錯的,但這最終會影響可讀性和長期支持。重命名對於較小的腳本來說還是不錯的,但對於長期項目來說真的不適用。那些使用 1-2 個字母作為命名空間(比如「import numpy as n」),而且還不按約定俗成的方式來命名的,簡直應該拉出去槍斃!

這還不是最糟糕的。大部分編程語言 include 代碼的時候就只是導入代碼而已。如果有一個帶有構造函數的全局對象,有些語言,如面向對象的 C++可能會執行代碼。類似地,有些 PHP 代碼可能會定義全局變數,所以導入可以運行代碼——但這種做法通常被認為很糟糕。相比之下,很多 Python 模塊包含在導入期間運行的初始化函數。你不知道在運行的是什麼,它要幹什麼,你甚至可能不會注意到。除非存在命名空間衝突,如果這樣就好玩了,你得花很多時間來尋找原因。

5. 命名法

在其它語言中,數組(array)直接稱之為"arrays",但是在 Python 中,它們被稱為 "lists"。關聯數組在某些地方被稱為 "hash" (Perl),但是 Python 將其稱為「字典」(dictionary)。Python 似乎完全按照自己的節奏來,不使用計算機科學和信息科學領域的常見術語。

此外,Python 庫的命名也有問題。PyPy、PyPi、NumPy、SciPy、SymPy、PyGtk、Pyglet、PyGame……(前兩個庫的發音一樣,但是它們的功能完全不同)。我理解「py」表示 Python,但是它們就不能統一出現在前面或後面嗎?

一些常見庫放棄了類似雙關語的「Py」命名約定,包括matplotlib、nose、Pillow和 SQLAlchemy。雖然有一些命名可能暗示其目的(如 SQLAlchemy 包含 SQL,所以它可能是一個 SQL 介面),但是其它的可能只是隨機的單詞。如果你不知道「BeautifulSoup」這個庫是幹什麼的,那麼你能從命名看出來它是一個 HTML/XML 解析器嗎?不過,BeautifulSoup 有很完善的文檔且易於使用,如果每一個 Python 模塊都這樣,我也就不抱怨了,但是大多數 Python 庫的文檔非常爛。

總的來說,我認為 Python 是一個具有不一致命名約定的函數庫集合。我經常抱怨開源項目的命名非常可怕。除非你知道這些項目在幹什麼,否則你從命名本身中什麼都看不出來。除非你知道在尋找什麼樣的庫,不然只能通過別人偶然提及的名字或偶然的機會發現一些庫。大多數 Python 庫加重了這種現象,也加重了 Python 的負面體驗。

6. 奇怪的操作

每種語言都有自己比較奇特的操作。C 語言中使用 & 和 * 獲取地址空間和值的命名法非常奇怪。C 語言中還有用 ++ 和—實現 increment/decrement 的捷徑。Bash 語言中,在引用特定字元(如用於正則表達式的圓括弧和句號)時需要一直考慮「什麼時候使用轉義符 ()」。JavaScript 兼容性有問題(並非每個瀏覽器都支持所有有用的功能)。但 Python 的奇怪操作比我見過的其他語言都多。如:

在 C 語言中,雙引號里的是字元串,單引號里的是字元。

在 PHP 和 Bash 中,兩種引號都能包含字元串。但是,雙引號里的字元串可以嵌入變數。相比之下,單引號的字元串是文字;任何嵌入的類似變數的名稱都不可擴展。

在 JavaScript 中,單引號和雙引號沒什麼區別。

在 Python 中,單引號和雙引號也沒有什麼區別。但是,如果你想讓字元串跨行,就得用三重引號,如"""string""" 或 """string"""。如果你想用二進位,那你需要優先選擇帶有 b(b"binary")或 r(r"raw")的字元串。有時你要用 str(string) 把字元串轉換為字元串,或使用 string.encode("utf-8") 將其轉換為 utf8 格式。

如果你一開始認為 PHP 和 JavaScript 中的=、==、===有點奇怪,那等你用 Python 中的引號時可能不會這麼想了。

7. 通過對象 Reference 傳遞

大多數編程語言的函數參數傳遞是傳值。如果函數改變了值,結果不會傳遞迴調用代碼。但正如我解釋過的,Python 偏偏要有所不同。Python 默認使用 pass-by-object-reference 來傳遞函數參數。這意味著改變源變數可能最終會改變值。

這是面向程序、函數和對象的編程語言之間的最大區別。如果每個變數都由對象引用來傳遞,並且變數的任何變化都會改變所有的引用,那你可能使用的都是全局對象。通過不同的命名調用相同的對象不會改變對象,所以實際上它就是全局的。此外,正如 C 的程序員早就學到的,全局變數太噁心了,別用。

在 Python 中,你必須通過值來傳遞變數,例如「a=b」只是給相同的對象空間分配了另一個命名,但並沒有複製 b 的值給 a。如果你真的想要複製 b 的值,你需要使用一個 copy 函數,通常是「a=b.copy()"的形式。然而,注意我說的是「通常」。不是所有數據類型都有一個「copy」原型,或者 copy 函數可能是不完整的。在這種情況下,你可以使用單獨的「copy」庫:"a=copy.deepcopy(b)"。

8. 本地命名

用所用的庫或函數的名字來命名程序是常見的編程技巧。例如,如果我用一個叫做「libscreencapture.so」的 C 庫來測試一個截屏程序,我會將該程序命名為「screencapture.c」並編譯為「screencapture.exe」。

gcc -o screencapture.exe screencapture.c -lscreencapture

在 C、Java、JavaScript、Perl、PHP 等語言中,這通常很有效,因為這些語言可以輕易地辨別本地程序和資源庫,它們有不同的路徑。但 Python 呢?還是算了吧,千萬別這樣做。為什麼?Python 會假定你首先要導入本地代碼。如果我有一個名為「screencapture.py」的程序使用了「import screencapture」,那麼它將導入自己而不是系統庫。至少,你應該調用本地程序「myscreencapture.py」吧。

並非一無是處

Python 是一門非常流行的編程語言,有很多粉絲。甚至我的很多朋友都很喜歡 Python。多年來,我和他們討論過這些問題,每次他們都點頭表示同意。他們並不反對 Python 存在這些問題,只是認為這不足以澆滅他們對這種語言的熱情。

我的朋友經常提到那些非常酷的 Python 庫。我同意一些庫非常有用。例如,BeautifulSoup 是我用過最好的 HTML 解析器之一,NumPy 使多維數組和複雜的數學更容易實現,而 TensorFlow 對於機器學習非常有用。但是,我不會因為喜歡 TensorFlow 或 SciPy 而用 Python 創建單片程序。我不打算為了這些「蠅頭小利」而放棄可讀性和可維護性,這不值得。

通常當我寫一篇關於某個主題的批評時,我也會嘗試寫一些積極的東西。但我沒辦法列出關於 Python 的好的方面,因為我真的認為 Python 很糟糕。

原文地址:https://www.hackerfactor.com/blog/index.php?/archives/825-8-Reasons-Python-Sucks.html


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

前端開發者的福音:根據UI設計圖自動生成GUI骨架代碼
從硬體到框架,30+巨頭參與的AI基準競爭結果公布(第一回合)

TAG:機器之心 |