為什麼我覺得Python爛的要死？原因有八

新聞 12-19

新智元報道

來源：hackerfactor；HackerNews

編輯：元子、大明、木青

【新智元導讀】作為機器學習程序員的首選編程語言，Python成為世界範圍內最受大學生歡迎的編程語言。但凡事有例外，近日，一位開發者講述了他無法忍受Python的8大原因，引髮網友大量回應。

作為機器學習程序員的首選編程語言，Python近年來可謂如日中天，人氣連年暴漲。由於AI熱潮持續不斷，Python在今年更是取代Java，成為世界範圍內最受大學生歡迎的編程語言。很多機器學習領域的教材、文章和技術文檔，給出代碼時會以Python作為示例語言，可見Python受歡迎程度之高。

Python具有上手快、門檻低、語法結構相對簡單等優點，初學者易入門、老手的二次學習成本也低，再加上機器學習任務上優勢獨具，受熱捧簡直是水到渠成的事。

但凡事有例外，東西再好也不可能人人都愛。

近日在hackerfactor上，一位名叫Neal Krawetz的人就撰文，指出了自己無法忍受Python的八大原因，把Python里里外外吐槽了一遍。

文章列出了作者認為Python存在重大缺陷的八條理由，包括版本兼容性問題、安裝版本混亂、在程序關鍵字命名規則、常用庫命名規則上獨樹一幟，且缺乏一致性、賦值傳遞混亂、本地文件命名策略易出錯等。

總之一通下來，把Python貶得夠嗆。這篇文章在當下Python大熱的背景下可算是一朵「奇葩「了。看多了Python讚歌是不是有點審美疲勞了？不妨換換口味。

原因1：版本之間不兼容

安裝Linux後，那麼它很可能默認會安裝多個版本的Python，可能有Python2和Python3，甚至更多零零碎碎的版本，如3.5或3.7。

這是有原因的：Python3與Python2不完全兼容，一些其他版本在這方面的缺陷也足夠明顯——向後兼容性不足（backwards compatibility，也稱為向下兼容性）。

所以Ubuntu同時安裝了Python2和Python3，因為這些版本的核心功能是不同的。

缺乏向後兼容和分離版本通常是走向衰敗的預警。Commodore創建了第一台家用電腦（要遠早於IBM PC或Apple之前）。但Commodore PET與隨後的Commodore CBM計算機並不兼容，而CBM與VIC-20，Commodore-64，Amiga等也不兼容。因此，用戶要麼花費大量時間將代碼從一個平台導到另一個平台，要麼就直接放棄了這個平台——Commodore就是前車之鑒。當用戶選擇放棄平台時，它就註定會消失。

同樣，Perl曾經很受歡迎。但是當Perl3問世時，它並沒有完全向後兼容Perl2的代碼。接下來是Perl4。當Perl5問世時，很多人選擇轉向使用其他更穩定的編程語言。所以今天，只有一小部分人還在積極使用Perl來維護現有的Perl項目，而其他任何基於Perl的重大新項目再也沒有出現過。

同樣，Python為每個版本設計了不同的代碼孤島。社區一直拖拽著這些舊版本，所以你最終也只能得到那些舊的、過時的Python代碼，因為沒有人願意花時間將它導到最新版本上。

據我所知，沒有人在Python2上創建新的代碼，但我們還讓它苟延殘喘著，因為沒人將所需的代碼導到Python3.x. 在官方Python網站上，這些文檔被主動維護並可用於Python 2.7、3.5、3.6和3.7——因為他們無法放棄舊代碼。Python就像編程語言的殭屍——行屍走肉般向前走。

原因2：安裝太太太太麻煩了

通常來說，你直接apt、yum、rpm後得到就是最新穩定版。

但你如果"apt-get install python"，就不知道是什麼版本，可能與你需要的所有代碼都不兼容。所以你在安裝的時候需要指定Python版本。

有一個項目需要用Python3.5（當時最新的版本），然而我的電腦上最終安裝了一大堆版本：Python2、Python2.6、Python3和Python3.5。兩個來自操作系統，一個為了項目安裝，一個是因為我安裝了一些不相關的軟體。

儘管它們都是「Python」，但它們並非完全相同。

如果你想安裝Python的軟體包，你應該使用「pip」（Pip代表「Pip Installs Packages」）。但是由於系統上有許多版本的Python，你必須記住使用正確版本的pip。否則，"pip"可能會運行"pip2"而不是你需要的"pip3.7"。（如果名稱不存在，你需要指定pip3.7的實際安裝路徑。）

我被一個朋友告知我需要配置環境，以便所有東西都能使用Python 3.5。這種方法的確很有效，但沒有持續多久，因為我開始了另一個需要Python 3.6版本的項目。兩個並發項目有兩個不同版本的Python——emmmm，這有點一言難盡吧。

pip安裝程序將文件放在用戶的本地目錄中。你不能使用pip來安裝系統範圍的庫，並且Gawd會阻止你犯下運行"sudo pip"的錯誤，因為這會搞砸整個電腦！

順便說一句，是誰維護這些pip模塊？答案是社區。也就是說，沒有明確的所有者，也沒有強制性的責任所屬。今年早些時候，一個版本的PyPi有一個後門發生了SSH憑據盜竊，但我對此一點都不驚訝，因為社區存儲庫根本不值得相信。出於同樣的原因，我也不使用Node.js和npm。

原因3：令人頭疼的語法問題，作用域使用空格導致可讀性差

我是可讀代碼的堅定信徒。乍一看，Python似乎非常易讀，而當你開始製作大型代碼庫，這種易讀性就會減弱了。

其他編程語言，像C, Java, JavaScript, Perl, and PHP，用{} 來表示作用域；List用()。Python用空格。如果你需要給一個複雜的代碼定義一個作用域，然後你縮進了下面幾行代碼，當縮進終止後，作用域就終止了。

Python手冊說你可以使用任意數量的空格或製表符來定義範圍。但是，每次縮進都要用四個空格！如果要縮進兩次以進行嵌套，那就得使用八個空格！

Python社區已經對這個術語進行標準化，儘管它沒出現在Python手冊中。文檔中的示例說可以使用TAB、「TAB+1空格」等等。但是社區卻對4個空格有著喪心病狂的偏執！因此，除非你打算永遠不向其他任何人展示你寫的代碼，否則每個縮進都要使用四個空格。

當我第一次看到Python代碼時，我認為使用縮進來定義範圍似乎是個好主意。事實上，我太天真了，這簡直是一個天大的缺點。

深度嵌套是可以進行的，但每行代碼會變得很寬，不得不在文本編輯器中換行。長函數和長條件操作都可能讓開始與結束變得難以匹配。我可憐那些錯誤計算空格數量（比如只輸了3個空格而不是四個）的人，因為這樣的錯誤需要數小時進行調試和追蹤。

我debug代碼習慣沒有縮進，這樣我就可以快速瀏覽代碼，並在完成後輕鬆識別和刪除debug代碼。

但是用Python呢？縮進錯誤的話，都會報錯。

原因4：特立獨行的載入庫方式

大多數編程語言都有一些方法可以包含其他代碼塊。對於C，它是「#include」。對於PHP，有"include"，"include_once"，"require"和"require_once"。而對於Python，則是「import」。

Python的import允許導入整個模塊、模塊的一部分或模塊中的特定功能。但查找導入代碼塊的方法卻很麻煩。使用C，直接看/usr/include/*.h就行了。但用Python？最好使用"python -v"列出所有位置，然後搜索該列表中每個目錄和子目錄中的每個文件。這真的很麻煩。

導入功能還允許用戶重命名導入的代碼，它們基本上定義了一個命名空間。乍一看，這似乎很不錯，但這最終會影響可讀性和長期支持。重命名模塊非常適合小腳本，但對於大程序來說真的很糟糕。這樣的操作「import numpy as n」，應該被打死。

但這不是最糟糕的部分。對於大多數語言，包含代碼真的只意味著包含代碼。而一些語言（如面向對象的C ++）則可以執行代碼。類似地，一些PHP代碼可能會定義全局變數，因此一項import可以運行代碼，但這通常被認為是一種不好的做法。相比之下，許多Python模塊包含在導入期間運行的初始化函數。你不知道什麼在運行，你不知道它在做什麼，你甚至都沒察覺到。除非存在命名空間衝突，否則在這種情況下，你需要花很長時間來查找原因。

原因5：關鍵字和庫命名「獨樹一幟」

在其他所有編程語言中，數組都稱為「array」。在Python中，數組被稱為「list」。在其他語言中，關聯數組有時稱為"hash"（Perl），但Python里叫做「dictionary」。 Python似乎沒有使用在計算機和信息科學領域的常用術語。

然後是庫的名稱。看看這些名字吧，PyPy、PyPi、NumPy、SciPy，SymPy、PyGtk、Pyglet，PyGame ...（是的，前兩個名稱發音一模一樣，但是它們的功能和用途有很大區別。）我知道「py」代表Python。但這兩個字母就不能固定在庫的開頭或是末尾嗎？

而且一些常見的庫並沒有沿用這個所謂的「Py」命名約定。比如matplotlib、nose、Pillow和SQLAlchemy。雖然從一些命名上能夠看出庫的一些功能（比如「SQLAlchemy」包含SQL，所以它可能是一個SQL介面），但很多名稱只是隨機化的單詞。如果你事先並不知道「BeautifulSoup」是幹什麼用的，你能從名稱中看出它是一個HTML / XML解析器嗎？

（順便說一句，BeautifulSoup庫的說明文檔很完備，非常易於使用。如果每個Python模塊都這麼好用，我也不會在這裡吐槽這麼多。但遺憾的是，這只是個例外，而不是常態。大多數Python庫的文檔都爛的要死。）

總的來說，我認為Python對庫的命名非常混亂，缺乏一致性的原則。我總覺得，開源項目的命名都存在這種規則混亂的問題。除非你了解這個項目，否則你從項目名字上根本看不出來。除非你知道要找的是什麼，否則你很可能永遠都無法找到想找的東西。從大多數Python庫的命名上看，我現在更加確信這個觀點了。

原因6：其他「獨樹一幟」之處略多

每種語言都有它的怪癖。在C語言中，使用＆和*來訪問地址空間和值是奇怪的命名法。C也有「++」和 --"這樣的變數增減控制方式在Bash語言中，當引用括弧和正則表達式的句點等特殊字元時，需要使用反斜杠。

JavaScript存在兼容性問題（並非每個瀏覽器都支持所有有用的功能）。但是，Python比我見過的任何其他語言的奇怪之處更多。以字元串為例：

?在C中，對字元串使用雙引號，對字元使用單引號。

?在PHP和Bash中，兩種類型的引號都可以用於字元串。但是，使用雙引號時可以在字元串中嵌入變數。相比之下，使用單引號括起來的字元串屬於文字。任何類似嵌入式變數的名稱都不可擴展。

?在JavaScript中，單引號和雙引號之間確實沒有區別。

?在Python中，單引號和雙引號之間沒有區別。但是，如果想讓字元串跨行，則需要使用三引號「」「string」「」或「""string"""。如果想使用二進位文件，那麼你需要用b（b"binary"）或r（r"raw"）來優先選擇字元串。有時還需要使用str（string）進行字元串轉換，或使用string.encode（"utf-8"）將其轉換為utf8。

如果你認為=、==和===這些符號PHP和JavaScript中有點怪，那麼等你在Python中使用引號時再說吧。

原因7：賦值方式怪異

大多數編程語言都按值傳遞函數參數。如果函數改變了值，則結果不會傳遞迴調用代碼。但Python不一樣。 Python默認使用pass-by-object-reference參數執行函數。這意味著更改源變數可能最終會改變值。

這是面向程序、面向函數和面向對象編程語言之間的重大差異之一。如果每個變數都是通過對象引用傳遞的，而且對變數的任何更改都會導致其他所有地方的變數值變化，那麼其實也可以全部使用全局變數來處理所有內容。使用不同的名稱調用同一個對象不會更改對象的值，因此實際上該對象就是全局的。C語言程序員有句老話，全局變數是邪惡的，不應該使用。

在Python中，必須按值傳遞變數。「a = b」只是為同一個對象空間指定另一個名稱，並不會將b的值賦到a中。如果要賦值，則需要使用copy函數。通常格式是「a = b.copy（）」。但是，請注意我說的是「通常」。並非所有數據類型都能夠這樣賦值，部分功能可能不完整。這時需要使用一個名為「copy」的獨立庫：「a = copy.deepcopy（b）」。

原因8：本地程序命名易混亂

根據使用的庫或函數來命名程序是一種常見的編程技術。比如，我正在使用名為「libscreencapture.so」的C語言庫測試屏幕捕獲程序，我調用的程序可能會命名為「screencapture.c」，編譯後命名為「screencapture.exe」。

如果使用C，Java，JavaScript，Perl，PHP等語言，這種命名方式很好用，因為程序語言可以很容易地將資源庫與本地程序區分開來，因為彼此的路徑是不同的。但是如果用的是Python，永遠不要這樣命名。

為什麼？ Python總是假定用戶首先要導入本地代碼。如果我有一個名為「screencapture.py」的程序使用「importscreencapture」，那麼它將導入自己而不是系統庫。至少，本地程序需要命名為「myscreencapture.py」才能避免這種錯誤。

當然了，吐槽了這麼多，但其實Python並非一無是處。

Python是一種非常流行的語言，擁有數量龐大的使用者。我身邊有一些朋友非常喜歡Python，這是他們首選的編程語言。多年來，我和他們討論過這些問題，每次他們都點頭表示同意。他們並不否認Python確實存在這些問題，只是覺得這些缺點不足以讓他們拋棄Python。

我的朋友經常在編程中將所有存在的非常酷的Python庫統統引用。我也認為一些庫確實非常有用。例如，BeautifulSoup是我用過的最好的HTML解析器之一，NumPy使得多維數組和複雜的數學過程更容易實現，而TensorFlow則對於機器學習非常有用。但是，我不會因為喜歡TensorFlow或SciPy，而在Python中創建一個單片程序。為了某些庫的便利性，放棄程序可讀性和可維護性，屬於得不償失。

一般來說，我在寫關於某個主題的負面批評文章時，也會嘗試寫一些正面的東西。比如當我寫FFmpeg的局限性時，我也明確提到它是最好的視頻處理庫。但我這裡寫不出關於Python的什麼優點了，因為我真的覺得Python很爛。

此文一發，在評論區引發了激烈的爭論：

「是你不懂Python」

Mario Abarca

你的這些問題可以總結為一點：你不喜歡Python因為它和C風格不一樣

版本不兼容不是bug，是特性；我就覺得沒人維護的東西就不應該再用了

用虛擬環境安裝不同的python版本而不是安裝在同一個環境下

現代編輯器默認TAB=4個空格。你也不需要非得用4個空格，但要確保一致性

官方的文檔特別好，真的。要是標準庫里沒有，翻翻The Hitchhiker』s Guide to Python這本書

我覺得Python的命名風格特別好，更直觀。list不是數組，就是序列；關聯數組明明就是dict

二進位字元串前面加個b，是因為Unicode規範中，1位元組≠1byte

這樣做的好處是，我可以隨時隨地引用一個東西，而不需要每次都去複製粘貼原來的名字

同上

notacoward

1和2是同一個問題，有關整個生態，跟語言本身無關。因為這類社區維護的項目都是不同的人花費寶貴的業餘時間去維護，每個人都有每個人的習慣和價值觀

這個只能說你自己太個性了。我們大家保持默認的統一風格，對於別人維護起來明顯更容易

C/C++的include很難處理模塊介面

list和array不是一個東西。下一個

每個語言都有自己的一套轉換方式。Python可能不是最完美的，但是其他的更差，呵呵

對象引用效率更高。尤其是當變數名不一致的時候，你直接複製會有問題。但是你引用一下，就好多了

最好不要把自己的程序命名成標準庫里的程序或者模塊的名字

folkrav

首先要糾正下你，PyPy和PyPi發音不一樣。前一個是「派派」，後一個是「派-屁-愛」

其次，名稱很重要嗎？第三方誒大哥，啥名字都可以出現誒大哥。你就能保證你起名的時候，能做到信達雅嗎大哥？

jaxtellerSoA

我就不明白了。用縮進來定義作用域，怎麼就不好了？多一目了然啊！別的語言{}裡面不也得縮進嗎？再說了，你就不覺得按住shift才能打出{}很難受嗎？

riskable

我跟C粉兒討論過「縮進vs括弧」這個問題。他說沒有括弧怎麼能輕鬆找出作用域呢？

標準Py粉兒答案是：啊原來你們喜歡括弧是因為你們的代碼壞習慣啊。

我想了想，可能這麼問更恰當：假如不使用文本編輯器/IDE來突出顯示括弧或它們之間的空間，你還是堅持用括弧不用縮進嗎？

我估計他終於get到我的點了，說：啊我明白了，你之所以用縮進是因為Python編輯器太爛了啊！真可憐。

Sign。

「我也不喜歡Python」

cutety

Python是我上手的第一個語言，但我以後再也不會用了。當然作者的這些問題，在我看來都不是問題，個人習慣而已。

包管理模式簡直爛到家。那麼多包管理器可以借鑒啊，可以讓pip不那麼爛啊

就不能有個標準包管理器有個標準manifest嗎？又不會懷孕！

twunde

安裝確實是個讓人頭疼的問題。是的很多人提到了安裝虛擬環境，venv/virtualenv。Ruby有RVM，可以輕鬆的在同樣環境下使用不同版本。我寧願挨個給Ruby，PHP，Perl…做環境配置，也不願意給Python配置。

nicoburns

哦！多行Lambda！我在JS里的最愛。Python里，沒！有！了！

setpatchaddress

我從1.5就開始用Python了。縮進來表示語句塊，是我最最最不能忍受的！

dbcurtis

我就喜歡C那種的括弧，不喜歡Python的縮進方式。

colanderman

我覺得Python最大的問題其實是內部模型對於它的意圖而言過於複雜了，就是一個有經驗的開發者都很難理解，別說初學者了。

你怎麼看？

參考鏈接：

https://www.hackerfactor.com/blog/index.php?/archives/825-8-Reasons-Python-Sucks.html

https://news.ycombinator.com/item?id=18706174

【加入社群】

新智元 AI 技術 + 產業社群招募中，歡迎對 AI 技術 + 產業落地感興趣的同學，加小助手微信號：aiera2015_2入群；通過審核後我們將邀請進群，加入社群後務必修改群備註（姓名 - 公司 - 職位；專業群審核較嚴，敬請諒解）。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※斯坦福學者：生物智能可能是解決AI發展瓶頸的關鍵
※蜻蜓折翼——谷歌搜索中國項目恩仇錄

TAG:新智元 |