當前位置:
首頁 > 科技 > 訪問量最高超7百萬的Stack Overflow問題竟然是……

訪問量最高超7百萬的Stack Overflow問題竟然是……

整理 | Jane

出品 | AI科技大本營(公眾號id:rgznai100)

Stack Overflow,一個面向開發者的 IT 技術問答網站,很多程序員都會在上面提問,瀏覽問題,查找技術知識。在 Top Question 頁面,我們可以根據 Hot、Week、Month,亦或是標籤對問題進行篩選過濾。當我們想對上面的問題進行數據統計與分析時,這些功能顯然不夠直觀與聚合。

近日,一位來自 Google 的開發者 Felipe Hoffa 發表了一篇文章,分析 Stack Overflow 上不同時間、不同語言的熱門問題,他用了一個互動式的數據展示界面,無論是讓概覽問題還是分析數據都變得非常簡單。

首先,你可以在左上方的折線圖中看到不同時間的熱門問題 Top10(時間統計單位為季度)

其次,你可以在右側的選項欄中根據 tag、 top for quarter、section 和 subtag 四個選項進行數據篩選。

技術類別根據此類問題瀏覽總量由低到高排列。

選擇 tag 後,還可以選擇此技術類別下的 sub tag。

問題不僅可以看 Top10,還可以看 Top30 前的三個區間。

而在問題羅列區,我們可以看到除問題本身外,還有問題發起時間、回答數量及排名等信息。

有了上面這些內容與數據的直觀展示,作者對一些數據進行了統計與分析,下面我們就一起來看看 Stack Overflow 上的用戶在過去和現在都在關注哪些問題。

1.最熱門的問題:所有時間 VS 2018 Q4

下面的數據顯示的是在 Stack Overflow 上,迄今為止關注度最高的十個問題:

最火的十個問題涉及了五個話題,4 個與 Git 相關,3 個與 JavaScript 有關,Java、Linux 和 html 的問題各有一個,沒有任何一個問題涉及目前很火熱的 AI、大數據乃至 Python 等技術領域。

也許受時間積累的影響?那我們回到最近一個季度(2018 Q4)的數據中,看看哪些是近幾個月有哪些熱門問題?

兩個圖表的數據對比發現,近期的十個熱門問題中,新增了 4 個 Python 問題,其他 6 個並沒有發生變化。問題「如何撤銷 Git 中最新的 commits?」一直位居 Top1 的位置,瀏覽量直逼 8 百萬,僅上個季度的瀏覽量就達到了 40 萬 ,但是都沒有 Java 的問題上榜。

2.問題領域發生了哪些變化?

看過 Top 10 的數據後,我們把數據範圍拓展到熱門問題 Top30。Python 相關的問題成為最近最受關注的領域,相比全部時間裡的問題 Top 30,最近的一個季度里,已經沒有 Java 和 SQL 相關的問題了。

3.JavaScript、Python 和 Go 三類語言中,最受關注的十個問題(時間截止到 2018 Q4)

下面的三幅圖分別展示了截止到 2018 年的 Q4,JavaScript、Python 和 Go 語言的問題 Top 10,以及這十個問題在過去兩年的時間裡的變化趨勢:

學 JavaScript 的開發者們一直在問「如何從數組中刪除特定元素?」

Python 學習者們問的最多的問題是「使用 for 循環迭代字典」

而 Go 語言的開發者們最想知道「將位元組數組轉換成字元串的最佳方法」

我們還能從圖中看到,隨時間的推移,大部分問題的關注度並沒有很大的波動,然而卻也有一兩個問題,上升趨勢變化非常明顯、突出。比如:

JavaScript 問題中「如何獲取當前數據」與」如何四捨五入時,保留小數後面兩位「,這兩個問題(藍色與紫色)在 2017 年的 Q3 和 Q4 期間分別有關注度下降的趨勢,但隨後關注度反升,並且以很快的速度縮短了與其他問題訪問量的差別,截止到 2018 年 Q4,差距已經遠沒有一開始時懸殊了。

Python 問題也有此類現象,」如何將字元串解析為浮點數或整數「,這個問題從 2017 年的 Q4 季度到 2018 年的 Q3 季度,近一年的時間都是下降趨勢,然而就從 2018 年 Q3 季度開始卻突然反溫,一下減少了與上一名問題之間的差距。

更有甚者,問題」如何利用 Pandas 在數據結構中根據列選擇行「,在一開始並沒有太多人問,卻從 2017 年 Q4 季度開始上升勢頭迅猛,不斷超過其他問題,躍居 Top5。這一年中學習使用 Pandas 的開發者們看來增多了不少啊!

Go 語言的問題中,」如何列出目錄中所有文件「這個問題的關注度一直在增加,到最後還反超了兩個問題的瀏覽量。

這些問題是否也曾讓你糾結煩惱呢?

4.TensorFlow 的掙扎

怎麼能少了近幾年發展最快的人工智慧領域。開發者們在 AI 技術領域中又在頻頻問哪些問題呢?

TensorFlow 可以說是使用人數最多的深度學習框架了,問的最多的問題是」不能用 pip 方法找到 TF「、」怎麼查詢我系統中安裝 TF 的版本信息「或是當前 CPU/GPU 組合能力等問題。看來大家在入門時遇到了很多共同問題,相信這些問題隨著時間的推移,也仍然是最常被問的問題。

5.其他類別的熱門問題 Top10

1.Redis 及子類與 Java 和 C# 相關的問題

開發者們問的最多的是」如何在 Windows 上安裝「。Redis Java 中的問題大多與 Spring 相關,和 C# 中問的最多的是想要簡單實例。

大家如果想看更多分析與查詢語句,可訪問

https://towardsdatascience.com/finding-the-real-top-stack-overflow-questions-aebf35b095f1

最後,給大家分享這個數據交互界面的地址,看看 Stack Overflow 上的小夥伴們都在問些什麼?

數據交互界面:

https://datastudio.google.com/reporting/1UUTtohIB1fBH7e8An-6AhEn4AyU3eMjd/page/QwNg

群招募

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI科技大本營 的精彩文章:

深度學習的黑暗時代已來臨?
NLP輸出文本評估:使用BLEU需要承擔哪些風險?

TAG:AI科技大本營 |