分散式、高並發與多線程有何區別
多線程是指從軟體或者硬體上實現多個線程並發執行的技術,它更多的是解決CPU調度多個進程的問題,從而讓這些進程看上去是同時執行(實際是交替運行的)。
當提起這三個詞的時候,是不是很多人都認為分散式=高並發=多線程?
當面試官問到高並發系統可以採用哪些手段來解決,或者被問到分散式系統如何解決一致性的問題,是不是一臉懵逼?
確實,在一開始接觸的時候,不少人都會將三者混淆,誤以為所謂的分散式高並發的系統就是能同時供海量用戶訪問,而採用多線程手段不就是可以提供系統的並發能力嗎?實際上,他們三個總是相伴而生,但側重點又有不同。
什麼是分散式?
分散式更多的一個概念,是為了解決單個物理伺服器容量和性能瓶頸問題而採用的優化手段。該領域需要解決的問題極多,在不同的技術層面上,又包括:分散式文件系統、分散式緩存、分散式資料庫、分散式計算等,一些名詞如Hadoop、zookeeper、MQ等都跟分散式有關。從理念上講,分散式的實現有兩種形式:
水平擴展:當一台機器扛不住流量時,就通過添加機器的方式,將流量平分到所有伺服器上,所有機器都可以提供相當的服務;
垂直拆分:前端有多種查詢需求時,一台機器扛不住,可以將不同的需求分發到不同的機器上,比如A機器處理余票查詢的請求,B機器處理支付的請求。
什麼是高並發?
相對於分散式來講,高並發在解決的問題上會集中一些,其反應的是同時有多少量:比如在線直播服務,同時有上萬人觀看。
高並發可以通過分散式技術去解決,將並發流量分不到不同的物理伺服器上。但除此之外,還可以有很多其他優化手段:比如使用緩存系統,將所有的,靜態內容放到CDN等;還可以使用多線程技術將一台伺服器的服務能力最大化。
什麼是多線程?
多線程是指從軟體或者硬體上實現多個線程並發執行的技術,它更多的是解決CPU調度多個進程的問題,從而讓這些進程看上去是同時執行(實際是交替運行的)。
這幾個概念中,多線程解決的問題是最明確的,手段也是比較單一的,基本上遇到的最大問題就是線程安全。在JAVA語言中,需要對JVM內存模型、指令重排等深入了解,才能寫出一份高質量的多線程代碼。
總結一下:
分散式是從物理資源的角度去將不同的機器組成一個整體對外服務,技術範圍非常管且難度非常大,有了這個基礎,高並發、高吞吐等系統很容易構建;
高並發是從業務角度去描述系統的能力,實現高並發的手段可以採用分散式,也可以採用諸如緩存、CDN等,當然也包括多線程;
多線程則聚焦於如何使用編程語言將CPU調度能力最大化。
分散式與高並發系統,涉及到大量的概念和知識點,如果沒有系統的學習,很容易會雜糅概念而辨識不清,在面試與實際工作中都會遇到困難。
※Intel投入5億美元提升14nm工藝CPU需求
※滾動開發–Clear Linux給用戶帶來驚喜
TAG:Linux資訊速推 |