雲計算技術在高速公路上的應用實踐
第一部分 初識雲計算、遷移上雲
2012年,當我們使用遠程桌面客戶端登錄雲端主機的那一刻開始,新IT基礎設施時代來了,基於傳統硬體模式的各業務系統架構將會發生巨變。
我們在雲端搭建好主機、資料庫、網路等環境後,聯繫了網站、投資、人力資源、財務管理等系統的軟體廠商進行系統遷移,按照從小到大、從易到難的順序,將這些系統陸續遷移到了雲端,並於2015年2月全部遷移完成。集團總部將原用於支撐這些系統的主機、存儲、防火牆、防毒牆、路由器、交換機等設備斷電並下架並同時拆除了網路專線。
1.1新的動力
2015年1月,國務院發布《國務院關於促進雲計算創新發展培育信息產業新業態的意見》, 雲計算成為「互聯網+」行動計劃的新基礎設施。
2015年7月4日,國務院印發《關於積極推進「互聯網﹢」行動的指導意見》,《意見》指出,加快互聯網與交通運輸領域的深度融合,通過基礎設施、運輸工具、運行信息等互聯網化,推進基於互聯網平台的便捷化交通運輸服務發展。
2016年11月世界互聯網大會,中國交通運輸部發出以整合資源、開放共享為重點,以泛在互聯、全面感知、便捷交互為目標,推動「互聯網+」與交通運輸融合發展的倡議。
2017年9月14日交通運輸部辦公廳印發《智慧交通讓出行更便捷行動方案(2017—2020年)》的通知,在不斷完善智慧出行發展環境的要求中提出,「深化出行公共信息資源開放示範。推動相關政府部門、事業單位加快交通出行公共信息資源開放,充分利用以綜合交通出行大數據開放雲平台為代表的各類數據開放平台,支撐各類出行信息服務產品的研發推廣。鼓勵各類主體利用開放信息資源開展出行服務創新。
2017年12月26日,在交通運輸部召開的全國交通運輸工作會議中,在實施創新驅動發展戰略,加快推進行業轉型升級的要求中提出「要充分利用互聯網廣泛覆蓋、高效連接等特性,解決傳統產業中存在的信息不對稱、中間環節多等問題,以旅客便捷出行、貨物高效運輸為導向,全面推進「互聯網+交通運輸」行動」,「要堅持以信息化驅動交通運輸現代化,推動雲計算、物聯網、大數據、移動智能終端等技術在交通運輸領域的深度應用,推動交通運輸傳統產業向自動化、智能化轉變。」
國家這一系列的政策與倡議的出台,更加堅定了我們選擇雲計算平台作為新的基礎設施來支撐「互聯網+」行動計劃的信心與依據,使我們有了新的強大動力。
第二部分 全面使用雲計算
2.1 雲計算基礎服務的應用
(1)按需付費,秒級計費
在2013年的時候,很多國內雲計算服務提供商宣稱自己的雲平台費用最低,我們在逐一試用後發現,各類資源最少的付費周期是一個月,也就是說其實是包月或包年價格最低,也就是無論你用不用這些計算資源,都得先支付至少一個月的費用,這與雲計算服務按需付費的特點是不匹配的。
那麼如何才是真正的按需付費呢?那就是按秒來計費。例如,我們在雲端建立了一台主機進行相關測試,在使用了59分59秒後刪除,那麼在雲端應該只收取59分59秒費用。在雲端購買的這些主機、路由器等資源和物理設備不同,若不再使用直接刪除就行,而物理設備買回來就成了固定資產。所以只有做到了雲平台上所有服務都按照秒級計費的要求,才能實現真正的按需付費,這才是真正的費用最低。
我們按照按需付費,秒級計費的要求,經過認真比較與全面親自的測試,我們最終選擇了一家於2013年上線,在當時國內第一家也是唯一的一家,從對外提供雲計算服務開始,雲端的所有資源都按照秒級計費的青雲QingCloud雲計算服務,正式開始了我們集團的雲計算之旅。
(2)定時器與自動彈性伸縮
定時器的應用場景
帶寬自動調整:已經遷移上雲的財務管理系統的帶寬是根據用戶日常作息時間自動動態變化的:7:00-19:00為20M帶寬,19:00-0:00為10M帶寬,0:00-7:00為5M帶寬,每天自動循環,計費也隨之調整。
資源自動備份:我們在雲端部署的主機、硬碟、資料庫等含有數據的資源,在每天凌晨3點自動進行包含操作系統的鏡像級備份,並且可以設定備份鏈的天數,可以從任何一個備份鏈條上,迅速還原到某天的狀態。
自動開關機:因與AI業務相關的測試需要使用到GPU主機,但這種類型的主機租用費較高,我們把它設定為每天在工作時間自動開機,非工作時間自動關機以節約費用。
自動彈性伸縮
自動擴充存儲空間:我們使用的開源資料庫可以根據實際資源使用情況,來自動進行資料庫存儲空間的擴容。例如:存儲空間使用到達80%後,自動擴充100G的空間,計費也隨之調整。
自動擴充負載均衡器後端主機的數量:我們的協同指揮調度雲平台如果出現高並發的訪問,在達到我們預設的閥值後,就會自動增加後端計算資源來應對。例如:負載均衡器後端主機的CPU負載只要到達80%,負載均衡器就會自動克隆出一台主機來應對高並發訪問,等到訪問量減少到預設的閥值,這台克隆出來的主機又會自動被刪除,計費也隨之調整。
自動伸縮網路帶寬:再拿我們的財務管理系統舉例,在定時器已經在使用的情況下,如果在某個時間段內突然出現了大量用戶訪問,而這個時間段內的帶寬又不夠,那麼根據預設的帶寬調整閥值自動增加或減少帶寬,計費也隨之調整。
(3)多副本熱備、熱遷移與備份
沒有永遠不損壞的硬體,雲計算平台使用的硬體也一樣。我們在雲端購買的任何服務,在後台都自動存在同樣運行著的至少兩個熱備副本在隨時待命,這些副本運行在與正本不同的伺服器上,只要正在運行正本的主機的CPU、內存等出現硬體故障,副本會在幾十秒之內進行熱遷移以接管服務,保證業務系統的不間斷運行。由於雲計算平台底層的存儲做了多重raid保護,所以當雲平台的硬碟出現損壞時,用戶是無任何感知的,所以在雲端是無需擔心數據丟失的。
而資源備份與多副本熱備是兩個不同的概念,備份是用來解決應用系統出現數據誤寫入、數據被篡改等問題後,進行回滾操作以恢復某時某天數據的。雲端提供的備份回滾功能也相當的快,通常在幾十秒內回滾完成。
(4)主、子賬號管理體系與計費方式
我們集團總部與所屬單位採用的是1個主賬號+多個子賬號的雲端賬號管理模式,實現了以下功能:
由主賬號統一管理全集團的雲端賬號許可權,包括開通、刪除、雲端ip地址規劃等操作。各所屬單位的業務系統均部署在各自的子賬號里。
子賬號可以共享主賬號的餘額或者獨立計費。
主賬號可以監管子賬號內的資源使用情況,以預防子賬號資源使用不足或分配不合理等問題。
使用雲端主、子賬號的管理模式,我們集團實現了原先在物理機房環境下無法實現的管理模式與成效,足不出戶就可以管理各子賬號的資源或幫助子賬號解決技術上的問題。
(5)全面使用各種類型的免費隧道服務
青雲的隧道功能齊全,有ipsec(含主模式與野蠻模式)、GRE,有了這些隧道,就可以實現主子賬號之間、各子賬號間的數據的安全互通與共享,這種模式為全集團的大數據集中分析奠定了最重要的網路基礎;同時也可以實現本地與雲端的安全互聯,實現各類數據在雲端快速交互與匯聚。目前多數雲平台的隧道功能有的按照數量計費、有的按照流量計費、有的按照時間計費、還有的限制隧道的數量。而青雲的隧道不但功能齊全,不限數量、不限種類、而且還免費,為我們安全、快速組網節約下了大量的費用。
(6)SD-WAN的使用
我們在使用隧道功能的同時,發現當本地需要接入雲端(隧道方式)的路由器越來越多時,在網路管理上的壓力越來越大。這時SD-WAN橫空出世,只要本地CPE終端設備通上電且能夠訪問雲端SD-WAN控制台,CPE終端里的配置就會由雲端控制台自動下發,本地就會自動建立隧道直達雲端VPC;SD-WAN同時也解決了單個VPC不能支持過多隧道的性能瓶頸問題,而且還能與普通模式的隧道共用一個VPC。
另外,SD-WAN網路除了支持本地CPE多WAN口(電信、聯通、移動的寬頻以及4G網路同時接入)自動切換功能之外,還能在本地到達雲端的互聯網鏈路上,支持多POP點的備份,以保證本地到達雲端隧道的連通性。後續我們還需在此基礎上研究擴展更先進的路由功能以匹配更高效、複雜的應用場景。
在這個強調自主可控的時代,我們也提出除了SD-WAN廠家自身要做到自主可控之外,用戶也需自主可控,我們需要能自助完成從CPE終端到雲端VPC的整個配置過程,這就需要SD-WAN廠家向用戶也同樣開放原先只有廠家自己才能看到或做到的內部網路參數與配置過程。
(7)去IOE
去I(傳統物理伺服器)在上雲的同時就已經實現了從購買硬體向購買服務的轉變,而且雲平台自身使用的是超融合設備,而非傳統物理伺服器。
去O(商業資料庫),我們從以下幾點來說明:
隨著我們各個系統用戶數量與需求的快速增長,支持商業資料庫的硬體配置需求越來越高,而商業資料庫是依據硬體的配置來收取授權費用的,硬體配置越高,授權費用就越高,最後高到用戶無法承受。
運維費用昂貴,如果遇到應用軟體商解決不了的商業資料庫問題,還必須請商業資料庫原廠工程師到達現場處理。
目前我們收費系統的資料庫還是商業資料庫,建立之初的用途只需滿足收費相關的業務就行。如今ETC不停車收費、高速公路客服系統、收費稽查業務、綠色優惠車系統等,這些需要頻繁讀寫資料庫的業務系統陸續上線,同時各級審計部門、行業管理部門等機構也有大量讀收費資料庫的需求。商業資料庫在這麼大的壓力下,我們為了保證業務系統的正常運行,就得圍繞著這個商業資料庫不停的想辦法,只有通過購買各種原廠或第三方的數據集群、同步、備份等軟體來維持,而往往這些軟體的價格反而要超過商業資料庫本身的授權費,並且這些軟體本身還在繼續消耗資料庫的讀寫資源。
而開源資料庫具有以下等先天的功能與優勢:
完全免費
多主多從節點,用主節點寫,用從節點來讀,主從節點之間數據強一致性同步。
無限水平擴展功能,包含計算節點數、存儲空間。
多重實時副本保障數據存儲介質安全,確保數據不會丟失
自動實現資料庫水平分表
目前很多軟體開發商在開發應用軟體時,還是會推薦使用商業資料庫,我們進行了原因分析:一是商業資料庫價格貴,但畢竟用的人多,熟練操作的人也多,遇到解決不了的問題可以請原廠工程師來。二是很多應用軟體廠商一直以來都是使用的商業資料庫,只要更換資料庫,那麼軟體廠商的軟體就要做較大改動。三是因為開源資料庫雖然是免費的,但沒有原廠上門的技術支持,應用軟體廠商在使用中若自己不能及時解決問題會造成損失。
雲計算服務也正是為了解決以上這些問題而來,在雲平台上,開源資料庫成了標準的PaaS服務,關係型與非關係型等各種類、各品牌的資料庫用於進行事務處理與數據分析。開源資料庫本身是免費的,應用軟體廠商也無需去搭建與維護開源資料庫,直接使用就行。
去E(傳統物理存儲設備)上雲後,我們現在使用的部分存儲已經從傳統的塊存儲(磁碟陣列、硬碟)、文件存儲(FTP、NFS)遷移到了既讀寫快、能共享、又按需付費的對象存儲上。
(7)微服務化、容器化、容器編排
我們學習採用互聯網行業的特點,迭代發布應用軟體,追求創新,快速響應用戶的變化、關注用戶的行為,倡導以用戶為中心的產品設計,也正是這些特點,我們使用了敏捷開發模式。使用敏捷開發模式就要進行微服務化,要進行微服務化,底層就要進行容器化,進行容器化後,就要有容器編排服務來管理這些容器。
我們目前新建的,以及綜合管理系統、協同指揮調度雲平台等系統,已經使用了微服務架構新建或者正在改造成微服務架構。我們在雲平台上從kubernetes到docker或再往上的每一層都做好了服務準備,同時也讓軟體開發商全力專註於應用軟體的開發。
2.2 大型應用
基於雲計算技術的協同指揮調度雲平台
我們於2017年3月開始新建基於公共雲服務的、全省統一的協同指揮調度雲平台,並於2017年12月正式開始使用。我們從開始建設到全省統一使用只用了9個月的重要原因之一就是使用了雲計算服務作為基礎設施,我們節省下建設整個數據中心(硬體部分)所需的時間,同時所需各類功能模塊全部採取調用雲端服務的方式進行,接下來我們就這個平台的部分關鍵技術進行分享。
支撐協同指揮調度雲平台的基礎數據有三大項,分別為全省高速公路各路段的沿線實時監控視頻,各級指揮調度中心日常處理事故、救援等公務的電話錄音,全省高速公路所有的情報板發布系統,這三大項的數據我們要求與協同指揮調度雲平台對接,接受協同指揮調度雲平台的管控,整個平台建設完成後平台就可以調看與管控全省高速公路的這些視頻、語音與情報板了。
接下來,將圍繞這三類基礎數據如何上雲來描述。
視頻上云:部署在青云云端的協同指揮調度雲平台需要管控各路段中心的視頻推流主機向視頻直播平台(含推流、拉流、鑒權、CDN等功能)推流。使用視頻直播平台是因為要考慮到高速公路內部管理與社會公眾的超高並發觀看的需求。這部分工作的關鍵技術在於,雲平台給高速公路各路段中心的視頻推流主機下發的推流地址,以及播放、停止等指令,因各類安全問題不可通過互聯網埠傳輸,這裡就需要用到雲端隧道技術來實現,這樣既有了雲平台的彈性伸縮、按需付費的特點,又具有了使用雲服務的安全性。
各路段的視頻推流主機接到傳輸指令後需要向視頻直播平台進行視頻推流,這裡需要用到直播平台的視頻推流鑒權功能,以防止非法的視頻推流。同時,用戶在調用直播視頻流的時候也需要進行防盜鏈的鑒權。
語音上云:各級指揮調度中心的電話錄音需要傳輸至部署在青云云端的對象存儲里保存,供隨時調用,這裡的傳輸也是通過雲端隧道進行的。
情報板上云:我們的協同指揮調度雲平台可實現全省高速公路所有情報板在雲端的統一發布,因情報板發布的安全性要求非常的高,所以雲端發布指令與情報板狀態的反饋除了必須通過雲端隧道傳輸外,我們還使用了青雲的WAF安全保護功能,啟用了發布主機ip地址白名單審核機制,確保情報板發布安全。
協同指揮調度雲平台還為了滿足多用戶的高並發訪問、用戶行為分析、快速檢索、系統日誌收集、子系統間消息訂閱、網路流量分析等需求,除了用到青雲負載均衡器的SDN透明代理等功能、Elasticsearch全文搜索引擎、zookeeper、Kafka、網路流量鏡像等功能外,同時調用了同樣部署在雲端的高德地圖LBS、容聯雲通訊的點對點視頻、IM通訊與簡訊發送、彩雲天氣的天氣定位、百度AI開放平台的語音合成等服務。
為保護用戶隱私、節約用戶手機流量,經過使用海康威視、大華股份等專業的視頻解決方案提供商為匹配我們的需求而專門研發的推流主機,進行視頻轉碼與降碼處理並推向雲端的視頻直播平台後,我們也將協同指揮調度雲平台中的功能組件之一,全省高速公路沿線的實時監控視頻向社會公眾開放,目前最高同時在線查看監控視頻的用戶數已達到21萬人左右,單日最高視頻點擊量為2300萬次。現在每個人都可以拿起手機、打開微信搜索並關注「江蘇高速」微信公眾號就可以使用了。
除了協同指揮調度雲平台,我們各類微信企業號、公眾號、社會公眾服務的APP、在線學習、安全生產管理等系統均使用了雲端相關的服務或建立在了雲端。
第三部分 理解雲計算
自從雲計算技術落地,開始大規模對社會提供雲計算服務以後,運維硬體基礎設施已經不再是我們必須做的事情了,因為我們要的是計算能力而不是計算機、要的是服務能力而不是伺服器。我們節約下了大量的硬體運維時間,去經營管理我們的主營業務,例如高速公路經營管理、社會公眾服務上。
我們集團從使用雲計算服務以來,已經不再自建機房與採購非必須的伺服器等硬體設備,我們從雲得到了這麼多傳統物理機房無法實現的先進功能,但總體IT基礎設施運維費用卻下降了70%。目前我們集團在雲端的各類業務系統有100多個,主機與容器數量(含PaaS服務組件)約為500台、防火牆、路由器、交換機等網路設備的數量約為800台,各種類型的雲端隧道約1000條,各種類型的安全規則約10000條,隨著我們業務的不斷發展,這些數量還在快速增加中,而這麼多數量的基礎設施及規則配置,我們集團總部只有1名員工在兼職管理,電腦不在身邊時甚至可用手機APP直接管理。
雲計算的本質就是互聯網應用,而真正的雲計算是必須擁有:按需購買,秒級計費、定時器與彈性伸縮、資源協作與編排、軟體定義網路、開源分散式資料庫與大數據平台等各類有彈性的PaaS服務。如果沒有這些雲計算的特徵標籤與功能,那就不是真正的雲計算,那還是傳統機房或者是加了點技術的傳統機房的升級版。
接下來我們來說一說雲安全,自從國家2016年11月7日頒布了《網路安全法》。在當今數字時代, 企業運營與網路密不可分,《網路安全法》的實施必將對企業的業務經營與合規工作產生重大影響。《網路安全法》的出台更加明確了在整個信息化建設中,各相關方的責任,更能監督各方認真做好各自的安全防護工作,加快國家整個信息化建設的進程。
雲安全可分為以下幾個層面:需求安全、高可靠、組織安全、宿主機安全、防病毒、賬號管理安全、合規、高可用、保密、虛擬機安全、應用架構安全、網路安全、容器安全、大數據等方面。很多關心我們網路安全的同事、專家們在以上各個層面都給我們提出了很多的建議與改進方法。
我們非常重視信息化安全,並在上述的各個層面都認真做了相對應的安全管理規則與措施。我們將雲應用方面分為三個層面,一是基礎設施,二是應用程序,三是網路連接,其中基礎設施安全由雲計算公司負責,應用程序安全由各個功能軟體開發商負責,而在網路連接安全方面,因為隨著信息化建設進程的加快,各類用戶需求的不斷增加與提高,同時雲端的各個業務系統的功能、種類、數量越來越多,各系統之間的關聯性、網路連接的複雜性、數據交換的頻率與所需帶寬也都越來越高,所以無論對信息化建設全局的了解與掌握方面、還是從各業務系統之間的各類資源的互通性上來看,這部分是由我們自己來管理。
現在有的雲計算公司宣稱自己是一個中立的雲,提出「上不碰用戶應用、下不碰用戶數據」等說法,這其實是雲計算公司本就應該堅守的基本規矩,這是雲計算行業自律的問題,同時我們也應該相信國家層面不斷加強的雲計算行業的監管力度,我們無需將精力分散到雲計算公司之間為相互競爭而不斷出新的廣告詞之中,而是應將重點放在我們的業務應用上。
目前市場上眾多的雲計算公司為用戶提供的IaaS層服務並不完全是自主可控技術,有的雲是用一個現成的、受某個基金會管理的開源技術架構,再經過加工改造提供給用戶使用;在PaaS層的很多服務也不是原生、原廠的組件,而也是經過雲計算公司自己加工改造後,做到比原生服務更好用的情況下,提供給用戶使用。
近期「中興晶元事件」使大家印象深刻,從中我們也可以明確的看出雲計算廠商在IaaS層完全擁有自主知識產權的重要性。IaaS層是雲計算平台的地基,如果一個雲計算公司所使用的IaaS層架構都不是完全自己開發的,沒有擁有完全的自主知識產權,那又怎麼能保證雲計算用戶的安全使用呢?又如何能迅速的滿足用戶的各類需求與建議呢?
同時,在PaaS層,有些服務都是經過雲計算公司自己加工而非原生的,雖然這些服務的功能、性能較多較好,但有很多對技術標準化、可轉移性、非依賴性等有嚴格要求的用戶,例如:交通、金融、物流、零售用戶,這類用戶怎麼能完全放心去用這些非原生服務呢?
另外,我們在進行雲平台技術參數比較的時候還發現以下明顯的區別:
一個功能齊全、靈活的雲平台,公共雲與專有雲的架構須是同一套底層架構,兩者的所有資源鏡像與備份要能通用。另外,還需要看雲平台的虛擬化效率與資源使用率,舉個例子來說,到達同樣的功能和應用效果,有的專有雲平台需要同樣配置的20台左右伺服器硬體,而有的雲平台只需要10台左右伺服器硬體。
有些單位需建立自己的專有雲,有的雲平台可以硬體利舊,使用現有各品牌與型號的伺服器與網路等設備,而有的雲平台則需要重新購買指定型號的伺服器與網路等設備。
面對市面上那麼多雲計算公司,我們除了看廣告、看品牌、更要看內在,所以以上這些才是作為雲計算的用戶真正應該關心的,也是用戶選擇提供雲計算服務商的重要因素。
在我們與青雲合作的5年多的時間裡,我們總共提出了700多條各種類型的工單,其中200多條為需求建議類工單,絕大部分青雲都幫我們實現了,還有些複雜的技術需求我們一直在保持溝通,共同努力解決;我們也與青雲達成了共識,將把雙方共同實現的技術與功能開放給所有的青雲用戶。同時,我們在這段時間裡,也向其他知名的雲計算公司合計提出了近200條的各類問題與建議,也就是說,我們不是單方面去使用雲服務,而是我們和雲計算公司形成了互動與合作關係,雙方經常進行技術交流,我們互相幫助共同進步。我們也會將6年來使用雲計算的經驗與雲計算用戶分享,共同加快國家經濟發展。
術業有專攻,只用一個雲平台的服務肯定無法全部滿足我們不斷提出的新業務需求,同時各個雲平台提供的各類雲服務的技術水平、服務方式、著重點等也不盡相同,所以我們選擇了多個雲平台中不同種類的雲服務,結合高速公路經營管理與社會公眾服務的各類應用場景,取各個雲之所長,來支撐我們的高速公路的信息化建設。
第四部分 總結與展望
我們在深度使用雲計算服務的同時,也聆聽了很多雲計算公司的演講與介紹,很多公司提出要攜手各類雲服務夥伴共同打造智慧交通生態,可以看出以雲計算為首的新興技術推動TO B時代已經來臨。
同時技術層面可以說只是智慧交通生態的一個方面,要達到真正的智慧交通則必須匹配相應的應用場景,除技術以外還需要行業投資、管理、運營、運維等一系列的因素相互配合;所以我們將會與高速公路上各類硬體終端設備廠商、各類軟體服務商共同打造「互聯網+」交通的雲生態,共同進行與高速公路相關的技術創新,並迅速轉化為應用成果。
近年來,我們也看到很多關於高速公路大數據應用與研究的文章,但我們事實上還處於數據快速匯聚與收集階段,為了儘快的實現大數據的應用,我們會加快將現有的離線、半離線與離線業務逐步轉變成在線業務,因為只有業務在線才能快速、實時匯聚高質量的數據,才能真正的去建設全維度的高速公路大數據平台。
只有擁有了基於在線數據的全維度高速公路大數據平台,才能結合當今最先進的人工智慧、物聯網、區塊鏈等技術,進行與高速公路相關業務的大膽想像與嘗試,向社會呈現一個充滿創新活力的高速公路,才能為國家交通事業的發展作出更大的貢獻。
本次我們分享的是雲計算技術的應用實踐,有機會我們也願意與大家分享用於支撐這些應用的底層關鍵技術、實施經驗、雲安全解決方案等內容,謝謝!
參考文獻
[1]王堅.在線.[M].中信出版社,2016.
※年營收上億美元的商業開源公司:38 家
※突發:碼農槍擊了 4 名同事,導致一人情況危急
TAG:雲頭條 |