科普成果 | 漫步數據云端—遇見更好的未來③

浙江社科 發佈 2022-06-23T13:54:44.505721+00:00

一、走進雲端(一)什麼是雲計算雲計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網絡訪問,進入可配置的計算資源共享池(資源包括網絡,伺服器,存儲,應用軟體,服務),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。

一、走進雲端

(一)什麼是雲計算

雲計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網絡訪問,進入可配置的計算資源共享池(資源包括網絡,伺服器,存儲,應用軟體,服務),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。

這個定義用通俗的語言翻譯一下,那就是:雲計算就是讓我們像使用自來水、電力、燃氣一樣,使用IT資源。用戶擰開龍頭(終端),IT資源就像自來水一樣噴涌而出,供用戶使用。在這裡,IT資源包括計算資源、存儲資源、網絡資源、軟體資源、服務資源等。而終端就是常用的手機、PC機、客戶終端機等。

當然,像使用自來水一樣,用戶也需要為所使用的IT資源付費,只不過,用戶是按照資源的使用量付費,和傳統IT資源獲取方式相比,它的好處是什麼呢?比如,用戶要搭建一個伺服器系統,使用雲計算後就不再需要購買一台真正的伺服器,而是在雲平台上(如阿里雲、騰訊雲、百度雲、華為雲等)租用一台虛擬伺服器使用,不需要時直接退租即可。再比如,用戶想要1TB的存儲空間,使用雲計算後就不再需要購買移動硬碟,而是在網絡雲盤上(如百度網盤、360雲盤、騰訊網盤、華為網盤等)註冊帳號,直接使用即可。

(二)雲計算的特色優勢

1.按需自助能力


按需自助我們最先想到的就是超市,每個顧客在超市裡都可以按照自己的需求挑選需要的商品,如果是同類商品,可以自己查看說明、查看價格、查看品牌來確定是按照性價比或者其它來決定購買哪一款。按需自助也是雲計算的特點之一。當我們根據業務的到來,可以根據自己的需要去購買自己需要的伺服器,進而提供業務,從而無需思考如何購買,買多久的問題。我們可以在業務增加時,購買多一些伺服器,在業務量少的時候,釋放一些伺服器。

2.廣泛的網絡接入


雲計算,通俗地講,就是網際網路加計算,所以網絡接入是雲計算自帶屬性。 在當今社會,網際網路幾乎可以覆蓋到全球每一個有人的角落,我們可以通過任意電子設備— —PC、Pad、手機等連接到網絡中,這也就意味著通過任何的電子設備都可以使用雲計算。在辦公室可以使用 PC,在機場車站可以使用手機或者 Pad,沒有網線可以用 WiFi 代替,沒有 WiFi,用流量也沒有問題,總之,可以接入網絡的地方,就有雲計算。我們業務需要做大時,也必不可少是增加業務的訪問面,不局限單一一種訪問方式,而雲計算的廣泛的網絡接入能力可以實現我們多種終端都可以進行訪問能力。

3.資源池化


資源池化是實現按需自助服務的前提之一,通過資源池化不單是把同類商品放在一起,而且還能將商品的單位進行細化。在超市裡,我們會看到生鮮區、果蔬區以及其它,這樣可以方便顧客快速地找到自己需要的商品,但這種形式不是資源池化,只能算是資源歸類,那什麼算是資源池化呢?

資源池化除了將同類的資源轉換為資源池的形式外,還需要將所有的資源分解到最小單位。

方便麵,算是很多人生活必需品之一,同時也有很多人反映一包吃不飽,兩包吃不完,這是因為超市中方便麵的最小購買單位是包,如果使用資源池化的方式,就需要打破「包」這個單位,將所有的面放在一個「池子」里,需要多少買多少。在很多的自助餐廳就這樣安排,將果汁按照不同的口味分開,客戶需要多少就打多少。資源池化還有一個作用就是可以屏蔽掉不同資源的差異性,如果餐廳中提供池化了的可樂,裡面裝的是百事可樂還是可口可樂或者兩者都有,顧客是看不出來的。對於雲計算中,可以被池化的資源包括計算、存儲和網絡等資源,計算資源包括CPU 和內存,如果對CPU進行池化,用戶端看到的 CPU 最小單位可以是一個核心,而不再體現 CPU 的廠商是 AMD 或者 Intel。

做到資源池化以後,我們可以更加精準地購買我們需要的伺服器數量,多了可以減少,少了可以增加。量化更加精細以後,我們不必擔心購買一整台伺服器怕資源過剩又怕資源不足。

4.彈性伸縮

我們前面在講按需自助服務時,提到過程式設計師為了應對熱點事件的突發大流量,自助購買伺服器進行擴容。除了可以擴容,當熱點事件降溫後,訪問流量趨於下降時,又可以將這些伺服器釋放進行減容,這種行為就屬於典型的快速彈性伸縮。

快速彈性伸縮包括多種類型,除了人為手動擴容,雲計算還支持根據預設的策略進行自動擴容或減容,伸縮可以是增加或減少伺服器數量,也可以是對單台伺服器進行資源的增加或減少。

我們熟悉的具備這個特性最典型的例子就是兒時的偶像——孫悟空的兵器金箍棒,可大可小,第一次出場時,「乃是一根鐵柱子,約有斗來粗,二丈有餘長」,在孫悟空的心中默念下,一 再地變小變細,「拿出外面,只有丈二長短,碗口粗細」,在後來孫悟空的炫耀中,「手中那棒, 上抵三十三天,下至十八層地獄」,而孫悟空拔根毫毛變出千萬個分身的時候,金箍棒也會變成千萬個。


在雲計算中,快速彈性伸縮對用戶來說,最大的好處是在保證業務或者應用穩定運行的前提 下可以節省成本。如果用戶是企業,在創立的初期,可以購買少量的資源,隨著企業規模的擴大,可以逐步增加資源方面的投資;另一方面,在特殊時期可以將所有的資源集中供給重點業務使用,非特殊時期,將空閒資源移做它用;如果特殊時期資源不足,可以臨時增加,度過特殊時期後,再將增加的資源釋放掉。無論是那種情景,對於用戶來說都是很方便的。此時就是前面說到的場景迫切需要的一個特性。

5.可計量服務

首先,計量不是計費,儘管通過計量可以進行計費。 在雲計算中,大部分服務都是需要付費使用的,也有服務是免費的,比如,彈性伸縮可以作為一個服務為用戶開通,大部分時間這個服務是免費的。 計量是利用技術和其它手段實現單位統一和量值準確可靠的測量,換句話說,雲計算中的服務都是可測量的,有的是根據時間,有的是根據資源配額,還有的是根據流量。服務可測量可以準確地根據客戶的業務進行自動控制和優化資源配置。對於用戶來說可以很清晰地看到自己購買服務的使用情況,還可以根據需求來購買相對應數量的服務。

我們還是用孫悟空的金箍棒來說明,在原著和影視作品中,我們可以看到金箍棒可以根據孫悟空的需求變大變小,但是具體變大多大,縮到多小都是隨心。如果金箍棒是雲計算模式,面對牛魔王這類大型妖怪,可以讓它變成 3 米長,1 米粗;面對小一點的妖怪可以小一些,2 米長,0.7 米粗;如果不用的時候,縮小到 1 厘米長,0.1 厘米粗,方便放入耳中。

說完上面5大優點,相信讀者們會想,雲計算說得那麼好,那麼如何落地實現呢?那麼以目前較為主流的雲服務提供商阿里雲、華為云為例,我們需要部署在雲上的業務可以使用計算雲服務中彈性雲伺服器ECS。如果不知道未來業務量多大,可以先購買通用計算型,然後設置彈性伸縮服務AS。當業務量增加時,增加ECS實例,當業務量減少時,減少ECS實例。帶寬也是如此。雲上就可以這樣進行靈活的根據業務量來調整。

二、雲計算的特點和服務

(一)雲計算的定義

我們在生活中常常聽到關於「雲」的概念,儘管我們對它完全不了解,但它早已進入了我們的現實生活中,像百度雲網盤、雲備份、手機中的王者榮耀,其實都是基於雲。本文帶你了解什麼是雲計算?雲計算如何解決我們業務中的問題?我們先來看一段美國國家標準與技術研究院的定義:

雲計算是一種模型,它可以實現隨時隨地、便捷地、隨需應變地從可配置計算資源共享池中獲取所需的資源(例如,網絡、伺服器、存儲、應用、及服務),資源能夠快速供應並釋放,使管理資源的工作量和與服務提供商的交互減小到最低限度。這種模式可以隨時按需為我們提供計算資源,也能夠跟著我們業務的需要而快速地增加或者釋放,也將我們管理資源的工作量與服務提供上的交互達到最小的限度。

可能覺得這個概念還是很籠統的,那我們可以來聊一聊最近的618活動,每年在這個時間以及雙11,雙12都會出現人們瘋狂購物,而在這裡就出現了用戶需求突然激增,而服務供給不足問題。


從上圖中可以看出,隨著時間的推移,用戶的訪問量會激增,而伺服器並不能知道何時達到能力閾值,也無法進行實時拓展。此時從紅黃二線首次交叉點到A線,出現了業務量無法正常供給,會造成用戶大量不滿意的情況,即使商家增加伺服器提高業務的上限能力,但是也需要長達2周到數月的時間,所以會造成業務量的浪費。當A線再到B線再次出現新的問題,業務量下降,而伺服器空閒的情況,這樣給企業帶來大量的浪費。這就是傳統IT伺服器算力攻擊的典型情況,而上雲,我們將會擁有更好的解決方案。

(二)雲計算的資源特點

雲計算最初的目標是為了實現對資源的管理,管理的資源主要包括計算資源,網絡資源與存儲資源,實現資源到架構的全面彈性。


1.什麼是資源

在選購電腦的時候,需要考慮的不僅僅是CPU,還要考慮它的內存能同時運行多少任務,可以把CPU,內存稱為計算資源。運營商接入的網絡,網絡的承載能力稱為帶寬,常說的10M,100M,1000M就是指帶寬的大小,帶寬越大,在單位時間內傳遞的數據量就越大,網絡帶寬稱為網絡資源。下載的內容越多,保存內容就需要更大的磁碟空間。常見的磁碟有機械和固態,MB,GB,TB是描述磁碟存儲能力的大小,存儲能力越大,存儲的內容就越多,存儲能力叫做存儲資源。

根據以上3個資源需求,就可以選擇出想要的電腦。同理,可以把伺服器想像成一個資源非常巨大的電腦,有著計算能力非常強的CPU,可以運行很多任務的內存,可以在極短時間內交互大量文件內容,可以存儲海量的內容。這樣的伺服器要怎麼使用才能發揮它的最大價值呢?只有用足了所有的計算資源,才能保證資源的最大程度地利用。

2.虛擬化

伺服器的資源能力非常強。需要用足所有的資源才能保證資源的最大程度的利用,但是什麼情況下才能保證資源完全利用呢?可以把這個伺服器進行虛擬化,根據自身的需要將資源進行分配,需求旺盛期間將資源全部利用,需求降低把多出的資源釋放出來做其他的事情。這個時候就需要利用雲計算虛擬化的技術,把虛擬化後的資源按需提供給所需要計算的任務。

3.靈活性

雲平台的虛擬化技術,可以將多餘的資源釋放出來做其他的事情。如果客戶只需要1個CPU,1G內存,1M網絡,10GB硬碟,專門去採購這樣的電腦給這個客戶使用就極有可能會造成浪費。如果在雲計算平台上面,就可以從剛才資源能力很強的伺服器上分一點資源出來就夠這個客戶使用了,客戶如果根據業務變化需要增加CPU,內存,存儲,只需要在雲平台上簡單操作即可完成擴充。

那麼這個靈活性體現在哪幾個方面呢?一是時間靈活性,需要的時候就增加。二是空間靈活性,如增減磁碟大小,甚至可以實現無限制存儲。時間靈活性和空間靈活性就是雲計算的彈性。

怎樣才能實現隨時隨地增加或者減少對應的資源呢?如果事先將物理設備都準備好了,虛擬化出來一台電腦是非常快的。根據以上內容,使用雲計算平台在極短的時間內創建出一台滿足需求的電腦,配套的應用部署,數據和管理才能拿來生產使用創造價值。

(三)雲計算的服務模式

根據應用的部署,數據和基礎架構託管等特徵,將雲計算模式主要分為公有雲和私有雲。

1.公有雲。業務部署在雲端,數據和基礎架構採用全託管模式。在雲計算的服務模式中,公有雲模式是發展最快。它有完整的雲解決方案,只使用一個或多個雲供應商的雲服務即可完成生產環境的部署;所有服務的功能模塊都完全位於雲託管環境中;按需支付,不需要關注物理硬體的故障問題,解放生產力。



2.私有雲。指為一個能單獨使用而構建的雲,提供對數據的安全性和服務質量的最有效控制。私有雲可部署在企業數據中心的防火牆內,也可以將它們部署在一個安全的主機託管場所,數據和基礎架構自己管理,其核心是指一種企業的專有資源。


3.混合雲。混合雲由兩種不同模式(私有雲、公有雲)的雲平台組合而成。這些平台依然是獨立實體,但是利用標準化或專有技術實現綁定,彼此之間能夠進行數據和應用的移植,例如在不同雲平台之間的數據容災備份和負載均衡。由於安全和控制原因,並非所有的客戶信息都能放置在公有雲上,這樣大部分已經應用雲計算的客戶將會使用混合雲模式。很多將選擇同時使用公有雲和私有雲,構建混合雲架構。

那麼,用戶到底是採用公有雲還是私有雲呢,這需要根據用戶的需求和關注點做綜合分析比較確定。三種雲計算組織模式的優缺點詳見(表1雲計算組織模式優缺點分析)。

項目

公有雲

私有雲

混合雲

優點

成本低,擴展性非常好


數據、安全和服務質量都較公有雲有著更好地保障

可根據需求,充分發揮公有雲和私有雲的優點

缺點

對於雲端的資源缺乏控制、保密數據的安全性、網絡性能和匹配性問題

成本相對較高,需要較高的建設和維護能力

架構較為複雜

由表格比較分析,公有雲成本低,擴展性更好,私有雲安全,但成本較高,混合雲架構比較複雜,但可以迴避公有雲和私有雲的缺點。

(四)雲計算資源管理

實現了資源層面的彈性還是遠遠不夠的,還需要應用層面的彈性。應用層面可以簡單分成兩個大部分,需要安裝的應用和通用不需要安裝的應用。

需要安裝的應用是客戶自行開發,如何安裝部署,導入私有依賴等內容。雲平台無法幫忙安裝,但客戶可以通過自動化幫忙實現,需要將配置信息融入到自動化工具安裝配置過程中,就可以實現批量化應用部署。

通用不需要安裝的應用一般指一些複雜性比較高的,但都要使用的,例如資料庫,雖然安裝和維護比較複雜,但安裝的方式都是一樣的。平台會提供安裝和維護等選項,幫助用戶降低成本。雲計算平台提供的服務能夠降低部分工作壓力,客戶只需要把有限的精力放在專業的應用上即可。

(五)雲計算與大數據應用

複雜的通用應用就是大數據平台,大數據與雲計算又存在什麼樣的聯繫呢?

大數據指的是指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的數據集合,需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。

大數據裡面的數據主要分為三種類型:結構化數據結構化數據、非結構化數據結構化數據、半結構化數據。

結構化數據是指固定格式且長度有限的數據,例如填寫的表格等。非結構化數據是指固定格式,長度不限,例如語音,視頻等。半結構化數據是指具有一定的結構性,例如xml,html等。

那麼,什麼樣的數據才有用呢?

數據本身不是有用的,經過一定的處理後,如梳理和清洗,才能被稱為信息。信息包含很多規律,將規律從信息中總結出來,放在應用上用於實踐,最後創造價值。

由於數據量龐大,一台機器是無法勝任這個工作的,需要更多的機器來協同完成這些工作。隨著時間,數據量會越來越大,很多小公司都能夠積累大量數據,但小公司沒有那麼多機器來處理這些數據,這個時候就可以擁抱雲計算,在需要的時候就藉助雲計算平台完成對數據處理、分析、檢索與挖掘。


中國雲計算產業迅猛發展,雲計算的生態圈也在瞬息萬變。近年來的發展主要呈現的趨勢:強化自身雲生態體系建設、更多數據中心投入建設、垂直行業的縱深場景化。作為人工智慧應用和大數據應用的基礎設施載體,雲計算正處於蓬勃發展的重要時期。

從大的層次上看,目前雲服務設備及網絡供應商、雲服務平台運營提供商、雲服務平台使用者三方構成了完整的雲計算生態圈:雲服務設備及網絡供應商為用戶提供構建雲計算平台的硬體設備和軟體系統。雲服務平台運營提供商使用雲服務設備及網絡構建雲計算平台,為使用者提供包括IaaS、PaaS、SaaS三大類的雲服務。雲服務平台使用者包含了社會各行各業的機構和個人,如政府部分、學校、IT公司、各行業的企業等,他們的應用需求促進了雲計算技術的變革以及推動了雲計算市場的發展。2020年我國雲計算市場規模達1781.8億元人民幣,而2020年全球雲計算市場規模達到2253億美元。


浙江省社科聯社科普及課題成果

課題編號:19YB27

課題名稱:漫步數據云端—遇見更好的未來

負責人:盧曉慧

推薦單位:嘉興職業技術學院

關鍵字: