摘要: 在這些用於數據分析的開源平台技術的實際企業部署方面,正在進行的許多工作都涉及到這一點。 “這些獨立的開源項目以他們的原始開發人員也沒有完全預料到的各式各樣的方式將它們自己結合起來。
二十年前,一家名為VMware的創業公司通過提供創建非物理機器虛擬化平台(如Linux,Windows等)來引入業務。隨著服務器處理能力的提高,基本應用程序無法最大限度地利用所有豐富的新資源。輸入虛擬機(VM),旨在在物理服務器上運行軟件,並模擬特定的硬件系統。管理程序是可以創建和運行VM的軟件或硬件。
使用不同操作系統的VM可以在同一台服務器上運行。例如,UNIX VM可以在也能運行Linux VM的服務器上運行。每個VM都有自己的應用程序,二進製文件和庫。與其購買能夠運行Unix軟件的新計算機不同,企業可以保留舊計算機,並添加新軟件。對於組織不斷變化的需求,這是一種更簡單,更便宜的解決方案。
服務器虛擬化是一種可以在虛擬化軟件的幫助下將物理服務器劃分為多個小型虛擬服務器的技術。在此系統中,每個虛擬服務器將同時運行多個操作。 Wikibon首席分析師James Kobielus在最近的DATAVERSITY採訪中表示:
服務器虛擬化的巨大優勢在於您可以更好地利用您投入的硬件資源。因此,您只需在實際需要時購買新容量。那是虛擬機。現在,虛擬機的一個問題是,在所有這些不同的平台上管理所有這些不同的虛擬機中的所有這些不同的機器映像可能相當複雜,它可能會成為一個管理負擔,非常複雜。“
雖然有可用的工具,但虛擬機技術可能很難使用。例如,在虛擬世界中解耦特定的,消耗資源的應用程序並不是非常簡單或直接。微服務和容器化提供了一種更容易的選擇。特定的應用程序代碼,例如數據庫索引邏輯中的查詢處理器和後端數據,可以通過微服務的容器化來分割這些不同的工作負載。
然後容器化來了
容器類似於VM,因為來自其他系統的軟件可以在非常不同的服務器上運行,容器還允許應用程序與資料庫和相依項目一起運行。然而,當虛擬機模仿硬件系統時,容器會傳輸自己的軟件系統,並以核心操作系統為基礎
虛擬機佔用更多空間,而容器佔用更少。 “VM可能需要大量的資源開銷,例如網絡輸入/輸出,內存和磁盤,因為單個VM運行自己的操作系統,而容器則不運行,”Kobielus評論道。容器共享稱為操作系統(OS)內核的東西,它訪問操作系統核心。另外,支持容器的操作系統可以更小,並且具有比虛擬機的操作系統更少的特徵。容器啟動速度更快,僅使用啟動整個操作系統所用內存的一小部分。顯然,容器是下一步的進化步驟。 Kobielus評論說:
“容器化在過去五年中確實流行起來。這是做微服務的方法,並且分發平台無關的虛擬化服務器環境,並且它可以工作。容器不僅可以在服務器中運行,還可以在客戶端設備上運行,等等。因此,我們所看到的是,容器化確實是通常所謂的雲原生計算的核心。“
容器化技術長期以來一直是Linux的一部分。您需要運行容器化軟件。 Kobielus表示,目前Docker是最受歡迎的容器之一,但是雖然還有其他容器化技術,但它們都插入了Linux。基本上,Linux是操作系統,Linux容器可以通過Docker,Mesos和其他各種方式實現。 “然後你可以在Docker容器中運行應用程序邏輯,然後獨立地擴展它們。
大多數Linux平台都支持ocker支持,因此可以輕鬆運行這些容器及其應用程序。它們基本上可以在任何Linux平台以及其他非Linux平台上運行。通過使用容器,可以在OS和底層硬件平台之間靈活地移動微服務。
Kubernetes
Kubernetes是一個開源的容器編排系統,旨在自動擴展,部署和管理容器化應用程序。容器編排系統最初由Google開發,但現在由Cloud Native計算基金會保存和維護。 NetApp現在使用Kubernetes架構,該架構嵌入在他們的環境中,並在整個分佈式雲端架構中協調存儲資源和存儲容器化。
StackPointCloud開發了一個基於Kubernetes的控制平面,用於管理聯合可信存儲集群,並在公共雲端的提供方之間同步化持久性存儲容器。然後,大型數據存儲供應商NetApp採用該技術並將其轉變為NetApp Kubernetes服務,該服務允許客戶在短至三次點擊的情況下啟動Kubernetes集群或存儲集群。
“它可以擴展到數百個用戶使用,這使得客戶可以部署可以從單個用戶界面擴展的容器,”Kobielus評論道。這是存儲的容器化。容器化的大部分發展都集中在應用程序和中間件功能上。
據Kobielus說:
“Kubernetes或Docker,以及和在此例中,Linux容器-的傳統漏洞或弱點之一一直是因為它們不適合存儲或持久性。然而,Wikibon在利用Kubernetes和容器,Docker等方面提供了大量關於存儲空間的創新,以實現雲端環境中的數據持久性。“
Hadoop 儲存空間
大數據分析平台正在形成一種趨勢。它與Hadoop用於存儲目的有關。它用於數據存儲,數據存檔和數據轉換。它也被用於數據治理。 Hadoop是一個開源核心平台,許多組織使用大數據用於各種目的。因此,Hadoop分佈式文件存儲已經變得非常流行。 Hadoop正在用於內部部署雲端,公共雲端和混合雲端。 Hadoop生態系統現在正處於容器化的過程中。 Red Hat是雲中Kubernetes的主要實踐者之一。 Kobielus說:
“創新者基本上將Hadoop生態系統的所有組成部分納入他們的計劃,然後對其進行容器化,以便可以獨立部署和擴展和管理它們。然後,他們使用Kubernetes以各種組合進行精心策劃。“
Kobielus評論:在這些用於數據分析的開源平台技術的實際企業部署方面,正在進行的許多工作都涉及到這一點。這些獨立的開源項目以他們的原始開發人員也沒有完全預料到的各式各樣的方式將它們自己結合起來。”。所有這些平台都得到了容器化。這種趨勢不會很快改變。
轉貼自: DATAVERSITY
留下你的回應
以訪客張貼回應