91av免费观看_日韩视频在线免费看_日本xxxx色视频在线观看免费_伊人222综合网图片_国产二区三区在线_91麻豆麻豆

IT之道-艾銻知道

您當前位置: 主頁 > 資訊動態 > IT知識庫 >

IT運維 | 異構計算簡介


2020-05-12 17:50 作者:艾銻無限 瀏覽量:
北京IT外包服務商為您提供專業的IT外包服務
 
隨著人工智能的發展,越來越多的計算平臺都采用了異構計算。作為IT運維必須要了解這種運算架構,以便更好的服務我們的客戶。異構計算主要是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式。異構計算已經無處不在,從超算系統到桌面到云到終端,都包含不同類型指令集和體系架構的計算單元,下面先從幾個系統了解下異構計算超算系統。


天河-2:包括16,000個計算節點,每個節點 2*Xeon (IveBridge)+3*Phi。Total 3,120,000 Core, Linpack測試基準為33.86 petaFLOPS ,Power 17.6 megawatts。編程框架:OpenMC/OpeMP。

Mac Pro: Intel Xeon E5 (6/8/2 cores) + Dual AMD FirePro D500 GPU (1526 stream processors, 2.2 teraflops, 3-way 4k video)。編程框架:CUDA、OpenCL、Metal。 

Amazon Linux GPU Instances g2.8xlarge: 4 GPU (each with 1,536 CUDA cores and 4 GB of video memory and the ability to 4* 1080p@30fps), 32 vCPU 。編程框架:CUDA,OpenCL。

Qualcomm Snapdragon 820 : octa-core CPU+ Adreno 530 GPU+ Hexagon 680 DSP,編程框架:MARE,OpenCL。

顯然,異構計算系統包含了不同異構計算單元,如CPU、GPU、DSP、ASIC、FPGA等。除了異構硬件單元,不同異構計算平臺采用的編程框架也不盡相同。那么,為什么要用異構計算?異構計算優勢主要提現在性能、性價比、功耗、面積等指標上,在特定場景,異構計算往往會表現出驚人的計算優勢。

· Google Brain:1,000臺服務器 (16,000 CPU核) 模擬simulating a model of the brain with a billion synapses.

· Nvidia:three GPU-accelerated servers: 12 GPUs in total, 18,432 CUDA processor cores.

The Nvidia solution uses 100 times less energy, and a 100 times less cost.

除OpenCL之外,還有很多編程框架?異構并行計算框架是充分發揮異構硬件性能和屏蔽硬件差異的關鍵,但目前業界不存在一個統一標準。OpenCL是業界主流公司推動的異構并行計算編程標準。OpenCL屬于性能層,業界很多產能層框架對接OpenCL。

· Intel、ARM、高通的異構硬件均支持OpenCL軟件設計。

· Intel Xeon+FPGA異構芯片支持OpenCL。

Nvidia CUDA、Apple Metal是針對各自異構硬件設計的計算私有框架,是封閉系統,但都有廣泛的開發者支持。CUDA和OpenCL在設計理念上非常相近,但Nvidia GPU性能業界最強,有能力通過CUDA綁定用戶,比如深度學習上Nvidia GPU效果最好,開發者只能選擇CUDA。異構硬件的一個趨勢是SOC上集成多種異構硬件。比如高通820芯片集成了ARM64+GPU+DSP等多種形態。

· 但傳統的計算框架只針對一種硬件設計,無法支持多形態。

· 高通設計了Symphony異構并行計算框架來發揮多形態異構硬件性能,同時適應未來芯片的演進。

OpenCL異構編程技術得到各大廠家的大力支持,可屏蔽異構硬件與OS差異,簡化異構核編程復雜度,OpenCL由蘋果提出,得到業界大多數廠商的支持:如Nvidia、Apple、AMD、ARM、INTEL、TI等等,支撐GPGPU、DSP、FPGA等通用硬件加速器。

· 優勢:OpenCL是針對GPGPU大規模數據并行的特性所開發的底層編程框架,屏蔽各廠商GPU之間的差異,與芯片設計協同演進,C語言的擴展。

· 不足:性能的可移植性不足。


 


 
OpenCL編程模型中隱含了很多的硬件特征,比如并行粒度、內存模型、存儲層次、資源粒度、內存帶寬和延遲、ISA差異等,這導致不同的加速器上的OpenCL代碼都要重新思考上述特征。隨著FPGA的廣泛使用,成本逐步降低,作為軟件定義實現快速在線指令優化,對整個編譯器、運行框架、

OS產生巨大影響。新架構對軟件的挑戰:

· 1)支持CPU+FPGA融合并行的計算框架,包括FPGA編譯和高層語言設計。

· 2)大規模分布式FPGA資源管理與調度

· 3)高性能FPGA算法庫。

異構計算主要是指使用不同類型指令集和體系架構的計算單元組成系統的計算方式。常見的計算單元類別包括CPU、GPU、DSP、ASIC、FPGA等。FPGA和GPU/CPU對比具有以下不同:

· 1.軟件定義的硬件架構:GPU/CPU硬件固定,其并行性設計是適應固定硬件。而FPGA的硬件邏輯可以通過軟件動態改變,從硬件的角度來適配軟件,從而獲得更高的計算性能。

· 2.更高并行性、能效比:FPGA擁有更豐富的計算資源組件,從而能夠滿足更多并行計算需求。并且能夠充分發掘軟件算法中的并行性,降低功耗。

同時,新架構融合CPU+FPGA,將成為一種發展趨勢:

· 1. 異構核首次作為一等公民:通過CPU+FPGA的融合設計,由主機+外設的Offloading模式轉變為異構多核片上系統設計,CPU與FPGA地位等同,通信方式由板級轉向片內。

·  2. OpenCL帶來了FPGA的編程革命:提高了FPGA的可編程性,將程序員從復雜的硬件電路設計中解救出來,更專注于系統/算法的設計。



 


 
總結:CPU主要是做通用控制以及計算的,整個算術邏輯單元ALU占整個芯片面積不到5%。CPU里面包含很多控制邏輯,預測,Cache等邏輯,所以算力不高,但是什么都能做。

· CPU主要特點:主頻高,但核數有限;邏輯控制和算術運算單元、具有大量緩存,主要功能在于管理和調度任務。

GPU專門用來做浮點運算,只能作為協處理器配合CPU完成特定計算。但GPU天然假設所有運算可以并行(GPU具有數千個計算核),整個芯片90%都是運算邏輯。所以算力非常高,通常是CPU的幾十上百倍。

· GPU特點:高并發(幾千個核并),強浮點能力和高顯存帶寬。

FPGA主頻低但集成大量計算單元,流水線并行和數據并行,具備硬件編程和加速和特定應用IP核。然而,ASIC是針對某一場景優化的專用處理單元,硬件基本不可編程,采用多個IP集成,但有高性價比和能效比。
 
艾銻無限科技專業:IT外包、企業外包、北京IT外包、桌面運維、弱電工程、網站開發、wifi覆蓋方案,網絡外包,網絡管理服務,網管外包,綜合布線,服務器運維服務,中小企業it外包服務,服務器維保公司,硬件運維,網站運維服務
 
以上文章由北京艾銻無限科技發展有限公司整理

相關文章

IT外包服務
二維碼 關閉
主站蜘蛛池模板: 国产成人精品自产拍在线观看 | 含着她的花蒂啃到高潮在线观看 | 国产美女牲交视频 | 鲁大师在线视频播放免费观看 | 黄色免费网站入口 | 亚洲AV乱码久久精品蜜桃 | 日韩精品人妻系列无码AV东京 | 精品国产一区二区三区四区色欲 | 欧美又黄又嫩大片A级克洛伊 | 熟妇人妻一区二区三区四区 | 久久亚洲色WWW成人不卡 | 色婷婷亚洲婷婷 | 亚洲JIZZJIZZ中国少妇中文 | 天海翼一区二区三区高清在线 | 国产交换配乱婬视频偷 | 狠狠热在线视频免费 | 精精国产xxxx视频第一次 | 中文字幕无码视频手机免费看 | 麻豆视频观看 | 老色鬼永久精品网站 | 国产精品刺激对白麻豆99 | 天天躁日日躁AAAAXXXX | 亚洲成AV人最新无码不卡短片 | 免费观看的a级毛片的网站 免费黄色网址在线观看 | 日本在线视频WWW鲁啊鲁 | 成人做爰69片免费看网站 | 亚洲中文字幕无码一久久区 | 免费精品国产人妻国语 | A级毛片免费真人 | 国产激情不卡 | 日韩免费无码一区二区三区 | 一群黑人大战亚裔女在线播放 | 日本亚洲国产一区二区三区 | 又粗又硬又大又爽免费视频播放 | 免费人妻精品一区二区三区 | 日日天干夜夜人人添 | h精品无码动漫在线观看 | 天堂а在线中文在线新版 | 国产美女露脸口爆吞精 | 亚洲日韩欧美在线中文18 | 97久久超碰国产精品旧版 |