账号:
密码:
CTIMES / 文章 /   
新一代异质运算带动资料中心运算架构变革潮
AI加速晶片和DPU加入

【作者: 季平】2022年01月25日 星期二

浏览人次:【1518】
  

随着人工智慧及大数据崛起,资料中心日益庞大,储存容量也因疫后数位转型加速而大幅成长。另一方面,智慧型网路卡与资料处理器所代表的新兴加速运算装置预料也将带动伺服器硬体加速成长,掀起资料中心运算架构变革潮。 CPU核心数增加以优化记忆体应用、提升高效运算能力成为重要课题。


CPU发展史堪称Intel和AMD「双雄争霸」的发展史,可分为4位微处理器、8位微处理器、16位微处理器、32位微处理器及六64位微处理器等。 Intel于1971年推出世上第一款微处理器4004,是包含2300个晶体管的4位CPU。


17年前,第一颗双核心X86处理器问世,AMD推出首款Opteron双核处理器,Intel也推出双核处理器,开启CPU多核处理器(Multi-Core Processor)时代。在多核处理器的竞技上,Intel多半保持领先,但约6年前AMD重返伺服器市场,抢先对手推出32核心伺服器处理器EPYC,刷新Intel的24核心纪录。迄今,双雄争霸互有胜出。


过去,单颗CPU核心数不够多,处理能力相对较弱,只能以增加CPU颗数的方式搭配高效能应用伺服器,组成更多CPU核心的运算丛集以提高伺服器处理效能。当CPU核心数达64核心,代表一台64核单路伺服器就能协助企业执行各种复杂运算或高密集运算工作。


X86处理器在随后的发展中逐步推展大量平行运算或浮点运算可视化、AI、深度学习等应用,之后,图形处理器(GPU)出现,智慧型网路卡(SmartNIC)与资料处理器(DPU)等新兴加速运算装置陆续分食X86处理器的运算工作,催化新一波伺服器硬体加速变革。


另一方面,为迎合DPU市场需求,业者必须快速提升伺服器的处理能力,增加伺服器CPU核心是最简单也最容易的方式。


此外,AI与特定运算的需求越来越大,加上物联网网路传输资料的安全性需求增高,处理器架构也必须全面翻新才能因应市场需求。市场上的CPU分为两大阵营,一是以Intel、AMD为首的复杂指令集CPU,二是以IBM、ARM为首的精简指令集CPU,除了品牌相异,产品架构也不尽相同,Intel、AMD CPU为X86架构,IBM CPU为PowerPC架构,ARM则是ARM架构。


新一代异质运算架构提升运算效能

由于AI加速晶片和资料处理晶片(DPU)加入运算阵容,新一代异质运算架构逐步成形。因应全球资料中心高效能运算、云端与AI运算需求,带动运算力更强大、更高效的伺服器需求。 Intel称霸半导体界十余载,如今,X86中央处理器统治资料中心运算架构的局面已然松动。



图一 : Arm推出新 Armv9 架构 CPU。(source:Arm)
图一 : Arm推出新 Armv9 架构 CPU。(source:Arm)

AI时代处理深度学习需要运用复杂运算,「效能」与「能耗」成为企业亟需解决的两大问题,因此衍生出GPU、FPGA及ASIC 等异质运算架构。异质运算是指系统使用不同的计算单元,如CPU、GPU、DPU、VPU、FPGA、ASIC等,不同运算工作需要交由符合需求的专用处理器执行才能大幅提升运算效能或改善能源使用效率。


近年来,异质运算的定义越来越多元,也包含使用不同架构的处理器及使用不同处理器架构的伺服器解决方案,主要目的是在最短时间内快速解决特殊工作负载,比方Arm架构处理器不只具有运算核心数量较多、功耗较低等优势,也更容易与Arm架构行动装置互通有无,顺畅沟通。


采用不同处理器架构相当于进阶版的异质运算,除了X86架构,还有Arm架构处理器等替代方案可以搭配各类新运算产品。随着晶圆代工商业模式成主流,AMD与苹果(Apple)似已威胁到Intel的霸主地位,过去2年,几大龙头业者也陆续推出新的CPU产品及异质运算架构解决方案。


商机可期 龙头业者动作频频

从数据面观察,不难看出资料中心运算架构商机可期,几大龙头业者也为加速抢滩而动作频频。 IDC《全球边缘运算支出报告》指出,2022年全球边缘运算支出预计达1760亿美元,较2021年成长14.8%,至于企业和服务供应商在边缘解决方案的软硬体及服务支出预计在2025年达到2740亿美元的水准。由于边缘部署具有多样化需求,为技术供应商创造极大商机,预料市场将出现更多新的解决方案。


以企业端来说,2022年边缘投资大宗包含制造营运、生产资产管理、智慧电网、全通路营运、公共安全与紧急应变、货运监控和智慧交通系统。预估2020-2025年,公共基础设施维护、网路维护、解剖诊断和AR 辅助手术等领域支出成长较快。 IDC进一步指出,美国将成边缘解决方案的最大投资者,预计2022年支出达765亿美元,西欧和中国则是第二大地区,支出总额分别为306亿美元和208亿美元。


DIGITIMES Research则预期,2022年下半年IC短缺可望缓解,由于北美云端业者、大型资料中心(如字节跳动、BAT)对伺服器需求强劲,加上Intel、AMD新一代CPU 2021下半年起小量出货带动换机潮,全球伺服器出货量呈现强劲成长力道。


几大龙头厂近2-3年动作频频,较劲意味浓厚。 Arm于2021年发表全新Armv9架构的全面运算解决方案,带来次世代沉浸式与互动式体验,提供更高的运算效能、安全性与扩充性。 Arm推出 Cortex-X2、Cortex-A710及Cortex-A510三款CPU产品,提升笔电效能及智慧电视用户体验,也为手游提供高效率的电池续航力。



图二 : 英特尔首度在PC X86架构处理器上推出具有大小核心的异质架构处理器。 (source:Intel)
图二 : 英特尔首度在PC X86架构处理器上推出具有大小核心的异质架构处理器。 (source:Intel)

Arm资深副总裁暨终端产品事业群总经理Paul Williamson 表示,Cortex-X2 是第一颗Armv9旗舰CPU,与Cortex-X1相较,效能提升16%,机器学习效能则提升二倍,预计带来逾30%的峰值效能,可以同步满足高阶智慧手机、笔电需求;Cortex-A710则是第一颗基于Armv9 的大核CPU,与Cortex-A78相比,能源效率提升30%、效能提高10%;Cortex-A510是首次推出的高效率小核核心,效能增加35%,机器学习效能更提升逾三倍,适合运用于智慧手机、家用及穿戴装置。


Arm也推出四款GPU新品:Mali-G710、Mali-G610、Mali-G510及Mali-G310。与Mali-G78相较,Mali-G710的效能提升20%、机器学习效能提高35%、能源效率提高20%,主攻高阶智慧手机与Chromebook市场;Mali-G610承袭Mali-G710功能但价格更亲民;Mali-G510不仅效能提升,耗电量也节省22%,锁定中阶智慧手机、高阶智慧电视与机上盒市场;Mali-G310则是将Valhall架构与高品质绘图技术导入成本较低的入门智慧手机、扩增实境装置与穿戴装置。


2021年底,Intel发表Alder Lake第12代Intel Core桌上型6款处理器,在伺服器虚拟化及软体定义化架构下陆续加入X86指令集,让X86处理器可以承担资料中心多数的运算负载。这款首度使用Intel 7奈米制程的混合架构CPU产品命名第12代Intel Core i9-12900K,堪称「地表最强游戏处理器」,16核心包含效能核心(P-core)及效率核心(E-core),也是X86架构个人电脑处理器首度使用大小核心设计。市场评估,Intel此举将掀起新一轮竞赛,尤其大小核心的混合架构设计,直接挑战2020年苹果发表的自研晶片M1,向其他龙头大厂示威的意图也很明显。


迎战双A(AMD与APPLE) Intel强势回归

在此不得不提CPU两大阵营外的第三方新势力:苹果(Apple),以及苹果掀起的异质核心(大小核心)概念。苹果于2020年发表采用Arm架构设计的自研晶片M1后,异质核心(大小核心)概念引起全球关注。M1系列处理器具有两大特点,一是异质核心概念让电脑可以视工作吃重度不同,将适合的工作内容分派给大核心或小核心处理,这般「适才适性」的处理方式大大降低机器耗能,提高运算最佳化效能;二是统一记忆体架构,透过M1 MAX,CPU跟GPU(显示晶片)可以同步共享64GB记忆体,达资料存取频宽最大化效能。



图三 : 全系列新款AMD Ryzen 6000系列处理器。(Source:AMD)
图三 : 全系列新款AMD Ryzen 6000系列处理器。(Source:AMD)

紧跟在Intel之后,AMD在2022年初发表全系列新款AMD Ryzen? 6000系列处理器,全新Zen 3+核心架构内建全新AMD RDNA? 2架构的显示核心。 AMD Ryzen 6000系列处理器采用台积电6奈米制程技术,带来1080p 3A级游戏体验以及超长的电池续航力。此外,AMD也发表新款Ryzen 7 5800X3D桌上型处理器,采用AMD 3D V-Cache技术,并率先采用Zen 4架构与全新AMD Socket AM5插槽的新款Ryzen 7000系列CPU。Ryzen 6000系列处理器的时脉速度高达5 GHz,堪称目前速度最快的AMD Ryzen处理器,与Ryzen 5000系列相比,处理速度提高1.3倍,显示效能提高2.1倍。


AMD在GPU和CPU运算核心部分都能提出效能更好的架构,如Zen和RDNA架构。绘图处理器GPU可以负责处理电脑显示绘图相关项目,Zen架构可协助电脑在执行网页浏览、多工作业及串流视讯应用时更快速处理显示速度,RDNA架构有助CPU更快速处理数据运算与执行指令。


辉达(NVIDIA)则在2021年推出首款基于Arm架构打造的NVIDIA Grace CPU,针对AI及高效能运算工作负载所设计,也是目前唯一支援NVLlink传输介面的CPU,可以和GPU搭配运作。 NVIDIA创办人暨执行长黄仁勋表示,要将Arm架构晶片拓展至云端运算、超级运算、个人电脑及自动化系统等领域,资料中心产品线将由CPU、GPU、DPU等三种晶片组成,NVIDIA架构平台将同时支援X86跟Arm。


预计2023年初上市的NVIDIA Grace CPU运算效能优于目前效能最快的超级伺服器约10倍的速度,可满足自然语言运算、推荐系统及AI超级运算等先进运算需求,同时可以整合Arm CPU 核心架构和低功率记忆体次系统,兼具高效与节能优势。


CPU双雄争霸 2022年更精彩

虽然几大龙头业者竞争态势明显,但各自着眼的产品发展策略不同,比方AMD走小晶片(Chiplets)路线,苹果选择M1 Max单一晶片,前者走小众化路线,后者强调「数大便是美」,在432平方公厘面积的M1晶片内布建高达570亿电晶体,功耗仅约90W。


数据显示,M1 Max GPU足以匹媲美AMD与Nvidia的高阶GPU。在Intel发表异质核心X86处理器后,X86架构往前推进一大步,未来CPU效能还有拓展空间,至于AMD等强敌未来是否跟进异质架构,对于市场及相关技术发展带来何种变数,值得观察。


相关文章
聪明部署边缘节点 实现灵活工业运行环境
TinyML前进物联 MCU深度学习成为可能
运算速度与峰值效能兼顾 行动运算肩负重任
技术预测:2022年及更远的未来
数位转型方兴未艾 新型态经济模式成形
comments powered by Disqus
相关讨论
  相关新品
mbed
原厂/品牌:RS
供应商:RS
產品類別:
Arduino
原厂/品牌:RS
供应商:RS
產品類別:
Raspberry Pi
原厂/品牌:RS
供应商:RS
產品類別:
  相关新闻
» [COMPUTEX] Silicon Labs实现物联网人工智慧边缘应用
» Artilux叁展COMPUTEX 2022 首发全系列光学技术产品
» [COMPUTEX] 英飞凌2022实体展 秀全系列智慧物联应用方案
» 爱德万再获自动化测试与最隹晶片制造设备大型供应商
» Pure Storage扩充Portworx产品阵容 提升开发人员生产力
  相关产品
» 是德推出PD1550A动态功率元件分析仪 提供DPT解决方案
» R&S向量信号产生器SMW200A推出56 GHz和67 GHz频率选项
» 儒卓力推出RECOM RAC20E-K/277高功率密度转换器
» ST推出DMS全局快门影像感测器 协助提升汽车安全性
» 研扬勇夺2022 COMPUTEX Best Choice Award金奖殊荣
  相关资源
» Power Management Solutions for Altera FPGAs

AD


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2022 远播信息股份有限公司版权所有 Powered by O3
地址:台北市中山北路三段29号11楼 / 电话 (02)2585-5526 / E-Mail: webmaster@ctimes.com.tw