异构计算大战升温 HSA、OpenPOWER、英特尔谁执牛耳?
——首届HSA峰会纪实

 

时间:2016-08-24        来源:半导体行业观察

 

当前,半导体行业创新风起云涌,特别是在计算领域,呈现出了全新的发展态势,多种计算方式和架构正在逐渐融合。处理器芯片架构历经单核、同构多核等不同时期,正向异构多核方向发展,国内外主流企业均已加强对异构处理器的研发投入,并取得了一些重要的成果。如AMD发布支持HSA(Heterogeneous System Architecture,异构系统架构)联盟标准的异构计算处理器芯片,英特尔也在进行异构计算芯片的研发,另外还有IBM发起的OpenPOWER联盟。近期,中国芯“申威26010”CPU+GPU异构计算处理器芯片,应用在“太湖之光”超级计算机上,取得了很好的应用成果。

 

在这样的行业背景下,首届HSA峰会暨“2016年全球异构计算HSA峰会”于8月22日在北京亦庄拉开帷幕。本次峰会由HSA联盟和中国半导体行业协会(CSIA)共同主办,华夏芯、超威半导体(AMD)、联发科技、进想科技(Imagination)、乐金电子(LG)承办,以“拥抱CPU+时代”为主题。本次会议得到了网信办、工信部和北京经济技术开发区的大力支持。

 

各承办单位就全球异构计算芯片最新发展做了主题演讲。Cadence、Synopsys、CEVA等海外企业与申威、北大众志、元心科技、复旦大学、国防科大、上海交大、中山大学等数十家中国产学研单位围绕机器视觉、人工智能、深度学习、云计算、虚拟现实、软件无线电等多方面应用,对高性能计算的需求做了主题报告。

 

何为HSA

 

目前,复杂的片上系统(SoC)是大多数电子产品的核心:包括基于视觉的物联网系统、移动设备、台式机、高性能计算(HPC)系统、AR / VR和服务器,这些异构架构通常由来自不同供应商的各种IP模块组成。这些IP包括CPU、GPU、FPGA、深层神经网络(DNN)、DSP等,通常采用它们自己的专有编程语言进行设计和实现。异构系统架构(HSA)规范旨在解决这种低效率的方式,帮助开发者加速设计和编程过程,从而开发日益复杂的异构系统。一旦采用缓存一致性的共享虚拟内存,HSA系统将实现对存储空间的高带宽共享访问,提高了系统的性能并降低了功耗。

 

HSA联盟于2012年成立,成员包括40多家半导体公司和17所大学,这些成员单位也包括中国的半导体公司和大学。该联盟的宗旨是提高计算效率,让异构编程更加容易、方便和简单,HSA是一个非营利性的组织。

 

从CPU向CPU+的发展,有可能引起芯片行业很多现行规则的改变,使得处理器设计变得更加容易集成,也更容易验证,对开发者而言,将更容易开发和调试,也更容易使用,价格也更低。该市场非常庞大,如果HSA联盟能够在中国首先实现CPU+的目标,不仅有利于突破传统处理器的技术和应用,而且有可能改变全球处理器产业的发展格局。

 

异构计算竞争格局

 

HSA联盟一直想建立一个开放的标准,并于2014年发布了HSA平台的系统架构手册1.0版本,以及HSA程序参考手册1.0等,希望通过这些开放标准迅速建立起HSA的生态系统,使它更容易推广,容易被人们接受。但由于它还是一个新的行业组织、一种新的标准,所以要被广泛接受还需要有一个过程。对于HSA联盟来说,如何让大家广泛地接受,推广自己是一个很重大的课题。

 

目前,国际上有其他一些跨国集团也在做类似于HSA所做的融合各种处理器的工作。2015年英特尔以167亿美元收购FPGA厂商Altera,最近,英特尔又收购了一些特色技术供应商,这些举动表明该公司也在向异构计算方向发展,英特尔具有CPU传统优势,但是他们也存在危机感,随着数据中心的需求、云计算的发展,为了提高竞争力,该公司希望通过收购的手段,用特定功能的加速器来加强他们在数据中心市场的竞争力。

 

此外,2013年8月IBM联合了谷歌、NVIDIA、Mellanox、TYAN等成立了OpenPOWER基金会,这个联盟的宗旨是基于IBM Power处理器架构建立全球性的生态系统,其中IBM提供GPU,有一些厂商把他们的芯片接到IBM的CAPI接口上,以提升IBM Power系统在数据中心的竞争力。今年6月,OpenPOWER在北京举办了峰会,这表明这些国际联盟都非常重视中国市场。

 

此外,非传统厂商也在进入这个新兴处理器市场,比如谷歌和脸书,他们主要是在人工智能、深度学习等有巨大需求潜力的领域推动发展新一代的处理器。谷歌认为,AlphaGO能够战胜李世石,秘密武器就是张量处理器(TPU),使得机器的深度学习能力,在同等功耗下,处理性能大大优于传统芯片。

 

中国工程院院士倪光南表示:“异构计算正在发展,我们希望大家能密切关注这个趋势。今天,HSA峰会提供给我们一个机会,让我们看到他们所做的工作,给我们中国处理器厂商提供了很好的学习和创新机会。我们希望这次大会能够在发展异构计算方面取得更大的进展,希望我们中国的同行能够在这其中积累经验,我们共同努力,让异构计算实现更大的创新和发展。”

 

HSA生态系统的建立

 

对于HSA生态系统的建立,该联盟主席John Glossner表示:“几个月前,我们发布了异构系统架构HSA 1.1规范,极大地提高了在异构设计中整合开放或专有IP模块的能力。我们现在已经可以看到一系列的HSA兼容解决方案进入市场,峰会期间与会成员公司还会展示技术细节和HSA兼容系统演示。”

 

AMD全球副总裁、中国研发中心总经理李新荣表示:“AMD作为HSA 联盟的成员之一,承诺支持一个使开发者可以自由选择的开放的生态系统。作为一个拥有丰富功能的开源软件平台,ROCm为超大规模多GPU计算进行优化,并支持更广泛的软件工程社区,为开发者提供一个优质和简易的编程环境。我们希望在开源的架构上促进更多的学术研究以及商业创新,并希望透过开源架构与合作伙伴一起开发更多的使用界面,并做更多工具的开发。”

 

Imagination谈软银收购ARM

 

作为全球第二大处理器IP提供商,Imagination也是HSA联盟的创始成员之一,其PowerVR GPU IP和MIPS CPU IP闻名于世。HSA峰会期间,当被问到近期软银收购Imagination最大竞争对手ARM时,该公司全球副总裁、中国区总经理刘国军表示:“Imagination在地球上的竞争对手只有一家,那就是ARM。日本软银公司收购ARM对我们有什么影响?坦率地讲,这是一个比较复杂的问题。不只是我们自己,整个行业的看法是,这对我们Imagination是一个很好的机会。特别是在中国,在没有并购的时候,ARM在嵌入式领域已经很强大。很多客户在做新产品开发的时候,已经感受到了来自ARM的压力,任何一个行业,如果只有一家独大的话,第一客户不喜欢,第二不可持续。”

 

“为什么我们认为软银并购ARM对我们来讲是个机会呢?原因有两个”, 刘国军说:“第一,软银旗下有很多IT和电信公司,原来ARM在剑桥完全独立的市场地位是不是能持续,这是一个很大的疑问,因为作为IP公司必须是中立、独立的。第二,跟中国市场有关系,坦率地讲,至少中国政府不喜欢一个日本公司掌握着我很多核心的东西。日本公司拥有关键IP,中国市场肯定会有很多人有疑虑。”

 

华夏芯努力建设HSA生态链

 

华夏芯(北京)通用处理器技术有限公司是异构多核处理器IP核供应商,在处理器IP核方面,拥有完全自主知识产权,在国内外申请了多项基础核心专利,基本形成知识产权保护门槛。该公司的副总裁John Glossner已于2015年当选为异构系统架构联盟(HSA)主席。

 

华夏芯在加入HSA联盟之初,就积极投入到相关技术的研究和开发中。目前在工具链方面,华夏芯开发的GCCBRIG已经交付GCC组织,成为HSA的主要开源工具之一。特别需要指出的是,在这一次峰会上,华夏芯还将对外发布新一轮的开源软件计划,这就是商业价值极高的深度学习和神经网络开源软件计划。

 

对于CPU+,华夏芯首席执行官李科奕表示:“CPU+时代的来临,背后有着强大的驱动力:那就是更强大的计算,更低的功耗,更方便的集成,开发团队更小,以及产品更快速进入市场。这不是某一项技术所能解决的,而是需要一整套从软件到硬件的标准。这正是HSA的目标。要实现这个目标,需要IP供应商、OEM制造商、学术组织、SoC厂商、操作系统供应商和软件供应商共同努力。”

 

在谈到开放性的时候,李科奕说:“HSA是完全开放的,全球有3个主要阵营做异构计算。HSA是全面兼容的,支持X86,HSA是向它开放的,它会不会把自己的东西开放给别人呢?这要画一个很大的问号。”

 

确实,对中国来说,很难跟英特尔去谈架构合作,因为英特尔认为它的标准就是全球的标准,你很难和它共同制定一个平等的游戏规则,它不愿意开放,因为开放之后它就没有优势了。

 

在谈到OpenPOWER时,李科奕表示:“我觉得这是一个很不错的开放体系,OpenPOWER的优势主要在服务器上,HSA覆盖面比较广,它的主要优势还体现在嵌入式、移动计算领域,英特尔现在放弃了移动计算,这是HSA的第二个优势,第一个是开放性。为什么我提倡更多的中国处理器公司,包括下游厂商一起加入HSA?就是基于刚刚提到的开放性和共享,今天,HSA主席提到,所有的东西都是免费的,都是大家来共享,开源的,这对中国来说是非常重要的。”

 

联发科十核三丛助力HSA

 

联发科在2012年6月HSA联盟成立时就加入进去了,是6个初始建立者之一。除了是基金会的董事会成员外,联发科还积极参加各种不同的工作组,向HSA提交技术方案。联发科还主持着多厂商工作组的工作。

 

应用HSA 技术,联发科首创了十核三丛集架构,并将其应用到高端芯片曦力X20上,再辅以CorePilot3.0技术,实现了高性能、低功耗的用户体验。联发科与其他伙伴公司积极合作,评估如何将HSA技术更好地嵌入到SoC中。HSA技术能够使 CPU及其他运算单元实现更高的性能和更低的功耗,得益于这些优势。

 

HSA推广面对的问题和挑战

 

对于中国市场来说,异构计算和HSA还属于较新鲜的事物,现阶段,其在推广方面还面临着一些问题和挑战,具体表现如下:

第一,像这种系统级的整合,特别是系统软件和系统硬件方面的整合,难点在于高端人才比较稀缺。

第二,这个领域需要产业链上下游的协同合作。

首届HSA峰会于北京拉开帷幕,参会人员远超预期 全球下一代处理器峰会在京举行 中国如何领跑异构计算