特稿 >

行业洞察 >

众核系统系列一:希望还是妥协?

众核系统系列一:希望还是妥协?

量子云 丨 行业洞察

16993
1503

2016-12-15

tuni

Xtecher特稿作者

关注

今天很高兴迎来了Socionext公司的CTO来量子云商谈合作。之所以高兴, 是因为2011-12年我曾在硅谷某个著名公司从事过类似工作,对这个系统比较了解。同时也证明,之前的公司在战略和科技研发上的确走在时代的前沿。今天它取得如此成就亦是情理之中。

说起SOCIONEXT公司,首先我们分析一下这个名字。不写出来,读音会误解成social-next,我第一次听到的时候还以为是做下一代社交网络的呢。然而当我看到这个名称的时候,才明白这个公司的意思是 SOC - IO - Next。SoC就是当前流行的system on chip,低功耗高集成度的一种芯片设计,比如现在的手机芯片和嵌入式系统都是这样的;IO顾名思义就是输入输出,当然IO在这个里面的意思有点别扭,因为这个公司实质上是做网络通讯的,抑或NoC(network of cores)的,当然网络也可以理解成一种IO;第三个词Next也就是所谓的下一代。所以从字面上理解就是下一代芯片和网络系统服务器。

WechatIMG11.jpeg


介绍完公司名称,我们再来看看什么叫下一代芯片设计。


回答这个问题前,我们先要明白芯片和系统的差别。芯片顾名思义就是计算核心,也就是俗称的CPU,中央处理器,主要代表为CISC指令集x86的Intel和AMD,Intel和AMD追逐摩尔定律30年,最后把AMD活活的拖死了,Intel也就占据了x86的核心地位, 也就是我们俗称的摩尔定律最完美的代表,也是性能的代表。第二类CPU就是RISC指令集的MIPS,PowerPC,ARM等,发展到现在,ARM占主要地位,特别是低功耗手机和嵌入式领域,占了绝对领导地位。【芯片发展史见下一期】

 

由于任何一下芯片都不可能完成所有计算任务(量子计算机可能可以:-)),所以人们很自然的就想到将多个CPU链接起来,也就是出现了网络,当然这个过程中最大功臣就是Cisco。思科当时想解决的问题非常简单也非常自然,就是“如何完成计算节点间的通信,任务调配,实现资源共享”,在2000年左右取得了极大成功。


WechatIMG12.jpeg


为什么提思科呢?因为很早(其实也就14年前)以前我们的CPU都是单核心的,一个CPU一个计算单元。然而芯片设计的人都是非常非常厉害而且很容易融会贯通的,网络概念也慢慢应用到芯片设计中。


刚刚简单的介绍了,网络的概念就是通讯和共享。所以如果在一个主板上放两个或者多个CPU,并通过“网络”链接起来就是我们现在看到的双路,四路,甚至八路(这个名字似乎很熟),十六路系统,也就是我们说的系统的概念了。总的来说,系统就是CPU和其他计算设备(内存,图形卡,网卡等)组成的一个提供完整的计算设备。通俗说就是服务器,工作站,笔记本电脑等,是我们看得见摸得着的东西。

 

说完了几路系统,然后在深入一些,如果我们在一个CPU中放多个计算单元,然后在CPU内部用“网络”链接起来,那是什么呢?那就是我们所说的多核心系统,比如4核,8核,甚至32核,48核等等。一般来说,多核和多路系统都是在一个操作系统管理,也就是widows或者linux/unix可以看到很多很多核心,(大家可以想象一下,在48核心设备的windows server系统上打开任务管理器的情形,看到密密麻麻的绿色小框,是不是很爽)。所以一个系统可以是多路,多核,或者两者都有。

 

说完系统的概念,再来说说当前芯片和系统的困境和发展方向。其实在上面的讨论中基本已经出了雏形。所有计算机发展的动力就是我们需要更快、更快、更快(重要的事情说三遍)的芯片。也就是摩尔定律。为什么人们要追求摩尔定律呢?参见我写的另外一篇文章【内容产业的摩尔定律-视网膜定律】

 

回到本文主题本身,人们在追求摩尔定律的时候出了问题。出了什么问题?很简单,就是一颗芯片无法处理所有问题,架构师们必须把芯片链接起来。什么?这个是个问题?其实是个大问题。而且这个问题造就了刚刚说的cisco,也就是网络的诞生。既然网络无法避免,那问题就回到,“如何更加有效的做网络?”。所以基本上当前的芯片设计师都是顶级的网络架构师(当然在计算芯片内部每个模块也是网络链接的,参见冯诺依曼计算机原理)。

 

如何将计算芯片连接起来?这个问题是一个非常大的问题,不同的系统不同的解决方案,比如多核,多路系统。再不深究细节的情况下,我们可以认为他们的差别就是模块间连接技术的不同。而常见的几种连接技术包括:1)核心内走线,2)QPI/HT ,3)PCIe,4)串形,5)光纤/网络,等等。其中1)是每个公司核心技术,非常非常快;2)是当前主流的多路系统中的通讯协议;3)是大家常见的设备通讯协议;4)就是一些usb等外设通讯协议;5)也就是网络了。

 

由于1)和2)是企业私有的核心技术,而4)非常慢,所以大部分核心连路系统采取的就是3)和5)两种连接技术。通过PCIe或者网络将系统链接起来,增加密度,并减小不必要的部件。两者技术的差别非常大,网络以HP的moonshot为代表,实施比较简单,但开销大,PCIe是当前比较流行的方案,开销小,性能不错。但开发难度大,基本还没有成型的产品。

 

这种通过连接技术将很多CPU连接成“一个”系统的服务器就叫众核系统。这个定义其实比较模糊,后面会讲到。姑且用这么一个词形容这个系统吧,当前比较好的设计大概是一个3U空间能有256个CPU!每个CPU可以达到48个核心,也就是说3U空间中有12288个计算核心!也就是如果一个核心对应一个网站的话(非常非常奢侈的配置了),一个3U空间就可以支持12288个不同网站!


打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机