Sandy Bridge 处理器:GPU 和CPU浑然天成融为一体

秋风一起,眼见2010年就要过去了。去年这个时候,大家还在展望32纳米的新酷睿Westmere 处理器—-第一颗了 “吞并”了主流GPU(图形处理单元,显卡核心)的CPU。而大家今天的话题则更多的转向英特尔新一代的架构Sandy Bridge,其中的亮点之一就是显示核心(GPU)的全新实现方案—-无缝融合。在业界继续保持这种融合技术的领先。


2010年初发布的新酷睿处理器(Westmere)采用的方案是32纳米的CPU核心加上45纳米的GPU核心。拆开Westmere 处理器的封装可以清楚地看到CPU+GPU的 “1+1″两个核心的组合。
明年第一季度将要发布的Sandy Bridge 则做的更彻底,这个新的处理器微架构不只是 “吞并”,而是把GPU “消化”并融入CPU芯片中,成为自己身体不可缺少的 “一部分”。 用户购买了这样的CPU,同时也就拥有主流性能的”显卡”了,显卡以一块”卡”的形式存在于电脑中也越来越无形了。特别是笔记本电脑,用户不再为以往的集成显卡性能不佳而烦恼,也不用为焊上独立显卡芯片的笔记本电脑太热太吵以及电池迅速耗尽而苦恼。因为融合于CPU之中的核显,具有更高更智能的性能和更精良的能耗管理,以及和CPU其它计算单元之间更协调的均衡计算。
从 “图一”可以清楚地看到,一颗4个物理核心的Sandy Bridge处理器具有一个核显(GPU)了,它已经是CPU芯片的整体不可分割的一个部分,同样采用英特尔最先进的32纳米处理器制造工艺来实现。如果有机会拆开Sandy Bridge的处理器封装,我们所看到将是浑然一起的一颗32纳米芯片,GPU完全融合在CPU之中,非专业人士已经很难区分哪个区域是原来的CPU主要单元,哪个部分是GPU。
SNB001.JPG
图一: 核显融合在Sandy Bridge 处理器中
在 “图一”中,4个物理核心、核显、内核管理、内存控制器(IMC)等等都可以使用最后一级的可共享的高速缓存,具体实现中这级高速缓存就是我们所熟知的三级共享的英特尔智能高速缓存。图中看到高速缓存分成了4个部分,不要误解它们是每个核心专属的一级和二级高速缓存,图中没有细化到把核心0到核心4的一级和二级高速缓存都画出来。图中所示的是共享的三级高速缓存,它被分成物理上的4个片段,逻辑上由处理器内部的各个核心单元共享。
既然融为一体,Sandy Bridge中的核显(GPU)带来的优势是之前的酷睿处理器(Westmere)中的GPU不能比拟的:Sandy Bridge的核显可以直接使用共享的三级高速缓存了,它与各个核心能够直接在高速缓存交换数据而不仅限于之前的系统内存。因此,我们称之为 “核芯显卡”就更为贴切。也就是我们图中简称的 “核显”。
Sandy Bridge 中还设计了创新的高速环形联通架构,各个核心、各个高速缓存段、核显、内核管理中心等等可以通过这个高速的双向环形架构进行数据的交换。图二可以看到这个环形架构将Sandy Bridge 内部的各个单元连接起来,其中核显就是这个环形联通架构上的重要一个节点。
SNB002.JPG
图二:Sandy Bridge的环形联通架构
Sandy Bridge融合架构让我们看到这样几个趋势:
(1) 采用CPU的制造工艺,融合的GPU(显卡)的性能将得到进一步的提升,它的发展和CPU休戚以共,共同进退。
(2) GPU从此成为CPU的标准单元,CPU的定义拓展了,具有主流图形能力和性能的CPU将是常态。反之,没有GPU单元(没有显卡功能)的CPU将成为 “前辈”。
(3) GPU 单元在CPU的核心设计中将继续融合,边界更加模糊,甚至在指令集上进行融合和相互补充。
(4) 中高端独立显卡将在高端应用上继续存在,但是主流市场的退缩已经在所难免了。
(5) 只要摩尔定律继续有效,CPU作为中央处理单元将继续融合更多目前还是独立的单元。

17 Responses to Sandy Bridge 处理器:GPU 和CPU浑然天成融为一体

  1. 八雲きゅう says:

    “融合”之后的Sandy Bridge,iGP能支持抗锯齿吗?图形API支持到DirectX 11了吗?是像GMA 600的PowerVR架构吗?“融合”之后的生产成本应该更低啊,那么在平台定价方面会更亲民么?

  2. 王宇 says:

    对于主流应用来说,节能、高效,稳定性将成为用户关注的。目前处理器的性能越来越高,主流应用对于硬件的需求门槛越来越低,所以整合显卡的处理器将成为一种趋势,作为一种硬件单元而存在,并能很大程度上节约消费者的成本。想想之前某品牌的显卡门事件吧,就是由于独立显卡设计的问题,导致笔记本主板整体更换,尤其以H牌为甚。 而整合为一个单元的设计能大大降低风险,处理器也可以灵活更换,而焊接在主板上的显示芯片,就没这么方便了。

  3. 赵军 (Jun Zhao) says:

    Sandy Bridge 中的图形核心可以支持Intel Clear Video Technology(清晰视频技术)可以支持视频的抗锯齿,对于2D/3D 也可以支持主流游戏的抗锯齿。
    Sandy Bridge目前的图形核心还不支持DirectX 11,DirectX 11的定位还是在高端的独立显卡上。
    融合之后平台的成本自然会降低,具体要看上市之后系统厂商产品起量的节奏。

  4. 赵军 (Jun Zhao) says:

    音频处理单元早就在其中了,因为音频处理的计算量和视频处理相比要小很多。无线模块单元在移动设备上的急迫性更强,特别是手持设备的芯片。

  5. Anonymous says:

    “音频处理单元早就在其中了”怎么理解? 现在主板离开了集成的音频处理芯片还是不能发声啊.
    intel自从推出了HD Audio后,感觉对音频技术的推动就止步了.没有继续发掘音频的潜力.但我承认, HD Audio是nVidia终止开发SoundStorm后, 音频领域的一个亮点. 既然音频处理量不大,为什么没有集成的高品质intel处理器出现? 曾经一度期望的集成了音频处理单元的显示芯片也一直未出现.

  6. 赵军 (Jun Zhao) says:

    我们2个说的东西不是一样,呵呵。
    英特尔的高品质音频处理单元无论是以前集成在芯片组中,还是现在与图形处理单元合为一处融合到处理器当中,都是实现的影音数字媒体计算和处理部分。更多的工作是用硬件电路实现对这些数字媒体内容的解码/编码和调优/美化。
    至于需要输出到外部播放设备,这还要看播放设备的类型。以高清内容播放(包含高清音频和视频的内容),为例来说明。
    1. 如果输出的设备是一台高清的电视机,高清影院电脑通过专业的高清播放软件可以把高清视频和音频的内容进行无损失的解码,通过HDMI接口把解码后的高清影音内容播放在高清电视机上。这个时候用到了CPU内部的高清音频解码,声音放大部分是电视机完成的。
    2. 如果家里有更加专业的音响功放,用户可以选择通过数字音频输出端口,把未解码的音频码流传送到专业功放进行解码和放大,声音就通过功放连接的多个音箱播放出来(而不是电视机内置的音箱)。注意:这种情况,电脑不参与音频的解码。
    主板上集成的音频芯片,多数是AD/DA部分和接口,AD是采集模拟音频到数字音频用的,DA是为了支持模拟的播发设备(模拟音箱,非数字音响),这些芯片并不需要音频的Codec电路。如果有也就重复了。所以你说的主板要加的是这些AD/DA芯片,就像主板上的模拟视频芯片VGA一样,需要VGA接口的DA芯片以及接口芯片。没有它们影音传不出来。
    HDMI是传输数字信号的,所以解码后的影音数字信号可以直接被支持数字信号的高清电视接收。DA/AD就省了,也没有保留的必要。

  7. HASWELL says:

    有传闻说HASWELL是全新设计,请问一下是不是这样的?毕竟P6(包括大幅度改进得来的CORE)用的时间实在太长了

  8. Anonymous says:

    期待赵老师下一篇博客写一下关于sandy bridge的下一代以及下下一代的处理架构的鸟瞰文章。处理器工艺进步了好几代,架构也不断演进,但桌面主流处理器的功耗始终在60瓦上下,很期待达到移动处理器的功耗水平。

  9. CBR says:

    如果所有基于Sandy Bridge处理器的电脑中,只有不到50%的电脑外加了独立显卡,那么Sandy Bridge的融合就非常成功。

  10. 陈强 says:

    您好;
    下一代的CPU集成了GPU共享CPU的缓存,但是GPU芯片还只是相当于一个低端的独显对吗?但是比起以前的集显要高出多少?比如说能支持一般主流游戏的运行吗?(在不加独显的情况下)

  11. 赵军 (Jun Zhao) says:

    Sandy Bridge 的核芯显卡在2D和媒体处理能力(视频编解码)上可以和高端独立显卡没有差别甚至更好,在3D性能上已经能够胜任大多数游戏,如魔兽世界,穿越火线等等。性能相当于中低端独立显卡,核心显卡在3D执行的单元少于中高端独立显卡,所以在使命召唤和孤岛危机上不能和中高端显卡相比。
    Sandy Bridge的核芯显卡比英特尔目前市场上酷睿i系列内含的显卡,在3D性能上高出一倍多,比。所以主流游戏,包含大型3D 网游,只要不是想使命召唤7这类的3D密集的游戏,都没有问题。

  12. Dennis ZHU says:

    我想问一下,现阶段Sandybridge上面的GPU能不能和独立显卡融合使用,对整体3D性能进行加速?还是只能用H系列主板输出使用?

  13. 赵军 (Jun Zhao) says:

    目前还不能和独立显卡融合使用。Sandy Bridge 其中的GPU需要使用H系列主板才可以使用之。
    不过,Sandy Bridge 中的GPU可以和独立显卡以Switchable(可切换的方式) 来交替使用,但是这种方式需要主板上提供可切换的功能,而且需要独立显卡的驱动程序支持。这就需要独立显卡厂商和主板厂商的配合。