Subscribe to RSS Add to Technorati Faves Digg This Page Send to Stumble Upon Bookmark on Delicious

为什么微处理器要从单核转向多核?

赵军 (Jun Zhao), 2007年6月03日

自从英特尔在2005年推出了第一代双核处理器之后,我们经常会被用户问到这个问题,为什么微处理要从单核转向多核?计算机上不断涌现的新兴使用模式让最终用户对处理器的处理能力——即性能——提出了更高的要求,并且对性能每年提高的幅度还在不断加速,而多核技术是目前行之有效的方法。

图注:如何将处理器性能提高10倍——采用多核技术

为什么不能用单核的设计达到用户对处理器性能不断提高的要求呢?答案是功耗问题限制了单核处理器不断提高性能的发展途径。

作为计算机核心的处理器就是将输入的数字化的数据和信息,进行加工和处理,然后将结果输出。假定计算机的其他子系统不存在瓶颈的话,那么影响计算机性能高低的核心部件就是处理器。反映在指令上就是处理器执行指令的效率。

处理器性能 = 主频 x IPC

从上面的公式可以看出,衡量处理器性能的主要指标是每个时钟周期内可以执行的指令数(IPC: Instruction Per Clock)和处理器的主频。其实频率就是每秒钟做周期性变化的次数,1秒钟只有1次时钟周期的改变叫1Hz(赫兹)。主频为1GHz 就是1秒钟有10亿个时钟周期。

因此,提高处理器性能就是两个途径:提高主频和提高每个时钟周期内执行的指令数(IPC)。处理器微架构的变化可以改变IPC,效率更高的微架构可以提高IPC从而提高处理器的性能。但是,对于同一代的架构,改良架构来提高IPC的幅度是非常有限的,所以在单核处理器时代通过提高处理器的主频来提高性能就成了唯一的手段。

不幸的是,给处理器提高主频不是没有止境的,从下面的推导中可以看出,处理器的功耗和处理器内部的电流、电压的平方和主频成正比,而主频和电压成正比。

因为: “处理器功耗 正比于 电流x 电压 x 电压 x 主频”,“主频 正比于 电压”

所以:“处理器功耗 正比于 主频的三次方”

如果通过提高主频来提高处理器的性能,就会使处理器的功耗以指数(三次方)而非线性(一次方)的速度急剧上升,很快就会触及所谓的“频率的墙”(frequency wall)。过快的能耗上升,使得业界的多数厂商寻找另外一个提高处理器性能的因子,提高IPC。

提高IPC可以通过提高指令执行的并行度来实现,而提高并行度有两种途径:一是提高处理器微架构的并行度;二是采用多核架构。

在采用同样的微架构的情况下,为了达到处理器IPC的目的,我们可以采用多核的方法,同时有效地控制功耗的急剧上升。为什么?看看下面的推导。

因为:“处理器功耗 正比于 电流x 电压 x 电压 x 主频”,“IPC 正比于 电流”

所以:“处理器功耗 正比于 IPC”

由单核处理器增加到双核处理器,如果主频不变的话,IPC理论上可以提高一倍,功耗理论上也就最多提高一倍,因为功耗的增加是线性的。而实际情况是,双核处理器性能达到单核处理器同等性能的时候,前者的主频可以更低,因此功耗的下降也是指数方(三次方)下降的。反映到产品中就是双核处理器的起跳主频可以比单核处理器更低,性能更好。

由此可见,将来处理器发展的趋势是:为了达到更高的性能,在采用相同微架构的情况下,可以增加处理器的内核数量同时维持较低的主频。这样设计的效果是,更多的并行提高IPC,较低的主频有效地控制了功耗的上升。
除了多核技术的运用,采用更先进的高能效微架构可以进一步提高IPC和降低功耗——即提高能效。基于英特尔®酷睿™ 架构的英特尔® 酷睿™ 2 双核处理器和至强处理器就是现实中的例子。相比英特尔前一代的NetBurst 微架构(Intel® Pentium® 4 和Pentium® D),酷睿微架构采用的英特尔® 宽区动态执行引擎和英特尔® 高级数字媒体增强技术,就是提高IPC的创新技术;英特尔® 智能功率特性则是降低微架构功耗的技术。


评论 (73)
del.icio.us StumbleUpon Digg It
其他归属标签: , , , ,

评论

2007年6月04日  |  andy :

功耗问题限制了单核处理器不断提高性能的发展途径.这句话是问题的症结所在,双核的出现像是打开了性能的潘多拉盒子,让人们看到了三核,甚至N核,但是在这种情况之下,留给价值链上其他厂商的技术压力,可能会是将来IT行业的看点。

2007年6月04日  |  赵军 :

不应该是“潘多拉盒子”,呵呵!因为开启双核和多核的设计思路,给业界带来了新的发展机会,而不是给大家带来了“瘟疫和灾难”。 IT业的发展本来就充满了创新和机会,同时也给大家带来了不断成长的压力。英特尔公司也不例外。

2007年6月04日  |  chantao :

多核心处理器与单核心处理器就像同样的水,用一个大功率的水泵抽水不如用多个功率稍小的水泵抽水。只不过问题在于软件行业现在支持双核心的OS还很少,双核心的优势只能表现在多任务的情况下,而多任务的表现又受限于其他硬件,表现的也不尽完美,所以未来必须要有更多的OS与应用软件相结合,才会更快的进入多核心的时代。

2007年6月04日  |  赵军 :

3楼比喻非常贴切,让大家更容易理解,谢谢!

其实,支持双核的服务器操作系统已经很普及了。对于客户端操作系统,像Windows XP, Vista 都是支持双核的操作系统——支持多任务多线程的操作系统。

目前,越来越多的软件和应用程序都支持多线程和多任务。这种趋势不是出现双核处理器才开始的,早在英特尔在Pentium 4 上支持超线程就开始了。

只要使用支持多线程的编译器编译高级程序设计语言编写的程序,就可以让生成的可执行程序支持多线程,当然就可以充分利用双核处理器的能力。

2007年6月04日  |  chantao :

技术部够敬业,我转了一圈回来竟然回应了所有的发言。 xp似乎只支持双核,英特尔好像已经发布了四核心的处理器,未来要开发8核心,据说还要开发2XX核心的处理器,看你的博客,似乎英特尔会在里面加入更多的协处理器。

2007年6月04日  |  赵军 :

Windows XP Home Edition(家用版) 可以支持一个物理处理器,而不管其中有几个内核,也就是说它可以支持多个内核没有问题。

Windows XP Professional(专业版)可以支持多达2个物理处理器,而不管其内部有几个内核。因此,从目前来看,这版本可以支持2个双核的处理器,或者2个四核的处理器。

我把微软网上的原话贴在这里,具体的,请你咨询微软公司。 Windows XP Professional can support up to two processors regardless of the number of cores on the processor. Microsoft Windows XP Home supports one processor.

2007年6月04日  |  陈昞睿 :

既然芯片频率的提升导致功耗三次方的加大,那么内存是否也有类似的情况呢?是否应该设计多核内存来降低能耗并提升性能呢?

2007年6月04日  |  赵军 :

陈先生提到的设想说对了方向,但是实现方法不是通过多核,而是通过提高内存芯片每个读写周期内发送比特的数量,从而可以使每个内存芯片的物理工作频率降低。

例如,内存技术从SDRAM, 发展到 DDR SDRAM, 然后是DDR2 SDRAM, 到最近的DDR3 SDRAM,就是按照这样的思路开发和设计的。

DDR-400 和 DDR2-400的数据传输率理论上是一样的,但是DDR-400 内存的物理工作频率是200MHz, 而DDR2-400 内存的物理工作频率只有100MHz, DDR2-800 内存的物理工作频率是200MHz, 可 DDR2-800 的数据传输率是DDR-400的两倍。

2007年6月04日  |  孙永杰 :

IBM的Power6的主频高达5GHz,但发热量和功耗仍就保持了Power5的水平,看来处理器架构的设计也很重要。

2007年6月05日  |  小二黑 :

从“铜矿”到“图拉丁”到“奔四”再到“酷睿”,Intel似乎经历了一个轮回;时至今日,想起当初价廉物美又性能卓越的图拉丁赛扬,依然感慨万千;令我至今迷惘的是这么好的CPU架构却遭遇了被抛弃的命运;不过令人欣慰的是,现在看到了“酷睿2”…… 其实想来,如果当初Intel在图拉丁架构基础上开发多核心技术,那么现在不知道CPU的发展会是怎样……

呵呵,扯远了……其实对于多核心,一直有一个疑问,对于个人用户来说,到底CPU需要多少的性能,与之相对应的多少核心的集成是最合理最经济、性能最优的?

比方说将上千个8086的核心集成在一颗CPU上那么结果会是怎样?当然这只是玩笑:)

2007年6月05日  |  刘行 :

我觉得最大的原因还在于应用,市场有需求,产品才能卖的出去.硬件推动软件,软件推动硬件.相符相承.就象VISTA一出内存狂卖一样.ROBSON同样也是开机太慢才存在的应用需求.

2007年6月05日  |  袁超 :

POWER 6虽说是性能翻番,功耗与上一代产品保持不变,但是从绝对数值上来看,它的功耗也太吓人了. 另外,还是期待Nehalem,它应该算是在整个平台的架构上都更新了.尤其是处理器与其他组件的数据带宽上.

2007年6月05日  |  赵军 :

看到数码相机,数码摄像机,高清电视/电影等等数字设备越来越普及,面对越来越多的数字内容和数字媒体需要加工、处理、共享等等,面对这样的应用,大家永远都会觉得自己的计算机不够用。这只是众多涌现出的新的使用模式中的一种。

另一方面,摩尔定律让我们有这样的经验,硅芯片技术的不断进步,让我们每2年都可以在同样面积的硅片上集成2倍的晶体管。这样,我们就可以在相同面积的硅片上集成更多的功能,功能强大的处理器又反过来催生了更多新兴的应用。

所以,用户如果需要自己的计算机做更多更复杂的事情,那么对更高性能计算机的需求就没有止境,今天看来还是这样的。目前选择多核技术作为提高处理器性能的方案之一就是自然而然的事了。

2007年6月05日  |  chantao :

不知道XP支持的双核心和多核心是并行处理还是串行处理, 如果是串行,那么处理器仍然是单线程的工作。 多核心是未来的趋势,而且技术也日趋成熟,不过似乎目前的核心之间的数据通讯,以及前端总线已经成为了多核心的瓶颈。

2007年6月05日  |  赵军 :

XP 支持双核和多核心是并行处理的,都是通过支持多线程方式来实现的。

对于英特尔的四核处理器而言,每2个内核都共享高达4MB的L2 Cache,目前高达1066MHz 甚至1333MHz的前端总线不会给单处理器(四核)的系统带来瓶颈。甚至对于双路的服务器来说,这么高速的前端总线预留的带宽也绰绰有余。

当然,对于更多路(4路,8路)的服务器,单条前端总线会是瓶颈,英特尔在不同阶段会采用不同的方案,如:2条前端总线,4条前端总线,将来的连接技术等等。

2007年6月07日  |  汪儒 :

请问双路CPU和双核CPU在结构和性能上又是什么关系呢?

2007年6月07日  |  赵军 :

双路CPU是指系统里面可以插上2颗CPU, 双核CPU是一颗CPU内部有2个内核。

例如,双路服务器,里面可以有2颗CPU,这两颗CPU可以是单核的,也可以是双核,四核的,等等。

2007年6月07日  |  赵军 :

双路CPU是指系统里面可以插上2颗CPU, 双核CPU是一颗CPU内部有2个内核。

例如,双路服务器,里面可以有2颗CPU,这两颗CPU可以使单核的,也可以是双核,四核的,等等。

2007年6月07日  |  汪儒 :

那么双路单核和一颗双核谁更强呢?

2007年6月07日  |  赵军 :

如果是同样的微架构,当然一颗双核强。

2007年6月07日  |  汪儒 :

真是谢谢您了。还有一个问题:既然主频和电压成正比,那么E4300、E2140可以不加电压把主频从200MHz升到333MHz与之矛盾吗?

2007年6月07日  |  赵军 :

E4300的主频是1.8GHz, E2140 的主频是1.6GHz。你上面讲的主频应该有误。这2个CPU的主频相差200MHz,即0.2GHz。这个差别是靠倍频选择来实现的,倍频不同取决于给CPU提供的VCC电压(核心电压)的不同来实现的。

我尽量解释的简单些,如果你有工程背景就更容易看的懂。

给CPU供电的电压不只是核心电压。你所说的电压相同,可能是指主板上给CPU供电的VRM,同一个版本VRM可以支持E4300和E2140,也可以支持同一个家族处理器的其他型号。VRM = Voltage Regulator Module ,即供电调节模块。

自适应CPU供电技术之后,给CPU核心供电的电压高低是由5到6根VID(Voltage Identification Definition)引脚的0/1相位所决定的,核心电压的供电不是额定不变的,就是由所谓的动态VID技术来实现的。VRM可以实时根据CPU的需求来改变输出的电压。一方面,处理器在高负荷运行时,VRM提供稳定的电压输出。另一方面,CPU在低载荷时,动态调节CPU的电压也可以有效地降低CPU的能耗和热量。

VRM会根据处理器上几根VID[0:5]引脚的0/1相位来判别这块处理器所需要的实际VCC电压(也就是我们常说的CPU核心电压)。

VID[4:0]定义的电压变化是每0.025V一个档次,而VID[5:0]定义的是每 0.0125V一个档次。

因此,E4300和E2140的核心电压是不相同的。另外,对于同型号同主频的处理器,实际的VID设定也不是完全相同的,是在出厂时才确定的,也就是说它们实际的核心电压还是有细微差别的,因为VID可以做到电压变化的微调。VID[5:0]就可以做到微调的一档为0.0125V,也就是一档12.5mV(毫伏)。

2007年6月07日  |  汪儒 :

我的意思是,这两款CPU不加电压时,都能把主频超到333MHz,这是怎么回事?(即:它们在OC时,核心电压都没有调,这时电压变了吗?)(汗,真不好意思)

2007年6月08日  |  赵军 :

我已经说过,这两款CPU的主频不是200MHz,也不是333MHz。

我估计你说的是超外频,通过超外频可以提高CPU的主频,因为除了至尊版的酷睿2处理器,其他商业版本的酷睿2处理器都锁倍频了。要超主频,就只能通过超外频。实际上,如果不通过可超频主板上BIOS提供的设置或者主板跳线来提高CPU的核心电压,是超不上去的,即使看起来启动了,但是会不稳定,甚至死机,或者没法进入操作系统。

但是要注意,不管超频的技术有多高,CPU的都会受到不同程度的损坏,寿命将短于正常使用的寿命。

2007年6月08日  |  汪儒 :

汗~其实想说的是外频,不知道为什么就打成了主频,现在懂了,谢谢!

2007年6月08日  |  程轩 :

我是做流体数值模拟的 迫切又欣喜地看着cpu核心的发展。不过在使用双核计算机计算一些数值计算程序的时候,感觉开双核反而效率没有关掉超线程技术后效率高。就是程序计算的时候开着超线程 反而比关掉超线程技术要慢。好像一点也没有体现双核的好处啊。

我使用的计算机是dell optiplex gx620, OS是xp中文版,系统默认是开超线程 就是单cpu双核,可以看到硬件设备有2个 cpu显示;关掉超线程计算后只有1个cpu显示。

最后 可否推荐能够充分利用双核的软件呢 我想体验下双核的优势

2007年6月08日  |  赵军 :

程先生:你好! 你用的程序是商用软件,还是自己编写的?如果是商用软件,请确认一下所用的版本是否支持超线程。

如果这个计算程序是你编写的,建议你使用支持超线程的编译器重新编译一下。

只要用支持超线程和多线程的编译器编译的程序,运行在支持超线程或者多核处理器的系统中都会有很好的表现。如果再对这个程序进行多核优化,效果会更好。

例外,英特尔推出的系列编译器现在都支持多线程,如:C++, Fortran,等等。还有优化和分析工具如 VTune™ Analyzers Performance Libraries Threading Analysis Tools

你可以到英特尔的这个网页去看看: http://www3.intel.com/cd/software/products/asmo-na/eng/compilers/284527.htm

http://www3.intel.com/cd/software/products/asmo-na/eng/vtune/239144.htm

http://www3.intel.com/cd/software/products/asmo-na/eng/threading/219785.htm

2007年6月09日  |  程轩 :

感谢赵先生的回复及建议 谢谢

2007年6月10日  |  biz4cn :

可是对于像python这样不支持多核的语言来说, 多核的优势似乎无法正常发挥吧?

2007年6月10日  |  小何 :

请问:2nd cache depends on CPU是什么意思? Intel Pentium®4 533/800MHz FSB是不是800mhz就相当于双核了?谢谢!

2007年6月10日  |  罗骥 :

PD915倍频大多时候是12,如何锁定成14.

2007年6月10日  |  赵军 :

Python 是一种面向对象的解释性程序设计语言,基本上也算是一种脚本语言。虽然脚本语言泛指单用作简单编程任务,但是Python比JavaScript等只能处理简单任务的编程语言要强大。因为Python 支持新的内置模块(module)可以用C 或 C++写成。

所以,遇到纯Python语言不能很好地支持多线程和多任务,或者支持时的运行效率不高,就可以用C或者C++编写的模块来解决。

总之,Python支持多线程(也就可以支持多核),但是其运行效率不高。

2007年6月10日  |  赵军 :

小何,你好!

我没有看到你提供的英文的上下文,就“2nd cache depends on CPU”的字面意思是“二级高速缓存取决于CPU”。

对于 Intel Pentium®4 533/800MHz FSB, 即使FSB是800MHz也还是单核,前端总线(FSB)和CPU 双核与否没有关系。

2007年6月11日  |  赵军 :

罗骥, 你好!

英特尔正式产品都是锁倍频的,之所以叫“锁”,就是不让修改倍频。

对于DIY的超频发烧友,他们都是通过超外频实现超CPU主频的。

英特尔最新的酷睿架构的至尊版处理器,把锁频保护关闭了,DIY发烧友可能根据自己的喜好选择倍频率,当然除了必备的超频知识外,需要支持超频的主板,内存,电源,散热方案等等。

2007年6月11日  |  小何 :

谢谢我懂了。我本来是想升级我的电脑 可我不太懂,电脑主板是fujitsu siemens GA-8ISXT芯片组是Intel 82865/pe,cpu是Intel P4 Northwood Processor(0.13 )内存768m 主板是否支持双核处理器,最佳配置是怎样的?多谢!期待您的答复。

2007年6月11日  |  赵军 :

小何,你好!

865 芯片组是英特尔在2003年推出的,基于865芯片组的主板只能支持478 PPGA的Pentium 4 处理器,内存也只能支持DDR的,不支持DDR2的内存。

这样的主板不支持LGA 775封装的 Pentium 4处理器,就更不能支持 LGA 775 封装的Pentium D 双核处理器。

因此,你需要更换主板,才可以支持双核的处理器。如果想支持酷睿2 双核处理器,尽量选择采用比较新的芯片组的主板。如英特尔的芯片组:945/946系列的,965系列的,甚至更新的3系列芯片组。

2007年6月14日  |  lhftonny :

博主好,对于您的精彩介绍十分钦佩,请问我从哪里可以看到Intel处理器发展的历史和现状,以及将来处理器发展的趋势?请您推荐一些文章或者链接,谢谢!

2007年6月14日  |  赵军 :

楼上Tonny,你可以从下面的链接看到Intel的历史,不过是英文的介绍。另外,链接中不光介绍了Intel 处理器发展史,还有介绍了其他技术和产品发展史。http://www.intel.com/museum/corporatetimeline/index.htm?iid=about+ln_history

在英特尔今天宣布投资大连建厂的时候,新浪做了一个专题,里面有不少英特尔历史的介绍。你可以去看看,URL如下: http://tech.sina.com.cn/focus/Intel_Dalian07/index.shtml

2007年6月15日  |  S2 :

感觉要充分发挥多核的CPU性能,必须使用多线程/进程的编程,但这对开发人员的要求会很高.

单单靠编译器优化,有多少帮助呢?

赵军你有什么见解吗?

2007年6月15日  |  dingAdministrator :

赵先生您好 CPU的发展到双核时,总是双核,四核,八核(2的倍数)地发展,为什么没有三核,六核呢?

2007年6月15日  |  小李 :

我想请问下,为什么多核心CPU都是2的倍数发展的?为什么没有奇数核的多核CPU?比如3核、5核、7核的

2007年6月15日  |  赵军 :

S2, 你好!

如果希望最充分地利用多核CPU的性能,首先要选用支持多核和多任务的操作系统;其次,是用支持多线程的编译器编译编好的程序,大部分人做到这一点,就足够了,因为优秀的多线程编译器可以让程序做到80%甚至更高比例的多线程优化,也就是大部分多线程优化的工作都让编译器代劳了。多核CPU带来的绝大多数好处都得到了。 第三,如果需要让程序的执行效率达到更高的境界,最为充分的利用多核的优势,就需要编程人员具有专业的多线程编程技术,除了编程时运用多线程编程的技术,还要使用多线程优化和分析工具。对于第三点,一般都是专业软件公司才可以做到。

英特尔公司不但提供了多线程编程的指南和白皮书,而且提供了多线程编译器,分析和优化工具。

2007年6月15日  |  赵军 :

dingAdministrator/小李,你们好!

不知道你们是一个人,还是两个人,问的问题一样,如果是两个人,就太巧了。

今天多核处理器技术其实来源于以前的多处理器计数,就是一台计算机(多为服务器或者工作站)中可以有2颗,4颗,8颗,按照2个指数增加的处理器,当然,也可以有2个倍数的系统如6颗,10颗,12颗,但是不太常见,还是以2个指数增加的方式为多。

在多处理器系统中,比较典型的技术是SMP,就是对称式多处理器技术,顾名思义,多处理器系统内的处理器是对称配备的,因而没有奇数多处理器系统的情况。也许有人会说,在4-路服务器中,我们可以根据需要配备1颗,2颗,3颗,最多配备4颗处理器,实际配置的情况就有奇数个处理器的情况。这也是SMP系统的灵活性,不过,设计SMP多处理器系统的主板,大家还是约定俗成设计2-路,4-路,8-路等等的主板或者系统,支持处理器的最大数量以2个指数增加,以偶数增加的也有。

随着硅半导体工艺的进步,可以在更小的硅片上集成更多的晶体管,自然而然,我们就会率先将SMP多处理器需要的多个分离的处理器集成到一个物理处理器内,使之拥有2个,4个,甚至更多的内核—就是多核处理器了。

学技术的人都喜欢偶数对称的美感,人们也都喜欢对称的和谐感,人类自己就是左右对称的,自然界对称能达到最基本的协调。有点调侃了,大家看看自己周围的很多东西大多数都是不是都是对称的。

理论上,设计3核,5核的处理器没有问题,但是设计出来,也许大家觉得怪怪的,没有人会买吧。好事成双吧?有点哲学的味道吧,哈哈!

2007年6月18日  |  S2 :

赵军,谢谢你的回答,我完全同意你的提到的1和3.但是对你说的第二点,我有些疑问,难到优秀的编译器能把单线程的程序优化成多线程的程序吗?我觉得,最多能优化多线程的程序,如果一个程序主体是单线程的话,很难通过编译器优化成多线程的.如果你觉得行的话,方便详细介绍一下吗?

2007年6月18日  |  赵军 :

S2,你好!

100% 纯单线程的程序是没有的,只要不是轮询这样的特例程序—就是等待一个数据输入,处理完,再等一个数据输入,否则就等待。

另外,程序员也要尽量避免编写轮询这样的程序,尽量避免程序不要有太多数据相关和指令相关。

总之,采用支持多线程的编译程序可以最大程度地减轻程序员的压力,只要按照正常的编成习惯编程,编译程序可以尽可能“智能”地把程序编译成多线程。

2007年6月20日  |  dingAdministrator :

我和S2是两个人,同时问了相同的问题,还真巧啊,谢谢赵先生回答!

2007年6月22日  |  胡平 :

赵先生您好,最近刚配置了E4300的酷睿双核机器用于仿真计算,我在使用matlab跑仿真程序时,在任务管理器里看到2个CPU,占用CPU仅为50%,我想问的是是不是matlab不支持双核呢?双核能不能同时计算,加速仿真速度呢?是否会影响其使用寿命? 期待您的回复!

2007年6月23日  |  赵军 :

胡先生,你好!

目前的Matlab 库函数不支持多线程计算,但编程人员可以在使用的编成语言中如FORTRAN或者C/C++中调用其他已经线程化的库,提高计算性能,例如调用Intel MKL 数学函数库。

2007年6月26日  |  Antaur Choi :

杜江凌博士、赵军先生,   在”博客@英特尔中国”看见你们的帖子提到Moore定律以及功耗与频率方面的观点,我有一个问题能否请你们给予帮助。   1、我认为台式电脑CPU的TDP受到散热技术的限制,随着散热技术的发展,比如IBM的芯片帽技术能提供100~400/平方厘米的散热效率,CPU的功耗仍旧有向上发展的趋势。

  2、手持设备受到运动生物学的限制,(整机)散热效率应当小于50瓦/平方米,外形应当小于15123厘米,即表面积小于500平方厘米,因此整机平均工作功率不适合超过2瓦,其CPU部分以1瓦以下为宜。(有报道在2002IDF上,Intel当时的技术总监帕特说手持机的CPU不能超过1瓦,可以告诉我这个1瓦的限制是怎么来的么,谢谢。在http://www.intel.com/cd/ids/developer/apac/zho/331923.htm也提到了相关的话题,但是没有计算过程,能否提供更详细的资讯)

  3、计算是一种消耗能源产生热量的过程,功耗的差距也表明了性能的差距,即使采用了种种努力,1瓦的手持机用CPU与随着散热技术的发展可以有更大功耗(也即更佳性能)的台式PC的CPU的性能差距也将越来越大

  这样一个推理是否合适,请指教。谢谢!     Antaur Choi 86-21-13816964164

2007年6月26日  |  赵军 :

Antaur, 你好!

从你的问题可以知道你是一个专业的人士,有些问题我并不知道答案。下面尽量回答你的问题。

  1. 关于台式机电脑的TDP 受到散热技术的问题。即使有更好的散热技术,我们也不想让芯片有更高的功耗,因为大功耗带来的不仅仅是能耗问题(说大了可以到影响环境问题,呵呵),更多的是系统设计的小型化设计和控制散热噪音问题,毕竟热量要从机箱中散到机箱外部。新的散热技术——因为散热效率的提升,解决了芯片现在面临的单位面积热密度过高的问题,但是解决不要系统的问题。

  2. 我们希望手持设备的芯片能耗越低越好,我个人的理解是希望手持设备具有更长的电池续航时间。因此,即使我们可以用更好的散热技术,但是芯片能耗高了电池的使用时间就短了,手持设备的移动性就差了,这是最终用户不愿意看到的。

2007年6月26日  |  Antaur Choi :

赵先生,   谢谢你的回答,能否得到你的联系方式,我想进一步请教。

  我也相信TDP不应该无限的高上去,但是作为对价格和性能的一个折衷,我以为它会有提升的空间。比如说core duo 2 E6300,现在是44瓦,如果达到90瓦的样子吧,性能应能提高70%,而成本只有很少的变化,但是采用4核或者更大的缓存,那将导致芯片面积的显著增加,而芯片的成本3次方于面积。并且采用IBM的芯片帽技术,并不会像风冷一样产生很大的噪音。而台式电脑甚至笔记本电脑,应当能接受这种有限的提升。

  对于问题二,事实上很多人提到长时间通话或者放mp3的时候手机感觉发热,为什么现在不把它的功耗就降下来呢,我想是因为应用决定手机需要这个处理能力,而这个处理能力需要在这样的功耗上才能实现。

  所以,我真实的问题应该是说,随着散热技术的发展,以及台式机也开始采用低功耗技术,其CPU的性能将越来越显著的领先于智能手机,有一天,智能手机的智能将成为摆设,谁会使用一个只能放10年前格式的音频、视频,打开10年前的网页的“智能”手机呢。这种情况已经在PDA身上发生过了,不是么。

  所以,手持设备的功率上限将决定这一天何时到来,那以后必然出现新的便携设备,(作为平台提供商,我想其实INTEL也在考虑这一变化)。所以,我希望知道“手持设备的CPU功率不能超过1瓦”是怎么得出的。

  谢谢!     Antaur Choi

2007年7月06日  |  canal :

赵老师你好,我正在学习并行算法的设计与分析。因为不同的并行机所采用的算法不一样,

所以想请教INTEL的CPU采用或近似于哪种结构模型。

SIMD(Single Instruction Stream Multiple Data Stream) 还是MIMD(Mutiple Instruction Stream Multiple Data Stream)?

谢谢!

2007年7月06日  |  赵军 :

英特尔目前的IA-32处理器使用的多媒体指令集是SSE,SSE = Streaming SIMD Extension, 就是流式单指令多数据流扩展指令集。

英特尔处理器内部用于执行SSE指令集的执行单元就是支持SIMD的结构。

2007年7月18日  |  winmax :

芯片组L1的ALAT是什么器件?

2007年7月18日  |  赵军 :

WinMax, 你好!

你指的是处理器内部L1高速缓存的ALAT吧。ALAT 是指Advanced Load Address Table——高级加载地址表。主要用于预测需要加载的数据,目的是减少内存子系统的延迟,提高处理器运行的效率——尽量减少处理器等待数据而空转的时间。

2007年7月18日  |  WINMAX :

系啊,我唔明白在L1中的ALAT咖作用》? QQ:285924619

2007年7月18日  |  WINMAX :

INTEL 有无可免费下载的芯片组硬件逻辑设计软件呢?

2007年7月19日  |  赵军 :

ALAT的作用就是预测需要加载的数据和指令,地址表的作用就是暂存预测需要访问的内存地址表。

WINMAX,对于你的第2个问题,我不是很明确你的问题。你需要芯片组硬件逻辑设计软件用于什么用途?设计类似于Intel 的芯片组?还是Intel 芯片组设计的逻辑说明?

据我了解,我们的设计工具都是内部使用的。

2007年7月19日  |  winmax :

我是将毕业的硬件逻辑设计系毕业生,我想多接触INTEL的实操设计软件,好让我能以优越的成绩进入INTEL做一名工程师所做的工作!我是安装在自己的电脑里自己实操的!但是,我的热切渴望与你们的规则产生磨擦,就只好以大局为重了,THANKS !!!!

2007年8月25日  |  chao :

我的CPU是PD915.两颗CPU为什么会工作在不同的倍频,一个是x12.一个是x14.要这么做才能让工作在同一频率

2007年8月26日  |  赵军 :

Chao 先生:

你的问题不完整,你是说2个CPU 内核工作在不同频率吗?

2007年8月27日  |  chao :

是啊。我的CPU是PD915(三年)主板是945PL,显卡是NX7100GS.声卡是SQ714W7.1声道。还有一张电视卡,400W电源,机箱内加了3台发风扇。在刚装上时使用512M X2的内存。当时CPU主频两个都是2800M,200M x 14. 后来我只用一条512内存后。CPU主频就变为 一个是2400M,200M x12 一个是2800M, 200M x14 我没有改动过BIOS 而且。现在觉得速度很慢。

2007年8月27日  |  赵军 :

Chao 先生:

945PL的主板支持双通道的内存,如果现在只用一条512MB的内存,对于系统性能的影响是不能忽略的。对于数据密集型的应用,性能的差别更加明显。

英特尔双核处理器的2个内核,并不是每时每刻都运行于相同的频率,根据应用程序的不同以及提高能效的设计,它们实际的运行频率不会完全一样,主要是看多任务程序对2个内核占用的情况。

我不知道你看到的外频x倍频的设置是在BIOS里看到的,还是在一些CPU 测试工具里看到的?你用的DDR2的内存是多少频率的? 你换上双通道的内存试试。

2007年8月28日  |  chao :

我是用CPU测试工具看的EVEREST和CPU-Z。我的内存是DDR667的。工作在266M。最近还出现只要启动两个大一点的程序时就会死机。维持20秒左右。此时看任务管理器。上面CPU记录一个达到了90%。另一个才20%左右。而且就连下载的电影也看不了。一卡一卡的。会不会和我的硬盘有关啊。我用的是希捷80G-8M-SATA硬盘 x2。最近发现读取数据时两个都会发出嗒!嗒!嗒!的声音。可是我的电脑才装了几个月啊 !

2007年8月28日  |  赵军 :

就芯片组的设计规格而言,945PL不能支持DDR2-667, 只能支持到DDR2-533。所以,你使用DDR2-667,其实在超频使用Pentium D 915, 我认为你看到的2个内核主频和倍频不正常是因为使用了DDR2-667, 使CPU处于超频状态。

2007年9月14日  |  邓卓明 :

既然intel要走多核来提升处理器的性能,不知道当核多了的时候总线应该怎么分配。而且总线也限制了多核的发展。我想intel应该在这方面多研究一下。提出新的计算机体系结构。

2007年9月14日  |  赵军 :

在IDF,大家可能看到了,Intel 在2008年推出的Nehalem 会采用QuickPath的点到点连接的技术。

2007年12月28日  |  xx :

应该设计一种可以插N块CPU的主板。CPU再降降价。 搞什么多核啊?

2008年5月21日  |  朱 :

我发现UG同时使用了2个cpu 但cpu使用一直是50%

UG如何使用smp模式

2008年6月18日  |  yu :

请教各位一个问题.什么是多线程编译器呀,我们用C++编写的程序,如何进行多线程编译,请指教. 另我们编写的程序主要进行科学计算和计算结果的仿真显示, 其中计算是一个分时步的反复叠代过程, 显示是用计算得到的数据仿真机械部件和颗粒的运动过程, 因此主要要求计算速度和仿真显示的效果, 我们已有的微机需计算较长时间如数周, 且仿真显示时闪烁. 采用工作站能否解决.

2008年6月18日  |  赵军 :

英特尔® C++ 编译器专业版可为创建多线程应用程序提供最好的支持。只有专业版才能提供广泛的高级优化、多线程和处理器支持,其中包括处理器自动调度、矢量化功能、自动并行处理、OpenMP*、数据预取和循环展开,以及用于并行处理、数学处理和多媒体库的高度优化的 C++ 模板。

你可以从这个链接查看更多内容: http://www3.intel.com/cd/software/products/apac/zho/compilers/358603.htm

2008年10月27日  |  zuozhihua :

请问windows2000 pro支持四核么?看特性上说支持两个CPU

2008年10月27日  |  赵军 (Jun Zhao) :

Windows 2000 Pro 发布有些年头了,理论上可以支持2颗CPU,是指它可以支持2颗物理处理器,但是不表示它可以支持最新的CPU和多个内核的处理器。具体细节请咨询微软公司。

发表您的评论






评论准则:欢迎您发表评论,不过所有评论必须适度。带有攻击性、偏离主题或带有欺骗性的评论将会被删除(不显示)。在向英特尔的博客提交评论之前,您必须同意我们的法律信息隐私条款中的规定,并且如果您大于或等于 13 岁,就必须在您的评论中附上自己的姓名。您的姓名和个人信息不会被用作其他用途,并且您的电子邮件地址也不会被公开。

免责声明:此处以及所有相关评论中表述的观点均为原作者个人的观点,并非必须反映英特尔的看法。所有英特尔名称和商标属英特尔公司或其子公司在美国和其他国家或地区的财产。其他名称和品牌可能归其他公司所有。