FJ3C.net福建IT行业平台
用户:
密码:
2018-11-14 星期三  首页 | 代理信息 | 产品新闻 | 行业新闻 | 技术文章 | 公司历程 | 大洋主板 | 留言本 | 娱乐 | 联系我们 
代理产品
 录音笔
 大洋主板
 工包显卡
 KingMAX(胜创)闪存卡
 HP惠普光驱
 读卡器
 专业服务器及配件
 黑匣子移动硬盘盒
 鑫谷电源
 其它产品
Intel与AMD 64位CPU终极较量

http://www.wair.cn 更新日期:2006-1-8       点击:3114
     前言:欢迎大家进来一睹本世纪最具意义的科技决战:两大巨人将为即将到来的64位时代进行一场殊死搏斗。参加决斗的一方是我们在64位领域绝对支持的频率为2.4G
Hz的 AMD Opteron处理器;另一方是在刚刚这个领域初露头脚得新手:由Intel推出的携带最新PCI-E和DDR2技术的 "Nocona" 3.4GHz Xeon处理器,我们被告知,Intel决心像以往那样同样也要在64位市场上夺取做大的市场份额。看来Nocona Xeon真的是Opteron最直接的竞争对手,女士们先生们一场伟大的世纪对抗就要上演了。

   嘿嘿,可能我们以上所说的太过夸张戏剧化,但是事实上两大巨头确实正在进行极其残酷的无硝烟的战争。自从AMD一年前发布Opteron芯片以来,AMD逐渐占据了很大一部分本来由Intel控制的中高端服务器/工作站市场,虽然在过去的一年里,Intel的销售量仍创了新高,但AMD Opteron无疑已经侵占了很大一部分Xeon处理器的传统销售领域并得到了消费者和OEM厂商的广泛支持。集成了内存控制器的Opteron在服务器/工作站市场上取得了很好的成绩,尽管当前的64位操作系统和应用程序只有可数的那么几种甚至几乎可以说是没有。但是Opteron既可以运行64位代码又可以同时向下兼容32位程序的能力,却是为Opteron完成如此良好的销售量中起到了至关重要的作用。

   为了报复并重新夺回Xeon的市场,Intel终于发布了代号为“Nocona”的64位至强处理器,通过Nocona我们不仅仅看到Intel是单纯提高时钟频率,也给我们带来一个全新的处理器架构、全新的内存访问接口、全新的芯片组、全新的外设接口,可以说是最近五年来Xeon的最大的一次改变,是Xeon家族的第一款具有64位处理能力的产品。

测试平台介绍:
  本次测试平台包括:最快的双处理套件:一对Intel "Nocona" 3.4 GHz Xeon,2GB DDR2内存,一块支持双处理器芯片组代号为"Tumwater" 的E7525主板。另一套是一对Opteron 250 2.4 GHz处理器,2GB DDR2 400内存,主板使用的是tyan的高端Thunder K8W平台。


双Opteron 250 2.4 GHz处理器 和 双"Nocona" 3.4 GHz Xeon


Nocona Xeon诞生的背景

  自从Opteron发布以来,Intel Xeon系列处理器在高端工作站和低端服务器市场上的日子就一直不好过。虽然Xeon据有超线程技术和频率上的 优势,但同Opteron相比较的话性能上还存在着一定的差距。在去年底,Intel发布了集成1MB三级缓存的新Xeon处理器来代替原来的512k版本,本意是想通过提高缓存容量的方法来提高Xeon与Opteron之间的竞争力,虽然在测试分数上新Xeon确实提高了许多,但这仍然改变不了人们对Xeon处理器的看法,几乎每个人都认为Xeon必须来一次彻底的升级才能真正面对Opteron的挑战,"Nocona" Xeon就是在这种情况下诞生了


  上图就是新"Nocona" Xeon处理器,主频从2.8GHz起跳到3.6GHz采用 Socket-604接口,读者会发现新"Nocona" Xeon的接口与老Xeon处理器一样都是采用Socket-604,但遗憾的是新Xeon芯片是不能用在老Xeon主板上的。"Nocona" Xeon使用800Mhz前端总线,由于现阶段我们能买到的最快的"Nocona" Xeon处理器是3.4GHz的版本,所以我们猜想Intel可能还没准备好大批量出货3.6GHz的版本。

  Nocona架构包含了一些先前我们已经在"Prescott" Pentium 4上看到的功能,芯片采用0.09微米工艺拥有32k一级缓存和1MB的二级缓存,支持超线程和SEE-3技术,以上这些标准都与Prescott相同,但你千万别简单的认为Nocona就是Prescott的在多处理器市场上的克隆版,Nocona在拥有所有Prescott的技术的同时也拥有后者所不具备的独特功能(或者仅仅是在Prescott的功能上做了Disable,你自己挖掘吧^-^),下面来看看都采用了什么新的技术:

  DBS(Demand Based Switching)DBS是比Speedstep更有效更先进的一种节电技术通过DBS,处理器能做到在空闲时自动降低处理器的倍频、前端总线频率和电压,来达到节能和降低发热量的目的。这在服务器工作环境中是非常有用的,在网络中一台典型的双路Xeon机架式服务器通常是24小时不关机的,然而一天中处理器真正繁忙的时间只有8到10个工作小时,借助DBS技术能大大降低机器在空闲时所浪费的功耗、节约企业在能源上的投资。DBS的发挥还取决于主板是否支持该技术,很遗憾这次我们无法对DBS展开测试,因为我们选用的Xeon平台还不具备有打开DBS的功能选项,所以处理器只好在任何时候都保持全速运行状态了,唉,想省点儿电费都不行。

  EMT64 (Extended Memory Technology)Intel对于Xeon拥有64位处理能力和寻址能力的态度其实是不情愿的,消费者之前一直都对Intel单纯是为了提高Itanium的销售量,而顽固的把64位处理能力禁锢在IA-64架构里的做法而抱怨不已,在Opteron发布以前,消费者除了Itanium是没有第二个64位系统的选择余地的,我们要感谢AMD的Opteron芯片,现在Xeon和Opteron都是64位处理器了。在名称上两家公司似乎也谁都不买对方的帐,AMD把64位扩展内存技术叫做AMD64而Intel则称它为EMT64,事实上它们都是一回事而已。

  EMT64允许处理器能同时处理32位和64位程序,允许处理器最大寻址范围达到64GB,在正确使用64位操作系统运行64为应用程序时,程序运行速度将更快。EMT64 Xeon与同是64位架构的Opteron运行程序的原理理论上应该是一样的,但两家公司64位产品在执行程序的过程中肯定会存在一些微小的差异。

为了举例说明这一点,我们在新“Nocona” Xeon系统上安装了最新版本的Windows XP 64-bit Edition测试版,这里我们要说明的是早期发布的Windows XP 64-bit版操作系统是不能在Nocona上运行的,因为程序会自动检验硬件代码判断硬件是否符合AMD Opteron/Athlon64 架构,如果答案为否安装进度会自动终止,在采用了最新发布的Windows XP 64-bit beta版后,Nocona总算能正常的运行Windows了。然而遗憾的是我们走到这一步还是不能得到真正的64位测试成绩,原因是现阶段还没有能正常工作的64位PCI-E显卡驱动出炉。但我们总算能看到Windows XP 64-bit Edition在Nocona上运行的效果了。

"Nocona" Xeon平台介绍:

  由于新Xeon芯片拥有更快的前端总线频率和不同的处理器构架,所以新Xeon平台芯片组和主板必须重新设计以符合新产品的需要。第一款支持"Noc ona" Xeon的芯片组产品是Intel E7525代号为“Tumwater”,“Tumwater”的推出也标志着Xeon平台是在这两年内发生的第一次重大的升级,这次升级给Xeon家族带来诸如DDR2内存、PCI-E外设等新的气象,在外围技术上压倒了AMD Opteron平台的气势。我们测试收到的第一款E7525主板是Supermicro的X6DAE-G2,这次我们将用它来进行测试。


  和上一代的Xeon处理器一样,新"Nocona" Xeon处理器仍采用“不”集成内存控制器的设计,其MCH仍然集成到北桥芯片E7525上,这就意味着两颗并行处理器必须共享内存带宽,而Opteron由于本身集成了内存控制器,所以两颗芯片都有自己独立的内存通道,很显然Opteron在内存带宽上要优于Xeon的设计。内存带宽共享造成的带宽紧张的同时也使内存延迟时间较Opteron系统更长。

支持DDR2内存是E7525得一项重大的进步,Intel计划在中高端服务器/工作站产品上逐步推行DDR2内存,有趣的是DDR2技术当初一发布Intel就宣布大力支持它,这与Intel以往需要很长时间检验内存技术的做法截然不同。目前E7525只支持400MHz的DDR2内存模组而当前的Pentium 4平台都已经支持533 MHz DDR2了。E7525拥有双通道DDR2内存接口,使用 400 MHz DDR2内存后平台拥有6.4GB/s的带宽,与此对照的是使用875P平台的Xeon内存带宽最高也只有5.3GB/s,虽然使用的DDR2内存在频率上还要低于DDR内存,但新的内存标准无疑还是Xeon家族的一次进步。E7525需要ECC/Registered规格的DDR2-400内存模组才能启动,该内存模组使用较低的1.8V电压,240 Pin接口。



  新Xeon平台的另一项改进是PCI Express,可能有的读者会觉得以往介绍这项技术的文章实在是太多了,但我们认为这项技术对于工作站/服务器市场的意义是非同寻常的,PCI-E最终会取代所以目前流行的AGP, PCI, 64-bit PCI和PCI-X技术,给扩展设备带来一个统一的接口标准,这对于服务器市场特别的重要,因为之前PCI标准的互不兼容性和造成的混乱已经给服务器市场带来了太多的变数。

  PCI-E能使外设拥有更大的带宽,更重要的是PCI-E能给每个外设以独立的带宽而不必像现在的PCI标准那样共享带宽,理论上整个系统的性能会更好,设备之间的兼容性问题会更少,操作系统跑起来也更顺畅。我们来做一个比较就能很好地说明这个问题:传统的PCI(33MHz)接口共享133 MB/s的带宽,64-bit (133 MHz)PCI-X拥有1.06 GB/s的共享带宽,而一个全速的PCI-E接口能拥有独立的8GB/s带宽,还由于PCI-E标准是可变的,根据主板设计的需要还可分为PCI-E x8 (4 GB/s), PCI-E x4 (2 GB/s)和PCI-E x1 (500 MB/s) 。

  新Xeon平台还搭配了Intel ICH5-R南桥芯片,该芯片在Intel 875P桌面平台上很流行,支持Serial ATA/150 RAID-0/1, 8x USB 2.0接口,而与此对照的AMD 8000系列芯片组只支持USB 1.1,芯片组本身还不支持Serial ATA/150需要第三方芯片支持。

Opterno篇:

Opteron cpu详细资料:


   虽然Intel的新Xeon处理器在架构上发生了巨大的变化,但我们测试所用的AMD Opteron处理器架构还是和一年 前刚发布时一样,只是频率在不断的提高。一年前发布的Opteron 200系列处理器以极高的性价比优势成为现今市场上最流行的服务器芯片。测试所用的Opteron 250处理器频率为2.4 GHz,内建全速1MB二级缓存集成双通道DDR 400内存控制器。与AMD其他处理器正逐步转向Socket-939接口不同Opteron仍采用Socket-940接口,我们就这个问题已经多次向AMD提出咨询,然而AMD告诉我们Opteron的接口是不会发生改变的,并且公司计划多处理器的接口到2006之前都会保持目前的状态。


  最新发布的Opteron 250采用Hammer核心CG步进,发热量比先前几款Opteron略小,这就允许CPU能够搭配较为便宜的铝制散热器,而先前的几款Opteron处理器必须使用厚厚的铜底座散热器才能稳定工作,与此对照的是Intel Xeon处理器必须使用的重达2镑的铜制散热怪物才能把温度降到安全的等级。虽然Opteron运行起来也很热但总比"Nocona" Xeon要凉快许多,这个情景与桌面级的有点相反的味道吧,Intel处理器居然比AMD的还要热,呵呵。

   Opteron 250仍是采用HyperTransport架构800MHz前端总线,现在流行的Opteron超频方法是将前端总线超到1G,虽然性能能提高多少还有待商榷。Opteron 250还支持NX bit技术,该技术能在某种程度上起到硬件层面上的防毒作用,有效的阻挡来自缓冲区溢出可能带来的病毒攻击。可能最终用户现在还无法享受到这项安全技术所带来的好处,一旦Windows XP SP2这个月发布,到时候NX bit技术所带来的好处每个人都会看到。

Opteron测试平台

   为了最大幅度发挥双Opteron 250处理器的性能,我们选用了Tyan Thunder K8W主板,该主板主要面对高端工作站市场,但由于它距发布已经有一段时间了,所以比起Xeon系统所具有的PCI Express 和 DDR2内存技术来说,这块主板略显得老态了点。但这不是主板的错,Tyan Thunder K8W使用的是AMD-8000系列芯片组。而AMD-8000系列芯片组自从Opteron发布以来就一直没得到升级,该芯片组在某些技术领域存在一些缺失例如高速存储、网络技术等,AMD赶在发布Opteron的同时才匆忙推出AMD-8000平台,公司本来寄希望与第三方厂家能够在后期推出兼容平台,但不幸的是还没有哪个厂家能走到这一步,所以就造成了现在只有AMD-8000系列芯片组才能支持Opteron处理器这个局面。唯一的希望只能放在Nvida正在研发中的nForce4芯片组上了,该芯片组将带给Opteron系统诸如千兆以太网、SATA/RAID、PCI-E等最新流行的技术。没办法,AMD在处理器上已经斗得实在太累了,再也没法在芯片组上与Intel展开撕杀。

   然而Tyan Thunder K8W仍让是当前高端Opteron平台最好的选择,它支持双Opteron芯片、最大支持16GB DDR 400内存,AGP8X和PCI-X。值得注意的一点是它还支持为每块CPU分配独立的内存通道,这样每颗Opteron能享有最大6.4GB/s(总共12.8GB/s)的内存带宽而Xeon系统的两颗cpu只能做到共享内存带宽,同时该项技术只能在拥有NUMA(非一致内存架构)架构的操作系统上才能实现,比如Windows Server 2003 和Windows XP 64-bit Edition。在Opteron系统上我们看到了历史的11GB/s强的内存带宽而与此同时"Nocana"Xeon系统还在吮吸着它可怜的2-3 GB/s水平的带宽。

   本次评测选用的内存是Corsair的XMS3200-LL 4条512MB DDR内存,满足ECC/Registered规格,拥有CAS为2的延迟,这比当前主流的CAS为3或4的内存要快不少。

测试篇:

先来看看双方的配置

Intel "Nocona" Xeon 系统配置


处理器: 2 x Intel Xeon 3.4 GHz - 32 kB L1, 1024 kB L2 Cache
     2 x Intel Xeon 3.4 GHz - 32 kB L1, 1024 kB L2 Cache (关闭超线程)

内存: 2 x Infineon DDR2-400 内存,总共2GB
    CAS 3,3,3

主板: Supermicro X5DAE-G2 - Intel E7525 芯片组
    Intel 6.01.1002 芯片组驱动

显卡: nVidia GeForce PCX 5900 128MB PCI Express x16
    雷管61.11 (350/550 显卡速度)

硬盘: Western Digital Caviar SE 80GB - 7200 RPM - 8MB Buffer - ATA/100

操作系统: Windows XP Professional Edition - Windows XP Service Pack 1 、 Direct X 9.0b

AMD Opteron 系统配置

处理器: 2 x AMD Opteron 250 (2.4 GHz) - 128 kB L1, 1MB L2 Cache
     2 x AMD Opteron 248 (2.2 GHz) - 128 kB L1, 1MB L2 Cache
     2 x AMD Opteron 246 (2.0 GHz) - 128 kB L1, 1MB L2 Cache

内存: 4 x Corsair XMS3200LL DDR-400 Memory - 2GB Total
    CAS 2.5,3,2

主板:Tyan Thunder K8W - AMD 8000 系列芯片组
   AMD 2.1.0.1 芯片组驱动包 8.12 AGP 补丁

显卡: nVidia GeForce PCX 5900 128MB PCI Express x16
    雷管61.11 (350/550 显卡速度)

硬盘: Western Digital Caviar SE 80GB - 7200 RPM - 8MB Buffer - ATA/100

操作系统: Windows XP Professional Edition - Windows XP Service Pack 1 、 Direct X 9.0b

本次测试所采用的测试程序:

Adobe Photoshop CS
Alias|Wavefront Maya 6
Apache Group Apache 2.0 Benchmark
Discreet 3D Studio Max 6.0
LAME 3.96 MP3 Encoder
Macromedia Flash MX 2004
Microsoft Windows Media Encoder 9.0
Sciencemark 2.0 Beta (September 23 Build) Memory Benchmark
SiSoft Sandra 2004 SP2

CPU Arithmetic Benchmark是测试CPU整数运算和浮点运算,而CPU Multi-Media则是着重测试CPU的多媒体性能



  我们可以看到在CPU Arithmetic Benchmark测试中,Opteron 250以绝对优势领先于新Xeon处理器,但在CPU Multimedia测试中,3.4 GHz Xeon又大幅度反超。看来多媒体性能方面,Intel处理器确是占着长期的优势。

       同时我们还测试了在关闭超线程后的3.4 GHz Xeon的 表现,读者可以很清楚地看到关闭该项功能前后的差别有多大,特别是在多媒体性能上相差达到了25%。超线程技术对提高应用程序的运行速度非常有用,对于运行在双Xeon系统上的程序来说,程序会把线程平均分配到四颗处理器上同时运行(两个物理、两个逻辑),通过这次测试我们更深刻的体会到了超线程技术决不仅仅只是说得好听而已。

  我们这里还要说明的一点是本次评测对于Intel来说似乎有点不公平,因为我们无法弄到最高端的3.6GHz版本Xeon,所以测试只能是在AMD的最高端芯片与Intel的第二快芯片之间进行了。



  测试结果是意料之中也是意料之外,Opteron表现更好这个可以理解,但是领先那么多却是我们没有想到的。我们在测试之前以为借助新一代双通道DDR2-400内存的威力,新Xeon能在内存带宽测试中应该会拉近与Opteron内存带宽的差别才对,但是结果并不是这样,我们把测试程序运行了一遍又一遍,确定所有的软件设置都是正确的,但新Xeon系统的内存带宽测试结果还是令我们大失所望。

  内存延迟测试同样也让我们大跌眼镜,集成内存控制器的Opteron多表现出具有恒定的平均内存延迟时间,而MCH集成在北桥E7525上的Xeon系统其内存延迟时间却上下波动很大,当Optern的延迟时间稳定盘旋在80ns的时候,Xeon的往往还在120ns之上。同时我们还注意到双Opteron系统的测试成绩要低于单处理器系统,单Opteron或Athlon64系统在这项测试中往往都能得到低于40ns的好成绩。无论如何,Opteron的所谓老DDR-400内存性能看上去要比Xeon的所谓新一代的DDR2-400内存性能要强得多。


(注:分数越低越好)

  下面我们来测试在实际应用中的性能表现,在Photoshop CS测试中Xeon大幅领先于Opteron,完成测试所花费的时间最少。我们原先估计这可能是因为Photoshop对超线称技术作了优化的结果,但在我们关闭了超线程之后,新Xeon仍然优于Opteron的表现。


(注:分数越低越好)

Flash MX本身并不支持多处理器(程序运行时只有一颗处理器在工作,从超线程的开启与否没什 么分别也可以体现出来),在 Flash MX Import测试中Xeon以平均20%的性能优势领先于Opteron,这与Intel一只专注于数字化多媒体制作和web构建领域所作的不懈努力是分不开的。


(注:分数越低越好)

    而在在3D渲染测试中,Maya清楚的表明了AMD Opteron平台在这方面的优势


(注:分数越低越好)

  3D Studio Max着色场景测试中,我们打开了程序菜单中的SSE支持选项,由于两款芯片都同时支持SSE和SSE2指令所以不论是Opteron还是Xeon的表现都很理想,但可能是Xeon具有Opteron所不具备的SSE-3指令支持,所以在本项测试中Xeon还是以一定优势胜出。




    Windows Media 9.0编码器能有效的利用多处理器所带来的性能提升 ,Opteron系统在测试中的表现要优于Xeon系统。可笑的是我们发现在关闭超线程后,Xeon运行程序所花的时间比打开时还少一些,而之前Intel还曾声称Windows Media Encoder是专门为超线程进行优化过的应用程序之一。


(注:分数越低越好)


同样的情况也发生在 LAME 3.96 MP3编码测试中


Apache 2.0.50是现今流行的webserver,我们通过整合在Apache中的测试程序模拟100000客户端的连接负载情况,记录系统每秒能发生响应的平均次数和最大传输数据量。

  坦白地说,Xeon根本就不是Opteron的对手,Opteron片载内存控制器构架的先进性在这里必显无疑,尽管在时钟频率上还要低于对手整整1GHz,但数据传输能力却比Xeon高出近70到80个百分点,这个测试中Xeon绝对是一败涂地,输得很惨。

结语:

  与前代的Xeon处理器相比,新“Nocana”Xeon确实有了很大的进步,更大的二级缓存,更高的时钟频率更重要的是具有了64位处理能力,通过搭配支持流行的PCI Express和DDR2内存技术的E7525芯片组,“Nocana”Xeon 确实有了人们所期望的新一代Xeon的样子。当然PCI Express技术所带来的益处可能到年底才能感受到,而DDR2内存现在似乎还看不出有比DDR内存高明的地方(事实上经过测试,DDR2性能还要差一些)。但这都只会是暂时现象,当整个PC工业加快速度朝着规格更统一带宽更高的PCI Express和速度更快的DDR2发展时,这些新技术所带来的好处将会立竿见影的表现出来。

  值得注意的是在以上这些测试项目中,AMD Opteron 250处理器在不少的项目上能以较大优势挫败Nocona Xeon的阻击,特别是对服务器来说特别重要的内存带宽/延迟,webserver性能和媒体编码测试中,Opteron更是以绝对优势胜出。只有在某些经过对超线程技术做了特殊优化的程序中,Xeon的表现才能得以超过Opteron。坦白的讲,在测试过程中我们发现Opteron系统运行测试程序显得更顺畅,这要归功于Opteron集成MCH的先进构架,如果单纯把性能作为购买指标,我们认为Opteron 250仍是当前最好的选择。

  另一方面,高端双Opteron平台暂时还不能给我们提供一些现今正在流行的新技术,这所带来的弊端在三个月后还将更为明显,因为到时候采用PCI Express 接口的显卡将大量上市取代现在的AGP 8X标准产品,可能AMD-8000芯片组现在还能暂时满足我们的需要,但高端工作站用户对技术的渴望是永不停滞的,Intel则在这方面有着很大的优势。

  最后要谈的是处理器的64位性能,现阶段我们真的不能说明任何问题,虽然这两个平台都能正常运行最新版本的Windows XP 64-bit Edition,运行一些64-bit SiSoft Sandra benchmarks测试程序,但仅仅是这些还不能全面的说明64位架构产品之间的差别,只有当以后有了真正的64位驱动和成熟的操作系统,不管是64-bit 的Windows XP, Server 2003,或者是Linux也好,才能真正体现出64位带来的真正实力,到时候这两位巨头的成败发展又不知道是如何了。AMD虽然是64位的先行者,但是Intel绝对不是省油的灯,在64位真正到来的时候,其强大的研发实力绝对会让AMD的压力比现在强不知道多少倍,那时候我们会有一场更好的免费的戏等着我们去看!

Copyright ©  2002-2003 福州无为科技有限公司 All Rights Reserved
TEL:(0591)83328007 83302707 83328134 28353007 13600802806 FAX:83302707
E-mail:ltwww@263.net  abiao@wair.cn  QQ:112185
地址:福建省福州市五一中路大利嘉城D区10层B19-20  邮编:350000

备案序号:闽ICP备18025041号 我要啦免费统计
  业务主管
   
  南平商务
   
  存储卡+读卡器
   
  公司商务