Sun Microsystems最新研发成功的八核四线程的处理器:UltraspARC T1(原预定称呼为UltraSPARC V),使用TI德州仪器90nm CMOS铜制程制造非凡是在2004年4月,Sun紧急公布停止研发中的两颗芯片:Millennium(原订为UltraSPARC V)及Gemini(原订为双核版UltraSPARCⅡ,诉求低价领域),而将资源、心力转专注至Niagara(新的UltraSPARC V)与Rock(更后续的芯片),使得大众更加认为Sun因技术进程与竞争上的落后而乱了方寸,因为业界很少公开公布取消芯片研发计划,尤其这些计划多半已在公开场合或重要用户前揭露过Roadmap(展望规划),临停等于是对营运信誉的一大影响。同时,Sun在公布研发计划改行后,也与富士通(FUJITSU)签订合作研发协议,共同发展新一代的SPARC架构芯片,并暂称为APL(Advanced PRodUCt Line),未来正式名称可能为SPARC64 VI,且主轴架构的承袭是SPARC64(原富士通的SPARC芯片),这更是让人联想:Sun是否在找接替的备胎?一旦Niagara也难产后,至少还有APL可用?但是Sun对外强调,APL是诉求在32-Way~64-Way以上的系统,而Niagara则是2-Way~32-Way的系统,两者并不冲突,虽然定位的公布较能消除备胎的联想,但也引发另一个疑问:Sun是SPARC架构的原创者,当年富士通是向Sun取得SPARC架构授权,才能开发出SPARC64芯片及PRIMPOWER的高阶UNIX服务器,然而现在似乎反变成Sun要向富士通取经?事实上国外的分析师也认为,同样是SPARC v9架构,富士通的SPARC64处理器一点都不输给原创的Sun UltraSPARC,SPARC64 V不仅运作频率高过UltraSPARC IV/IV+、快取大过UltraSPARC IV/IV+,在芯片内的RAS(Reliability、Availability、Serviceability)机制设计上也略高一筹,且能超序执行(Sun仍维持依序),这必然与富士通过去即有大型主机的技术、经验有密切关连,也或许这就是APL定位高于Niagara的原因。当然!也可能SPARC系统的市场因素,不得不让两家SPARC系统业者相互合作,以精省研发成本,Alpha、PA-RISC等之所以自此停休,很大原因即是研发投入与收益的平衡问题,由于先进芯片的研发一代比一代昂贵,且研发周期愈来愈长(非凡是在除错、验证过程中),最后完成系统所销售的获益若不理想,则更后续的研发投入自然会减缓,经过数代的反复,其它收益良善、后续投入充沛的芯片便会胜出。正当大家把焦点对准IBM POWER与Intel IA-32/IA-64时,其实两者的后续推展也产生诸多波折。附注:类似Sun、富士通于2004年的大型系统技术合作,2005年还有NEC与UNISYS,主要是就高阶Itanium 2服务器进行共同研发及技术合作。Apple背叛PowerPC、Dell放弃Itanium 2
使用Opteron处理器的Sun Fire V20z/V40z服务器是Sun所提倡的低成本运算(Low Cost Computing)中的产品,V20z/V40z其实为Sun的ODM/OEM业者所研制,推测V20z/V40z将很快被Sun自有Galaxy专案的Sun Fire X系列所取代,图为Sun Fire V40z,机内可配置4颗单核或双核Opteron再者,Itanium工作站也公布失败,自2001年5月开始推行,到2004年9月HP公布停供Itanium 2工作站,三年时间内似乎没有业者跟进响应Itanium 2工作站,自此Itanium 2只用于服务器系统中。此领域的缺则由IA-32/x64的Xeon、Opteron工作站递补,究竟PA-RISC工作站也将告休。不仅工作站市场不适合Itanium 2,就连运算界的最高殿堂:Top500超级计算机排名中,2005年11月的纪录更新上Itanium 2的排名、占量也是下滑,主要原因是超级计算机的架构几乎一致倾向初阶系统的集群串联架构,强悍的单机并没有太多的取分优势。不过,有太多系统业者的后续芯片需要倚赖Itanium 2,包括HP、SGI、NEC、富士通、富士通/Siemens、Bull、Hitachi、UNISYS等都有使用,一旦Itanium 2的后续发展有所波折,上述这些系统业者也多少会受影响,尤其双核版的Itanium 2及整个后续研发计划已公布要顺延半年,更是让大众错愕。QQread.com 推出游戏功略 http://www.qqread.com/netgame/game/index.Html 魔兽世界 跑跑卡丁车 街头篮球 水浒Q传 龙与地下城OL 征服 轩辕剑5 FIFA07 热血江湖 大唐风云 梦幻西游 武林外传
Sun的Sun Ray精简型计算机系列自1999年的Sun Ray 1开始,图为Sun Ray 170,与17” TFT LCD显示器整合为一体,且具有6个USB埠及内建聪明IC卡卡片阅读机比较例外的是IBM、Sun,2001年IBM推出使用自行研发的EAX芯片组(研发代号:Summit)的eServer x440服务器,最高可让IA-32系统达16-Way,若改用双核则可至32-Way,2005年再推出第三代EAX架构的X3芯片组并用在x460服务器,最高可让x64系统达32-Way,改用双核可至64-Way,不过此芯片组仅支持Xeon家族。而Sun方面,其Galaxy服务器研发项目中也计划推出8-Way的Opteron系统,搭配双核则可至16-Way,此外UNISYS多年来早有突破8-Way的系统,但由于软件无法配套跟进,以致多年来的销售不尽人意。由此可知,IA-32服务器从1996年的2-Way起步,至2004年才由Opteron力攻4-Way,今年因双核才进入8-Way,就技术推进速度来说实令人汗颜。UltraSPARC T1(Niagara)率先实现多核多线程!虽然各大系的CPU都有其持续的难处,不过Sun方面似乎有了新的斩获,Niagara已正式完成,原本认为它将命名为UltraSPARC V,但Sun却出其不意地给予新名称:UltraSPARC T1,接下来的工作即是尽速将其运用在新的服务器中,如同IBM POWER4于2000年就完成,但运用该芯片的服务器:eServer p690(研发代号:Regatta)至2001年才发布,预计2006年初即可见到UltraSPARC T1服务器,目前所知将有1U机种:Sun Fire T1000(研发代号:Erie)与2U机种:Sun Fire T2000(研发代号:Ontario)。
Sun公司主管可扩展系统事业部的全球执行副总裁,在介绍采用T1处理器的最新Sun Fire T1000/T2000服务器附注:笔者个人推测,Sun对Millennium、Gemini计划的喊停,也有因素是希望及时导入Sun所主张的高通量运算(Throughput Computing)理念及CMP(Chip Multi-Processing)、CMT(Chip Multi-Threading)架构,非凡是Sun于2002年7月23日收并Afara Websystems,将高速骨干交换设备所需的多核处理器技术导入至新一代的SPARC芯片中。附注:Sun Fire T1000、T2000的主体架构将与现有Galaxy项目已完成的Sun Fire X2100、X4100/4200极相近、一致。因此,本文接下来将剖析Sun UltraSPARC T1有何先进之处?非凡是2004年IBM发表双核双线程(最多同时四线程执行)的POWER5处理器,2005年底更用制程技术提升成POWER5+,随后Intel也发表双核双线程的Xeon 7000(研发代号:Paxville MP),CPU界正式迈入双核双线程,未来也有四核及更高规格的计划,届时将进入多核境地,然而Sun UltraSPARC T1现在即可提供八核四线程(最多同时32线程执行),可谓是最早进入多核多线程的CPU,Sun是否真因为UltraSPARC T1而领先群伦?本文将对此进行更多了解与探析。最酷的线程?CoolThreading!UltraSPARC T1第一标榜即是八核四线程,远胜IBM POWER5及Intel Xeon 7000,非凡是在多线程技术上Sun也用上非凡称呼,Intel于2003年推出双线程技术时,将其称为超线程(HyperThreading,简称:HT),今日Intel Inside标章上都有HT字样,而2005年IBM POWER5则称为MultiThreading,两者异曲同工,皆为双线程,至于UltraSPARC T1的每核四线程技术Sun特此称为CoolThreading。
Sun运用大量的Sun Fire V20z服务器进行效能串接(集群架构),以此来满足各种科学、技术领域的重度运算,推估除了Sun Fire V20z/V40z以及Sun Fire X2100/X4100等Opteron服务器外,未来也当会以UltraSPARC T1服务器来组构Compute Grid方案。在寻址上,T1实体寻址为40-bit,虚拟寻址为48-bit,内存治理的分页可以8KB、64KB、4MB、256MB为单位,相对的IA-32/x64仅能以4KB或2MB(使用36-bit寻址的PAE模式,PAE=Physical Address Extension)为单位,且自硬件层面就支持Hypervisor(虚拟机器功能的治理层机制),Intel也于今年首次于硬件层面支持Hypervisor(Xeon 7000)。接着是内存接口部分,UltraSPARC T1内建内存控制器(等于内建北桥芯片),不过不是内建1组,而是4组,理由在于8核,8核的数据处理量大、数据进出可观,所以不能让内存频宽成为效能瓶颈,且4组都是128-bit宽的DDR2-533MHz,加上实行Chipkill ECC技术,使传输宽度成为144-bit,并可自动侦测出4-bit内的内容错误及自行修正,或可侦测出8-bit内的错误但要求重新传送。再者,内建的4组内存控制器,每组可连接4个DIMM,最多达16个DIMM。虽然用4组128-bit的内存接口来接应8核已是相当充足、匹配,但T1还是提供了更多的组态选择,在必要的时候可让控制器采双信道模式运作,即是让原本4组各自独立读写传输的内存接口,可改采同时并用2组的存取操作,这对于若干核心有更迫切的数据进出需求时非凡管用。更重要的是,T1也使用Sun独有的革新互连(Interconnect)界面:JBus,在此之前Sun所用的是Fireplane(频率150MHz)接口,此接口也是由Sun自家独创,今日Sun仍持续销售的各款SPARC工作站、服务器中,只要是UltraSPARCⅢ Cu(铜制程版)以上皆有使用到Fireplane,如今T1则升级至JBus。附注:JBus 1.0版规格早于2003年4月发表,但当时少有实际运用。Fireplane则于2001年提出,至于更早的Sun独创界面还有1996年的UPA(Ultra Port Architecture)、1993年的XDBus、1991年的MBus。中高阶服务器有很大的效能因素取决于整体系统的连接架构设计而非CPU,只有初阶服务器、工作站、个人计算机的效能要害较集中在CPU,也因此UNIX服务器业者多半坚持实行独有研发的系统内互连技术,包括HP、IBM、SGI等各大业者都类似。JBus是具有128-bit宽的地址/数据接口、运作的频率频率为150MHz~200MHz,最尖峰的传输率可至3.1GB/Sec。相信未来的Sun SPARC芯片都将用JBus取代Fireplane。QQread.com 推出游戏功略 http://www.qqread.com/netgame/game/index.html 魔兽世界 跑跑卡丁车 街头篮球 水浒Q传 龙与地下城OL 征服 轩辕剑5 FIFA07 热血江湖 大唐风云 梦幻西游 武林外传 八核四线程的尖峰用电不到80瓦!在设计之外,我们也不能避谈T1的制造工艺,Sun向来交付给TI(德州仪器)代工制造较先进、高阶的SPARC芯片,但随着时间递移也会将转入初阶、嵌入式运用的SPARC芯片交付给UMC代产(如UltraSPARCⅡ世代的IIi、IIe),因此T1想必是由TI生产,至于Sun与富士通合作的APL则将由富士通生产(自己有晶圆厂)。TI以90nm CMOS铜制程来制造T1,共享上9迭层连接的晶圆电路,运作频率依据良率的好坏有1GHz或1.2GHz。至此各位可能会对1GHz~1.2GHz的频率感到失望,但只要与“八核四线程”对应仍会觉得值得、划算,总体表面仍会相当惊人。
Sun Fire X4200服务器的机内图,X4200是2U高度的服务器,机内可配置2颗单核或双核的Opteron处理器,强调效能、用电、价格等表现都优异于Dell、HP、IBM的同级Xeon服务器,预估UltraSPARC T1的2U机种架构将与X4200设计相近。若拿T1与Opteron、Xeon相较,会发现T1确实相当精省,因为Opteron的用电可达95W,Xeon更是在90W~130W间,且Xeon还不含北桥芯片(内存控制器),而Opteron已包含,T1也包含,且总尖峰用电不超过80W。不过Intel Xeon也并非是最惊人的,IBM的POWER5的用电亦在170W~200W间,相信Xeon、POWER5主要用电都来自庞大容量的高速缓存上。附带一提的,Sun已表明并非所有的T1都是8核,也会推出6核、4核版本,但说穿了无论4/6/8核版都是同一套光罩电路及晶圆制造流程,只是制程中因良率问题而有若干核坏损时,会将坏损所及的执行电路加以关闭,视同忽略,如此就成了4核、6核版T1,价位也较低廉。不过Sun也非此作法的首用者,现有的GPU也经常以此方式提供中低价位的产品线,且多半与降频、限缩视讯内存容量等手法相搭配。在T1之后的,Sun原有的后续计划为Rock,但在2004年10月决议再加插一个Niagara 2(笔者推测会命名为T1+),Niagara 2将持续第一代Niagara所专注的网络型运算而更加强化提升,事实上Niagara、Niagara 2、Rock这一轴线的发展便是针对此一特性而来。Niagara 2与Rock预计2008年才能问世,其中Rock的平行线程会更高,同时间最多可以执行64个线程,比T1又多出一倍。若不看远处,Sun在2006年也预计推出两款新芯片:UltraSPARC IIIi+(原有UltraSPARC IIIi的制程强化版)与APL,笔者推测APL芯片将采取系统板兼容的方式,让既有Sun、富士通的中高阶SPARC服务器可直接换替系统板来实现就地、活线(On-Line)、零停机(Zero-Downtime)的热插拔(Hot-Swap)升级。开战时刻?重回SPARC紫阳王朝?进一步的,我们来谈论技术发展、强化方向与经营策略、态势的相关性。Sun的SPARC服务器(也包括HP、IBM的UNIX服务器)近年来饱受x86服务器的价格效能比所挤压,尤其x86 CPU多以制程、频率、快取的提升作为竞争利器,SPARC的频率提升进程若与x86相比简直是缓步(900MHz推进至1.2GHz就已经相当辛劳,但x86阵营却动辄2GHz、3GHz)。加上Sun体会到Edge Computing需求的成形,以及多线程的程序(如java、.Net,Sun方面多半避谈.Net)日渐普及,因此决定不与频率表现起舞,转走入高度平行线程的设计路线,且同样要实现卓越的整体效能,以更大的设计转向来争取价格效能比的优势,如今相信Intel也必须转向,理由是4GHz频率魔障已困扰Intel许久,眼前已确定改以双核、多核方式来持续提升效能,等于与T1走相同路线,不过Xeon目前仅双核双线程,离八核四线程的路程尚远。
富士通的SPARC64 V处理器(已装上散热片),富士通透露2006年将会有双核版的SPARC64 V,同时在更下一版的SPARC64 VI当即是与Sun共同合作研发的APL处理器而且,Intel过往重度倚赖的快取容量也将在网络运算领域中大失效果,快取的加速在单机运算上较为受用,能强化本机端重复运算的效能,但网络运算的数据重复率较低,讲究的是高通量的运算,此方面快取就难有帮助,反而成为CPU的累赘(芯片的耗电主源),因此要从高度重复的本端机运算,转变成相依性低、重复性低、传输量大的网络型运算,此一调整将极为可观,加上省电表现也是目前Intel的首要难题,同时要面对两种体质的大调适,确实有着极高的难度。再从另一个角度看,若要朝更高阶运算的领域发展,那么CPU的连接架构、RAS设计等也必须强化,这方面Sun属意的正是与富士通合作中的APL,APL不强调高度的平行线程处理,而是强化少数纵线程的执行能力,主要诉求在传统SMP高阶系统上,有高度集中、一致、相依的运算特性,且严苛讲究运算过程及结果数据的正确性,即是往大型主机的极坚稳、良善的方向迈进,但也要重视效能。笔者也确实认为,Sun若希望打入更高的运算层次,与富士通合作,将富士通大型主机的经验、技术、及SPARC64的RAS机制引入到APL,是目前最理想的作法,2001年Sun曾试图用既有的UltraSPARCⅢ搭配更多的机内备援组件设计,期望以Sun Midframe系列挑战IBM大型主机,但成效却不佳,如今改用APL再次挑战,胜率必然比过往Sun Midframe高。
目前富士通的PRIMEPOWER服务器(即UNIX服务器,与Sun相同皆实行SPARC RISC+Solaris UNIX的组合)之系统模块板(如图)尚无法与Sun的Sun Fire E系列服务器共通使用,但相信至APL处理器完成时,此一相通可能性将会大增所以,Intel原先期望复制自己擅长的用量规模优势来经营Itanium,因此积极争取多数系统业者来共享Itanium,以尽可能增加芯片用量,但也因为各系统业者期望持续把握系统层面的自主,使Itanium只好维持中立、共通的设计路线,不能轻易改变连接架构及相关的体质设计,相对也让Itanium难以用设计变更来提升质量、效能,最后可能完全只能朝制程、制造技术强化的路线来发展,如更高的频率、更多的快取、更多的核等。Alpha、PA-RISC等末代芯片最后也落入此种提升法,尽可能不改变原有架构设计,例行提供给用户更高的价格效能比(甚至用户认为理所当然有所提升)。当然!Sun在初阶领域已与AMD密切合作,Sun也有意与AMD进行更深入的技术合作(在CPU设计层面),究竟T1与Opteron的定位较为接近,Sun等于要维持两种初阶系统及芯片,除非Sun想重回独尊“SPARC+Solaris”的专注一箭政策,否则就必须让Opteron与T1的后续发展尽可能相似,才能让维护心力获得精省,目前来看也确实如此,T1的系统将与Sun Fire X2100/4100/4200相近。即便是Solaris有x86/x64版及SPARC版,对用户而言使用T1或Opteron的差异不大,但也仅在操作治理及应用程序方面较为平顺,驱动程序、硬件支持的开发、兼容验证测试等依然有两套程序要执行,所以最后还是尽可能融合一致,让后续的T1与后续的Opteron能划上等号,Sun方面也认为自己有多年的工作站开发实务、Know-How、机制技术等可导入到Opteron中。QQread.com 推出游戏功略 http://www.qqread.com/netgame/game/index.html 魔兽世界 跑跑卡丁车 街头篮球 水浒Q传 龙与地下城OL 征服 轩辕剑5 FIFA07 热血江湖 大唐风云 梦幻西游 武林外传 三大优势到手 攻势将如“水银泻地”?最后,T1问世后会对Sun有何改变?甚至是对他的竞争业者会有何冲击?笔者推测冲击层面将相当多,往后可能有一大串事情要忙碌了!因为:价格效能比、用电效能比、体积效能比等三大优势,似乎都高度朝Sun端倾斜,由其所把握、主导。1.初阶运算系统:工作站、服务器、刀锋服务器初阶运算系统会是T1最先导入的目标,首先是1U、2U服务器,接着笔者推测是刀锋服务器,再来可能会是Sun Blade系列工作站或Sun Fire V890(8-Socket)以下的服务器,此一领域几乎完全以价格效能比取胜,唯刀锋服务器会进一步对用电及体积进行要求,但这对T1一样是游刃有余(指对手是Intel Itanium/Xeon或IBM POWER/PowerPC等),当然!此领域也是T1与Opteron重迭最多的部分,眼前Sun必然诉求Opteron可用Windows、Linux、Solaris,T1适合Solaris跟Linux应用程序(以LSB执行环境或Xen虚拟机器执行)。2.公用运算Utility Computing、随选运算Sun于2004年推出一项公用运算服务,透过网络方式租用Opteron处理器的运算力,每小时收取1美元,然而笔者认为Sun也只能就单颗运算效能卓越的Opteron来提供此一运算租赁服务,而不用SPARC提供服务,理由是单颗SPARC的运算力薄弱,同样的每小时运算,其工作成效并不乐观,SPARC芯片近年来几乎只能以单机系统中的多颗协力运算为价值诉求,即有较高的scale-up(垂直效能延伸)能耐,但此价值逐渐仅受用在大型的数据库与大型的应用程序中。不过,T1登场后,用T1提供运算租赁服务亦是可能,然相信多数的业者还是倾向贩卖而非租赁,只有两种情况下比较有可能提供T1租赁,即是T1良率及产能上的不适,导致T1缺货或过剩,缺货有可能改采租赁,过剩除降价外也可能实行租赁。另外也可能会提供随选运算(Computing On Demand;COD)服务,此也是Sun于1999年最先提出,但是COD较倾向用于中大型系统,诉求初阶的T1应当还是选择调价整机售价,而非COD预装以待超用收费。3.高速交换系统近年来高速网络交换系统也倾向实行双核芯片(如:PMC-Sierra的RM11200),未来也必然迈向多核,T1所用的技术也取自Sun所收并的Afara Websystems,该公司原先就是希望以SPARC芯片为基础来发展高速交换系统用的多核处理芯片,所以T1也极有希望延伸、拓展至此应用领域,然如此Sun就必须与此市场的既有芯片业者竞争,包括AMCC、Broadcom、Freescale、PMC-Sierra等,且面对的竞争核心会是POWER或MIPS。
Sun执行长Scott McNealy手拿UltraSPARC T1芯片,足见八核四线程可以封装在极小的体积内最幸运的当是AMD,截至目前AMD都没有多线程CPU,一律以多核为主,包括往后的计划为四核,所以无此安全隐忧。当然!核、线程的增加、硬件虚拟化的逐渐遍行,很快地软件业者又要重新改写授权模式,软件当如何计价?预计又会有一场大规模口水战。此外,过往不同架构的CPU并无法用齐头尺度来比较其效能优劣,但在跨平台执行的Java、.Net,以及网络网格运算愈来愈盛行的情况下,未来各家CPU齐头较量效能的机会将愈来愈大,也愈来愈白热化,届时将会是一场大规模的价格效能比战争,甚至用电效能比也会同步或相近时间开战!至于体积效能比将会最后开战,因为只有密集机房会在意占地,但用电是连个人、家庭都会在意,非凡是今日能源日益短缺,有时用电反而比效能更重要。QQread.com 推出游戏功略 http://www.qqread.com/netgame/game/index.html 魔兽世界 跑跑卡丁车 街头篮球 水浒Q传 龙与地下城OL 征服 轩辕剑5 FIFA07 热血江湖 大唐风云 梦幻西游 武林外传 新闻热点
疑难解答