双雄对峙
|
|
双雄对峙——新一代3D芯片Radeon 256与GeForce2 GTS朱云2000.5(独家授权于《电脑报》) 回想起头一次听说3D显示卡,也就是4、5年前的事;但是再看一看当年的Voodoo和Verite 1000同如今市场上的GeForce 256和Savage 2000有什么相同之处,真让人又恍若隔世的感觉。历史的车轮不等人,我们这些DIYer还没能全面普及第1代的T&L显示卡,第2代的新产品GeForce2 GTS和Radeon 256又蜂拥着上市了。 自从nVidia在去年秋天推出了GeForce 256后,就一直在主流显示的技术和市场两方面遥遥领先,只有少数几家公司的技术能够赶上nVidia,有能力同nVidia抢占市场占有率的厂家就更少了。在第1代T&L显示芯片中,只有S3的Savage 2000的功能与速度能同GeForce 256一较高低;现在的第2代T&L显示芯片里,ATI的Radeon 256成了GeForce2 GTS的唯一对手,如果没有更多的厂商在各方面迅速赶上来,3D显示芯片市场的竞争肯定将成为少数3D产业巨头的决战。 nVidia公司很早就预定在4月26日公开其半年一度的升级产品,这一次的代号为NV15,得到了这一消息的ATI公司也不甘示弱,宣布于提前两天的4月26日推出开发了近两年的秘密武器,代号为Rage 6C。因此我们就有了4月底繁忙的一周,整个因特网都充斥了关于它们的各种报道(当然还有Matrox的G450)。就让我们来仔细看看Radeon 256和GeForce2 GTS,究竟谁是未来的赢家? 3D之王GeForce2 GTS在前年的Riva TNT推出之后,nVidia就保持了半年一次的稳定升级节奏,差不多每两次升级技术就上了一个台阶,这样高的开发速度在3D行业是绝无仅有的,甚至Intel和微软的创新能力也没有这么惊人。据说nVidia拥有两个独立的开发小组,研究工作交替向前进行,也就是说每个小组每年开发出一种相互间隔一代的新产品,各种资源的共享保证了技术的继承和持续发展——该公司的华裔CEO最近总是很有信心地说:“我们有能力按计划推出新产品。”nVidia不具有板卡生产能力,本来这会造成利润率的低下,但nVidia不自行生产板卡直接参与竞争,成功地赢得了广大不能自行生产显示芯片的板卡厂商的支持,反而达到了空前的市场占有率和利润。nVidia的产品覆盖了市场的各个区段:顶级性能的GeForce 256、GeForce2 GTS系列是为电脑发烧友准备的,专业设计工作站使用专业版的Quadro,TNT2 Pro用于主流的中高性能PC,低端的Vanta、Vanta LT、TNT2 M64系列是主流和高性价比PC的选择,还有低价电脑使用的的主板北桥芯片Aladdin TNT2,以及仍未正式公开的移动计算(手提电脑)版的NV11,nVidia的各种芯片在OEM整机市场和零售板卡市场都受到了广泛的支持。 nVidia的产品代号很特别:最初集成3D显示和波表声卡的第1代芯片正式称为NV1,第2代的Riva 128代号为NV2,第3代Riva TNT就跳到NV4(很可能中间有未成型的NV3),Riva TNT的完善版TNT2代号为NV5,到支持T&L的GeForce 256代号又跳到了NV10以表明其进步的巨大,现在的GeForce2 GTS是GeForce 256的完善版,所以代号为NV15,移动计算的简化版就成为NV11,nVidia年底还将推出的结构复杂、性能更惊人的NV20,那将是技术上有很大进步的下一代产品了,至于微软的X-Box游戏机用的NV25(X-Chip)则是将于明年年中问世的NV20改进版。那么NV15为什么叫作GeForce2 GTS呢?“GeForce”就是几何(geometry)力量的简称;“2”表示同一技术水平上的第2版,做了必要的改进和完善;“GT”就是GigaTexel的缩写,是性能以10亿计的图素引擎之意;“S”代表Shader,就是nVidia引以为荣的单像素明暗引擎。GeForce2 GTS使用0.18微米工艺生产,集成2500万只晶体管,工作在200MHz的核心频率,现在使用166MHz的DDR SDRAM达到5.2GB/秒带宽,今后还将使用200MHz的DDR显示内存将达到6.4GB/秒带宽。——注意:DDR双倍速内存都是SDRAM,千万别一看到4面有脚(QFP封装)的内存就以为是SGRAM;将来可能会使用的QDR四倍速内存则是更高速的静态内存SRAM。 GeForce2 GTS的第2代T&L引擎是改进的设计,达到了2500万三角形/秒,比GeForce 256的1500万/秒提高了近一倍,也希望能在GeForce 256和Quadro过大的CPU占用率方面有长足的进步。一方面,nVidia的T&L引擎同Radeon 256一样支持几何变换、图形剪裁和光源照射的全部功能;另一方面,nVidia使用2个浮点矩阵计算T&L数据、使用顶点混合来达到平滑衔接的渲染效果,而ATI利用4个浮点矩阵完成T&L计算和平滑化的关节贴皮工作,孰优孰劣就要看实际结果了。 GeForce2 GTS的渲染引擎称作nVidia Shading Rasterizer(NSR,nVidia明暗光栅化引擎,类似于专业绘图芯片的命名方式),内部具有4条像素流水线,每条像素流水线各配有2个纹理贴图单元,因此每个时钟周期都能渲染4个2重纹理的像素或2个4重纹理的像素,理论峰值填充率高达创纪录的16亿图素/秒,比GeForce 256的4.8亿/秒提高了2倍左右。NSR主要的新功能就是单像素明暗渲染,每条像素流水线能够在一个时钟周期内渲染完成一个经过7种操作的像素,这7种操作包括:基本的纹理贴图、单像素凹凸贴图、单像素散射光照、单像素高亮光照、色彩雾化、背景光照和半透明混合。其中单像素的凹凸贴图、散射光照和高亮光照比较新颖,能够根据给定的每个像素的法线方向确定每个像素的光线反射和凹凸情况,从而显示出每个像素的实际明暗状况。这无疑可以容易的生成凹凸不平的纹理在不同光线作用下的效果,是对多重纹理贴图的最新和更真实的发展,还根本不必动用T&L引擎的几何和光照能力——这样大型的几何结构和光源效果由T&L负责,局部的凹凸不平和粗略光照由NSR完成,GeForce2 GTS带来了令人耳目一新的细腻3D感受。 GeForce2 GTS还具有几乎全部重要的3D特性,如:全景反锯齿(FSAA),利用更高分辨率的渲染结果得到更清晰、减少锯齿感的图像;同S3交换专利得到的S3TC纹理压缩,不但包括Direct3D中的DXTC,还有OpenGL中的S3TC(此前只有S3的芯片才行);AGP 4x Fast Write(快写),允许CPU通过芯片组直接送数据给显示卡、大大提高AGP传输性能;立方环境贴图等各种环境贴图,制造更真实的镜影反射效果;顶点混合,使几何图形的接合处更加平滑;单像素MIP贴图,为每个像素提供不同细节级别的MIP纹理,表现从近到远不断延伸的物体特别真实有效。当然这些3D特性GeForce 256也具有一大部分,毕竟GeForce2 GTS只是一个阶段性的改进版本。然而nVidia并未提到激动人心的VTC,即3D纹理压缩功能,不清楚是技术开发尚未完成、今后会添加进GeForce2 GTS(如同GeForce 256近来打开了反锯齿和纹理压缩功能),还是3D纹理的数据量太大、即使压缩了也暂时无法进入实用阶段,估计到NV20出现时总该揭开VTC的面纱了。 GeForce2 GTS的视频引擎称为HDVP(高清晰度视频处理器,nVidia喜欢把芯片的每个部分都称作处理器),在GeForce 256已经不俗的视频性能基础上,主要的进步是支持HDTV高清晰度电视的所有18种ATSC模式的解码,实际就是高分辨率的MPEG2解码功能。GeForce2 GTS当然集成了隔行扫描转换器和运动补偿解码硬件(已经比3dfx的VSA-100强多了),但是仍缺少Radeon 256那样的逐像素处理的隔行扫描转换器和硬件iDCT(离散余弦变换),所以nVidia要想在视频方面也独占鳌头,还有很长的路要走。另外,GeForce2 GTS还有视频输入输出功能,集成了TMDS发射器,可以另接第2台LCD或普通显示器,使用32~128MB的DDR显示内存,350MHz的RAMDAC。 GeForce2 GTS的软件支持情况已经很不错了,有不少正在开发的游戏软件本来是支持GeForce 256,现在又为GeForce2 GTS做了优化。nVidia 列出的热情“捧场”的游戏公司就有著名的id、Origin、Shiny等。nVidia的驱动程序采取独特的全系列统一的雷管驱动程序,尽管下载起来不太方便,但保持了高质量的驱动程序传统,现在GeForce2 GTS就可以使用5.16非官方版的雷管驱动,已经打开了FSAA、S3TC、AGP 4x Fast Write等功能。已经在生产GeForce2 GTS显示卡的公司有: Dell(戴尔)、Gateway、Micronpc、Compaq(康柏)和HP(惠普)等主要的OEM(品牌)PC公司, ASUS(华硕)、Creative(创新)、ELSA(艾尔莎)、Guillemot和Leadtek(丽台)等主要的显示卡生产厂。GeForce2 GTS显示卡该在公布后几周内上市,估计已经有样品进入国内了。基于GeForce2 GTS的显示卡价格暂时十分昂贵:32MB的版本就要$350以上,64MB的是$450左右,128MB的很可能被作为专业用绘图卡使用,竟然开价$1000多!相信今后随着生产成本的降低,价格会不断下降。 GeForce2 GTS确实是出类拔萃的3D之王,但有几位DIYer有条件每半年升级一次,以保持自己显示卡的技术领先?我的建议是在需要的时候购买技术成熟、工艺先进的产品(bug较少、超频容易,还比较便宜),如现有的TNT2 Pro、最新的GeForce2 GTS和将来的NV25,正如微软那样“狡猾”一些才好。 3D挑战者Radeon 256同去年Savage 2000抢先一天成为第1片T&L显示芯片一样,Radeon 256提前两天夺得了第1片新一代T&L显示芯片的桂冠。但是ATI公司的实力更强,它不但是销售额最大的显示芯片厂家,还自行生产全系列的高质量显示卡,在OEM品牌机领域有着巨大的实力(而且苹果电脑基本都使用ATI的产品),在手提计算机的市场中又占据着近乎垄断的地位——ATI的庞大帝国由广泛的销售渠道和完善的售后服务网络支撑着不断前进,唯一的问题是近几年的新产品开发速度较慢。但这个问题ATI正在通过收购和开发逐步解决:先是买下了技术独特而先进的ArtX公司来补充新鲜血液,然后就是凭借4个实验室同时工作开发出了技术一流的Radeon 256。有了Radeon 256系列作为高端和专业用途的旗舰产品,现有的Rage 128系列负责中、低档市场,低端则由ArtX开发的支持T&L和分块渲染的廉价主板北桥芯片S1-370TL坐镇,这样就解决了以往的产品覆盖面太窄的问题,ATI可以在主流3D市场上大展宏图了。另外,ATI正在继续开发下一代产品,据称性能是Radeon 256的4倍。 很久以来,ATI的产品都以Rage命名,这一次为了突出新产品的革命性,ATI终于不再使用Rage打头的那些容易混淆的名称了。Radeon无疑是为了保留传统的缩写“R”而创造出来的新词,“256”则表示其内部的3D处理引擎是256位的结构。Radeon 256主要由以下及部分构成(ATI喜欢把芯片的每个部分都称作引擎):Charisma几何引擎、Pixel Tapestry渲染引擎、HyperZ高带宽结构和Video Immersion视频引擎,生产工艺是0.18微米的,集成了前所未有的的3千万只晶体管(比CPU复杂多了),工作在200MHz核心频率,使用350MHz的RAMDAC。 Charisma几何引擎包括完整的TCL(几何变换、图形剪裁和光源照射)操作以及三角形设置(将顶点坐标转化为扫描线)工作,同GeForce系列不同的是,Charisma内部由4个浮点矩阵同时计算而不是2个,因此Radeon 256的T&L理论性能是目前最高的3千万三角形/秒,速度10倍于使用CPU软件完成TCL工作。Charisma几何引擎不但速度快,而且还具有一些首创的几何处理功能:骨骼动画系统和关节贴皮技术,只需要规定骨骼的运动就能由硬件自动算出各种动画效果,还让游戏人物有更自然的动作和更平滑的关节(4矩阵系统的附加性能就是用来计算关节贴皮的),既节省了内存、又加快了速度;关键帧插值(顶点变换),为了得到更平滑的3D动画效果必须绘制更多的中间状态图形,Charisma只需要提供动作的开始和结束数据,就能自动用插值法算出中间图形,既提高了图形质量、又降低了创作者的工作量。这些功能协同起来,能为3D游戏带来逼真的环境、栩栩如生的人物、真实的动作、流畅的运动甚至人物的表情与口形。 Pixel Tapestry渲染引擎具有2条像素流水线,每条像素流水线又配有3个纹理贴图单元,就是说Pixel Tapestry每个时钟周期能渲染2个3重纹理的像素,理论峰值填充率是12亿图素/秒,加上HyperZ的帮助进一步被提高到15亿图素/秒,而且是32位色彩情况下的速度。Pixel Tapestry引擎还支持很多先进的3D渲染特性:3D纹理,就是将立方体形状的纹理材料直接雕刻成3D物体,属于ATI首先推出;凹凸贴图,包括从简单的浮雕模式、Dot Product 3模式到最复杂的环境模式的各种凹凸贴图;环境贴图,是指使用纹理反射出周围的环境,包括从简单的球体、双抛物面模式到最真实的立方模式的各种环境贴图;投影纹理,用于制造物体真实的阴影和遮挡效果;优先级缓存,可以存储各像素点距离光源的距离来制造阴影效果、进行阴影贴图;范围雾化,不同于常见的基于景深(仅仅是垂直方向的距离)的雾化,能根据距离观察者的远近调整雾化效果,ATI首创的技术;单像素明暗,类似GeForce2 GTS的明暗处理,能对每个像素单独进行处理;全景反锯齿(FSAA),是新一代3D显示芯片的必备特性,Radeon 256还支持T-buffer中的动态模糊和3D景深。所有这些功能的目标只有一个:争取将每一个像素都处理得尽善尽美。 HyperZ高带宽结构是ATI一系列独特专利技术的综合,很可能受到了ArtX的虚拟AGP技术的帮助。Radeon 256支持多达128MB的200MHz的DDR SDRAM显示内存,由于使用128位的内存接口,理论代宽为6.4GB/秒。为了进一步提高带宽,HyperZ降低了Z-buffer对显存带宽的占用,结果是提高了系统带宽和填充率,带宽提高到前所未有的8GB/秒。Radeon 256还能够2片并行工作再将性能和带宽成倍提高,当然是使用MAXX专利技术(显示卡估计叫Radeon 256 MAXX或Radeon Fury MAXX)。 Video Immersion视频引擎显然继承了ATI领先的视频技术,不但保留了硬件运动补偿、独有的iDCT变换和半透明混合功能,而且青出于蓝胜于蓝,还增加了自适应隔行扫描转换器、165MHz的TMDS发射器和完整的HDTV解码支持。特别是自适应隔行扫描转换器,仅仅插值处理图像的运动部分,因而不会造成以往产品进行插值后产生的整体模糊的效果。 Radeon 256的软件支持情况仍不明了,表示支持游戏软件公司仍不多,倒是微软、Intel和AMD表示热烈祝贺。尽管能够运行以往的3D游戏,但为了发挥Radeon 256的全部潜力,必须有新游戏支持那些独特的3D特性。ATI的驱动程序在Rage 128上已经越来越完善了,可以预计未来的Radeon 256驱动程序也能较快地进入状态。ATI当然将自行生产Radeon 256显示卡,也会将Radeon 256交给OEM公司生产整机,至于其他品牌的显示卡何时上市则不得而知。Radeon 256上市的价格和时间仍未公开,但是如能赶在第3季度以较低的价格全面推出,应该很有竞争力——估计上市速度相对较慢将是ATI最大的弱点。 理论数据上,同GeForce2 GTS相比,Radeon 256使用同样的生产工艺,在T&L速度上略微领先20%,在系统带宽上由于HyperZ技术有25%优势,但填充率有了HyperZ仍落后1/16——Radeon 256更适应多重纹理、GeForce2 GTS更适合高分辨率,而且Radeon 256晶体管数目多20%造成成本较高。再考虑到GeForce2 GTS的3D特性受到的支持较广、上市时间较早,nVidia又是第2次生产T&L技术的GPU,显然Radeon 256想战胜GeForce2 GTS将有很大的难度。Radeon 256打下竞争的基础,真正能够动摇GeForce2 GTS王者地位的恐怕应该是下一代的Radeon芯片,到那时nVidia又要推出强大的NV20,ATI胜算几何只能到时再作分析了。 3D大家族看过了在各方面都比较领先的nVidia和ATI,我们再来检阅一遍其他几家主要的3D显示芯片厂商,研究他们的主要潜力与问题。 S3公司在技术上比较超前,一直能够紧跟nVidia,但没有拿出过硬的新产品来夺回过去的市场占有率,S3已经不是2D时代的显示芯片之王了。近几年因为收入不佳、负债较高,又采取了过多的收购行动,因此S3不久前将显示芯片部分连同先进的3D技术,几乎全部卖给了同VIA(威盛)合资的新公司(数亿美元的价格真是很低),自己只保留了显示板卡生产部分。尽管VIA现在拥有了从CPU、芯片组到显示芯片、内存的全部开发、生产能力,但是将所有这些整合到目前的低价位战略中很难一蹴而就。产品方面,Savage 2000系列至今尚未有正式的T&L驱动程序,能否及时开发出新的驱动程序、按时推出新的Savage 2000+,同GeForce2 GTS和Radeon 256一争高低,甚至年底推出下一代的ProjectX挑战NV20和下一代Radeon,这都关系到属于VIA的S3显示芯片的未来。 从去年Voodoo 3上市后3dfx公司的经济状况就一直不好,尽管基本上3dfx开创了显示卡的3D时代。用于新的Voodoo 4、Voodoo 5系列的新VSA-100芯片使用较落后的0.25微米生产工艺,仍没有见到独立的T&L处理芯片,所以新一代的Voodoo只能采用多片并行的架构来提高像素填充率和显示带宽,还有T-buffer中的几种新功能(FSAA、动作模糊和3D景深),同GeForce 256争夺市场。想恢复昔日的光荣,3dfx还必须尽快开发出下一代的Rampage甚至属于未来的Legend。最近3dfx购并了技术先进的小公司GigaPixel(GP系列产品曾同nVidia竞争微软的X-Box显示芯片),不知是否会因此而重新设计快要开发完成的Rampage,看来到Legend的时代3dfx一定会采用GigaPixel那种分块渲染的“另类”结构。 一直传闻Matrox公司正在开发T&L技术,但是同样在4月底公开的G450芯片不过是G400的内核缩小版,使用0.18微米制造工艺,使用200MHz核心频率、360MHz的RAMDAC和64位的DDR SDRAM(带宽同128位的普通SDRAM相同,能降低成本吗?真是浪费),还集成了第2个RAMDAC进行双头显示。尽管发热量低了很多、速度提高不少,但G450那仅有的两个纹理贴图单元只达到了超越TNT2 Pro的水准,是无法同技术先进两代的对手相提并论的。因此近来Matrox特别强调G450的商业用途和图形质量,可是这还很不够,Matrox必须在未来的G800上取得更好的成绩。 Videologic公司独特的分块渲染架构,在当年同3dfx的Voodoo体系的竞争中失利;第2代的PowerVR S2系列,仅仅在SEGA的DreamCast家用游戏机上大显身手,却空有超过TNT2和Voodoo 3的性价比而难以推广;新的PowerVR S3系列(由ST而不是NEC生产)集成T&L功能,本应成为GeForce 256和Savage 2000的敌人,但从去年年底到现在也没有消息,Videologic推出新产品时一贯的慢速度又一次成了大问题。但愿到推出时PowerVR S3还能够顶得住GeForce2 GTS和Radeon 256的两面夹击,不然我们就要失去PowerVR这一独特的显示芯片系列了。 小公司Bitboys“历史悠久”的Glaze3D再一次延期了,上次是因为使用新的XBA嵌入式纹理缓存结构,造成了生产工艺困难;这次是因为从0.21微米嵌入式工艺转移到0.17微米工艺,仍旧由Infenion(Siemens的半导体公司独立后的名称)生产,预计到第3季度出货。另外Bitboys正在为4片IC并行工作的Glaze3D 4800芯片组开发名为Thor(北欧的雷神)的T&L引擎,这也要花些时间——最早明年初才能见到。现在看来,Bitboys总是而且“擅长”发布各种阶段性进展的新闻来“拖时间”,但照这么个拖法,到Glaze3D真正上市时(不看到产品就没法确定是否还有这么一天),要胜过GeForce2 GTS、Radeon 256和Savage 2000+都难,就不用说NV20、下一代Radeon和ProjectX了,还缺乏各方面的支持。 更困难的是那些落后太多的厂家。3Dlabs新工艺、新技术的Permedia 4/5根本没有动静,还因为财政问题把技术都卖给了Intel。买下了3Dlabs的专业图形芯片专利的Intel也没能开发出什么出类拔萃的产品,最新的i815芯片组集成的仍是i752/1754档次的“sub-$xxx”的PC用的显示部分。还有几家已经完全退出3D芯片市场的著名厂家:属于Micron的Rendition几年没有消息了,当年说明书出众的V4400E至今没有下文,嵌入式显示内存已经被移动(手提计算机)显示芯片用得滚瓜烂熟; Number Nine是继Diamond Multimedia后被S3买下的又一家板卡生产厂,由于最后一个显示芯片产品Ticket toRide 4仅仅是Banshee和G200档次的单纹理流水线,估计今后只会做板卡了;当年同S3和ATI齐名的2D巨头、现在的廉价芯片厂家Trident在最新的Blade3D Pro之后就基本停止了主流芯片的开发,一心一意专注于移动市场,今后只同NeoMagic(刚刚宣布退出移动显示领域)、ATI和S3去争夺市场份额了;还有ARK之流的小公司们,既没有出过名,也没有生产出卖得到的产品,现在很难说是否仍在开发新的3D显示芯片…… 现在,3D市场正处于“从混沌到有序”的整合阶段,今后的3D芯片领域必将成为几个3D巨头之间的决战场地。不论如何,激烈的竞争只要不被垄断势力所阻挡,我们总是能期待发展越来越快的3D技术带来越来越真实、互动的3D化PC环境。 |
|