穷人的劳斯莱斯
|
|
穷人的劳斯莱斯——剖析GeForce2 MX图形芯片朱云2000.7(独家授权于《电脑报》)不久前本报曾经介绍过开发代号为NV11的移动版3D芯片,6月28日nVidia终于公开了这款新产品,正式命名为GeForce2 MX。但让我们意外的是,GeForce2 MX并未象计划的那样成为特殊版本的GeForce,而是最终成为一块面向主流市场的GPU,不但有GPU的高速度、而且具备占领主流市场的中档价格。于是不仅仅是零售显示卡市场和商用品牌机市场热切盼望着GeForce2 MX的出现,手提计算机领域和自成体系的苹果计算机用户也期待着GeForce2 MX显示卡的上市。 GeForce2 MX集成了同GeForce2 GTS相同的第二代T&L引擎和先进的单周期7操作明暗引擎,而且集成了nVidia最新的双显示器和图像加强技术;尽管GeForce2 MX的渲染流水线数目只有GeForce2 GTS的一半、工作频率也只达到175MHz,而且只能使用64位接口的DDR SDRAM和128位的SDRAM,但GeForce2 MX最大的优点是价格便宜——32MB的成品显卡基本上只需要GeForce2 GTS的40%, $119!凭借超过GeForce256普通版的性能和同TNT2 Pro相近的价格,nVidia这次的雄心不仅仅是占领某个市场区段,GeForce2 MX的目标是以普通人可以接受的价格、尽量普及带有T&L功能的GPU,因此称它为“穷人的劳斯莱斯”并不为过。 高性价比的GPUGeForce2 MX具有两条双纹理的渲染流水线,因为使用0.18微米工艺工作在175MHz,因此峰值渲染能力达到7亿图素/秒,就是GeForce2 GTS的43.8%,大大超过了GeForce256的4.8亿图素/秒,不同的是GeForce2 MX在二重纹理的场合更能彻底发挥、而GeForce256的四条单纹理流水线在单纹理时稍快一点(在二重纹理时由于需要多次传送几何数据就很慢了)。正式版的ATI Radeon 256尽管有12亿图素/秒的渲染能力,但在通常的二重纹理时只不过达到8亿图素/秒,而且Radeon 256有比GeForce2 GTS更复杂的结构,属于高端产品;ST的KYRO STG4000的等效7.5亿图素/秒也与此类似,不同的是KYRO有同GeForce2 MX差不多简单的结构、价格也很便宜,很可能是GeForce2 MX的劲敌;3dfx的Voodoo5 5500双芯片并联也只达到6.7亿图素/秒,而且同样是两条双纹理的渲染流水线,恐怕不是GeForce2 MX的对手(相对而言Voodoo5 6000就贵得可怕了);至于Voodoo4、S3的Savage 2000系列、Matrox的G450都只能同GeForce256比试。有强大的渲染能力作后盾,GeForce2 MX具有GeForce2 GTS的各种3D渲染特性,例如NSR明暗引擎、高质量的FSAA和立方环境贴图等。 然而渲染阶段最大的问题是显示内存带宽不足,GeForce2 GTS尽管用到128位166MHz的DDR SDRAM也只有5.3GB/s的带宽、仍然不够,GeForce2 MX的128位166MHz的SDRAM虽然只能有一半的2.7GB/s带宽,但因为渲染能力还不到一半所以理论上说带宽问题比GeForce2 GTS有少许改善(仍然不够)。GeForce2 MX支持先进的接口:AGP 2x/4x以及Fast Write功能,这方面不会成为系统瓶颈。 GeForce2 MX的第二代T&L引擎同GeForce2 GTS完全相同,仅仅因为工作频率较低而只有80%的性能——2000万经过处理的三角形/秒,而且看来nVidia的第二代T&L引擎已经解决了内部传输率不足的问题。Savage 2000系列的T&L引擎问题似乎仍未完全解决,Bitboys的Thor单片T&L引擎没有消息,只有Radeon 256的T&L引擎达到3000万三角形/秒,速度超越GeForce2 GTS、胜过GeForce2 MX自然不在话下——至今为止完全掌握、并能有效应用T&L技术的厂家仍然不多。 GeForce2 MX不但在游戏中速度和质量上都接近于GeForce2 GTS(因为多数游戏不能充分发挥它们的能力),而且在专业测试中的结果也很接近,堪称高性价比。GeForce2 MX还有一样GeForce2 GTS不具备的优点,就是超频能力,因为用同样的工艺制造,GeForce2 MX的结构相对简单(约只有GeForce2 GTS的2500万晶体管数的一半),发热量只有GeForce2 GTS一半左右的4W,因此至少能同样工作在200 MHz,而且搞好散热的话比较容易再往上超一些,极限纪录是220~230 MHz。超频时应首先考虑超显存,因为除非带宽不成问题(例如使用低分辨率、低色彩精度,甚至使用nVidia专门版的超高多边形Q3A)超频内核才有意义;GeForce2 MX搭配的新SDRAM一般能接近200 MHz,运气好也许能达到210~220 MHz。 增强的显示功能GeForce2 MX也带来了两种实用的新显示功能,这同它面向大众的市场定位相符合。 先是Twin View,就是类似于Matrox的双头显示的功能(恐怕GeForce2 MX比G400还便宜),能够同时连接普通CRT显示器、电视机、数字液晶显示器或模拟液晶显示器等种类的两台显示设备,只有在同时使用两台CRT显示器或者CRT显示器加上模拟液晶显示器适才需要外接RAMDAC。GeForce2 MX也具有比较完善的视频输入、输出,以及DVD视频解码辅助功能。在购买时应当注意显示卡是否支持Twin View显示(包括电视输出)和视频处理的功能,不同配置的GeForce2 MX在售价上还是有明显差距的。 Digital Vibrance Control(Vibrance有活力的意思)则是第一次见到的特殊功能,作用是使各种电脑图像更锐利、明亮和干净,类似MAG显示器上的“黄金眼”,但调节项目更多。这一专利技术不但对显示器上的图像有效,而且对电视、LCD显示器也有效,用户可以对显示芯片内部的图形子系统传输到显示子系统的数据流进行详尽的控制。nVidia表示Digital Vibrance Control只是一种软件,那么显然也能被使用在GeForce系列的其他产品中,TNT2系列能否使用就要看内部结构了。nVidia无疑使用这种改进的Gamma控制功能来进一步提升GeForce2 MX的价值,使它更适合主流市场的需要。 相关资讯和目标市场GeForce2 MX仍使用nVidia独特的统一结构驱动程序,这保证了从Riva TNT开始的产品的前向和后向兼容性,这在3D行业飞速发展的今天是相当不容易的。GeForce2 MX对DirectX和OpenGL的支持都是完整而且优化的,支持几乎所有的3D特性。 从正式公布开始的数周内,GeForce2 MX显示卡就全面上市了,几乎所有没有自己芯片的显示卡厂家都已经或即将推出相应产品,比较著名的有:生产整机的Fujitsu-Siemens(富士通-西门子)、Packard Bell等,生产板卡的Creative(创新)、ELSA(艾尔莎)、ASUS(华硕)、Guillemot、Leadtek(丽台)、Gigabyte(技嘉)、MSI(微星)等。 GeForce2 MX推出后,nVidia的产品从低到高全面铺开:Quadro负责专业工作站、数字创作、CAD领域;GeForce2 GTS和GeForce256面对PC游戏发烧友阶层;GeForce2 MX面向大公司使用的桌面系统的主流市场;TNT2 Pro主要用于要求高性价比的中低端市场;Vanta、Vanta LT和TNT2 M64面向廉价的商用和家用市场;最便宜的Aladdin TNT2主板芯片组,适合最廉价的PC。整个战略中GeForce2 MX位于中段,承担了极其重要的任务。 未来的NV20和NV25NV11和NV15之后,又是nVidia创新的时间了。将在10月或者11月推出的NV20,具有划时代的复杂结构和处理功能;如果nVidia始终能够坚持6个月一次的升级节奏,明年5月就是NV25的天下了,这一改进版的下一代GPU不但战胜了GigaPixel(现属于3dfx)的Giga3D GP-3成为微软将于明年推出的新游戏机X-Box的图形核心:X-Chip,而且在NV20的基础上进一步提高了生产工艺和3D速度。 NV20仍使用0.18微米工艺,在集成5000万晶体管的情况下芯片面积是GeForce2 GTS的2倍、发热量不会小;NV20的核心频率同样是200MHz,通过8条4重纹理流水线达到8000亿操作/秒和64亿图素/秒;NV20的T&L能力进一步提高,将有1.5亿小多边形(或称作“粒子”)/秒,估计相当于5000万三角形/秒,这可能预示NV20第1次正式支持PS2那样的粒子系统,另外还硬件支持比PS2更多样化的各种高次曲面,比如Nurbs、H&B取样面、Tensor拼图、细分曲面等;NV20还支持高达8x、16x的FSAA(估计是4纹理的流水线帮助),新的单像素明暗引擎改为可编程形式,还能使用单像素顶点色彩(类似通过算法生成的内部纹理)代替纹理来节省带宽;NV20硬件支持DirectX 8的Tesselation和Decimation操作,支持DirectX 8和OpenGL的所有特性。 NV20继续使用200 MHz的DDR SDRAM,性能成倍提高后外部带宽将十分紧张,所以不得不采用了类似KYRO那样的隐面去除技术,通过不渲染不可见的表面来提高显存带宽的利用率。看来这不可能是市场策略,因为如果不采取措施NV20的实际表现将同GeForce2 GTS差不多;有了隐面去除,在图像重叠程度达到3倍的游戏中,NV20能把速度至少提高到3倍。 NV25的生产工艺提高到0.13微米(同样结构下芯片面积比0.18微米缩小一半),能工作在300MHz的核心频率,但是16条4重纹理的流水线把总晶体管数提高到1亿左右,也使渲染能力提高到有些令人怀疑的192亿图素/秒(真不知道工作在200 MHz 的GP-3如何能达到256亿图素/秒?即使是乘了4倍重叠程度的等效值也需要8条4重纹理的流水线),T&L速度是900~1000万三角形/秒,同样支持FSAA和S3TC。从这些粗略、甚至可能有些水分的数据中,我们也能看出X-Box的3D能力比PS2强多少;谣传PS3将采用AMD的CPU和3dfx的GPU、新DreamCast也将采用带T&L的3D芯片组,但是对于最终用户,两年升级一次的游戏机同PC又有多大差异? 快快存钱!我一向主张购买nVidia的显示卡时,应选择同一技术水准上的第2代产品,如TNT2(特别是新工艺的Pro版)、GeForce2 MX(GeForce2 GTS太贵)和将来的NV25。因为提升3D水准的头一代产品难免会出现这样那样的缺陷,而且不惜工本制造出的新一代产品肯定昂贵。微软显然不笨,所以选择了NV25而不是NV20。 我们现在面对的GeForce2 MX,凭借40%的价格、50%的渲染性能、80%的T&L性能和0.18微米卓越的超频能力,必将很快成为囊中羞涩的国内发烧友们的爱物(GeForce2 GTS的廉价替代品?)。毕竟TNT2太老了、也不太便宜,GeForce256既昂贵、又耗电、还特别热,SDR版的肯定不如GeForce2 MX,买得起DDR版GeForce256还不如直接用天价的GeForce2 GTS 64MB DDR。 不论各位如何考虑,反正我是已经开始攒钱了——“本人手按3D二字郑重宣誓,从购买Diablo II之日起,到买得起GeForce2 MX之日止,不再购买任何电脑硬件!” |
|