abs3dblend350.gif (9778 bytes) 

Quadro DDR之野望

七月案例分析 ] 穷人的劳斯莱斯 ] FSAA有什么价值 ] 动力之源 ] QDR:内存的未来之星 ] OpenML挑战DirectX ] 新一轮3D之战 ] 双雄对峙 ] 后来居上的Sensaura ] 揭开3D纹理的面纱 ] DVD播放机选购指南 ] 新3D之王 ] 新一代nVidia剖析 ] ATI的新曙光 ] TNT2 Pro挑战极限 ] 优秀的内存优化工具Cacheman ] [ Quadro DDR之野望 ] 怎样设计"JS牌"音箱 ] 袖珍内存优化工具RAMFree ] 余音绕梁A3D 3.0 ] 新一代A3D声卡SQ3500 ] 3D新纪元 ] 3D奇兵GP-1 ] 我有两颗强劲的“芯” ] 新世纪野人揭秘 ] 划时代的GeForce 256 ] 图形处理器——GeForce 256 ] 新世纪的野人 ] 神秘高手Glaze 3D ] 超频是我们的生命 ] 声卡芯片的过去与未来(下) ] 声卡芯片的过去与未来(中) ] 声卡芯片的过去与未来(上) ] 关于Permedia2 ] 3D加速芯片的过去与未来(下) ] 3D加速芯片的过去与未来(上) ] Intel的3D新杀手——i752详解 ] 奔腾III的新搭档i752 ] 划时代的TNT3 ] 野人又回来了 ] 细说S3 Savage4 ] 兼容CPU挑战Intel ] 论文(1998) ]

3border_l.gif (2501 bytes)

3border_s.gif (1818 bytes)

Abs3D主页
Abs3D留言
Abs3D搜索
Abs3D目录

3border_s.gif (1818 bytes)

3border_s.gif (1818 bytes)

Abs3D转移

http://abs3d.yeah.net
http://abs3d.126.com

Abs3D镜像

http://abs3d.webprovider.com
http://abs3d.myrice.com
http://yunzhu.163.net
http://3dabs.webprovider.com

Quadro DDR之野望

朱云

2000.2

(独家授权于《计算机应用文摘》)

    在3D显示市场上战胜了3dfx后,如日中天的nVidia公司在1999年底推出的新旗舰GeForce 256集成了T&L(几何变换与光源照射)引擎,使被称为GPU的3D加速芯片成了能与CPU分庭抗礼的PC主要核心部件之一。代号为NV10的GeForce 256以及随后推出的专业版GPU——代号为NV10GL的Quadro,都具有T&L引擎、4像素渲染流水线和256位的内部结构,至少在近期的市场上都还难逢对手,而Quadro相比GeForce 256,达到了更高的速度、增加了对一些专业3D特性的支持,并且以OpenGL作为主API,成了专业显示领域的又一颗耀眼的新星。因为GeForce 256/Quadro系列具有顶级的3D内核却被比较低速的显示内存拖了后腿,nVidia很快就又推出了使用DDR高速DRAM显示内存的新版本GeForce 256/Quadro芯片组合。GeForce 256 DDR /Quadro DDR系列具有名副其实的超级像素填充率,王者至尊的地位无可动摇,本文的主角Quadro DDR更是无可争议的王中之王。

Quadro DDR的背景

QuadroDDRRef.jpg (56543 bytes)

    基于nVidia出品的Quadro和GeForce 256芯片的显示卡,凭借GPU强大的图形加速能力,将很快开始冲击传统的专业绘图加速卡市场。Quadro和GeForce 256系列具有速度高达50G FLOPs浮点运算能力的几何变换和光源照射(T&L)引擎,就算这个数据打一些折扣也远远高于传统专业显示卡的T&L芯片(5G FLOPs左右)。在众多的芯片中,64MB的Quadro DDR是nVidia的旗舰产品,也是最贵的芯片组合。

    nVidia为了将Quadro的市场定位同GeForce 256区隔开来,在功能方面特意关闭了GeForce 256中的部分高端特性,包括点、线的全景抗锯齿(AA),双面光照,前端缓存3D剪切和共享后端缓存等。(至今还没有办法通过驱动程序的调整和注册表的修改来打开GeForce 256上的这些功能。)在速度方面,Quadro的核心频率是135MHz,比GeForce 256的120MHz提高了15MHz,峰值像素填充率也随之提高了13%,达到5.4亿/秒;Quadro的峰值三角形生成率,也从GeForce 256的1000~1500万/秒提高到1700万/秒;另外Quadro的标准内存配置是64MB的普通(SDR,单倍数据率)或者DDR(双倍数据率)型号的SDRAM,GeForce 256用的是32MB的SDR或DDR SDRAM,显示内存接口仍是128位(可不要望文生义,以为名字里有个256就是256位的接口,那是指内部数据通道为256位),显示内存带宽分别是2.66MB/s(166Mhz的SDR)和4.8 MB/s(150Mhz的DDR)。显然DDR显示内存是比较可行的提高内存带宽的方法,比嵌入式内存和256位显示内存接口成本低得多。

    64MB的Quadro DDR的出现使nVidia能同老牌的专业绘图加速卡厂商3Dlabs、Intergraph、E&S等一争高下。另一家老牌的专业图形卡生产厂ELSA,在被3Dlabs“抛弃”之后失去了芯片来源,同没有板卡生产能力的nVidia一拍即合,不但全系列产品都改用nVidia的芯片,还专门使用非专业化的TNT2生产了Synergy II入门级专业显示卡(ELSA的研发实力可见一斑)。现在ELSA作为Quadro系列显示卡的唯一制定生产商,全力推出了著名的Gloria系列的最新款,基于Quadro的专业绘图加速卡棗Gloria II和Gloria II DDR。

Quadro DDR显示卡的价格肯定高于Quadro显示卡的$650,参照GeForce 256显示卡换成DDR显示内存时价格增加了$90,再算上双倍的内存容量,估计Quadro DDR显示卡的售价是$830。虽然还算不上最贵的专业图形卡,但已经比初级产品贵得多了,是否值得为Quadro芯片和DDR显示内存多花这么多钱呢?关于Quadro的另一个问题是时间,Quadro DDR现在正准备上市,但是nVidia的新一代GPU、代号为NV15的新产品(很可能称为Crush)预计今年春季推出(已经设计完成,进入了验证和试产阶段),虽然新一代的专业芯片肯定要更晚些,留给Quadro系列产品的时间仍并不很长。

Quadro的用途和对手

GloriaII.jpg (88556 bytes)

GloriaIIBox.gif (18770 bytes)

    基于Quadro DDR的专业图形卡的主要用途当然是技术相关的应用,相应软件可以粗略的分成两个类别:一是机械领域的计算机辅助设计(MACD),例如Pro/Engineer(Pro/E)、Solidworks和SDRC Ideas等;二是可视化设计和模型模拟,例如Maya和3DS MAX等。MACD应用强调较高的三角形生成率和精确的浮点数据处理,而可视化和模拟应用则重视较高的像素填充率和精确的屏幕显示。

    nVidia在工作站图形卡市场上的对手主要是3Dlabs、Evens & Sutherland(E&S)、Diamond和Intergraph,市场上主要有3Dlabs的VX1/ GVX1/GVX210系列、E&S的Lighting 1200和Tornado 3000、Diamond的Fire GL1等。下表列出挑选出来同Quadro DDR做比较测试的部分流行显示卡的简单资料:

显示卡

价格

驱动程序

T&L引擎

显示内存

Quadro DDR

标准样板(135/150)

$830

nVidia Detonator 3.65

片上集成

50G FLOPs

64MB DDR/128位

ELSA Gloria II SDR (135/166)

$650

ELSA

4.02.02.014-19B

片上集成

50G FLOPs

64MB SDR/128位

Creative GeForce 256 SDR (120/166)

$300

nVidia Detonator 3.65

片上集成

50G FLOPs

32MB SDR/128位

3Dlabs GVX-1 AGP

$680

3Dlabs

2.14-1060

卡上安装

3 G FLOPs

32MB SDR/128位

3Dlabs GVX-1 PCI

$680

3Dlabs

2.14-1060

卡上安装

3 G FLOPs

32MB SDR/128位

3Dlabs VX-1

$200

3Dlabs

2.15-0146b

依靠主CPU

32MB SDR/128位

Diamond 770U TNT2 Ultra (150/183)

$200

nVidia Detonator 3.65

依靠主CPU

32MB SDR/128位

Quadro DDR的测评

测试条件

    Quadro DDR比较测试的硬件平台是:Pentium III 600 CPU、Intel SE440BX2主板、384MB PC-100内存、双Quantum Atlas III 9GB SCSI硬盘、Adaptec Ultra2 SCSI接口卡、HP 8100 CDRW光驱。

    测试的软件平台是Windows NT 4 SP6a,测试软件有:GLperf、3D ExerciZer、Indy3D、ViewPerf、Pro/E Test等。下面就让我们来看一下测试的结果,并作出简洁、深入的分析。

GLperf

    SPEC的GLperf 3.1.2是一款易于使用的较底层的OpenGL测试工具,通过生成1~512像素的三角形测试几何处理速度和填充率。从图(GLperf1)中可知,Quadro DDR有最高的性能,Quadro SDR紧跟其后;具有T&L引擎的显示卡在峰值三角形生成率方面明显优于全靠CPU运算的VX-1和TNT2 Ultra。

GLperf1.gif (13151 bytes)

    加上抗锯齿功能(AA)的GLperf线框测试结果图(GLperf2)中,不支持AA的GeForce 256出现了问题,Quadro DDR则仅次于分数最高的GVX-1 AGP。

GLperf2.gif (11132 bytes)

3D ExerciZer

    著名3D硬件公司Intergraph推出的3D ExerciZer也是易于使用的较底层的OpenGL测试工具,测试在不同的数据量下的纹理贴图能力。图(3DExerciZer)中可以看出,Quadro DDR 又是第一,而且64MB DDR内存同64MB SDR相比有明显优势。另外,64MB的显示内存比32MB的显示内存更适于处理16MB~48 MB的纹理数据。

3DExerciZer.gif (11893 bytes)

显示卡

Indy3D V3

WF/Poly

Animation

Simulation

(帧/秒)

ViewPerf

ProCDRS-02

ViewPerf DRV-06

ViewPerf DX-05

ViewPerf AWadvs-03

ViewPerf Lightscape-03

Pro/E Test

OCUS R20

(秒)

Pro/E Test

APC V20

(秒)

Quadro DDR

标准样板(135/150)

5.78/19.29

38.23

82.3

23.44

25.43

32.01

82.42

3.677

524

5247

ELSA Gloria II SDR (135/166)

5.30/17.96

41.68

48.12

25.19

24.67

30.09

75.10

3.508

530

7036

Creative GeForce 256 SDR (120/166)

1.56/16.19

38.17

49.92

-

24.27

31.62

68.95

3.640

538

-

3Dlabs GVX1 AGP

3.52/6.80

20.79

29.33

15.68

15.36

25.23

22.86

2.636

520

5447

3Dlabs GVX1 PCI

2.46/6.30

19.29

25.98

12.77

13.26

15.97

20.08

2.043

533

5800

3Dlabs VX1

1.40/4.82

14.22

22.56

6.815

7.327

13.82

22.62

1.759

607

10533

Diamond 770U TNT2 Ultra (150/183)

1.94/4.51

11.94

35.89

13.55

9.481

14.68

13.53

1.651

621

11224

Indy3D V3

    从Indy3D V3开始,数据被汇总在以上表格中。

    Indy3D V3是Sense8制作的,通过4个不同的测试来检验显示卡在MACD(第一项结果,WF=线框和多边形)、动画和模拟几方面的OpenGL 3D性能表现的软件,还能检验图形质量和3D建模能力。Indy3D是易于运行、测试迅速的工具,所以模型不是很大或很复杂。这次Quadro DDR很轻易地战胜了所有对手,Quadro芯片在绘制线框的速度上远远优于GeForce 256,DDR内存也总是优于SDR内存。

ViewPerf

    ViewPerf是SPEC的另一套3D专业显示卡测试工具套装,具体分为ProCDRS-02、DRV-06、DX-05、AWadvs-03、Lightscape-03等多种测试软件。

    ProCDRS-02就是最新的ProDesigner Viewset,ProCDRS-02替代了广为使用的CDRS系列,而且通过更大量的定点和三角形数据,来测试系统在PTC公司的Por/Designer系列软件中的设计性能,共分为10个单独的测试加权平均得到总分。结果是Quadro系列遥遥领先,GeForce 256由于不支持AA没能得到结果。ELSA开发绘图专用的驱动程序的确有一套,竟能凭SDR版本胜过DDR标准版。

    DRV-06即DesignReview Viewset,DRV-06使用的是欧洲北海的某石油钻井平台的平面图,通过实际工作中需要的观看、定位、修改等操作来测试系统的检查图形的性能,共分为6个单独的测试加权平均得到总分。Quadro DDR/SDR还有GeForce 256 SDR的得分十分相近,比其他显示卡快了约60%以上。SPEC网站上的数据显示,只有两个超级系统具有Quadro DDR同样的测试结果:Coppermine 700/733+Intergraph Wildcat 4110和NEC TE4E图形系统。

    DX-05称作Data Explorer测试,是模拟IBM的Visualization Data Explorer,通过显示一组粒子在矢量场中的轨迹来主要测试三角形的生成和绘制,共分为10种不同的测试加权平均得到总分。Quadro DDR/SDR和GeForce 256的得分几乎相同,比其他最快的显示卡(GVX-1 AGP)快了约20%,SPEC网站上也只有Coppermine 700/733+Intergraph Wildcat 4110和NEC TE4E两种图形系统的数据能超过它们一倍以上。

    AWadvs-03全名是Advanced Visualizer测试,是模拟Alias/Wavefront的Advanced Visualizer工作站3D建模、动画、渲染、合成、输出系统,AWadvs-03共通过10种不同的测试再加权平均得到总分。Quadro DDR/SDR和GeForce 256在这一测试中表现出色,Quadro DDR超过Quadro SDR约10%,Quadro SDR超过GeForce 256 SDR约16%,Quadro DDR的得分超过SPEC网站商的大多数系统,除了那几个超级系统。这是少数能体现DDR内存优势的专业测试项目之一。

    Lightscape-03是模拟Discreet Logic公司的Lightscape Visualization软件,该软件的特色是利用辐射专利算法,优化基于物理规律的光照接口。Lightscape-03共有4个独立的测试,加权平均得到总分。Quadro DDR/SDR和GeForce 256的得分基本相同,比其他显示卡快38%以上,只有Coppermine 700/733+Intergraph Wildcat 4110和NEC TE4E能超过它们40%。

Pro/E Test

    著名的CAD软件Pro/E受到广泛的重视,所以也有少相关的测试工具。

    OCUS R20是Olaf Corten个人开发的中、小型Pro/E基准测试,只需运行8~12分钟就可以得到结果,OCUS R20通过将17个子项目的结果归入粗略的CPU、图形、GUI+I/O共3大类,最后汇总得到总分。在这个项目中,Quadro DDR是最快的,但是其他具有T&L引擎的卡棗Quadro SDR、GeForce 256和两块GVX-1棗同它的差距也就在7%以内,没有T&L引擎的VX-1和TNT2 Ultra则明显落后45%左右。

    APC V20是来自SPEC APC的大型Pro/E测试软件,每次运行要数小时之久。APC V20是同实际渲染一张约37万三角形的复印机图像来测试的,一共有17个测试项目,包括启动和初始化时间,但这一项并不计入总分。Creative GeForce 256没能完成测试,似乎在第2项测试中就死机了。Quadro DDR标准版和ELSA Gloria II SDR的成绩最好,而且几乎在所有项目里领先,但是nVidia和ELSA必须修改驱动程序以消除第6项测试中缺少涂色的显示问题,解决了这一问题Quadro系列的分数还能更高、能抛开GVX-1更远。在这一大型测试中,DDR内存并没有带来什么明显的优势。Quadro同价格超过$8000的配有fx6+图形系统的HP工作站以及使用Intergraph Wildcat 4110的IBM工作站相比又如何呢?至少在第2和第5两项中,Quadro系列能超过它们约10~25%(CPU还差了不少呢)。

CPU占用率

    片上和卡上的T&L引擎都能够减轻主CPU的负担,在ProCDRS-02测试过程中比较Quadro DDR和3Dlabs GVX-1的CPU占用率就可以明白nVidia的T&L引擎同3Dlabs的Gamma芯片之间的异同。图(CPUUtilization)中可以明显看到,ProCDRS-02共有10个子测试,Quadro DDR(同Quadro SDR和GeForce 256类似)几乎用尽了所有的CPU处理能力,基本没有减轻主CPU的负担,而GVX-1几乎不在处理过程中占用主CPU(小于10%),只在初始化时CPU才较忙。奇怪的是Quadro DDR完成测试较快,这可能是Quadro驱动程序的问题。总之Quadro的性能会随着CPU性能的提高而提高,GVX-1的性能则不太受到CPU性能的影响。

CPUUtilization.gif (15470 bytes)

图形质量

    ProCDRS-02在每一个子测试中都会自动截图,其中第4项中作的全屏截图比较适合比较图形质量(由于差别细微,这里就不列出各显示卡的截图了)。七种显示卡里,TNT2 Ultra的图形质量最差,有几处多像素组成的错误,其他显示卡都只有单像素的错误,GVX-1和VX-1的错误较少,Quadro DDR/SDR和GeForce 256稍多些。而且nVidia和3Dlabs的产品的错误很有特点,本公司的芯片上,错误是完全一样的,可能的解释是显示芯片的内部处理过程精度不够,而且很可能同T&L阶段无关,仅仅是三角形设置和渲染部分的问题。可惜现在的厂商(包括显示芯片和CPU公司)都更重视速度而不是质量,毕竟用户更容易注意到速度的提高。

分析和结论

QuadroIC.gif (12965 bytes)

    由于nVidia集成了片上T&L引擎,Quadro DDR/SDR和GeForce 256在专业应用中表现十分出色。Quadro和GeForce 256两个系列的性能十分接近(除了GeForce 256没有打开的全景抗锯齿功能):多边形速度,Quadro和GeForce 256基本一致,可以从GLperf、Indy3D、OCUS R20和APC V20中看出;像素填充率,DDR显示内存明显优于SDR显示内存,可以从GLperf、Indy3D中看出;点线抗锯齿,Quadro很正常,但GeForce 256就有问题了,无法完成APC V20以及ProCDRS-02中的每一项测试;可视化应用需要高填充率,DDR显示内存优于SDR显示内存,可以从Indy3D和AWadvs-03中看出;MACD应用,Quadro DDR并没有比Quadro SDR优越多少,特别在APC V20的大模型测试中,DDR显示内存没有表现出很大的优势;CPU占用率,Quadro和GeForce 256的CPU占用率都比较大,不适合同老式的低速CPU配合;大纹理应用,Quadro系列由于显示内存较大,使用16~48MB大小的纹理时比GeForce 256更游刃有余。

    Quadro DDR虽然有一流的性能,但是Quadro SDR在专业图形应用中有更高的性价比,如果不在意抗锯齿功能和16MB以上的大纹理应用,便宜的GeForce 256 SDR是更经济的选择。尽管如此,Quadro DDR仍旧会是最好的专业图形卡之一。只不过nVidia应该好好修正一下Quadro/GeForce 256的T&L引擎和驱动程序了,但这也说明在Quadro/GeForce 256基础上还有很大的改进空间。

    Quadro的意义在于,nVidia终于填平了专业3D显示卡和游戏3D显示卡之间的鸿沟,使用专业的超高速T&L技术制造游戏3D显示芯片,而使用主流的高集成度、单芯片方式制造专业3D显示芯片。以nVidia为主的创新型厂商们正推动着两部分市场合二为一地向前高速发展。

    参考资料来源:www.anandtech.com

3border_l.gif (2501 bytes)

Abs3D主页 ] 回上一层 ]

Send mail to webmaster@abs3d.webprovider.com with questions or comments about this web site.
Copyright © 1999 Absolute 3D
Last modified: July 08, 2000

[an error occurred while processing this directive]