3D新纪元
|
|
3D新纪元朱云1999.12新世纪回首3D细细回想主流3D图形加速芯片的历史,也不过就是近四、五年间的事。刚刚过去的1999年是3D硬件飞速发展的一年,也是3D市场风云变幻的一年。 去年在3D技术上最重要的事件就是nVidia GeForce 256和S3 Savage 2000引入了T&L几何变换与光源照射的硬件加速技术,硬件T&L是自3D硬件加速卡出现后3D领域的最大变革,它使3D图形加速芯片终于囊括了独立的、完整的3D图形处理流水线,并且有了一个响亮的名称——GPU。不断提高的3D像素填充率终于顺理成章地超过了1Gtexel/s,使我们现在终于可以拥有同“真实”基本相似的3D场景。还有ELSA、ASUS Tek等公司为我们准备的3D眼镜,让图像在我们眼前活起来…… 在3D市场中,nVidia终于当仁不让地坐上了3D之王的宝座,昔日霸主3dfx竟因财务问题推迟了新产品的推出,新产品又缺少了T&L技术,曾在3D“门槛”上绊倒的S3终于扬眉吐气地率先进入了T&L时代,又吞并了如日中天的Diamond Multimedia,ATI和Matrox正在同3dfx相近的地位奋力向上,3Dlabs的Permedia 3在主流市场的失败、Videologic的PowerVR Series2在Sega DreamCast游戏机上的成功、Intel的急流勇退、Trident的淡出、Rendition和Number Nine的沉默、还有Bitboys的“威胁”、众多小厂商的蜂拥而上…… 不必再回忆了,跨进新世纪我们也同时站在了3D新纪元的门槛上,勇敢地向前,未来将带给我们更多的惊喜和挑战!跟着我,让我们到3D的新世界遨游一番吧! 新世纪3D新市场3D图形加速芯片公司大检阅我们可以将3D芯片公司从技术与市场实力分为四个层次:一线公司,已经拥有或者有能力很快开发出最新的T&L(几何变换与光源照射)技术及其配套的3D特性,包括nVidia、3dfx、S3、ATI、Matrox、3Dlabs和Videologic等公司;二线公司,技术实力较弱,在市场上也比较不活跃,有Intel、Trident、Rendition、Number Nine和Fujitsu等公司;另一个层次是在技术上有特长但各方面实力较弱的小公司,如Bitboys、Stellar、GigaPixel、PixelFusion和ArtX等公司;还有一个不被普通用户所注意的专业公司层次,有Intergraph、E&S、3Dlabs和Real 3D等著名的专业公司。 nVidia通过技术上的不断创新、市场上的迅速拓展,已经成为主流3D硬件市场无可争议的王者,自然也是一线厂商中的首位。nVidia已经上市热卖的GeForce 256(代号为NV10)集成有256位内核、T&L硬件加速引擎和4条像素流水线,代表了一个T&L时代的开始,只可惜捉襟见肘的显示内存带宽限制了强劲的内核发挥出全部潜力,即使有DDR(双倍数据传输率)显示内存和AGP 4X FastWrite接口也难以完全改观;0.21微米工艺生产的GeForxe 256由于硅片面积较大,造成发热较多和成本很高,结果是显示卡价格难以降到1500元以下和核心运行频率较难提高。已经少量上市的Quadro(代号为NV10GL)是GeForce 256的专业版,这是nVidia向专业3D加速芯片市场进军的第一次尝试,由于受到ELSA等专业显卡公司的支持和二次开发,将顶级的娱乐功能同标准、全面的专业绘图功能相结合的Quadro定能为nVidia打下一片崭新的市场。nVidia公司的开发体系采用3个小组轮番上阵的方式,保证了高速、持续的新产品供应。现在nVidia已经完成了GeForce 256的增强版,代号为NV15的Crush的设计工作,正在进行集成电路设计的“展开”和“分析”工作(就是优化设计以提高速度、减小面积),很可能将在第2季度前后推出,预计Crush要达到高得多的性能和更低的成本,必须使用0.18微米的工艺生产,还要使用嵌入式内存或256位显示内存接口来提高显示内存带宽。而nVidia今年年底前将推出的代号为NV20的新一代产品,预计将利用8条以上的像素流水线带来更惊人的像素填充率、更强大的T&L引擎生成更多的多边形和硬件光源,还必须拿出解决显示内存带宽不足问题的根本方法或新的架构,生产工艺只能是0.18微米甚至0.13微米。总之,nVidia试图象Intel一样靠高端产品赢得利润,而用中低端产品打击对手,越来越快的降价循环将为nVidia赢得以几何级数发展的资本动力。 3dfx就象所有跌下神坛的偶像一般,成为一间技术比较先进的普通一线公司。直到Voodoo 3上市时,3dfx仍拥有不错的实力,但不支持32位渲染让3dfx十分为难,还好那时仍有“铁杆”Voodoo迷的拥护;随后新一代产品代号为Napalm的VSA-100的开发就成了一场决定性的“灾难”,3dfx用了近一年的时间才搞出32位的渲染流水线,而这时nVidia和S3都完成了T&L系统的开发,3dfx只能用抗锯齿加上几种3D特性组成的T-buffer和独特的FXT-1纹理压缩来迎战;去年第3季度Napalm推迟公布,大家乐观地认为3dfx正在研究更先进的T&L,到年底COMDEX上我们见到的仍是不支持T&L的VSA-100,而推迟竟是因为财务问题——3dfx的局面可真是江河日下。使用VSA-100的Voodoo 4/5系列利用并行工作方式SLI达到了前所未有的像素填充率和显示内存带宽,这符合3dfx的“Hacker”传统,从Voodoo 2开始新产品往往由多片旧产品经小小的改进拼接而成(君不见,Banshee花了3dfx多少时间才集成为单片IC?),虽然新产品推出的速度加快了,但多片IC的系统成本却不可避免地翻番,而VSA-100使用两条纹理流水线和0.25微米的生产工艺无异于雪上加霜,使内核速度只能达到Voodoo 3的水平,发热量和成本又很高。3dfx今年别无选择,必须在第1季度、最晚第2季度拿出硬件加速T&L的补充芯片才可以同技术领先者竞争,还必须在年底前完成更高集成度和工艺水平的VSA-200,才能够有机会抵挡NV20等新一代“杀手”的猛烈攻势。3dfx现在面临重大转折关头,能否象当年用Voodoo打天下那样使用秘密武器夺回市场,这一切都看今年的了。 S3在进入3D显示芯片领域时曾经很不顺利,但经过两年来的努力,在新一代产品上终于赶了上来,并且同nVidia同时推出了具有T&L引擎的Savage 2000系列。已经上市的Savage 2000使用0.18微米工艺制造,nVidia也只有到Crush这一代新产品才有可能使用这一档次的生产工艺(Intel的Coppermine CPU也使用了0.18微米工艺)。Savage 2000系列的4条纹理流水线加上T&L引擎的性能不输于GeForce 256,而且因为工艺先进,硅片面积和发热均较小,在核心频率上有更大的发展空间,另外因为内核结构简单(只有GeForce 256约一半的复杂程度),更进一步降低了成本,从而使Savage 2000系列的性价比很有竞争力。先上市的是核心频率较低的Savage 2000,在今年第1到第2季度就会有核心频率较高的Savage 2000+面世,当然它直接的竞争对手就是Crush。同nVidia一样,S3也早就在未雨绸缪,准备它的下一代产品,代号为ProjectX的新产品,如果按照S3一贯的半年换一代产品的速度(比nVidia有过之而无不及)。它应该在年中前后上市,比NV20早了不少,当然考虑到探索未知道路、扩展体系结构的困难,还有S3一贯乐于推出不是完全成熟的产品、随后对其进行“修补”的习惯,ProjectX也可能需要花更多的时间才能大批量上市,但最晚也不应该拖过年底,因为它同NV20还有个“约会”。S3就象从浴火重生的凤凰,雄心与实力与日俱增,S3买下了如日中天的Diamond Multimedia更加坚定了人们的信心。事实上,S3今年的地位已基本超越了3dfx,而处在挑战nVidia的门槛上。 ATI同Matrox都属于紧跟在最领先的公司后面,很快推出较为先进的产品的类型,有时还会有些创新的那类厂商。ATI最主要的实力在于它在OEM原装机市场和在手提电脑市场上的巨大号召力和超群的服务。ATI去年推出的Rage 128系列就比Riva TNT2技术上稍有落后,去年年底又推出了将两块Rage 128作Multiple ASIC Technology并行连接制成的Rage Fury MAXX(代号为Aurora),这同3dfx的方法是相近的,不惜提高成本,利用并行处理使速度翻番来赢得时间。但ATI一点也没歇着,在完成Rage 128以来的近一年时间中,ATI除了研究并行体系,其主要设计力量均投入了下一代体系的研究中,这就是代号Rage 6的芯片,集成有新一代产品不可缺的T&L硬件加速功能,具有至少4条渲染流水线和惊人的像素填充率,还保持了ATI一贯的完整DVD/HDTV视频解码功能,而且应该是以0.21微米甚至0.18微米工艺生产才能保持其低功耗的传统(但是如果加上低核心频率就很难讲是优点还是缺点了)。ATI保持了多年的业界收入冠军称号,但随着nVidia进军OEM市场的举措付诸实施,ATI的重要地位正变得岌岌可危,如果今年ATI仍无法在技术上迎头赶上nVidia和S3等公司,那么沦落为二流厂商也是很有可能的,这一切还是取决于ATI能否迅速地在今年第3季度前推出各方面都比较完善的Rage 6。 Matrox一贯以优秀的图形质量著称,其主要的客户群是高端的商业用户。Matrox在去年年中推出G400后一直认为其销量还不够,所以在年底竟然策略性地宣布暂时不会推出下一代产品,在今年仍以G400为主力。但G400除了在图形质量和品牌声誉上稍有优势外,速度、兼容性和价格方面均有销售上的障碍,只有事实才能告诉我们这种依赖品牌、想将老产品尽量多卖一些的方法是否正确。但有一点是毋庸置疑的,Matrox正在开发下一代的G800(或称作别的什么),如果不能在年中以前推出集成T&L功能、更多渲染流水线的G800(当然还会有一些只有G800才有的3D特性),那么今年对Matrox将是一个艰难的关口。Matrox要想保持在高端市场和OEM原装机市场的形象与份额,在年内拿出比竞争对手更快更好的技术(还得有至少相当的生产工艺)是绝对必不可少的。 3Dlabs在专业图形卡方面的地位不必多说,只要看看最“古老”的Permedia 2仍被预算有限的3D绘图“发烧友”们如何追捧就会明白。可惜的是3Dlabs的Permedia 3几乎整整晚了一年才上市,又被生产工艺等问题困扰,而3D游戏性能还同Riva TNT2和Voodoo 3不在一个档次上,最后只能作为一块准专业用的3D绘图芯片——这同3Dlabs当初所描绘的工作、娱乐两不误的目标相去甚远。痛定思痛,3Dlabs决定不再将主力押在Permedia 3上,而是另起炉灶,全力研发下一代的Permedia 4(或5)。还好3Dlabs在专业市场上仍十分成功,Gamma G2几何加速器和Glint R3光栅化加速器的黄金搭档代表了最高的绘图水准,今年仍将为3Dlabs赢得大量订单,这样在不会象3dfx那么缺钱的背景下,如果Permedia 4集成了3Dlabs高水平的Gamma系列引擎作为T&L部分,加上已有的Delta系列三角形设置引擎,还有多条Glint系列的渲染流水线,要是在年中前后上市恐怕有机会面对Crush和ProjectX而毫不脸红,而3D绘图玩家怕是会抢购到“打破头”的地步。然而Permedia 4致命的困难在于生产工艺,要集成这么多性能非凡的部件至少需要0.21微米的工艺(很可能要0.18微米才能让大家买得起)。3Dlabs作为一家专业厂商,最大的目标在于如何让其主流市场上的Permedia系列拥有至少同竞争对手持平的3D游戏性能,而Permedia系列集成的专业功能既要有足够水准来面对来自主流市场(诸如Quadro)的挑战,又不能威胁其高端产品的销售,这种“脚踩两只船”的战略需要极其微妙的平衡,失去了哪一边的市场都会是难以挽回的失败。 Videologic的PowerVR系列面对老对手Voodoo系列一直没有占到什么便宜,现在Videologic在市场上的PowerVR S2系列是另一形式的“脚踩两只船”:PowerVR 2DC是SEGA的DreamCast家用游戏机的图形引擎,得到了市场上基本一致的好评,但游戏机的发展是跳跃性的,很难预计还有什么游戏机会使用新的PowerVR;PowerVR 250是NEON 250显示卡的核心,尽管性能不输于Riva TNT2系列,价格又便宜,但却几乎听不出“捧场”的声音。PowerVR系列坚持采用与众不同的分块渲染和隐面去除原理,可以简化内核、减少带宽占用,但是这种结构似乎始终有同标准方式不兼容的地方。Videologic从去年初就表示自己在开发T&L技术,比nVidia毫不落后,但集成T&L功能和增强型分块渲染、隐面去除引擎的PowerVR S3系列本该同GeForce 256系列、Savage 2000系列几乎同时出现,并在去年圣诞节上市,成为前三名T&L“种子选手”之一,可惜至今仍未有PowerVR S3的消息。如果Videologic能够使用比较先进的工艺(对PowerVR类的内核,0.21微米生产工艺足矣)在今年第1或者第2季度生产出PowerVR S3,还是很有机会与nVidia和S3三足鼎立的。另外希望大家接受新生事物谈何容易,Videologic还必须使用“杀手锏”——低价倾销的方法,还好PowerVR结构的一个主要优点就是高性价比。还是让我们等着看Videologic今年是否能打翻身仗吧。 退居二线的公司也不少,这里我只举典型的例子。Intel果断地退出了3D显示芯片市场,仅仅保留了整合型主板芯片组中的3D显示部分。这主要是由于Intel同Real3D合作建立的技术基础并不坚实,根本赶不上nVidia、3dfx和S3这些公司的技术发展速度,以至于将Intel的产品限制在中、低端市场。不幸倒闭的Real3D被Intel部分收购,在新的一年内,Intel将不仅通过同3Dlabs等公司的合作,而且会利用自行开发以及其他一切途径获得最新的、甚至超前的3D显示技术。Intel同微软一样窥觑3D显示芯片这个大市场,但他们的“入侵”几乎同样的不顺利,唯一可以肯定的是,他们都会再回来的,也许就在不远的将来。Trident在廉价的显示卡市场上一直很活跃,只是在去年同Voodoo和Riva 128同一档次的Blade 3D上市后,Trident似乎是“江郎才尽”(据说已经全面转向手提电脑显示芯片市场了),今年充其量不过是推出Blade 3D的加强版,因为Trident连单周期双纹理的双渲染流水线都还未完成,要同T&L武装起来的4条流水线的产品竞争,至少是比较遥远的愿望。Rendition的成形产品都还是Voodoo时代的印象,后来似乎一直在改变名称,从取消了V3x00系列产品,到将新产品RRedline命名为V4400E(据说有嵌入式内存和“惊人”性能),那都是一年多以前的新闻了,Rendition的一蹶不振已成定论。一向同Matrox争夺高端市场的Number Nine在Revolution IV(Ticket to Ride IV)之后就没有推出过自己的显示芯片,一直都在使用S3等公司的产品,但S3不再对外供货了怎么办?只听说Number Nine同久违了的PixelFusion在合作开发具有3MB嵌入式显示内存的FUZION 150,只有今年我们见到FUZION 150上市,才能证明Number Nine还未落伍。 小公司里最出风头的要属Bitboys,继不成功的Pyramid 3D之后,Bitboys一直在用Glaze 3D的数据刺激大多数对手的神经,集成512位9MB的嵌入式内存(带来巨大的带宽,而且这个容量已经足够作为手提计算机的显示芯片了)和至少8条纹理流水线(带来创纪录的像素填充率)的Glaze 3D系列只要能在今年第1季度上市,那么第2季度(最晚第3季度)我们就会见到其单片T&L引擎了,这将使Bitboys不但进入一线厂商行列,而且站在同3dfx差不多的起跑线上。但即使0.20微米的先进工艺也很难生产那么大的嵌入式内存和极其复杂的传统内核,就让我们等着看Glaze 3D这最后的冲刺吧。在COMDEX上很出风头的Giga Pixel(使用分块渲染、隐面去除技术)设计的GP-1,这一IP方式的3D内核尽管不含T&L功能,但样品竟可以同GeForce 256同台较技,比PowerVR S2性能更为强劲,今年很可能会大有作为。Stellar Semiconductor的PixelSquirt结构的VelaTX也具有嵌入是内存和超并行的单像素渲染核心,可惜一年过去了仍未见任何动静。微软的Talisman设计是两年多前的东西了,只听说Trident研究过,Fujitsu一年前就打算推出增强型Talisman结构的Marquis 2000,加上Fujitsu本来就内行的T&L技术,按理说可以同GeForce 256和Savage 2000一较高下,可一直就没有下文了,如果今年推出新产品倒是可以紧随Videologic之后,为3D图形加速芯片市场增色不少。ArtX则同SGI有些渊源,正在为任天堂的下一代游戏机“海豚”开发3D图形芯片ArtX 1,还在同Acer合作推出整合型主板芯片组。PixelFusion不必重复,全看同Number Nine合作的FUZION 150能否在今年推出。老牌厂商ARK的旧的Tiger 3D和新的Cougar 3D芯片都属于预算有限情况下的高性价比产品,不过一直没有成什么气候。 专业公司的市场受到娱乐型3D硬件厂商的挤压,正在逐渐向高端萎缩,尽管State of the Art(现今最高水平)的产品永远有市场。虽然Intergraph、E&S和3Dlabs这三巨头都在不断推陈出新,但看到Real3D的倒闭,不免也该考虑考虑自己的多样化发展道路,可惜要让专业公司设计娱乐产品无异于“杀鸡用牛刀”,既大材小用,又笨拙不堪。 3D硬件整合大趋势在电子系统的功能日益复杂、集成电路的集成度日益提高的今天,3D图形加速芯片的性能正在以超越“摩尔定律”的几何速度不断膨胀着,因此各种整合趋势就不可避免地成为3D的历史主旋律。这里我将娱乐-专业性能的整合、3D-系统芯片整合、芯片-板卡厂商整合这三个不同层面上的整合大趋势并列在一起,以期为新世纪的3D硬件市场勾勒出一幅“白描”的整合前景。
娱乐-专业性能整合讲的是娱乐用的3D图形加速芯片和专业用3D绘图加速芯片之间的界限将日渐模糊,纯粹的专业3D芯片市场将逐步向高端萎缩,而娱乐3D芯片则将同时囊括中、低档的专业功能。如同中、低端工作站正在被高性能的个人计算机逐步取代,Intel的普及型CPU蚕食着高档服务器、工作站CPU市场,微软低端的Windows 9x同高端的Windows NT终于“合流”成为Window 2000,娱乐型3D芯片公司进军专业领域也只是迟早要出现的趋势。娱乐型3D硬件厂商有着更大的市场占有率、更雄厚的资金后盾、更先进的生产工艺和更强有力的开发机制,因此可以凭借更复杂、高速的3D硬件结构、更低廉的大批量价格迅速占领中、低档的专业市场,所欠缺的仅仅是设计专业产品的经验和从娱乐型市场的激烈商战中腾出资金和人力、物力的时机罢了。从G400在专业3D绘图软件中的入门级表现和ELSA Gloria II使用Riva TNT2达到的低端3D绘图水准,到现在GHz级Athlon配合使用Quadro的ELSA Gloria III显示卡时所获得的所向无敌(同价位内)的性能表现,可以认为娱乐-专业性能这一整合潮流已经启动。而3Dlabs的工作则是同nVidia相反的过程,它凭借专业市场上的实力多年来一直试图在娱乐市场中领先,尽管Permedia系列始终未能在娱乐性能上占据优势(专业性能还是能保持入门级水准的),但其专业主力Gamma G2和Glint R3倒是部分融合了十分地道的娱乐型3D特性,新一代的Permedia 4将是今年3Dlabs的又一次整合努力,经过3、4轮挫折之后,3Dlabs应该给整个市场一个惊喜了。 3D-系统芯片整合是后PC时代的必然产物之一,由于计算机不再是行业增长的重心,主流市场不断升级的高档PC逐步被“傻瓜”化的廉价机型所代替,将3D加速芯片和系统芯片组(不少已整合了声卡部分)合而为一无疑是降低系统总成本的顺理成章的解决方案。这种整合方式早已十分流行,从SiS公司过去的整合SiS 6326的芯片组到现在整合SiS 300的芯片组甚至单芯片,Intel公司的i810系列芯片组整合了i752显示芯片,VIA公司过去有合并了Trident Blade 3D显示部分的MVP4等,如今又在努力地融合S3的Savage4(VIA同S3的合作倍增了双方在这一新兴市场上的信心),规模小一些的Acer集团的ALi则同3D霸主nVidia合作开发Aladdin TNT2芯片组,又同时和ArtX合作开发Acer-ArtX芯片组(ArtX正在为任天堂的新一代游戏机“海豚”开发显示部分)。今年3D-系统芯片的整合潮流已是不可逆转了。
芯片-板卡厂商整合是3D硬件市场激烈竞争的直接后果,竞争使得实力差的公司无法生存,也使得各个厂商的利润剧减,芯片厂商和板卡厂商进行“纵向”联合,可以提高整体利润,不对外供应芯片则可以避免相同芯片、不同厂家的产品之间的恶性价格战(尽管这也使不拥有芯片设计能力的板卡公司转向对手的产品)。ATI、Matrox一向都是使用这种“一条龙”生产销售方式,因此收入一向在行业内部名列前茅,规模较小的Videologic也采用类似方式;Rendition被品牌计算机公司Micron买下后,始终没有成功地推出产品;3dfx买下著名的板卡厂STB之后也加入了这一行业,但3dfx既没有好好利用STB这一著名品牌,又间接扶持了对手nVidia在其他板卡公司中间的生意;S3去年购并了著名的Diamond Multimedia(帝盟多媒体),决定充分利用Diamond这一品牌;3Dlabs买下Oxygen专业显示卡公司后,自行生产销售Oxygen品牌的显示卡,把SLEA等老客户推给了nVidia(使其更方便地进入专业领域)……虽然各芯片厂有时还会售出一些IC给其他公司,但这种“自产自销”的模式对市场的影响还时不仅巨大而且复杂。总体来看,芯片-板卡厂商的整合模式有利也有弊,就看两家公司如何取长补短、默契合作了。 3D显示卡公司大检阅随着竞争的加剧、合并的增多,大型的3D显示卡公司已经是越来越少了。在Hercules(大力神)公司倒闭、Wicked 3D(属于Metabyte公司)退出了这一市场之后,国外的著名公司也就剩下Creative Labs(创新)、ELSA(爱尔莎)、AGI、Guillemot、Number Nine、Canopus等几家了,其中Creative的声卡部分是采取芯片、板卡“一条龙”生产模式,显示卡部分又是规模最大的,因此在显示卡厂商中最为举足轻重;ELSA和AGI则基本上是专业用显示卡生产商,在专业3D方面功力深厚;Number Nine则从芯片-板卡公司跌落到几乎是纯板卡生产厂。国内(包括港、澳、台地区)的显示卡大厂有丽台(Lead Tek)、华硕(ASUS Tek)、微星(MSI)、奔驰、小影霸、耕宇(Card Expert)、启亨(Triplex)和景丰等,当然还有不少小厂商、小品牌,而且几乎每家厂都同时生产主机板、声卡等其他产品。 nVidia的未来从上面的讨论中我们可以发现,3D显示芯片之王nVidia是唯一还未拥有板卡生产厂的3D芯片公司。nVidia始终表示不愿收购他人,而是更愿意被收购,尽管由于如日中天的nVidia要价不菲,似乎只有Creative这样的超大型公司才有实力收购,但nVidia的购并看来只是早晚的事情。 一旦nVidia被购并,3D显示卡市场将成为这些超级显示联合公司火拼的战场。那些失去了3D显示芯片来源的厂商该如何是好呢?除了几家能够自行或者合作开发芯片的厂家,大多数公司会联合起来扶持一家或几家新兴的3D显示芯片公司,这一切对新兴的芯片小厂有利,但是将使整个市场在各个价格区段上都更加复杂、竞争也更加白热化。 新世纪3D新技术3D显示技术的发展速度越来越快,各种新技术层出不穷,在这个令人眼花缭乱的新世纪里,我们该如何把握3D新技术的脉搏? 3D技术的发展大致可以分为两种类型:一类是在现有的技术体系内顺理成章的扩展,基本上属于工程师(或者说,技术化)的工作;另一类是在现有的成就之上跳跃式的创新,可归功于发明家(或者说,艺术化)的工作。让我们在这里一一分述如下: 顺理成章的扩展并行渲染开始于有2条纹理流水线的Voodoo 2。现在GeForce 256有4条像素流水线,Savage 2000系列有4条纹理流水线,Glaze 3D 1200有8条纹理流水线,Rage 6、G800、Permedia 4与PowerVR S3应该有4条以上的渲染流水线,更高的像素pixel(或图素texel)填充率。更高的分辨率、更复杂的场景、更高的帧速率,我们渴望的行云流水般细腻的3D图像,时时刻刻呼唤着高、还要更高的填充率,在芯片核心频率难以成倍提高的今天,成倍增加的渲染流水线是别无选择的选择。 纹理压缩是在更精细、漂亮的大型纹理和系统开销之间的一种权宜措施。S3最先提出的S3TC标准被广为接受,成为DirectX中的一个事实标准,称作DXTC。现在S3的全系列产品GeForce 256,还有VelaTX都支持DXTC,PowerVR S2的Vector Quantization纹理压缩方式也符合DXTC标准,VSA-100的FXT-1纹理压缩方法是在DXTC的基础上作的扩展和改进。如同网上传递信息通常要使用压缩工具,纹理压缩将是现阶段3D显示芯片的必备功能,除非我们有了过剩的3D图形系统资源。 抗锯齿(Anti-Aliasing)是很早就有的3D特性之一,在Voodoo 2时代,使用的是边缘抗锯齿,到如今VSA-100“炒”得尽人皆知的全景抗锯齿,抗锯齿技术有了飞跃的发展。全景抗锯齿一般先在高分辨率下进行渲染,再将图形用失真最小的方法转化为低分辨率来减少锯齿感,所以需要巨大的像素填充率。今年新出的3D加速芯片基本都会支持全景抗锯齿,这将为我们带来更加细腻、清晰的3D图形。 3D特性总是在不断地增多,今年会比较引人注目的有:3dfx的T-buffer,除了包括全景抗锯齿以外,还有运动模糊(Motion Blur)、可编程景深(Programmable Depth-of-Field)、柔和阴影(Soft Shadow)、柔和反射(Soft Reflection)几种“电影效果”;GeForce 256的立方环境贴图(Cube Environment Mapping)可以实现光线照射在物体表面的逼真反射效果,顶点混合(Vertex Blending)有助于表现平滑的人物和物体,还有适合制作火焰、魔法的漂亮的粒子系统(Particle System);Glaze 3D的积层缓存(Accumulation Buffer)可以实现T-buffer那样的特殊效果;还有环境凹图贴图(Envirornment Bumping Map),是Matrox首先倡导,现在已被多数新3D芯片接受的特性。 附加功能是指3D显示芯片的2D和视频等功能。新一代3D加速芯片在视频方面几乎全部支持DVD/HDTV的MPEG-II动态补偿解码,还很可能会增添MPEG-IV的解码功能。2D方面将会出现256位的超级2D内核,而且支持LCD平板显示器将形成潮流。至于更多的显示内存、更高频率的RAMDAC、更高的显示分辨率则更是不在话下。 跳跃式的创新T&L几何变换与光源照射是整个3D图形处理流程的前半段,以前一直是由CPU负责几何变换,由3D图形加速芯片进行三角形设置和纹理渲染,光源效果一般是使用光照纹理进行模拟。从去年第3季度的GeForce 256和Savage 2000系列开始,新一代3D芯片(多数可以称为GPU)集成了T&L硬件加速引擎。很快将推出的Rage 6、G800、PowerVR S3和Permedia 4也基本上都会集成T&L类的功能,VSA-100和Glaze 3D则略有不同,计划使用独立的T&L芯片以提高灵活性(但成本要高一些)。添加硬件T&L是主流3D显示体系自诞生以来最大的变革,显示卡终于可以不那么依赖于CPU的浮点能力,T&L强大的几何处理能力与光源计算功能,不但使3D场景和任务更加细腻、真实,而且让CPU有空闲去处理与游戏内容相关的事务,从而改善PC游戏最大的弱点——可玩性。 嵌入式内存是解决显示内存带宽不足的一种途径。我们知道,3D显示芯片的核心可以达到动辄几亿、十几亿的像素(或图素)填充率,为什么在高品质的游戏中至今很少使用1024x768以上的分辨率?那就是因为显示芯片的外部带宽太低,限制了3D内核性能的发挥。AGP总线的带宽可以先不考虑,因为即使AGP 4X Fast Write接口也仍比不上普通的128位本地(卡上)显示内存接口的性能。现在主流的显示内存接口是128位150MHz~183MHz,如果要成倍提高带宽,通常只有两个办法:一是将接口改为256位的,但这么多的引脚会大大增加3D芯片的封装难度和成本,因此Voodoo 5系列、Rage Fury MAXX和Glaze 3D 2400等采用多块芯片分别配上显示内存来部分缓解这一困难;二是使用DDR(双倍数据传输率)DRAM来使带宽加倍,GeForce 256和Savage 2000系列等新一代3D芯片基本上都可以使用DDR DRAM,只是这种内存仍然比较贵。另外以上两个办法还很难继续提升带宽,因为512位的接口和4倍速DRAM还不太可能实现,嵌入式内存就成了唯一可行的继续提升带宽之路。嵌入式内存是在3D芯片的核心硅片上集成高接口位数(轻易就可以达到512位)的内存作为cache,不必多大容量就可以大幅度提高对外交换数据的效率。cache的效率只要看集成了128Kb嵌入式内存的Celeron A(Mendocino)比老式没有cache的Celeron快多少就可以明白。首先提出嵌入式内存应用的显示芯片是V4400E,但一直没有实施,Glaze 3D 1200单芯片上集成了512位9MB的内存(很大,甚至可以用在手提计算机上,但比较难以生产),VelaTX有512位2.5MB的嵌入式内存,FUZION 150有3MB。相信随着对带宽需求的进一步提高,嵌入式内存的设计将很快普及并进入主流市场。 各种曲面的应用至今仍不多,游戏中只有Quake 3 Arena使用曲面,PlayStation 2是拥有曲面生成硬件功能的先驱。我们现在的3D显示芯片是以多边形(或三角形)为单位进行处理的,但由于曲面的多样性,不用多久就会有更多的软件乐于使用曲面,也会有一些显示芯片硬件支持生成曲面,当然这都是将曲面分解为小的平面来处理的。随着曲面精细度的上升需要的处理能力会呈几何、甚至立方级数增加,更加根本的方法是以三次参数曲面、Bezier曲面、B-Spline曲面以及NURBS曲面等这些曲面为单位直接进行处理,不过这类技术仍很遥远,因为当前即使在专业领域中也还未达到实时处理的要求。 分块渲染与隐面去除是“另类”3D渲染架构。现有的主流3D渲染硬件的结构,比较复杂和低效率,从Voodoo时代开始就没有什么大的改变,所以才会有比Athlon还要复杂、达到2倍Pentium III晶体管数目的GeForce 256出现,随着渲染流水线的数目再次提升,3D芯片将变得很难生产,发热量也会变得难以控制——这就是为什么3D芯片的发展已同CPU类似的受制于生产工艺。从PowerVR开始的分块渲染与隐面去除方式,首先是将屏幕或窗口分成多个小块逐个渲染,再将当前块中的多边形以观察者为基准进行排序,把看不到的图形抛弃(这时半透明多边形的排序比较困难),之后再开始通常的三角形设置和渲染流程。因为每一小块的数据量较少,处理机构就比较简单,还可以将纹理、Z-buffer等数据一次读入3D内核中的寄存器里,处理结束后将结果一次写入帧缓存(Frame-buffer),这样再加上不渲染隐藏图形就可以大大节省处理能力和芯片外部带宽,硬件结构的简单性又便于提高工作频率和使用并行处理机制。这种结构的主要缺点是取消了Z-buffer,使得软件兼容性不完全。这类3D加速芯片中,PowerVR S1使用软件分块和进行半透明排序,问题比较大;PowerVR S2使用硬件引擎解决了这两个关键问题,水平不错,另外PowerVR系列是以无限大平面作为排序单位的;Talisman也使用分块渲染方式,但一直没有出成品;VelaTX使用单个项素作为渲染单位,用大量的并行结构提高速度,可惜一直没有看到成品;IP内核GP-1是用传统的多边形作为处理、排序单位的,而且具有集成在芯片内部的可读写Z-buffer,兼容性达到了前所未有的高度。 特殊3D特性包括骨骼系统、纹理变化和场景控制等。骨骼系统可以让游戏中的人物的行为、动作不再象木偶一样呆板,《侏罗纪公园》中的恐龙就使用了这类技术,因此看起来栩栩如生。Quake 3 Arena中使用了初级的骨骼系统,这也是Quake 3 Arena能够保持第一人称射击游戏之王称号的一个原因。今后游戏中更真实的骨骼系统,必须依赖于在3D硬件和3D软件两方面的共同努力才有可能实现。纹理变化是为了表现出真实环境中千变万化的纹理缺陷与差异,在贴图时对纹理作出随机的变化、处理,又叫做可编程纹理(Programmable Texture)。场景控制则距离现实更加遥远了,它试图在同一个场景内同时表现成百上千的人物和事件(现今的游戏中,场景是基本不变的,变化的人物只是少数几个)。光是那些人物的多边形和变化的光线就可以让现有的GPU不知所措,更不用说什么样的CPU可以处理那么多人物的动作。这种现在仍不可想象的工作需要CPU、GPU和API以及应用软件的通力合作才有可能变成现实,近期内恐怕难以实现。 最终目标对于3D显示系统来说,就是表现尽量真实的环境与人物。真实世界由无穷多的多边形、光源和各不相同的纹理组成,要达到更加接近真实的效果将是我们永远的追求。 如今我们距离真实这个终极目标还很远很远,可是以硅为基础的集成电路的发展已经接近于物理极限,3D图形加速芯片要有更大、更广的进步,不但需要有创新的3D硬件、软件技术,更比CPU还要急切地盼望着半导体生产工艺的突破。 新世纪3D新应用计算机在信息时代就如同电子时代的电灯一样,只是初级设备,现在的3D图形加速芯片在3D新纪元的门槛上也不过是些粗陋的工具。新的世纪我们将拥有更多革命性的3D硬件产品,而且3D图形的应用将远远超出你我的想象力。就让我们用最平凡的理解,来预言未来的3D交互式媒体世界和3D拟真网络空间吧。 信息时代,一切过程均是实时进行。无论通信、网络、工作,还是娱乐,人们都没有时间再作等待,所以3D图形系统在保证图像质量的前提下,我们需要速度快、更快、还要再快! 3D应用领域3D图形一起直观性、交互性的特点优于传统的2D图形。在新世纪里,3D图形的应用将不仅仅局限于游戏和地图等简单用途,任何通过使用3D图形可能提高生产率的工作都将利用3D表现形式,任何凭借3D形式能够改善人与人之间、人与机器之间交流的手段都将提上议事日程。 在3D的计算机世界里,我们除了3D眼镜,还需要比鼠标更3D化的输入设备,正象鼠标在2D图形世界里代替了属于文字世界的键盘一样。因为鼠标只能提供两个方向的定位,要在三维空间中进行操作必须有3D手套那样的灵活性,而又不能结构太复杂。未来的鼠标(该不会叫“猫标”吧?)会是什么样子?我不知道,但也许为3D世界找到答案的人不是别人,就是读者你! 3D桌面工作传说Windows界面将会3D化已经有些时日了,我们也有了一些3D化桌面的小程序,3D视窗系统和3D应用程序将随着3D硬件、软件的进步和普及越来越多。使用3D的Windows(也许该叫“Boxes”?)将使工作效率倍增,3D的文本将让超文本(HTML)系统变得更直观、方便,3D的表达方式使人们同时看到事物各个“侧面”的信息,3D的数据库让我们随手就可以“抓”到需要的资料,3D的数据“挖掘机”让人们的直觉更有用武之地…… 3D网络生活当网络的带宽发展到足够大时,3D的外观将是改造Internet的最优先的形式之一。在网上面对面的工作、游戏、生活将把世界真正变为“地球之家”、“地球办公室”或“地球商店”,我们将会拥有网上的3D职业、3D旅游、3D家园甚至3D人生! 我只提醒一句——可千万别成了3D狂人啊! |
|