abs3dblend350.gif (9778 bytes) 

动力之源

七月案例分析 ] 穷人的劳斯莱斯 ] FSAA有什么价值 ] [ 动力之源 ] QDR:内存的未来之星 ] OpenML挑战DirectX ] 新一轮3D之战 ] 双雄对峙 ] 后来居上的Sensaura ] 揭开3D纹理的面纱 ] DVD播放机选购指南 ] 新3D之王 ] 新一代nVidia剖析 ] ATI的新曙光 ] TNT2 Pro挑战极限 ] 优秀的内存优化工具Cacheman ] Quadro DDR之野望 ] 怎样设计"JS牌"音箱 ] 袖珍内存优化工具RAMFree ] 余音绕梁A3D 3.0 ] 新一代A3D声卡SQ3500 ] 3D新纪元 ] 3D奇兵GP-1 ] 我有两颗强劲的“芯” ] 新世纪野人揭秘 ] 划时代的GeForce 256 ] 图形处理器——GeForce 256 ] 新世纪的野人 ] 神秘高手Glaze 3D ] 超频是我们的生命 ] 声卡芯片的过去与未来(下) ] 声卡芯片的过去与未来(中) ] 声卡芯片的过去与未来(上) ] 关于Permedia2 ] 3D加速芯片的过去与未来(下) ] 3D加速芯片的过去与未来(上) ] Intel的3D新杀手——i752详解 ] 奔腾III的新搭档i752 ] 划时代的TNT3 ] 野人又回来了 ] 细说S3 Savage4 ] 兼容CPU挑战Intel ] 论文(1998) ]

3border_l.gif (2501 bytes)

3border_s.gif (1818 bytes)

Abs3D主页
Abs3D留言
Abs3D搜索
Abs3D目录

3border_s.gif (1818 bytes)

3border_s.gif (1818 bytes)

Abs3D转移

http://abs3d.yeah.net
http://abs3d.126.com

Abs3D镜像

http://abs3d.webprovider.com
http://abs3d.myrice.com
http://yunzhu.163.net
http://3dabs.webprovider.com

动力之源:新一代PowerVR显示芯片KYRO

朱云

2000.7

(独家授权于《电脑报》)

    Videologic公司设计的新一代PowerVR 3系列3D显示芯片,让我们这些关心PowerVR发展的3D发烧友从去年秋天直等到今年5月中旬,仍没有什么动静。PC版的PowerVR 250显示卡在同类产品中性能出色,可惜国内几乎没有见到;倒是使用同样属于2系列的PowerVR 2DC芯片的DreamCast家用游戏机,全世界都卖得很红火;同属Sega公司的Naomi街机最近有了下一代机型,使用由NEC生产的独立芯片的PowerVR系列T&L协处理器和多块PowerVR 2DC并行渲染,新Naomi打算同PlayStation 2竞争的决心,体现出Videologic近年来在T&L和并行渲染方面的重大进展和PowerVR体系结构的日渐成熟;新一代的DreamCast 1.5版估计也是增加了一块PowerVR T&L协处理器或PowerVR 2DC,甚至同新Naomi同级配置也未可知。

    VideologicNEC携手拓展游戏机用3D显示芯片市场的同时,并没有放弃竞争激烈的PC市场,相反的,Videologic去年就同ST公司(SGS-Thomson,法意半导体,著名的IC生产商,nVidia的产品有部分由该公司生产)合作开发、生产新的3D显示芯片(由Imagination Technologies出面进行技术授权),产品就是称为KYROPowerVR 3PowerVR 4系列。因为4ST在德国的WinHEC上展出了KYRO的原型,而且5月中旬以后ST不慎泄漏了部分资料,因特网上有不少网站开始讨论KYRO系列的性能,直到65日我国台湾省的台北Computex电脑展上,ST才正式公开了KYRO系列2D/3D/视频加速芯片,并展示了第一片正式KYRO产品的实际工作情况我们期待已久的KYRO终于面世了。

KYRO系列产品

    KYRO又可以分成两个系列:传统的PowerVR 3系列渲染加速器和集成T&L 功能的PowerVR 4系列GPU

    PowerVR 3包括: STG 4000是第一片KYRO,具有双渲染流水线、0.25微米工艺、1200万晶体管、125MHz核心频率,800万多边形/秒、2.5亿图素/秒,相当于普通显示卡的7.5亿图素/秒,32MB版的STG 4000显示卡售价低于$200,基本上就是两片PowerVR 250合起来的性能;STG 40050.18微米版的STG 4000,预计今年9月上市,达到150MHz核心频率、1000万多边形/秒、3亿图素/秒,相当于普通的9亿图素/秒;后面还将推出低成本版STG 4003,用于TV机顶盒等“value”用途。

    PowerVR 4包括:STG 5000是第一片集成T&L引擎的PowerVR芯片,计划今年年底上市,具有四渲染流水线、0.18微米工艺、2000~2500万晶体管、支持GDR内存、166MHz核心频率、6.6亿图素/秒,相当于普通显示卡的18亿图素/秒;STG 5005STG 5000的生产工艺改进版,具有更高工作频率和处理速度。

    KYRO之所以能够凭借较低的价格实现较高的性能,完全是因为PowerVR家族特殊的分块渲染引擎具有特别高的效率、特别节省带宽,所以能达到一流的处理速度,另外完全的内部32位处理保证了图形质量,8重纹理贴图和其他各种3D特性用来产生精彩的3D图形效果。下面让我们来一一讨论:

分块渲染引擎

    分块渲染(Tile Based Rendering)的含义是:将要显示的窗口(或全屏幕)图形分割成多个小矩形区域作为图形处理单位,目的是减少每个单位的数据量,这样一来z-buffer、纹理、明暗和半透明混合等操作所需要的数据都可以直接存放在芯片内部的微型缓存器中,不再需要从外部的显示内存、甚至系统内存中多次读写,这样能够极大地节省传统3D显示芯片体系中特别紧张的外部带宽,而且通过多边形排序功能不需要象传统3D芯片那样渲染那些看不见的多边形,从而成倍提高了实际运行速度,目前分块渲染引擎一般能够将芯片外部带宽的需求降低到传统结构的1/3。在已经实用化的3D显示芯片中,只有3dfxGiga3D GP-x系列和PowerVR系列全面使用了分块渲染体系结构,ATIRage 128系列等产品部分使用了隐面去除等技术。分块渲染在PowerVR PCX1/2的时代,由于根本没有z-buffer功能,同主流的3D芯片兼容性不佳,而且因为半透明排序功能由软件实现造成性能下降,从而给人们留下了分块渲染架购的各种不良印象;到PowerVR 2系列和Giga3D GP-1/2时,就已经解决了这些兼容性问题(主要是增加了可读写的片上z-buffer),而且速度上廉价的PowerVR 250能超过TNT2、名不见经传的GP-1/2甚至能同GeForce 256较量。分块渲染引擎的优势主要体现在以下几个方面:

    一、能够大幅度提高外部带宽的使用效率。现在,有限的内存带宽已经成了3D图形发展的主要障碍,从过去的32位、64位显示内存接口发展到目前的128位接口和128DDR(双倍数据率)接口,继续成倍增加芯片的引脚看来不太可能,今后传统体系只有使用QDR(四倍数据率)接口和类似CPU使用大容量片上缓存两条比较昂贵的发展途径了。分块渲染引擎另辟蹊径,从减少外部带宽的使用出发把带宽的使用效率提高到3倍,这样甚至统一内存结构的情况下64位的内存接口都勉强够用了,而高性能的T&L芯片需要的更多带宽也能够由普通128位接口提供。

    二、隐面去除和片上像素混合进一步提高了效率。普通3D芯片是在所有多边形都渲染完成后,才从远到近凭借z-buffer中的深度数据确定遮挡关系,当然多渲染了许多看不见的纹理点(图素)而浪费了大量处理能力;分块渲染引擎则事先对多边形排列顺序、确定遮挡关系,从而去处隐藏的面、只渲染那些可见多边形,既快速又节省外部带宽。现有3D软件(主要是游戏)中总多边形数同可见多边形数的比例,已经随着3D场景的复杂化,从过去的1.2~1.5倍提高到现在的2~3倍,今后还将提高到4~5倍,因此分块渲染结构的像素/图素填充率相当于其3倍的实际效果,而且在越复杂的场景中潜力越大。以往的3D芯片总是将渲染的中间数据存放在显示内存的帧缓存内,多个层次的图形都处理完毕后再读进来进行半透明混合;KYRO的新方法是将因为分块处理而变得较少的中间数据存在片上缓存器内,提高了速度的同时节省外部带宽和显示内存的容量。

    三、全32位内部结构和8重纹理贴图带来了超群的图形质量。MatroxG200开始,3D业界就开始鼓吹内部是32位的渲染流水线,但是KYRO恐怕是首次完全地实现了这一目标。传统的3D结构由于必须将中间数据存在显示内存中,如果渲染模式是16位色彩,保存的数据也必须是16位的,再次读入进行混合时就有了较大的误差,多层混合时的问题就更严重了;因为是在芯片内部进行半透明混合,只在最终输出时才一次转化为16位,因此KYRO16位模式的图形质量明显超过普通芯片的16位表现,甚至能超过某些情况下的32位图形。同时,传统的3D显示卡因为使用显示内存存储,在16位模式下只能有16位的z-buffer、没有模板缓存;KYRO则由于基本全部使用片上缓存,不论什么色彩模式下都能有32位的z-buffer8位的模板缓存,速度还更快。由于使用内部的半透明混合缓存,KYRO能够一层叠一层地进行纹理贴图,每条流水线竟然都能完成最多8重纹理贴图,尽管不能在单一周期内实现,但也不会像普通显示卡那么“缓慢”。8重纹理能达到什么样的表现力暂时很难估计,但全部发挥出来后一定能让PlayStation 2汗颜,现在至少能胜过ATIRadeon 2563重纹理贴图,同GeForce2 GTS的单周期、7功能的NSR渲染引擎有的拼呢!

    四、结构简化带来的灵活性。的概念内实际上就包含了并行处理的因素,如果逐个去处理每个方块,即使500MHz的核心频率也是来不及的,因此分块渲染引擎的内部一定普遍具有并行结构(不然两条渲染流水线的STG 4000也用不着同Savage 2000近似的晶体管数了)。从这个角度出发,多芯片的KYRO系统能够方便的象一块芯片那样工作、成倍的提升性能;另外低带宽需求,使得KYRO能灵活的使用显示内存,从几乎不需成本的统一内存结构到64位和128位的高速SDRAMSGRAM都行;从生产工艺角度来说,随着工艺的改进提高了核心工作频率的话,KYRO内部的那些缓存器的速度也同步提升,于是整体性能几乎能成正比提高,不象传统显示卡的性能主要受显示内存质量的制约,当然KYRO的这个特点对于喜欢超频的朋友也是非常合适的。

全面的特性

    每块新3D芯片推出时,总是会带来一些新的3D特性作为独特的卖点。KYRO可能是因为本身的结构太独特,反而没有公开什么惊人的新特性,但普普通通的特性还是值得我们浏览一遍的。

    全屏反锯齿(FSAA并不是什么新东西,在Riva 128的时代就有了这个功能,但是当初的显示卡速度太慢、FSAA没有什么实用价值,所以一直都没有游戏支持。最近是3dfxFSAA带入了公众的视线、作为新功能T-Buffer的组成部分,现在nVidiaGeForce 256/2 GTS系列、3dfxVoodoo 4/5系列和ATIRadeon 256等处理能力比较强劲的芯片都能够使用FSAA功能,支持FSAA的都是Quake 3 Arena档次的“硬件测试型” 游戏。其实FSAA的实质无非是将图像在更高的分辨率下渲染,再通过降低分辨率的措施变成现有分辨率(称为downsampling),获得的图像效果接近高分辨率的图像为什么不直接使用较高的分辨率呢(还省得转化)?只能是因为显示器(或显示卡)的分辨率和刷新频率上不去,所以现在最“渴望”FSAA的朋友不是PC用户、而是PlayStation 2的玩家,因为PlayStation 2没有反锯齿功能,不少时候图像表现还不如有简单FSAA特性的DreamCast(电视的分辨率太低)。Videologic的设计,从PowerVR 2系列开始就已经支持FSAA了,现在的KYRO凭借出色的像素填充率,统统支持2X4X模式的全屏反锯齿。

    环境凹凸贴图(Environment Bump Mapping是从MatroxG400开始采用的,现在已经不是什么特别的技术了。KYRO的特别之处是能进行逐像素调整的环境凹凸贴图,有些类似于GeForce2 GTS的单像素明暗处理,可惜KYRO仍不支持立方环境贴图这类更复杂的纹理贴图技术。

    纹理压缩(TC也是新一代显示芯片都具有的特性,PowerVR 2就有了VQ(矢量压缩)纹理压缩技术,可惜S3S3TC成了DirectX中的标准,所以KYRO现在也同时支持事实的标准DXTCKYRO还支持很多常见的3D特性,如平面和高洛德明暗、视点矫正的纹理贴图和明暗、镜头高光、查表和顶点雾化、4位和8位的模版缓存、16/24/32位的纹理数据、YUVDXT纹理、点/双线性/三线性/各向异性过滤、全部的OpenGLDirectX混合模式等,这里就不再赘述了。

    KYRO集成了128位的高速2D引擎,还集成了不少视频功能。我们知道,在MPEG2领域,ST公司是无可争议的泰斗,现在KYRO的视频引擎无疑使用了ST的领先技术,因此在视频回放和DVD解码方面具有比较全面的功能:动态补偿、子画面混合、水平和垂直插值、色彩键控等。唯一的遗憾是没有集成IDCT(反离散余弦变换),当然这个功能只有ATI的芯片才集成。KYRO符合AGP 2.1标准,支持AGP 1x/2x/4x,包括边带寻址功能,显示内存支持128位的SDRAMSGRAM,容量是16/32/64MB,还有视频输入输出的数字接口。KYRO支持DirectX 7OpenGL 1.1这两种最新的3D API,提供Windows 95/98/NT 4/2000的优化驱动程序。

新一代显示芯片之战

    让我们再来看看KYRO在各方面的对手。

    现在属于3dfxGigaPixel即将推出的Giga3D GP-3,属于同KYRO相同的分块渲染、隐面去除架构,因而具有较大的可比性。GP-3集成了T&L引擎,所以与STG 5000系列是同一档次的产品,同样支持全屏抗锯齿、纹理压缩、环境凹凸贴图等3D特性;但是GP-3最惊人的是其速度,达到3300~6600多边形/秒、256亿图素/秒,真不知道200MHzT&L引擎和4条双纹理流水线如何能达到(很可能是根据16倍重叠的场景计算出来的),实际速度也最多就比STG 5005快一倍;GP-3的缺点是很少有人见过GP-1GP-2的实际表现(DreamCast的效果大多数感兴趣的人都看过了吧?),开发GP-3这样复杂的芯片又不知需要多久(还得加上3dfx的早发消息、晚出产品的“传统美德”)。

    STG 4000系列仅具备渲染流水线,尽管不能同具有T&L的那些GPU相提并论,但渲染速度却不会输给GeForce 256Savage 2000Voodoo5 5000/5500这些并非最先进的产品,G450更不在话下了。有了T&L功能的STG 5000,当然能同目前最先进的GeForce2 GTSRadeon 256,甚至G800RampageGlaze3D 4800加上Thor(以北欧雷神命名的单芯片T&L引擎)一较高下。KYRO最大的问题是在时间上落后了,现在STG 4000系列的对手是nVidiaGeForce2 GTSATIRadeon 256,年底STG 5000将面对的是nVidiaNV20ATI的新RadeonS3ProjectX3dfxRampage以及GP-3。希望KYRO以弱胜强确实不容易,还好PowerVR结构的最大优点是高性价比,凭借低廉的价格同前一代产品争夺市场胜算就大多了,同等性能下能够同KYRO打价格战的恐怕只有3dfxGP系列和S3的产品了(Trident的新一代Blade XP只支持32MB的显示内存,估计不是一个档次的“选手”)。

    现在,3D市场正处于“从混沌到有序”的整合阶段,今后的3D芯片领域必将成为几个3D巨头之间的决战场地。KYRO系列凭借高速度、高质量和低价格的分块渲染架构,为我们带来了新的高性价比解决方案。只要VideologicST能及时地克服生产能力和市场推广两方面的困难,KYRO STG4000/5000这两个档次的产品一定能够赢得广大工薪阶层用户的青睐。

3border_l.gif (2501 bytes)

Abs3D主页 ] 回上一层 ]

Send mail to webmaster@abs3d.webprovider.com with questions or comments about this web site.
Copyright © 1999 Absolute 3D
Last modified: July 08, 2000

[an error occurred while processing this directive]