RADEON 8500 架构特点

Radeon 8500 旨在与最好的 NVIDIA 产品竞争。 ATI。 随着 RADEON 8500 的发布,ATI 给了 NVIDIA 一个非常痛苦的打击。
ATI RADEON 8500 芯片的主要特点
制造技术——0.15微米;
60万个晶体管;
核心工作频率 - 250-300 MHz;
显存接口 - 128 位;
显存类型——SDRAM/SGRAM、DDR SDRAM/SGRAM;
显存量 - 16-256 MB;
显存工作频率——最高300 MHz,与内核同步;
支持 AGP 2x (3.3V)、4x (1.5B)、SBA、DMA、DiME;
支持 ACPI 1.0b、OnNow 和 IAPC 电源管理。
3D - 部分
4 个像素管线,每个管线 2 个纹理单元;
一次覆盖最多 6 个纹理,每个时钟 2 个纹理;
支持三线性和各向异性过滤;
支持使用Emboss、EMBM、Dot3方法进行浮雕模拟;
支持全屏抗锯齿SMOOTHVISION 2x-6x;
支持高达 8.1 的 DirectX 1.4 像素着色器;
支持高达 8.1 的 DirectX 1.1 顶点着色器;
硬件块固定功能T&L;
支持 TRUFORM 技术;
隐藏表面剪裁 (HSR) 支持 - HYPER Z II。
2D - 部分
两个内置 CRT 控制器;
内置RAMDAC,频率为400 MHz;
内置TMDS收发器,用于连接数字显示器;
支持多显示器配置和 HYDRAVISION;
支持MPEG2硬件解码(iDCT);
安装 ATi Rage Theater 芯片时支持视频输入/视频输出;
支持 GDI 功能,包括 GDI 扩展 Windows XP。
在所有特性方面,RADEON 8500 看起来,如果不是更令人印象深刻的话,那么至少在当时的游戏 3D 图形之王 NVIDIA GeForce500 Ti3 的水平上。
立即引起您注意的第一件事是 ATi 的开发人员拒绝在管道中使用三个纹理模块。 显然,第三个纹理模块几乎总是空闲的 RADEON 256 的悲惨经历导致 ATi 找到了与 GeForce3 中实现的解决方案完全相同的解决方案。 RADEON 8500 一次最多可以将 6 个纹理应用于多边形,使用超过两个纹理时需要一个额外的周期,而使用超过 4 个纹理时需要一个额外的周期。 以同样的方式,NVIDIA 的 GeForce3 芯片(现在的 GeForce3 Ti 200/500)支持多达 4 个纹理叠加,在像素管道中也只有 2 个纹理单元。
RADEON 8500 的第二个有趣功能是完全支持多显示器配置。 这是第一款除了 3D 性能外,还完全支持多显示器配置的游戏芯片。
一般来说,RADEON 8500 既支持新技术,也支持旧技术,经过验证和“磨合”,但自 RADEON 256 时代以来有所改进。
RADEON 8500 图形管线框图:

三角形的镶嵌(分割)甚至在转换和照明块中的处理之前就已执行,并且顶点着色器已经在“切碎”的三角形上执行。 这意味着对 TRUFORM 技术的支持并非一帆风顺,在高度分区的情况下,可能会导致较大的性能损失,因为在 TRUFORM 的作用下多次增加的三角形数量会导致负载显着增加在 T&L 块和顶点着色器上。
特鲁福尔
这项技术在 RADEON 8500 的硬件支持下,可以通过分割构成模型的三角形来提高游戏中模型的质量。分区时,使用有关三角形顶点法线方向的信息。基于此信息,RADEON 8500 构建了 N-Patch,即曲率由控制点指定的曲面,并将其划分为更小的三角形,三角形的数量由细分级别决定:


由于 TRUFORM 动作,模型变得更平滑、更自然,重要的是,无需将任何额外数据传输到加速器 - 在绝大多数情况下,法线被传输到加速器,例如,它使用它们来计算照明。
智能着色器
结合了 RADEON 8500 像素块和称为 PIXEL TAPESTRY II 和 CHARISMA ENGINE II 的顶点着色器。
RADEON 8500 的顶点着色器单元与 GeForce3 一样,能够处理长达 128 条指令的着色器,并具有 96 个常量和 12 个临时寄存器:

像素着色器单元比 GeForce3 更先进:它可以处理长达 22 条指令的着色器,这些指令被转换为像素着色器单元设置 - 6 个纹理样本提取、8 个地址命令和 8 个着色命令:

作为比较,GeForce3 像素着色器单元最多可以处理 4 个纹理,并且像素着色器的长度最多可以是 12 条指令 - 4 个提取操作和 8 个着色操作。
此外,RADEON 8500 像素着色器单元支持统一寻址和着色命令,符合 DirectX 8.1 1.4 像素着色器规范。
从所有这些信息中得出的一个简单易懂的结论是,RADEON 8500 不仅支持 DirectX 8.0 和 DirectX 8.1 像素和顶点着色器,而且由于其与 Geforce3 相比的增强功能,它可以显示更多“高级”特效或处理比 GeForce3 更快的复杂效果。
平滑视觉
RADEON 8500 硬件中的一种新的全屏抗锯齿方法体现了 DirectX 8.0 多采样缓冲区的思想,这反过来又是对现已死去的 3dfx 的 T-Buffer 思想的发展。
就像在 Voodoo5 中一样,RADEON 8500 的全屏抗锯齿是基于场景几何体的小位移(顶点抖动)以及随后获得的“移位”样本的颜色组合。 但是,这个想法在 RADEON 8500 中的实现更加完美:首先,RADEON 8500 可以使用最多 8 个样本来获得一个像素的颜色(Voodoo5 - 最多 4 个样本),其次,取决于位置像素(一个像素既可以位于多边形边界上也可以位于其内部)RADEON 8500 可以选择最佳样本数,这可以避免在不需要的区域平滑图像。
超级Z II
HyperZ 和 HyperZ II 旨在通过切断不可见的表面(隐藏表面去除,HSR)来提高加速器的效率。 也就是说,如果可能的话,让核心不必绘制那些被更近的物体隐藏的场景部分,因此绘制它们没有任何意义。
例如,如果游戏中的任何场景由两个由一扇紧闭的门隔开的房间组成,而您的英雄正站在其中一个面向门的房间中,那么优化不佳的游戏引擎会定期将所有场景多边形发送到加速器渲染,虽然第二个房间关闭的门是看不到的,而渲染那个房间整个内部的工作将由加速器完成。 高铁的任务就是尽量让加速器摆脱这种无用的工作。 而Overdraw指标,即场景中物体的重叠程度越大,使用HSR所能提供的增益就越大。
| 名称 | Radeon 8500 |
| 核心 | R200 |
| 工艺技术 (µm) | 0,15 |
| 晶体管(百万) | 60 |
| 核心频率 | 275 |
| 内存频率 (DDR) | 275(550) |
| 总线和内存类型 | DDR-128bit |
| 带宽 (Gb/s) | 8,8 |
| 像素管道 | 4 |
| 每个传送带的 TMU | 2 |
| 每时钟纹理 | 8 |
| 每次通过的纹理 | 3 |
| 顶点输送机 | 2 |
| 像素着色器 | 1 4 |
| 顶点着色器 | 1,1 |
| 填充率 (Mpix/s) | 1100 |
| 填充率 (Mtex/s) | 2200 |
| 的DirectX | 8,1 |
| 抗锯齿(最大) | 不锈钢 - 6x (800*600) |
| 各向异性过滤(最大) | 16x |
| 内存容量 | 64 / 128 MB |
| 接口 | AGP 4倍 |
| RAMDAC | 400 / 240兆赫 |
英伟达终于有了一个有价值的竞争对手。 ATI RADEON 8500 主板的性能并不逊于基于 NVIDIA GeForce3 Ti500 的主板。 同时,与 GeForce8500 一样,RADEON 3 不仅符合 Direct X 8.1 规范,而且还拥有旨在提高图像质量的新 3D 技术。 例如,GeForce3 Ti500/200 不支持的 TRUFORM 和 SMOOTHVISION。
重返德军总部





