Radeon HD 3000系列特色技术汇总一
DirectX 10.1是微软DirectX 3D API的最新版本。其关键特性包括:一个更新的着色器模型、抗锯齿支持的提高、更灵活的数据获取,以及能够保证程序更好的兼容性的更严格的规格。目前只有AMD Radeon HD 3000全系列产品能够支持DirectX 10.1,具体到细节,则包括以下部分:
DirectX 10.1 新 特 性 汇 总 | |||
| 特性 | 功能 | 优势 | |
| 着色器与纹理的改进 | 立方图阵列 | 允许在一次渲染过程中对多重立方图阵列进行读和写 | 能够对复杂,动态的交互场景进行高效的实时全局照明 提供许多光线追踪技术具有的品质效果,包括:间接照明、褪色、软阴影、折射和高质量的有光泽反射
|
| 区分每个多重缓冲区的混合模式 | 允许每个像素着色器使用不同的混合模式输出到多重缓冲区中 | 在复杂的3D场景中,能够有效地进行延时渲染以提升性能 | |
| 增加的顶点着色单元的输入与输出量 | 从16位提升到32位,达到每着色器128位值 | 使复杂着色器的性能得到了提高 | |
| Gather 4 | 允许在一个单一双线性滤波的纹理查找中提取一个2×2的未经过滤波的纹理值 | 使流计算应用的性能得到了提高 | |
| LOD 指令 | 为了进行滤波的纹理查找而要求返回层次细节的新的着色器指令 | 定制纹理滤波技术,以优化性能和提高图像质量 | |
| 抗锯齿失真的提高 | 多重采样缓冲读写 | 允许着色器直接存取多重采样缓冲区中的每个色彩采样和深度采样 | 定制边缘检测滤波器以获得高质量的抗锯齿效果,性能得到了提高 提高自适应抗锯齿的性能 通过HDR渲染提高抗锯齿质量的兼容性 通过延时渲染技术提高抗锯齿的兼容性和性能。 |
| 像素覆盖 | 使得像素着色器具有可编程抗锯齿功能 | ||
| 可编程抗锯齿采样模式 | 使得开发人员可控制每个像素的采样位置 | 实时抗锯齿 通过多 | |
| 更严格的规范 | 要求32位浮点滤波 | 对128位的浮点纹理格式进行滤波作为要求而不是可选功能 | 通过确保硬件的兼容性鼓励使用高精度的数据格式 |
| 要求Int16混合操作 | 对64位整型像素格式进行混合操作作为要求而不是可选功能 | ||
| 要求最小支持4种多重采样抗锯齿支持 | 对于所有的32位和64位像素格式,要求每个像素至少支持4种采样以实现多重采样抗锯齿 | 确保抗锯齿功能在所有的DirectX 10.1 GPU上表现一致 通过提高一致性,鼓励支持抗锯齿功能 | |
| 标准化的抗锯齿采样模式 | 硬件必须支持2×、4×、8× 和16×抗锯齿模式的预定义采样位置 | ||
| 提高浮点运算操作的精度 | 要所有的浮点运算(加、减、乘、除)和混合运算的精度都要达到0.5ULP | 消除舍入误差 要求所有的运算匹配IEEE标准 | |
在AMD的演示DEMO中,DirectX 10.1能够实现一个和DirectX 10区别明显的应用,如上图所示,这显示了有无全局光影照明的区别,DirectX 10.1+DirectX 10.1硬件可以在演示的墙壁漫反射光源发出的光,并正确渲染每一个球体的光影效果,DirectX 10则做不到。
● PCI Express 2.0
PCI-Express是第三代I/O架构,通过提供点到点、高速度、低针脚数解决方案,满足了日益提高了I/O带宽需求。PCI-SIG于2007年1月出版了PCI Express Base 2.0规范。这一规范以无缝的可兼容的方式把互连位速率提高了一倍,从2.5 GT/s提高到5 GT/s。PCI Express 2.0版规范的其它新增功能和改进功能包括动态链路速度和链路宽度管理、以及活动状态电源管理(ASPM)相关改进。
PCI Express 2.0(16GB/s)可以提供2倍于PCI Express 1.0的上下行带宽,更有利于GPU和系统内存之间进行数据交换,加速HyperMemory / TubroCache类应用。按照惯例,显卡的总线接口很难在换代之时就带来明显的整体速度提升,更多的意义是未雨绸缪,眼前的PCI Express 2.0也是一样也成为新发GPU的现实标准。