NVIDIA ®的Quadro ® RTX ™ 4000
是世界上第一个光线追踪GPU
Quadro RTX 4000将NVIDIA Turing GPU架构与最新的内存和显示技术相结合,以单插槽PCI-e尺寸形式提供最佳性能和功能。通过逼真的渲染享受更大的流动性,通过支持AI的应用程序体验更快的性能,并在更广泛的工作站机箱配置中更经济高效地创建详细,逼真的VR体验。
Quadro RTX 4000具有36个RT内核以加速光线跟踪,具有288个Tensor内核以加速AI,并具有8 GB GDDR6内存以容纳大型数据集。它配备了三个具有HDR支持的DisplayPort 1.4连接器,并具有最新的VirtualLink连接器(也可以通过附带的USB Type-C到DP适配器驱动DisplayPort面板),以简化与下一代VR HMD的连接。此外,结合Quadro Sync II,您可以以更高的密度和更低的成本部署大规模的数字标牌解决方案。
令人难以置信的应用程序性能
· 体验快速,交互式,专业的应用程序性能
· 最新的NVIDIA Turing GPU架构和超快速图形内存
用于实时光线追踪的新RT核
· 36个RT核心可加速逼真的射线追踪渲染
· NVIDIA RTX技术为专业人士带来实时渲染
Tensor Core加速AI工作流程
· 288个Tensor Cores支持AI开发和培训
· 难以置信的推理性能非常适合“边缘”部署
下一代VR支持
· VirtualLink简化了HMD布线
· 用于沉浸式VR的高级渲染和阴影功能
性能和可用性功能
革命性的实时光线跟踪加速
图灵集成了新的基于硬件的光线跟踪引擎,是业界首款支持实时光线跟踪的图形处理器。一块Quadro RTX 4000板可渲染具有物理上准确的阴影,反射和折射的复杂专业模型,从而使用户能够立即获得洞察力。基于Quadro RTX 4000的系统可与利用NVIDIA OptiX,Microsoft DXR和Vulcan光线跟踪等API的应用程序协同工作,从而为真正的交互式设计工作流提供强大的动力,以提供即时反馈,从而实现前所未有的生产力水平。
RT内核
基于硬件的新型专用光线追踪技术首次允许GPU通过物理上精确的阴影,反射和折射实时渲染胶片质量,逼真的物体和环境。实时光线跟踪引擎可与NVIDIA OptiX,Microsoft DXR和Vulkan API配合使用,以提供远远超出传统渲染技术所能实现的真实感。RT内核使用通过像素投射的少量光线来加速边界体积层次(BVH)遍历和光线投射功能。
增强的Tensor核心
专为深度学习矩阵算术而设计的新型混合精度内核,与上一代产品相比,可提供8倍的TFLOPS进行训练。Quadro RTX 4000使用288张量内核; 每个Tensor内核每个时钟执行64个浮点融合乘法(FMA)操作,每个SM每个时钟执行总计1024个单独的浮点操作。除了支持FP16 / FP32矩阵运算外,新的Tensor内核还增加了INT8(每个时钟2048个整数运算)以及用于矩阵运算的实验性INT4和INT1(二进制)精度模式。
网格着色
提供基于计算的几何管线,以加快几何复杂模型和场景的处理和剔除速度,从而将性能提高多达2倍。
运动自适应阴影
提供更精细的控制,以分配GPU功能(例如,将更多的周期应用于场景的详细区域,而将更少的周期应用于较不详细的区域),以提高性能并保持相同的图像质量,或者将图像质量降低50%生成阴影像素所需的时间。
可变速率阴影(VRS)
更好地控制像素阴影率;对于运动模糊和偏光阴影效果非常有效。此功能使阴影和几何体样本能够以不同的速率进行处理,以更高效地执行。
纹理空间底纹
使阴影与屏幕空间脱钩,从而提高阴影效率和重用性。
多视图渲染(MVR)
单次通过的扩展立体声可在一次通过中渲染具有唯一视图原始位置或视图方向的多个视图。
高速GDDR6内存
Quadro RTX 4000内置Turing的经过优化的8 GB GDDR6内存子系统,可提供业内最快的图形内存(峰值带宽为416 GB / s),是处理延迟敏感的应用程序处理大型数据集的理想平台。
H.264和HEVC编码/解码引擎
借助专用于H.264和HEVC编码引擎以及专用于3D /计算管道的专用解码引擎,以比实时性能更快的速度进行转码,视频编辑和其他编码应用程序。
图灵VR
光线追踪和可变速率阴影可提高视觉质量,而多视图渲染可提供更宽的视野,并支持下一代HMD和显示器。RT内核可提供精确的声学模拟,而VirtualLink仅需一根电缆即可使VR设置比以往更加轻松。
画面质量
全屏抗锯齿(FSAA)
高达64倍FSAA(SLI模式下为128倍)可显着减少视觉混叠伪影或“锯齿”,从而获得无与伦比的图像质量和高度逼真的场景。
32K纹理和渲染处理
从32K x 32K表面进行纹理渲染,以支持要求最高分辨率和高质量图像处理的应用程序。
显示功能
NVIDIA Quadro Mosaic ™技术
通过单个工作站透明地扩展多达8个GPU和32个显示器的桌面和应用程序,同时提供完整的性能和图像质量。
DisplayPort 1.4
在60 Hz时最多支持四台8K(7680 x 4320)显示器,在60 Hz时最多支持四台5K(5120 x 2880)显示器,或在最高120 Hz时支持四台4K(3840 x 2160或4096 x 2160)。Quadro RTX 4000支持DisplayPort 1.4(SMPTE 2084 / 2086.BT.2020)上的HDR,具有60 Hz的4K 10b / 12b HEVC解码,60 Hz的4K 10b HEVC编码。提供的DP连接器上连接了三个显示器,而第四个则使用随附的USB Type-C到DP适配器。
NVIDIA nView高级桌面软件
获得最终用户对桌面体验的前所未有的控制,从而在单个大显示器或多显示器环境中提高生产率。
NVIDIA Quadro Sync II
在单个系统中同步同步来自8个GPU(通过两个Quadro Sync II板卡连接)的多达32个显示器的显示和图像输出,从而减少了创建高级视频可视化环境所需的系统数量。
OpenGL四路缓冲立体声支持
为专业应用程序提供流畅,身临其境的3D立体声体验。
专业的3D立体声同步
通过专用连接将3D立体声硬件直接与Quadro图形卡同步,从而实现了对立体声效果的强大控制。
超高分辨率桌面支持
使用最大显示桌面大小为32K的高分辨率显示设备获得更多的镶嵌拓扑选择。
虚拟链接
VirtualLink是USB Type-C的行业标准替代模式,可为下一代VR HMD(头戴式显示器)提供4条显示通道的HBR3 DisplayPort,USB 3.1 Gen2 SuperSpeed数据以及高达27 W的功率。
软件支援
NVIDIA RTX实时光线追踪平台
使实时射线追踪成为可能,可移植且可显示的软件框架。
提供栅格化,光线跟踪,计算和AI /深度学习之间的互操作性。
OptiX,DXR和Vulkan中新的图灵射线跟踪加速。
NVIDIA MDL(现已开源)并支持Pixar的通用场景描述(USD),可提高便携性和一致性。
NVIDIA NGX:视觉应用程序AI
提供用于图像处理的神经图形框架。
为最终用户应用程序提供基于AI的功能,以增强图形,照片,图像和视频处理。
NGX功能利用Tensor核心来最大化性能和效率。
允许NVIDIA为开发人员带来AI功能方面的进步,这些开发人员将其通过NVIDIA预训练的中性网络放置在应用程序中。
NVIDIA NGX技术
AI InPainting允许从图像中删除现有内容,并用现实的计算机生成替代方法替换它。
AI Up-Res使用AI通过解释图像并将数据智能地放置在新图像中来创建新像素,从而将图像或视频的分辨率提高2倍,4倍或8倍。
DLSS(深度学习超级采样)可去除锯齿状的线条以使其平滑,从而产生比使用其他技术更高质量的图像。
AI慢动作将插值的帧插入视频流,以提供平滑的慢动作视频。
针对AI优化的软件
诸如Caffe2,MXNet,CNTK,TensorFlow之类的深度学习框架提供了显着更快的培训时间和更高的多节点培训性能。诸如cuDNN,cuBLAS和TensorRT之类的GPU加速库为深度学习推理和高性能计算(HPC)应用程序提供了更高的性能。
NVIDIA CUDA ®并行计算平台
本机执行C / C ++和Fortran之类的标准编程语言,以及CUDA,OpenCL,OpenACC和Direct Compute之类的API,以加速诸如射线跟踪,视频和图像处理,有限元分析或计算流体动力学(尤其是)等技术。
统一内存
单个无缝的49位虚拟地址空间允许在CPU和GPU内存的全部分配之间透明地迁移数据。
NVIDIA GPUDirect视频
GPUDirect for Video避免了不必要的系统内存副本和CPU开销,从而加快了GPU与视频I / O设备之间的通信速度。
NVIDIA企业管理工具
最大化系统正常运行时间,无缝管理大规模部署,并远程控制图形和显示设置,以实现高效操作。
3D图形架构
· 可扩展的几何架构
· 硬件细分引擎
· 具有7个异步复制引擎的NVIDIA GigaThread ™引擎
· 着色器模型5.1(OpenGL 4.5和DirectX 12)
· 高达32K x 32K的纹理和渲染处理
· 透明的多重采样和超级采样
· 16x角度独立各向异性滤波
· 32位按组件浮点纹理过滤和混合
· SLI模式下为64x全屏抗锯齿(FSAA)/ 128x FSAA
· MPEG-2,MPEG-4第2部分高级简单配置文件,H.264,HEVC,MVC,VC1,DivX(版本3.11及更高版本)和Flash(10.1及更高版本)的解码加速
· 专用的H.264和HEVC编码器
· 蓝光双流硬件加速(支持高清画中画播放)
· NVIDIA GPU Boost(自动提高GPU引擎吞吐量以最大化应用程序性能)
NVIDIA CUDA并行处理架构
· 每个SM的新RT(射线追踪)核心
· Turing SM体系结构(流式多处理器设计,可提供更高的处理效率)
· 动态并行(GPU动态生成新线程,而无需返回到CPU)
· 混合精度(1、4、8、16、32和64位)计算
· API支持包括:CUDA C,CUDA C ++,DirectCompute 5.0,OpenCL,Java,Python和Fortran
· 最多可配置96 KB RAM(每个SM专用的共享内存大小)
先进的显示功能
· 支持四个连接的显示器的任意组合
· 三个DisplayPort 1.4输出(支持分辨率,例如120 Hz时3840 x 2160、60 Hz时5120 x 2880和60Hz时7680 x 4320)
· 随附的UBC Type-C转DP适配器可提供上述各种分辨率和刷新率
· DisplayPort到VGA,DisplayPort到DVI(单链路和双链路)和DisplayPort到HDMI电缆(分辨率支持基于软件狗规格)
· 通过DisplayPort 1.4(SMPTE 2084/2086,BT.2020)的HDR支持(4K 60Hz 10b / 12b HEVC解码,4K 60Hz 10b HEVC编码)
· 通过DisplayPort和HDMI连接器支持HDCP 2.2
· 12位内部显示管道(对支持的面板,应用程序和连接进行12位扫描的硬件支持)
· NVIDIA 3D Vision ™技术,3D DLP,Interleaved和其他3D立体格式支持
· 完整的OpenGL四缓冲立体声支持
· 欠扫描/过扫描补偿和硬件缩放
· NVIDIA的nView ®多屏显示技术
· 使用NVIDIA SVS平台支持大规模,超高分辨率的可视化,其中包括NVIDIA Mosaic,NVIDIA Sync和NVIDIA Warp / Blend技术
显示和HDMI数字音频
· 支持以下音频模式:杜比数字(AC3),DTS 5.1,多声道(7.1)LPCM,杜比数字加(DD +)和MPEG-2 / MPEG-4 AAC
· DisplayPort数据速率为48 KHz
· HDMI数字音频数据速率为44.1 KHz,48 KHz,88.2 KHz,96 KHz,176 KHz和192 KHz
· 16位,20位和24位的字长
可用配件
· 通过冶天DP to HDMI将Quadro RTX 4000连接到HDMI显示器,分辨率最高为4K。NVIDIA推荐三个随附的DisplayPort转HDMI适配器,它们提供出色的图像质量,并且符合专业标准。
规格
CUDA核心 |
2034 |
RT内核 |
36 |
NVIDIA Tensor核心 |
288 |
GPU内存 |
8GB GDDR6 |
RTX-OPS |
43 T |
射线投 |
6.0千兆射线/秒 |
峰值单精度 FP32性能 |
7.1 TFLOPS |
峰值半精度 FP16性能 |
14.2 TFLOPS |
峰值半精度 INT8性能 |
28.5分 |
深度学习TFLOPS 1 |
57.0 TFLOPS |
记忆体频宽 |
416 GB /秒 |
系统介面 |
PCI Express 3.0 x16 |
最大耗电量 |
|
能源之星 |
是 |
散热解决方案 |
超静音有源风扇 |
构成因素 |
4.4“高x 9.5”长,单插槽 |
显示连接器 |
DisplayPort 1.4(3)+虚拟链接 |
DVI-D单链路连接器 |
是的,通过附带的适配器 |
HDMI支持 |
是的,通过附带的适配器 |
支持的显示数量 |
4 |
MAX大DP 1.4分辨率 |
|
5K显示支持 |
60 Hz时HDR 5120 x 2880 |
4K显示支持 |
120 Hz时HDR 4096 x 2160或3840 x 2160 |
MAX大DVI-D DL分辨率 |
通过第三方适配器在60 Hz时2560 x 1600 |
DVI-D SL最大分辨率 |
通过随附的适配器在60 Hz时1920 x 1200 |
HDCP支持 |
是 |
专业的3D支持 |
通过可选的立体声连接器支架 |
兼容Quadro Sync II |
是(框架锁和同步锁) |
兼容NVIDIA GPU Direct |
是 |
图形API |
着色器模型5.1,OpenGL 4.5,DirectX 12.0,Vulkan 1.0 |
计算API |
CUDA,DirectCompute,OpenCL |
NVIEW |
是 |
NVIDIA MOSAIC |
是 |
保证 |
3年 |
1. FP16矩阵与FP16和FP32相乘的累加
保固与支援
为专业图形客户提供无与伦比的服务和承诺:3年保修
支持平台
· Microsoft Windows 10(64位)
· Microsoft Windows 8.1和8(64位)
· Microsoft Windows 7(64位)
· Linux –完整的OpenGL实施,带有NVIDIA和ARB扩展(64位)
最低系统硬件要求
· Intel Core i5,i7,Xeon或更高版本
· AMD Phenom或Opteron级或更高版本
· PCIe x16 Gen 3(首选)扩展插槽
· 8GB系统内存(首选)
· Internet连接(用于驱动程序安装)
· DisplayPort(首选)或DVI兼容显示器
· DisplayPort(首选),HDMI或DVI兼容显示器
包装内含
· NVIDIA Quadro RTX 4000专业显卡
· Quadro RTX快速入门指南
· Quadro支持指南
· USB Type-C转DP适配器
· DisplayPort转DVI-D SL适配器
· DisplayPort转HDMI适配器
· 辅助电源线
资源
· 产品手册
· Quadro比较
· Quadro配置器
· Quadro电源准则
· 3年有限保修