显卡如何看算力,显卡负载怎么算

2022-07-28 20:27:50 研报分析

　　NVIDIA对于设计师用户来说并不陌生。由于各种生产力工具(如视频编辑、3D建模和渲染等。)开始支持NVIDIA显卡的硬件加速，n卡成为设计师用户安装或购买整机的首选，NVIDIA也终于推出了面向设计师用户的完整NVIDIA STUDIO解决方案(包括NVIDIA显卡、STUDIO驱动和各种黑科技功能)。随着第一个支持光学追踪的图灵架构的出现，NVIDIA STUDIO的强大让设计师和用户惊叹不已，而支持第二代光学追踪加速的Ampere架构则让NVIDIA STUDIO的功能和效率有了里程碑式的提升。　　

　　不止玩游戏强，NVIDIA Ampere架构生产力更犀利 　　

　　与上一代架构相比，Ampere的SM单元、RT核和张量核都得到了升级。　　

　　我们熟悉的RTX 30系列显卡采用NVIDIA Ampere架构，采用三星先进的8nm工艺，相比上一代架构大大增加了晶体管数量，提高了执行效率。从数据上看，Ampere架构的SM单元提供了两倍于FP32单元的数量，每个时钟周期可以实现128位FMA浮点运算；采用全新L1缓存/材料系统，提供双倍L1缓存带宽和缓存分区大小，总容量提升33%；搭载全新加速核，包括两倍三角形交率的第二代RT核和两倍稀疏矩阵计算能力的第三代张量核。这些升级使Ampere架构的SM单元FP32的最大计算能力提升了约173%，RT核提升了约71%，张量核提升了约167%，为NVIDIA Ampere架构在各种生产力软件中的强大加速能力奠定了硬件基础。　　

　　以RTX 3080为例，得益于工艺升级，芯片规模较上一代对位产品大幅提升。　　

　　那么在实际应用中，Ampere架构的升级带来了哪些提升？首先，第二代RT核在计算光线追迹时，可以同时计算三角形相交和时间插值三个位置，从而实现具有光线追迹效果的动态虚化效果。在这个计算过程中，相当于提供了最快8倍的射线穿越计算性能。我相信经常需要完成3D建模工作的设计师和用户都很清楚这会带来多么高的效率。　　

　　其次，虽然RTX 30系列显卡每个SM单元的张量核数量有所减少，但是由于张量核已经升级到了第三代，最终的效率有了很大的提高。例如，RTX 2080 SUPER可以在一个时钟周期内完成每SM单元512次FP16浮点运算，而RTX 3080可以在单个时钟周期内完成512次(密集矩阵)/1024次(稀疏矩阵)FP16浮点运算，数量仅为第三代张量核的一半。这样第三代张量核的效率比上一代提高了一倍左右。　　

　　RTX 3090/RTX 3080使用GDDR6X内存，速度是GDDR6的两倍。　　

　　另外，安培架构的RTX 3090/3080显卡有一个巨大的升级，那就是使用了英伟达与美光合作开发的GDDR6X内存。由于GDDR6X显存采用PAM4信号编码，即每个周期使用四个电平信号进行数据传输，相比GDDR6的两个电平信号，效率大大提高，从而带来更高的显存数据带宽，这在需要频繁交换大量显存数据的专业设计应用中具有重要的实际意义。　　

　　RTX 30系列显卡提供HDMI 2.1接口，可以用单条数据线输出8K/60Hz HDR视频信号。同时还为AV1提供硬件解码加速，支持8K/60fps视频实时解码。　　

　　采用NVIDIA Ampere架构的RTX 30系列显卡提供了对HDMI 2.1接口的支持，可以用单条数据线实现8K/60Hz或4K/120Hz的HDR画面输出。此外，RTX 30系列也是全球首款支持AV1硬件解码的显卡，可以流畅解码8K/60fps视频，这对于视频编辑来说也是非常有价值的功能。　　

　　RTX 30系列显卡的超强计算能力为内容创作提供了强大的动力。　　

卡负载怎么算7.jpg">

在渲染动态模糊画面方面，RTX 3080的性能约为RTX 2080 SUPER的5倍

在达芬奇视频剪辑中，RTX 3080的效率甚至超过了RTX 2080 SUPER的两倍

正是因为Ampere架构带来了硬件性能上的飞跃，基于RTX 30显卡的NVIDIA STUDIO解决方案也得到了大幅升级。从官方提供的数据来看，RTX 3080在各种主流渲染器中的加速性能都远超RTX 2080 SUPER，在LUXMARK和V-Ray中甚至超过了RTX 2080 SUPER的两倍。视频剪辑部分，RTX 3080也表现出了惊人的性能，DaVinci测试中的成绩远远领先RTX 2080 SUPER，甚至有些项目几乎达到了RTX 2080 SUPER的2.5倍性能。总而言之，现在设计师用户入手一块RTX 30显卡，可以大幅提升工作效率、改善工作中的使用体验。

当然，除了制造工艺、架构和硬件规格方面的升级，Ampere架构的RTX 30显卡还有大量针对设计师用户的黑科技功能。

新一代黑科技助力！RTX 30显卡专业应用更高效

RTX IO快速载入技术

RTX IO技术可直接将压缩数据读取到显存，CPU占用率降低20倍、载入速度相较HDD提升百倍

针对磁盘数据载入特别占处理器资源、效率较低的问题，NVIDIA推出了RTX IO技术，通过这项技术，就能让GPU来处理数据解压，从而大幅度降低CPU的占用率。从图上可以看到，在PCIe 4.0固态硬盘上达到同样读取速度的时候，如果采用传统的方式，会占用24个CPU核心，而采用RTX IO技术后，只需要占用0.5个CPU核心，这在实际的创意设计应用中就可以体现为载入素材和项目文件的时候更加流畅。要享受这项技术，需要软件支持微软的DirectStorage API，当然也需要RTX 30系列显卡。

NVIDIA OMNIVERSE MACHINIMA

通过NVIDIA OMNIVERSE MACHINIMA可以让用户使用游戏素材打造电影级视频

NVIDIA OMNIVERSE MACHINIMA是基于RTX 30系列GPU强大计算能力打造的APP，能够让设计师用户利用现有的游戏素材，通过RTX 30显卡AI技术制作出电影级的视频。NVIDIA OMNIVERSE MACHINIMA可以从支持该技术的游戏中获取素材、工具，然后通过赋予材质、Audio2Face（声音转表情）、增加物理效果、AI采集动作，最后使用RTX光线追踪渲染从而制造出堪比电影画质的视频。

NVIDIA BRODCAST

得益于RTX 30系列显卡强大的视频加速和AI计算能力，用户可以轻松打造家庭工作室

NVIDIA BROADCAST工具可以为用户提供强大的直播应用解决方案，它主要包括了音频降噪（降低录音的环境噪音）、虚拟背景（通过AI抠出人像，并提供各种直播时需要的虚拟背景）、摄像头自动构图（可以保证改变动态视频图像比例时，自动将目标位于视觉中央）等实用功能。从图上可以看到，麦克风、音箱（或耳机）、摄像头等设备连接到电脑后，通过NVIDIA BROADCAST工具可以被AI技术强化形成虚拟设备，从而获得各种强大的功能。

由此可见，NVIDIA Ampere架构的RTX 30显卡确实不止是玩游戏厉害，还有各种实用黑科技可以让你在工作中如虎添翼。当然，要享受到如此强大的性能与功能，你得拥有一块强大的RTX 30显卡才行，例如技嘉雪鹰GEFORCE RTX 3080 VISION OC 10G，就是众多超公版RTX 3080显卡中的代表之作。

技嘉雪鹰GEFORCE RTX 3080 VISION OC 10G

规格参数

GPU型号：RTX 3080

核心频率：1800 MHz

CUDA数量：8704

显存规格：320 bit/10 GB GDDR6X

显存容量：24 GB

显存频率：19000 MHz

输出接口：DP 1.4a×3

HDMI 2.1×2

显卡配备了风之力三风扇正逆转散热系统

显卡顶部提供了支持炫彩魔光灯效同步技术的LOGO灯，色调也非常适合设计师用户

背板金属装甲设计感强烈，防护能力和散热能力出众，并提供了进气栅格设计，有利于改善机箱内散热风道

技嘉雪鹰GEFORCE RTX 3080 VISION OC 10G显卡隶属于专为设计师打造的VISION系列，它采用了银色与白色的搭配，散热器造型科技感十足，符合设计师的审美口味。散热部分，技嘉雪鹰GEFORCE RTX 3080 VISION OC 10G搭载了风之力3风扇散热系统，配备两个90mm与一个80mm风扇，采用刀刃式扇叶设计，搭载正逆转功能、配备7根高性能纯铜导热管、散热片巨大的铜底直接与GPU接触，风扇支持智能启停，并在背板上设计了进气格栅，这些设计对于大幅提高散热能力都很有帮助。此外，散热器的风扇还配备了纳米石墨烯润滑油，可以大幅延长油封轴承风扇的寿命，达到滚珠轴承风扇的水平。

技嘉雪鹰GEFORCE RTX 3080 VISION OC 10G显卡还采用了独有的超耐久供电设计，配备数字供电电路，可以有效降低MOSFET的工作温度，而且每个MOSFET芯片都提供了过温保护、支持负载平衡，配合长寿命的固态电容、合金电感与低电阻式晶体管等超耐久用料，提供强劲的显卡性能和更长的使用寿命。频率方面，该显卡的核心频率达到了1800 MHz，比公版的1710 MHz高出很不少，性能表现更出色。

接下来，我们一起来看看技嘉雪鹰GEFORCE RTX 3080 VISION OC 10G在实际的设计师应用中，相对上代旗舰有多大的优势吧。

RTX 3080生产力性能实测：相对上代旗舰提升巨大

测试平台

显卡：技嘉雪鹰GEFORCE RTX 3080 VISION OC 10G

主板：技嘉设计师Z590 VISION D

内存：技嘉 DESIGNARE DDR4 3200 32GB×2

处理器：Intel酷睿i9 10900K

硬盘：技嘉钛雕AORUS Gen4 7000s 1TB

电源：技嘉AORUS AP850GM

操作系统：Windows 10 64bit 专业版 20H2

NVIDIA STUDIO驱动461.92

在达芬奇视频转码测试中，得益于新一代编码器和CUDA算力的大幅提升，RTX 3080相对上代旗舰RTX 2080 Ti有大约12%的效率优势，这个提升是非常可观的，可以有效提升视频后期处理效率。

Blender渲染测试中，RTX 3080相对RTX 2080 Ti的优势从32%到72%不等，综合优势为58.7%，这就非常厉害了。特别值得一提的是，新版Blender使用了Optix渲染引擎，对于RTX 30显卡的光线追踪加速支持也非常完善，能够更好地发挥RTX 30显卡第二代光追的强大性能，提供更高的执行效率。

V-Ray测试中，RTX 3080相对RTX 2080 Ti的优势也高达75.8%，渲染效率得到了跨代的巨大提升。OctaneRender测试包括了开关光追情况下的渲染对比，从测试来看，关闭光追的时候，RTX 3080相对RTX 2080 Ti的优势约为30%（完全来自CUDA计算的优势），而开启光追后，优势提升到了46%~49%。由此可见，在包含光追渲染的专业设计应用中，RTX 3080的优势会被进一步放大，第二代光追单元的升级幅度确实是非常明显的。

总结：高效渲染无压力，专业设计装机首选RTX 30显卡！

从前面的测试数据可以看到，如果设计师将手中的RTX 20系列显卡升级到RTX 30系列显卡，并搭配最新版的NVIDIA STUDIO驱动程序，就可以在视频剪辑、3D建模渲染输出等等创意设计应用中获得巨大的工作效率提升，这对于“时间就是金钱”的设计师用户来说，相当于带来了可观的经济利益和更舒适、流畅的工作体验。所以，说RTX 30显卡是“设计师必备”真是毫不为过的。当然，技嘉雪鹰GEFORCE RTX 3080 VISION OC 10G作为专门为设计师用户打造的高效生产工具，不但在外观设计方面更符合设计师用户的品味，而且在散热设计与性能方面也相比公版表现更价，确实值得设计师用户优先选择。

特别补充：如何切换NVIDIA STUDIO驱动

在NVIDIA官网下载最新版STUDIO驱动

在GeForce Experience中切换到STUDIO驱动

要让RTX 30显卡在创意设计软件中发挥出完美的性能和稳定性，当然少不了NVIDIA专为设计师用户推出的STUDIO驱动。在NVIDIA官网即可下载最新版STUDIO驱动，它和针对游戏玩家的GAME READY驱动是可以一起安装的，而且安装完之后可以在GeForce Experience中自由切换，用户拥有RTX 30显卡之后，既可以享受强悍的游戏性能，也可以随时切换到STUDIO形态拥有一流的创意设计工作效率，鱼与熊掌兼得，岂不美哉？