在今天
gpu的作用
,已经不是单纯的游戏工具,需要用到的地方越来越多,比如说在Premiere中它能加速输出视频,在游戏直播时不仅能渲染游戏画面,而且能把游戏画面压缩成视频,再直播出去,甚至在看B站也少不了加速,那在今天到底起多大作用呢?
显卡
从2D加速到生产力工具
在20多年前,显卡性能非常孱弱,为了实现3D渲染,不得不配置3D加速卡。在1999年,NVIDIA发布了首款以GeForce命名的显卡——GeForce 256,代号NV10,它不仅加入了Pixel Shader,而且引入了T&L引擎与MPEG-2硬件视频加速,自此显卡整合2D、3D功能已成定局,显卡行业加速发展。
在过去20多年时间,GeForce显卡经历多次革新,在DirectX 10时代,G80核心(代表产品GeForce 8800 GTX)将Vertex Shader和Pixel Shader合一,加上高效的架构设计,性能大幅度飙升,横扫四方,同时G80支持CUDA,向3D渲染、视频加速之外应用领域扩张。
从TURING架构开始
gpu的作用
,GeForce显卡不再以“GeForce GTX”命名,而是采用“GeForce RTX”的命名方式,因为它加入了创新的“光线追踪”(Ray Tracing)。而在第二代GeForce RTX显卡,也就是AMPERE 架构性能更是进一步提升——负责进行实时光线追踪运算的专用硬件单元RT Core更新到第二代,增加动态模糊的加速运算支持,有效提升实时光线追踪效率,按照官方说法其速度是上一代的8倍;第三代Tensor Core大大强化了DLSS,最高分辨率提高到8K;此外全新SM也实现了2倍FP32吞吐量。
与此同时显卡也在AI应用、图像处理、视频渲染等大展拳脚,NVIDIA顺势推出了NVIDIA Studio,让GeForce RTX显卡在视频剪辑、摄影、图形设计、直播、架构可视化多个领域发挥更高的效能。目前NVIDIA Studio已经获得大量厂商,比如说传统软件Adobe,电影摄影机制造商Red,近年新兴的AI软件公司Topaz。
不过,在测试显卡时,更多人是关注3D性能,也就是游戏上的表现,对生产力关注度不高,顶多增加视频转码测试。那GeForce RTX与CPU、集成显卡差距有多大,一起通过索泰(ZOTAC)GeForce RTX 3060Ti AMP 月白 GOC显卡与Intel最新的13代酷睿it-13600K对比感受一下。
性能测试
索泰GeForce RTX 3060Ti AMP 月白 GOC显卡属于GeForce RTX 3060Ti 系列,也就是基于GA104-200核心,GeForce RTX 3060 AMP 月白 GOC共拥有3584个流处理器,核心频率为1320-1867MHz,搭载12GB GDDR6显存,频率达到了15000MHz,整卡功耗为170W。在GeForce RTX 4090已经发布的今天,这张显卡不属于NVIDIA最顶级战斗力,但是仍是最主流的显卡,下文问了行文简洁,简称为RTX 3060Ti。下面测试使用的平台:
在今天,Photoshop毋庸置疑是最常用图像处理软件,我们甚至会用“P图”一词代替处理图片。在2021年初,Adobe推出了Camera Raw13.2,加入超级分辨率功能,让Photoshop无损提升图片分辨率。而现在NVIDIA Studio已经支持Adobe Photoshop Smart Portrait神经滤镜,能调用N卡进行超级分辨率处理。下面是基于Photoshop 2022以及Adobe Camera Raw 15进行的测试,所用的照片是尼康Z9拍摄的高效率RAW,分辨率为8256*5504,文件大小为31.5MB,秒表手动计量处理时间。
RTX 3060Ti性能表现非常抢眼,耗时只要4秒,而集成显卡UHD770、处理器i5-13600K分别耗时83秒、95秒,最大差距超过20倍,需要注意的是虽然在PS里关闭了GPU加速,但是i5-13600K在进行超级分辨率处理时依然需要调用到GPU。
第二项测试是使用Premiere Pro 22.5版将一段8K H.265视频加载LUT进行调色,然后输出成4K30P视频,素材是EOS R5拍摄的8K30 All-I视频,参数为8K30P、码率1300Mbps、10bit 422、H.265编码,长度为5分2秒,输出参数为4K30P、码率60Mbps、8it 420 H.265编码。其中RTX 3060Ti、UHD770在软件里设置硬为件加速,13600K则是设置为软件加速。
虽然同为Adobe出品软件,但是在Premire Pro下三者差距没有那么夸张了,RTX 3060Ti耗时6.9分钟,UHD770耗时32.5分钟,13600K耗时32.7分钟,RT3070 Ti效率是后面二者近5倍。
接下来一项测试是AI算力测试,软件是Topaz DeNoise AI(3.6.2),测试方式是将一张1.13GB、四亿像素(23296*17427)的TIFF照片进行降噪处理,设定为Standard,Remove Noise 18、Enhance Sharpness 42。需要特别说明的是时间统计方式,DeNoise AI进行AI降噪分为三个阶段——预处理、渲染和输出,为了更好反映实际情况,我们统计整个处理流程所需时间(全程)与渲染时间(渲染),其中前者是秒表手动统计,后者是软件自动统计的。
在DeNoise A当中,RTX3060 Ti优势依然明显,渲染耗时只要39秒,是UHD770的17%,13600K的15%。
结语
在智能手机、平板电脑多种终端设备涌现的几天,PC用途越来越倾向生产力方向,通过索泰GeForce RTX 3060Ti AMP 月白 GOC显卡与Intel13代酷睿it-13600K在Photoshop、Premiere Pro、DeNoise AI中的对比测试,不难发现GPU在生产力软件中起到非常重要,甚至孱弱的集成GPU也能比CPU体现更佳的性能表现,但是要真正起到高效的加速的作用,还是需要一张支持NVIDIA Studio的高性能独立显卡。