对极致性能的追求可谓是显卡界的主旋律,就像运动员刷新世界纪录一样,每一次的显卡性能纪录刷新都能让玩家和从业者内心澎湃。随着Pascal显卡家族的诞生,业界的最强神话在短短一年不到的时间里一次又一次地被打破,我还记得去年5月老黄手举GTX 1080大声宣布:“a new king borned!”;我也记得去年7月,老黄在斯坦福大学的AI会议上公布NVIDIA TITAN X时骄傲的笑容;就在本月,最强游戏显卡的纪录再次刷新,新卡皇在本月初正式降临!
GTX1080 Ti
2017年3月1日,NVIDIA发布了玩家们期待已久的GeForce GTX 1080 Ti显卡,老黄在GDC 2017大会上明确声称,该卡的性能强于NVIDIA TITAN X,是“Ultimate GeForce”,翻译过来就是最强最极致的GeForce显卡。在GTX 1080 Ti未发布之前,很多人以为该卡会在NVIDIA TITAN X的基础上再削减一部分流处理器来区分定位,但意外的是,GTX 1080 Ti同样拥有3584个CUDA处理器,核心上一刀未动,可谓是开创了X80 Ti和TITAN间关系的先河。
GP102-350核心和二代G5X显存
毕竟GTX 1080 Ti还是要比TITAN X low一些的,因此NVIDIA破天荒地阉割掉了1GB显存以区分定位,与之对应的,显存位宽减少了32-bit、ROPs单元少了8个、L2少了256KB。可能是吉吉我资历尚浅,我从来没见过这种“阉割”方式,11GB的显存也算是活久见了,不得不让人怀疑GTX 1080 Ti是不是老黄临时赶工,把TITAN X少焊一颗显存便当成GTX 1080 Ti卖了。机智的老黄显然会猜到我们这么想,所以老黄在会上说,GTX 1080 Ti只是性能上强于TITAN X?乃们太天真了!
“就问你怕不怕?”(设计台词)
当然,老黄原话肯定不是这么说的,不过想表达的意思确实是GTX 1080 Ti对比TITAN X是全方位的提升,那么此话怎讲?老黄在会上称,GTX 1080 Ti使用了第二代G5X显存,经过优化后频率从10GHz上升至11GHz;供电部分也得到了强化,采用全新7相双FET设计,这使得整卡性能和超频潜力要远大于TITAN X;散热方面,GTX 1080 Ti搭载了全新设计的真空腔均热板,照比之前散热面积扩大了一倍,同GTX 1080比同温下噪音降低2.5dB,同噪音下温度降低5℃。
GeForce GTX 1080 Ti Founders Edition
如此多的改进表明了NVIDIA的诚意,那些观望许久的高端玩家们已经准备好入手这款新旗舰,不过与此同时,那些已经购买了GTX 1080和NVIDIA TITAN X的玩家们则表达出了强烈的不满。新旗舰的发布自然会导致老旗舰的降价,老黄宣布GTX 1080下调100美元,在国内的反应便是非公版GTX 1080的售价普遍下调了1000元人民币,那些年初购买GTX 1080的玩家们简直上吊的心都有了。NVIDIA TITAN X作为信仰级显卡,售价高达9499元,性能做工等各方面却都落后于GTX 1080 Ti,这让购买了TITAN X的资深N饭们深深地体会到了什么叫“信仰被无情地践踏”。
尽管AMD Ryzen是现在PC界最受关注的对象,但GTX 1080 Ti的发布抢了Ryzen不少风头,可见玩家们对这款新旗舰是非常感兴趣的。相信正在看这篇文章的你一定非常想知道测试的结果,所以我就先给大家透个底:GTX 1080 Ti的综合性能的确超越了TITAN X,但并不是每一项测试都胜过后者。此外,吉吉我会在本文结尾向大家详细阐释NVIDIA让GTX 1080 Ti胜过NVIDIA TITAN X的意义以及本人根据小道消息的一些猜想。那么GTX 1080 Ti究竟超越GTX 1080和NVIDIA TITAN X多少,又是哪些测试不敌前任游戏卡王?就让我们一起揭晓答案吧!
GP102-350核心解析
GeForce GTX 1080 Ti采用全新16nm制程的Pascal架构,核心代号为GP102,具体型号为GP102-350-K1-A1,而NVIDIA TITAN X的核心代号为GP102-400-A1。GP102核心面积约为471平方毫米,得益于16nm的制程优势,核心内集成了12亿晶体管,是GTX 980 Ti晶体管数量的1.5倍,核心面积却仅为GTX TITAN X的78.4%。
GTX 1080 Ti
GTX 1080
GTX 980 Ti
首发限价$1200$699$699$649GPU代号GP102GP102GP104GM200GPU工艺16nm16nm16nm28nmGPU晶体管 12B 12B 7.2B 8B着色器数量3584358425602816单精度浮点11 T11.5 T9 T6.4 TROPs数量96886496纹理单元数量224224160176核心频率1418 MHz1480 MHz1607 MHz1000 MHzboost频率1531 MHz1582 MHz1733 MHz1075 MHz架构PascalPascalPascal Maxwell 2显存频率1251 MHz1376 MHz1250 MHz1753 MHz内存位宽384 bit352 bit256 bit256 bit内存带宽505 GB/s484.4 GB/s320 GB/s336.5 GB/s内存类型GDDR5XGDDR5XGDDR5XGDDR5内存容量12 GB11 GB8 GB6 GB注:表中售价均为官方首发限价
基于Pascal架构的GP102-400芯片运算资源总量为3584个ALU,于GP102-400相同;GP102-350的TMUs数量为224个,后端的ROPs数量为88个,5个带宽为64bit的双通道显存和1个带宽为32bit的单通道内存控制器组成了总量为352bit的显存控制单元,大小为11GB。同NVIDIA TITAN X相比,其各项参数基本相同,不过显存位宽下降32-bit,显存带宽从505GB/s下降至484GB/s,ROPs单元数量也下降了8个。
GP102-350架构图
我们可以看到,GTX 1080 Ti的默认核心频率为1480MHz,Boost频率为1582MHz,比NVIDIA TITAN X的频率要高出60MHz左右,其中显存频率提升较大,由于G5X显存升级换代,等效频率提高了足足1GHz,因此单精度浮点运算性能比后者还要高出0.5 TFLOPS。GTX 1080 Ti的默认Pixel Fillrate能力达到了142.2Gpiexls/S,默认Texture Fillrate能力为331.5Gtexels/S,照比NVIDIA TITAN X均有所降低。最后需要说明的是,在TDP相同的情况下,GTX 1080 Ti拥有11.5 TFLOPS的超高单精度浮点运算能力,照比GTX 980 Ti提升了80%,能耗比惊人,为目前单精度浮点运算性能最高的单芯游戏显卡。
Pascal架构GP104-350芯片由以下主要的部分组成:
1、基于TSMC的16nm FinFET Plus工艺,相比28nm HPM提升了65%的性能或者减少了70%的能耗,同时晶体管密度翻倍。
2、6单元的宏观并行结构,30组SMs单元被分为6个GPC,每个GPC包含5组SMs,但砍掉了2组SMs单元,因此总量为28个,相对应地,纹理单元缩减为224个。
3、28组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的SMs单元。每个SMs单元包含一组负责处理几何任务需求的PolyMorph Engine,同时均下辖5组更基本的SM单元,每个SMs单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的Texture Array,四组并行的二级线程管理机制以及对应的shared+Unified Cache等缓冲体系。
4、GP102-350拥有11个32位显存控制器,总计352位,每个32位显存控制器包含8个ROPs单元和256KB二级缓存,共计88个ROPs单元和2816KB二级缓存。
5、改进型的4.0版本PolyMorph Engine,包含了为VR设计的The Simultaneous Multi-Projection Engine,在极端情况下,SMP引擎可以减少32倍VR所需的几何渲染工作量。
第3页:显卡新技术解析
新一代GDDR5X显存
为了进一步提高性能,GeForce GTX 1080 Ti配备了以11 Gbps运行的新一代GDDR5X显存,这是目前显存所能达到的单端IO信号传输的最快速度。NVIDIA与显存供应商倾力协作,改进显存的数据通道,使用先进的均衡技术减少物理接口的不利影响,并使抖动和噪声达到最小,实现更高的数据传输速率。
上图为显存工作时的数据眼图,左侧的图像显示了以11 Gbps运行的原始GDDR5X显存,右侧为新一代GDDR5X@11 Gbps显存,我们可以看到,左图采样数据的中心与转换中的数据混淆在一起,因此无法可靠地捕获数据,而右图显示新的GDDR5X显存具有显着改进的数据眼,结合Pascal强大的IO设计,使显存IO速度达到了一个新高度。
图块缓存技术(Tiled Caching)
NVIDIA最新的GPU采用了旨在放大原始内存带宽并为GPU核心提供更高有效内存带宽的技术,该技术被称为区块缓存。传统的渲染架构分为两种,高端桌面级GPU使用的是立即式渲染器,如左图所示;绝大多数移动级GPU使用的是图块式渲染架构,如右图所示:
传统渲染架构
在立即式渲染架构中,输入命令列表中的每个命令按序执行并完成,例如当输入三角形时,在开始下一个三角形的绘制之前先绘制之前的整个三角形。此架构的优势包括只读取一次输入的几何数据,并且能够在复杂输入时节约资源。缺点是在具有高透明度的区域中,相同的像素被多次读取和写入,增加了存储器带宽的消耗。
图块式渲染器的工作原理是屏幕被分成许多单独的区块,并且进行两次渲染,第一次处理几何数据并确定每个三角形覆盖哪些区块,并将该信息写入DRAM;第二次为每个区块再添加几何列表,每次一个区块,在移动到下一个区块之前渲染完成之前的区块。这样做的好处是所有渲染都在芯片内发生,最终只有颜色信息被写入DRAM。
图块缓存技术
与立即式渲染相比,图块式渲染有两个明显的限制:首先,对于合并通道的需求增加了数据延迟和复杂性;第二,保存和读取合并通道信息所需的显存带宽是与渲染场景中几何形状的量成正比,如果每像素带宽节省超过合并带宽量,则图块渲染是相对节省带宽的。对于那些相对简单,几何复杂度低的场景,例如移动端游戏是可行的,但对于具有丰富几何形状的桌面级游戏,图块式渲染对带宽的需求可能要比立即式渲染更高。
图块式渲染与立即式渲染对比
从Maxwell架构开始,NVIDIA便一直都在使用不同于以上两种传统渲染方式的渲染技术,其名为“图块渲染”,这种技术在Pascal架构中演变得更加成熟。这种渲染技术的基本理论是“化整为零”,将整个屏幕划分为一个个16*16或者32*32的小区域,然后以每一个小区块为基础对整个画面进行光栅化处理。Maxwell和Pascal GPU可以动态地评估每个帧所需的图块大小,根据场景的复杂度随时调整。
图块缓存的优势
“化整为零”的好处是GPU需要处理的单位画面数据变少,也就是说待渲染数据可以被暂时存储在GPU的L2高速缓存当中。这意味着GPU不必在更大、更慢的显存池中大海捞针,从而减少了显存系统的负载,增加可用于其他任务的可用显存,同时加速渲染速度和渲染质量。此外,这种图块化的渲染方式也很符合GPU的并行运算逻辑,GPU可以根据可用资源同时处理许多独立的图块,在多路显卡系统中的优势更加明显。
从上面的解释中我们不难看出,图块渲染的核心就在于L2缓存,更大的L2缓存将能够提供更多的渲染画面数据存储,于是我们看到由Kepler升级至Maxwell时,L2缓存被增加了8倍,从256KB大幅攀升至2MB,而从Maxwell升级至Pascal时,GP102核心L2容量达到了3MB,再次大幅提升。
显卡拆解赏析
从外形上可以看出,除了其散热器外壳、显卡名称和散热鳍片颜色互相对调以外,其他地方GTX 1080 Ti和NVIDIA TITAN X是相同的。
显卡正面外观
GTX 1080 Ti Founders Edition采用公版标配的涡轮散热器,涡轮将热空气经I/O区散热孔中吹出,涡轮扇的最大转速被限制在55%,也就是2300转左右,这点跟TITAN X的涡轮扇相同。
显卡背板
拆分式背板
老黄称GTX 980 Ti没有背板是为了让多卡SLI有更好的散热,这点显然不会被玩家所认可,所以GTX 1080 Ti上搭载了全新设计的背板,在组建SLI平台时,可以卸掉一半背板来增加气流量,以此来增强散热效果。
散热器外壳部分
拆掉散热器外壳
真空腔均热板散热模块
GTX 1080 Ti搭载了全新设计的真空腔均热板,照比GTX 1080的真空腔均热板,散热面积扩大了一倍,同GTX 1080比同温下噪音降低2.5dB,同噪音下温度降低5℃。
显卡中框和涡轮扇
GTX 1080 Ti的全金属中框既可以加固显卡,又可以起到一定的辅助散热作用,在中框上贴有导热垫,辅助显存等高发热部位散热。显卡搭载的涡轮扇十分静音,即使在高负载情况下,风噪声也不是很明显。
显卡PCB设计
与NVIDIA TITAN X相比,GTX 1080 Ti多了很多MOS管,基本上不存在空焊位,从做工上的确可以看出NVIDIA在新旗舰的设计上十分用心。此外,由于GTX 1080 Ti的显存容量为11GB,所以有正面一处显存空焊位。
显卡供电设计
NVIDIA TITAN X的供电设计采用了7+1+1相双FET供电设计,相比之前GTX 1080的5+1强了不少,也比TITAN X的7+1+1相单FET供电更加豪华。就料件的品质来说,高品质贴片电感、钽电容等高档元器件是没什么值得挑剔的,旗舰范十足。
显卡核心
GTX 1080 Ti上的芯片自然是全尺寸Pascal游戏核心,代号为GP102-350-K1-A1,在晶体管数量涨了半倍的情况下,照比GTX 980 Ti的核心面积却小了22%。
供电接口设计
GTX 1080 Ti采用8+6pin辅助供电接口,这也是NVIDIA 250W TDP公版显卡的标配了,加上PCI-E最大可提供300W功率,足够显卡在高频下稳定工作,并且有着一定的超频能力。
视频接口设计
NVIDIA去掉了一直沿用的DVI接口,接口缩减为:DP1.4*3+HDMI*1,不过NVIDIA在包装盒中附带了一根DP转DVI转接线,方便使用DVI接口显示器的玩家接驳设备。那么为什么NVIDIA要砍掉DVI接口呢?NVIDIA的官方解释是为了增强散热,毕竟砍掉DVI接口,出气孔就会更多些,这也是NVIDIA声称的“2倍排气设计”的关键。
分解后的部件一览
,撞破烟楼寻airdrop怎么用 极致 GTX 1080 Ti首发测试相关:
国企改革落地见效还需抠细节 配套政策要跟上节奏 “混合所有制改革有时间窗口期”,“混改需适当触及战略性领域、打破单一所有制领域垄断局面”,“建议出台更多配套政策和实施细则吸引非国有资本参与混改”,“军工科研院所改革尚需税收、人员处置等政策配套”,“处理僵尸企业建议设立破产管理基金,解决破产程序启动经费”…… 连日来,出席全国两会的代表委员就如何推进国企改革纷纷建言献策。 国企改革再度成为浓墨重彩的一章..
啥土壤才能长出“中国的乔布斯”摘要 【啥土壤才能长出“中国的乔布斯”】“为什么我们的学校总是培养不出杰出人才?”著名物理学家钱学森首发此问是在2005年,据传也是钱老的临终遗言。四年后钱老病逝,随后11位教授联名公开上书教育部部长及全国教育界:让我们直面“钱学森之问”!此后,2010年至2014年间,每次的全国两会都要重提此问,今年两会前夕,中青网一篇《“钱学森之问”不能永远在路上》的评论,又使其重回热点榜。
如果特朗普和希拉里_性别互换,_谁会赢得大选 如果特朗普和希拉里性别互换, 谁会赢得大选 [特朗普传递信息的简单化方式,通过女性诠释显得更加明显;男版希拉里的口才更好,说得也都对,可就是没法引起共鸣] 如果美国现任总统特朗普保留一切性格和特点,只不过转换成女性,当初的他还能赢得去年的大选吗? 一直强烈反对特朗普,到目前为止仍然为此前的总统候选人希拉里打抱不平的美国自由派学者们,希望找到这个问题的答..
三分之一法国人_支持极右翼_封杀勒庞只靠马克龙 三分之一法国人支持极右翼封杀勒庞只靠马克龙 面对极右翼国民阵线总统候选人勒庞民意支持率的不断高涨,法国左翼人士率先指出,投票给马克龙是挽救法国的唯一选择,而法国总统奥朗德也一反此前的鄙视和不屑,于日前表示,勒庞取得胜利的威胁是存在的,其原因在于“极右翼在过去30年中从未得到过这样程度的支持”。 奥朗德指的是,十余年以来,国民阵线在法国发生的巨大变化:2002年..
人民日报刊文谈美国“禁穆令”:骨子里白人优先原标题:从“禁穆令”看美国少数群体的权利保障郝亚明2017年1月27日,美国总统唐纳德·特朗普签署了一份即刻生效的行政令,要求在未来90天内,禁止伊拉克、叙利亚、伊朗、苏丹、索马里、也门和利比亚等7国公民入境美国。由于禁令所涉国家均以穆斯林人口为主,因此该行政令也被普遍解读为“禁穆令”。作为针对特定来源国或特定宗教信仰的歧视性禁令,该行政命令一经签署执行,立刻在全美国乃至全球范围内引发广泛的批评抗议浪潮。..
投资大佬做多原油惨被打脸 这才是油价暴跌的幕后元凶?之前我们曾报道过,做多原油的“大宗商品之王”加特曼(Dennis Gartman)竟然在一周之内即被打脸,止损离场。2月22日,当被问及对原油的看法时,加特曼给出了今年以来的首次做多原油建议:我们押注原油上涨,建议投资者做多。当时加特曼称,做多原油的逻辑基于以下几点:1)目前原油市场上看多力量过于强大。投机性净多仓持续飙升,商业性空头仓位也触及历史高位;2)仓库和油轮中的原油库存现在比过去40年中任何一个时期都高,但..
“乌龙指”还是利益输送?新三板转让模式引市场热议吴柳雯 盛波从频现1分钱/股交易,到昨日惊现1970元/股买单,从“中山帮”倒腾到“姜素华”截胡,新三板市场交易乱象已引起业界关注。不管这些异常交易是乌龙指还是利益输送,抑或是纯粹“炫富折腾”,都折射出新三板“任性自由”的交易模式亟需改革完善,毕竟这个市场的公司数量已高达1万多家。是乌龙指还是利益输送3月9日,新三板创新层公司宁波水表以1970元/股的价格成交2000股,创下两市及新三板历史最高股价。“天价”成交..
陈锡文:农村宅基地上建房属于保障房不能入市买卖玉米高库存的问题如何解决?农村集体产权制度改革的目的是什么?农村土地经营权的属性是物权还是债权?农村宅基地可否入市买卖?全国政协常委、经济委员会副主任陈锡文9日在农业组驻地接受上证报记者专访时对上述问题一一作了解答。各部门正在研究玉米去库存的政策我国玉米一直面临库存高企的问题。今年政府工作报告明确提出,鼓励多渠道消化玉米库存。陈锡文对上证报记者表示,去年玉米的总产量是2.2亿吨,现在库存还有2.3亿吨..
黑天鹅飞走了?中国版“恐慌指数”传递出什么重要信号严政在如此沉闷的行情中,一条“大新闻”悄然发生,被称为中国版的“恐慌指数”,降至史上最低。去年11月28日,上交所和中证指数公司正式发布上证50ETF波动率指数(又称“中国波指”)。截至昨日,该指数收盘报10.57,盘中最低触及10.31,刷新该指数发布以来新低。中国波指究竟是什么?波动率指数被称为恐慌指数,是市场“黑天鹅”事件的预警器。简单来说就是一句话,市场对未来30天风险越恐慌,波动率指数就越高;市场对未来30..
摩托罗拉官方确认下一款Moto Mods模块即将发布在前些天的MWC 2017发布会上,摩托罗拉除了发布两款中端机型Moto G5及G5 Plus外,还一同发布了包括电池模块、充电Dongle、无线充电模块、快速充电模块和照片打印模块等一系列全新Moto Mods模块。近日,摩托罗拉配件官方账号在其推特上发布了一张倒计时海报,并附有文字“倒计时开始!惊喜将至,敬请期待。”Moto Mods新配件将发布这条信息是由“摩托罗拉配件”官方账号发布,同时摩托罗拉曾在2016年年底表示将在2017年带来..