易奇官网-活动

水冷都不够用?为什么现在的芯片越来越热了

日期:07-20

  ▼

       易奇科技导读:在以功耗换性能的趋势下,未来芯片的发热量与功耗势必将越来越大。说到台积电,经常关注消费电子领域的朋友想必不会感到陌生,作为当前全球规模最大、产能最开放的半导体生产商,其同时承担着包括苹果、AMD、联发科等多个巨头的芯片代工生意。而他们的生产工艺,更是直接影响着这些厂商旗下芯片产品的发布周期、出货量、性能,甚至是质量水平。

  正因如此,当台积电方面近日突然公布了一系列关于“片上水冷”芯片的实验成果时,自然也就引发了我们的好奇。

  什么是片上水冷?它将散热结构做进芯片里

  众所周知,如今的半导体芯片在工作时基本上都会带来不小的发热,因此这就需要使用散热器来对其进行散热。那么问题就来了,散热器是如何散掉芯片所带来的热量的呢?

  可能有人会说,这还不简单。在芯片上涂一层导热硅脂、然后把散热器装上去,导热硅脂将CPU表面的热量传递到散热器底部,然后再被热管或水冷管把热量传递到鳍片,最后风扇吹走鳍片或冷排上的热量,这不就是散热的过程吗?

  


  一块高端台式机CPU,金属顶盖下方还有一层导热材料,然后才是真正的核心硅片

  的确如此,但这里面其实存在一个误区,那就是我们通常所认为的芯片“顶部”,其实大多数情况下都只是一个起到保护作用的金属盖。在它下面还有一层导热材料,然后再下面才是真正的半导体硅晶片。换而言之,热量实际上要经过硅晶片-内部导热材料-CPU金属盖-外部导热材料(导热硅脂)的好几重传导,才能传递到散热器上。

  不仅如此,即便是对于像显卡、笔记本电脑CPU这类不带金属保护盖的芯片来说,其发热部位实际上也不能直接接触到散热器。因为硅晶片顶部的一层光滑的硅材料本质上其实也是个“盖子”,它保护着下方的电路结构,但同时也阻隔了热量的传递。

  


  明白了这一点,就不难理解台积电“片上水冷”设计的原理了。简单来说,台积电实验了三种不同的“片上水冷”设计。第一种是直接在芯片表面的硅覆盖层上蚀刻了许多凹槽,让导热液体从这些凹槽中流过,从而带走热量。台积电将这种设计称为“DWC”,应该就是Direct Water Contact(直接水流接触)的缩写。

  而剩下的“片上水冷”设计,则相对保守一些。它们是在芯片制造的过程中,在光滑的、带有覆盖层的硅晶片表面,再加一层有水路蚀刻的硅材料,从而相当于让芯片出厂时顶部就自带了一个散热水路。与第一种设计相比,这种设计因为需要在硅芯片表面再加一层硅结构,所以需要用导热材质粘接两层硅片,并且根据导热材料的不同,也演化出了OX TIM(硅氧体导热材质)和LMT(液态金属导热材质)两种不同的方案。

  很显然,与传统的、需要用户(或设备生产厂商)在芯片表面涂抹硅脂,再安装上散热器的设计相比,台积电的“片上水冷”方案原理其实是没有任何区别的。它本质上其实就是将芯片表层做得更薄、让芯片发热部位与散热结构之间的距离更近、同时通过直接在芯片生产步骤中加入更高级、也更薄的导热材质,让热量能够更好地从芯片内部传达到表面、传达到散热结构上而已。

  当然,它同时也表明,台积电方面或已非常清楚,未来的半导体芯片必然会在发热上更加严重,需要使用更加靠近“热源”的新散热设计。那么问题就来了,为什么未来的芯片发热会越来越严重呢?

  首先,芯片设计和半导体制程确实走入了瓶颈

  尽管半导体厂商总是说,摩尔定律从未失效。但无论是从产品设计思路、功耗数据,还是从真实的能效比测试结果来看,如今的整个消费电子芯片产业,实际上都已经走入了一个“性能大幅提高、但功耗也快速上涨”的怪圈。

  


  就拿大家熟悉的PC端CPU来说,前几年无论Intel还是AMD的旗舰产品,大多都还维持在95W的功耗水平上。然后从9代酷睿开始,Intel率先将CPU的典型功耗放宽到了125W,然后就有了后续10代、11代酷睿睿频时超过200W的功耗表现。更不要说在高端工作站领域,2014年的Xeon 2699V3功耗还仅145W,到了2017年就出现了默认功耗300W的E5-2699P V4,而如今最高端的Xeon 9282 56核处理器,设计功耗甚至已经来到了400W之巨。

  当然,AMD方面其实也并没有好太多。初代的锐龙7 1700X同样只有95W,到了Zen2的3800X上,典型功耗就上涨至105W,解锁PBO后我们甚至测得过300W+的瞬时功耗。而在定位更高的锐龙线程撕裂者平台上,初代的1950X“只有”180W,到了2990WX就上涨到250W,而目前最新的Ryzen Threadripper PRO 3995WX,则更是已经成为了常规散热器难以降服的280W“怪物”。

  不仅如此,根据目前已经曝光的消息显示,Intel的下一代酷睿将会引入“大小核”的设计来降低日常功耗,但它同时也可能会带来更高的峰值性能和峰值功耗。而AMD的下一代CPU也将再次大幅增加缓存容量,然而不幸的是,缓存本身也是高功耗器件,所以据说下代家用版锐龙中的高频型号热设计功耗将达到170W,从而创下家用CPU史上默认TDP的新纪录。

  


  顶级的CPU、高端的CPU和中低端的CPU的面积对比

  并且功耗日渐增长的情况或许还不仅仅发生在PC CPU领域,显卡领域近日有海外网友统计了NVIDIA和AMD两家过去数代产品的性能和功耗表现。结果发现,从多年前的DX11时代开始,两家的GPU单位晶体管/频率性能指标几乎是一直在走下坡路。换而言之,也就是说这些年来的显卡性能提升,基本都是靠着堆更多的核心、拉更高的频率来实现,但在最底层的晶体管结构设计、计算架构设计上反而都在退步。

  


  然而,这可能还不是最糟糕的情况。根据台积电发布的一份报告显示,在他们看来,未来一些面积大于500平方毫米(也就是差不多2cm*2.5cm以上)的“大芯片”,目标设计功耗可能会高达2000W以上。虽然通常中低端CPU/GPU不太可能这么大,但大家要知道,诸如线程撕裂者这样的发烧级产品,目前芯片面积都已经达到了1000平方毫米以上,因此台积电的这番预测自然不可能是毫无依据的。

  除此之外,软件思路的变化也导致了功耗上涨

  差不多二十多年前,当我们接触最早的一批PC软件时,它们给我们留下的最深刻印象往往就是“慢”。这不只是因为当时PC性能糟糕,也因为对于那个年代的软件而言,“尽可能地降低对电脑的性能消耗,哪怕为此牺牲执行速度”可以说是非常突出的一个设计特征。

  正因如此,对于当时来说,诸如杀毒软件扫描一次需要数小时、Windows系统更新从下载到安装耗时一整个下午这种事,可以说是非常司空见惯的。虽然说这种“低耗低速”的软件设计,确实让更多性能糟糕的PC也可以避免光开启一个应用软件就陷入卡顿的尴尬,但从另一方面来说,也确实造成了对那些高性能硬件的浪费,同时不利于硬件技术的发展。

  所以差不多从Windows Vista时代开始,各大软件厂商都逐渐转变了开发思路,尽可能地针对新型硬件进行充分优化,尽可能将电脑的性能“吃”到极限,并借此实现更快的运行速度。

  Chrome对老电脑很不友好,但在新电脑上它实在是太快了

  就拿杀毒软件为例,如今Windows所集成的Defender杀毒软件不仅会消耗CPU的算力,还会用上显卡的通用计算能力来加速扫描过程;又比如说,如今占据浏览器行业绝对主流地位的Chrome,其实是一款对内存和CPU消耗都非常厉害的软件,但谁也不能否认,高硬件占用的设计的确使得其渲染速度、页面加载速度,比起其他竞争对手要快了很多。除此之外,在办公软件方面,Office更是从好几年前的版本开始就已经用上GPU进行字体渲染和界面加速,这也是为什么很多人会感觉Office明明软件体积不小,但运行起来的界面流畅度却反而比许多轻量级办公软件反而更快的原因。

  不止如此,在游戏领域,如今DirectX 12从一开始就是以“能更好地利用超多核CPU的算力”为前提开发的。在最新的Windows 11里,微软更是专为顶级PC提供了一系列游戏增强功能,让用户可以体验到比其他电脑更快的游戏加载速度、更好的游戏画面效果、更出色的屏幕显示质量。当然,这些也会消耗更多的硬件算力、从而带来更高的功耗,并对散热提出更高的要求。

  真有好硬件用,谁会在乎功耗(图中为一台56核心的双路PC+双RTX3090)

  换而言之,无论是硬件还是软件,如今整个PC行业其实都呈现出一种“以功耗换性能”的大趋势。虽然对于环保人士而言,大概会觉得这是非常糟糕的情况,但作为受惠于这种大幅性能上涨的用户来说,却未必会对这种功耗、发热的增加感到不适。

  毕竟谁叫现在的PC,用起来比过去快了太多太多呢。