AP李逵劈鱼网站|AP李逵劈鱼投注

旅游攻略

联系我们

地址:AP李逵劈鱼网站-江苏省南京市玄武区玄武湖

邮箱:9490489@qq.com

手机:13988999988

电话:4008-888-888

摩尔定律正在放缓 大型芯片公司方向或发生重大

2019/10/02

为什么Intel,AMD,Arm和IBM专注于架构,微体系结构和功效变化。

大型芯片制造商正在转向芯片组等架构革新,片上和片外更快的吞吐量,以及每个操作或周期集中更多事情,以提高处置惩罚速度和效率。

总的来说,这代表了主要芯片公司偏向的重大转变。他们所有人都在努力应对处置惩罚需求的大幅增加以及传统要领无法提供足够的革新能力,性能和面积。自28nm以来,缩放的利益一直在淘汰,在某些情况下还要好。与此同时,重新设备,新应用法式和各地传感器的大量增加中收集的数据越来越多,需要使用相同或更低的功率更快地处置惩罚。

对于芯片制造商来说,这相当于一场完美的风暴,已往他们使用投机执行等要领来增加扩展的利益。可是,投机性执行已被证明会发生宁静毛病,只是缩小的功效不再能使功率和性能提高30%到50%。今天的数字靠近20%,甚至需要新的质料和结构。

与此同时,大型芯片制造商看到谷歌,亚马逊和Facebook等公司纷纷跨界其主要市场——巨型数据中心。此外,它们正在人工智能 / 机械学习市场中受到挑战,而且在一些初创公司开发专门的加速器方面受到挑战,这些加速器通过架构变化有望实现数量级的革新。

最大的芯片制造商开始接受它,而不是试图反抗这种趋势。例如,AMD推出了Zen 2架构,它依赖于由它们和其他人制造的芯片组合——高速芯片到芯片互连和可以调整的优先级方案,以便数据可以更快地移动到一个偏向或其他。

AMD首席架构师Dan Bouvier在半导体芯片大会上表现,小型芯片可以提高产量。但他指出,通过使用通用互连并将所有这些组件放在基板上,小芯片也可用于将芯片尺寸增加到1000平方毫米,这大于光罩尺寸。该互连还可用于毗连在差别工艺节点上开发的芯片,详细取决于对特定功效最有意义的内容。

图1:AMD的芯片架构。资料泉源:AMD 

英特尔的战略也很大水平上依赖于芯片,它通过种种要领毗连,包罗内部开发的芯片到芯片桥(嵌入式多芯片互连桥或EMIB)。但该公司也一直在研究内存会见和存储问题。该解决方案的一部门涉及持久存储器,这有助于弥合DRAM和固态驱动器之间的差距。

一段时间以来,英特尔一直在公布一种称为3D XPoint的持久存储器类型。基于相变存储器技术,英特尔在其自己的SSD和DIMM中集成了3D XPoint设备,从而加速了这些系统中的操作。

英特尔高级首席工程师Lily Looi说:“最大的挑战之一就是你已经获得了所有需要处置惩罚的数据,但你的空间有限。” “在已往的几年里,数据爆炸式增长,有两件事情发生了变化。首先,纳秒很重要,因此您需要更多容量。第二件事是您需要一个持久性功效,以便在关闭电源时数据仍然存在。可是您不必生存所有数据。您可能只需要生存一个块甚至几千字节的数据,这样效率会更高。”

图2:存储指数级数据的位置。资料泉源:Intel 

更智能的权衡

更大的芯片和更快的互连并不是实现更好性能的唯一途径。

例如,Arm推出了它的Neoverse N1架构,它显着提高了分支预测的准确性——基本上相当于搜索中的预取。Arm还继续推动以更低的功耗做更多事情,通过连贯的网状网络将IP磁贴毗连在一起,允许凭据特定应用的需要调整处置惩罚器的巨细。

Arm的战略要害是更大的2级缓存和上下文切换,Arm的高级首席工程师Andrea Pellegrini 说,它比以前的要领快2.5倍。“我们也看到分支误差预测淘汰了7倍,”他说。Arm还专注于通过降低缓存未掷中率来淘汰其指令占用率,Pellegrini表现已降低1.4倍。与此同时,L2会见量下降了2.25倍。

这是检察处置惩罚器效率和每瓦性能的另一种方式。虽然大多数处置惩罚器公司从在相同功率预算下做得更多的角度来处置惩罚它,但其他公司正在思量用更少的功率做更多的事情,这在带电池的设备中很重要。这包罗智能手机,但它也包罗为电动汽车和机械人开发的芯片。

Arm还将使用其网状网络要领添加为特定数据类型定制的第三方加速器。

图3:Arm的可定制Neoverse架构。资料泉源:Arm

与此同时,IBM推出了一种既简朴又很是差别的架构。IBM的目的之一是假设数据包何时到达,这实质上将预取观点提升到更高的抽象级别。它明白如何使这些假设变得如此难题,因为它有效地将使用模子应用于架构中。

IBM的要领是使用最可能的芯片设置,预先举行权衡并设置限制。凭据IBM的 Power系统硬件架构师Jeff Stuecheli的说法,这可以牢固物理层的数量,通过PCIe Gen 4运行一些数据,其余的通过25G SerDes运行。“这更具功率和面积效率,”Stuecheli说。该公司还做了一些事情,如走向差池称的架构,这意味着一个加速器的状态不会影响另一个加速器的运行。“我们希望隐藏加速器的状态表。”

图4:IBM强调数据吞吐量。资料泉源:IBM 

毗连各个部门

从所有这些角度来看,所有主要的芯片制造商都在解决目的市场中的类似问题。它们通过通用处置惩罚器和自界说加速器的组合提高了每瓦性能,而且在许多情况下,它们使得从一个市场到下一个市场更容易,更快地替换模块成为可能,而且随着算法的更新。它们还提高了片上数据,片外到存储器的吞吐量,并优先思量差别类型数据的移动。

其中许多要领并非新思路,但已往并不存在使这一切成为现实的一些技术。

“建立通用PHY以启用加速器是发生的要害事情之一,” Cadence的高级设计工程架构师Stuart Fiske说。“你还看到的是,处置惩罚器并没有变得更简朴。许多这些公司都在实验为加速器建立接口。这并不能解决庞大性问题。它仍然是一个几年的设计周期,并没有措施解决这个问题。可是你可以让加速器适应最新的神经网络。”

要害是平衡所有这些组件的集成,并具有足够的灵活性来举行更改。实际上,所有这些芯片制造商都在设计多芯片平台,可针对特定市场和用例举行定制,同时优化每瓦性能并提高数据吞吐量。

Silexica产物和技术营销卖力人Loren Hobbs说:“时钟速度方面的设计正在崭露头角。” “前进的偏向是使每个时钟周期尽可能高效。随着多核异构多处置惩罚器的增加,这加速了这些芯片的庞大性。您可以将所有这些小芯片组合在一起以提高处置惩罚能力,但您需要使用工具来资助分发和分析它们。您必须映射代码库,这是无限庞大的。它需要静态,动态和上下文分析。”

这里的配合点是不停增长的数据量,无论是在边缘照旧在云端。处置惩罚数据的位置以及移动的速度是架构的要害部门。

“每小我私家都在与CCIX抗争,” Arteris IP总裁兼首席执行官K. Charles Janac说。“如果你有一个加速器和两个连贯的模具,那么有太多的情况可以让它轻松事情。但现在您可以使用3D互连将平面CPU宁静面I / O毗连在一起。因此,这看起来像是软件的一个系统,而且您在芯片上的网络和差别的芯片之间存在芯片间链接。这样,您可以支持跨两个芯片的非连贯和一致的读/写。它使互连更有价值,但也使它变得越发庞大。”

实际上,这就是为什么这些架构已经在事情一段时间的原因之一。让所有部门一起事情已经证明比任何人最初想象的要难题得多。

“内存控制器和NoC将必须更精密地集成,”Janac说。“问题在于,没有人明白整个芯片的QoS,也没有任何独立的内存控制器公司。可是内存流量必须更好地集成才气实现这一目的。”

为了让小型车市场真正起飞,还需要有开放尺度。

“没有尺度用于毗连芯片,” Achronix营销副总裁Steve Mensor说。“问题是你必须能够与他们攀谈。所以你应该能够为套接字开发一个芯片,并有一个链接和一个协议栈来支持它。有AMD和英特尔的专有解决方案。另有正在开发的尺度解决方案。如果我构建ASIC并购置小芯片,我需要一个尺度的解决方案,以便我可以独立构建该芯片。这是这个模子的基本要求。”

只管如此,它确实为构建在差别ISA上的加速器打开了大门,例如RISC-V。

“这是小型轻量级硬件加速器的新机缘,” Codasip营销副总裁Chris Jones说。“初创公司构建芯片的开放接口可能会为半导体提供另一个繁荣周期,而这种情况将一直发生在全封装上。关于这一点仍然存在一些问题,例如谁最终卖力测试整个界面,以及如何在签署界面时使用它。我们还需要看看它们的芯片接口是什么样的,它们是尺度化照旧保持专有。但它肯定为更多验证IP,仿真和模拟增添了新的时机。”

更换组件

现在尚不清楚的是这些架构另有哪些变化。现在推出的大多数是平面的,但也可以选择将其中一些设计推入Z轴。

例如,SerDes增加了设计的延迟,但使用先进的封装技术可以实现同样的延迟。台积电的CoWoS(基板上芯片上芯片)和InFO MS(基板上带有存储器的集成扇出)是两种选择。eSilicon的业务和企业生长副总裁Patrick Soheili表现,该公司刚刚使用联华电子的插入器开发了一种CoWoS类型的要领。

“你可以将它拆开并将其带到差别的抽象条理,”Soheili说。“如果你看一下这些架构中的一些,如果你有大量的数据流,那么拥有大量的小型SRAM是很低效的,当你做大量的内存时效率很高。这可能听起来违反直觉,但我们发现更大的内存更有效,特别是对于AI类型的应用法式。”

如何迈出下一步?

所有这些要领的市场才刚刚开始。现在的要害是找出在这些差别架构中构建可重复性和可靠性的要领,以便它们可以用于汽车或工业等宁静要害应用,以及当今种种各样的终端市场。

这些新架构如此引人注目的原因在于能够针对特定应用法式对其举行自界说,并使用架构作为此类自界说的基础。所有处置惩罚器供应商都接纳这些类型的架构,从FPGA供应商到像Nvidia这样的公司,后者在创纪录的六个月内推出了新的芯片架构。但很显着,未来,随着设备的修改和更新,行业将需要更多的工具,更多的数据分析以及对潜在交互的更好明白。

这只是一个转变的开始,最终将涉及整个半导体供应链。虽然扩展将继续,但在处置惩罚器领域,它只是一个分外的开关,可以在一个长列表中转换,现在包罗架构,封装,质料和事情负载优化。设计师现在是厘革的驱动力,他们中的大多数人预计随着摩尔定律的减速,设计的变化将会加速。

新闻源:semiengineering

 

Copyright © 2002-2019 AP李逵劈鱼网站|AP李逵劈鱼投注 版权所有 网站地图XML | 网站地图HTML Power by DedeCms 电话:13988999988

地址:AP李逵劈鱼网站-江苏省南京市玄武区玄武湖 技术支持:AP李逵劈鱼  ICP备案编号:苏ICP12345678