与英特尔对峙多年的AMD品牌新建筑禅是什么
这是自上次AMD能够与英特尔战斗了很长时间。所有的球迷想念EV6总线由K7和AMD64时代的先驱,微软的新系统要抓住有利,迫使英特尔放弃去促进IA64 x86-64授权的那些辉煌的日子然而,美好的时光总是不能持续太长时间,随着英特尔摆脱和通过创建核心时代的阴影造成的,一个不是我的人占了便宜,然后投靠ARM阵营没有同时发挥各自的优势,GPU部门也越来越明显的下降,造成相当大的摩擦,根据NVIDIA的时间在地面上。
This is the past few years, ldquo factory; slide; mdash mdash AMD; harmonic; rely on ldquo; PPT salvation ; the policy has been hanging A fans of the heart hanging in the air of the heart, which also makes them face every time A update, given the support of speech more than half with a self deprecating nature.
但这一次,AMD似乎真的看到了咸鱼翻身的希望。在本周的热门芯片2016芯片技术论坛上,AMD公司透露了许多关于其新微处理器架构禅的细节。
那么,禅宗要取得什么样的进展,AMD又要和英特尔站在同一个平台上呢
增强程序:微指令高速缓存
AMD为下一代微处理器架构设计选择了完全放弃现有架构的方式。从一开始,我们就设定了高性能x86处理器的目标,并重新设计了禅的核心。
一代建筑,即推土机挖掘机在实践中暴露了许多缺陷,在第一次断裂后立即选择而不漏装,AMD的核心设计工程师应该有自己的考虑。
从新的核心架构,其中一个变化是值得注意的:AMD增加了一个微指令缓存禅。
在计算模块的微指令缓存的作用是使微指令接近微指令队列,避免了在低水平的指令高速缓存的核心消耗时间的指示,提高执行效率的核心。
英特尔开始自己的CPU核心设计成微指令缓存,并且效果好让他们继续做几代人(考虑到英特尔和AMD双核的差距或直接受益于此),没有理由不相信AMD将遵循相当可观的带来积极的影响,目前在缓存中的问题是它的微指令和禅宗的大小。
如果我们要想,典型的微指令缓存是比较小的,和英特尔的微指令缓存支持8路和1536操作站。AMD的缓冲参数应该与英特尔持平,因为没有选择。
有了这一点,AMD公司声称,禅宗有至少40%个时钟周期指令数(IPC)和更可信的比上一代。
当然,只有微指令缓存条目,和数值提升的缺乏将使40%苍白,所以AMD也放一圈禅放大所有的指标:一个微指令调度的数目从4到6(和4的整数和浮点指令可以在6微同时发布);整数 /浮点48 / 60增加到84/96指令调度器;L / S排队回队列长度的50%左右的增长。
根据理想情况,这些值增强了配置和更准确的分支预测,使核心能够以最快的速度实现更高的吞吐量,并保持较长时间的有效持续时间。
用微指令缓存,AMD禅应该添加一个核心的短板,如果没有这一步,英特尔的挑战不能谈了。
再次重塑信任:缓存级重构
相比于推土机,缓存层次禅不能overdescribed四字重生。虽然AMD缓存延迟和带宽不谈论数据,但肯定会带来变化的积极影响是存在的。
第一是禅在每一个核心32kb级数据缓存从推土机传动为回写,不再总线周期核心缓存数据更新和CPU和内存的绑在一起,它可以保持一个高速缓存性能的突发写,不在同一总线周期缓存较慢的内存同步端的数据。
据统计,负载操作比存储频繁,禅宗的第一级缓存与L/s单元不对称,并提供更多的负载通道。
总之,AMD已经完全拆除原有推土机架构,并建立了一个新的ccxmdash;mdash;结构挂四个CPU核心和一个或两级缓存三级缓存。
的8MB大的三级缓存是不是像我们常见的CPU较低级别的缓存,它收集的数据通过CPU核心要求/请求指令预取。
它的作用是为从第一和两级缓存中排出的指令提供临时遮挡,因为它没有及时执行,或者被写入无效命令符号。它更像是一个难民营,所以作为一个或两个级别的缓存是无效的。
But because the Zen core's 8 - way two - level cache is large to 512KB, this part of the low efficiency can be corrected to a certain extent.
同时,由于不必让难民将存储数据缓存在两级缓存中,减少了缓存中的数据冗余,间接提高了缓存利用率或缓存容量。
在AMD的模块化设计AMD也使新的CPU有更好的产品线的可扩展性,使一套架构被吃掉的最节能的移动芯片最流行的性能PET,避免像上一代的故障现象。
例如,一个美国是一个低能耗的笔记本,4核CPU,移动i3 / i5和英特尔的测试,将两CCX一起融入8核禅桌上,面临挑战i7。
但AMD不说CCX之间的互连结构是什么,他们否认基于HyperTransport总线来炒作的改进,但没有给出具体的答案,留下一个问题让人浮想联翩。
总之,它没有提到,缓存效率AMD可兼做什么它声称相比,的一个或两个级别的缓存是一倍的吞吐量,以及三级缓存的速度乘以5,至少英特尔的大小Skylake。
三元方法:实时SMT
英特尔在同步多线程(SMT)中的应用可以追溯到2008,一个核心分裂成两个线程是困难的,只有两个线程来解释如何相互关系,以及合理使用缓存资源,不要互相取出……这就足以让那些工程师喝一锅了。
也许AMD最近几年没有向CPU增加SMT功能。这阻碍了这个问题的解决。明年,我们应该看到8个核心CPU线程的AMD CPU,这是核心的 16。
从内部的角度来看,禅宗核心线程之间的调度主要遵循的是时间划分策略。
虽然考虑不同线程的不同占用特性,但这不是最好的解决方案。AMD仍然依赖于自己的线程标记/区分方法。
在禅宗干扰进程的优先级通常有三种,一是CPU为每个线程的数据流分析,确定高优先级算法mdash;mdash;在相应的分支预测、整数和浮点重命名这些资源型的工作,调整线程优先级;另一个是TLB缓存和负载队列的操作延迟敏感的螺纹相关(体现在上通常是响应用户的反馈,在操作过程中,CPU)根据延时要求的标签分配线程的处理优先级;像队列的顺序一路走下来的部分按照微指令,CPU将使用静态时间让线程交替治疗策略。
至于其余的,它更简单和粗糙,先来先,哪个线程需要更多的核心资源,哪些线程将首先抓住他们。
如果我们从操作系统和应用软件的角度来提高操作水平,我们将从AMD的角度来观察AMD的SMT。与英特尔超线程类似,每个线程都被视为核心,并且不会有像推土机那样的资源约束。
AMD不知道这是不是从英特尔超线程获取灵感,可以学生超过老师。但可以肯定的是,禅宗的性能,浮点计算与前一代AMD CPU相比,不会有小的升级。
工艺过程:又见FinFET
你必须听术语FinFET得到一顿,以前我们讲手机芯片不到这里所描述的技术,所以我们长话短说。
在设计自己的CPU时,功耗一直是AMD公司关注的一个习惯。在100W的TDP的实现不仅是一种更为激进的设置门控时钟,但是禅拟测试全球代工14nm FinFET工艺早在北极星的GPU的帮助。
此外,AMD公司不打算复制GPU的计划。他们还需要优化密度过程。毕竟,我们需要控制芯片面积加和mdash;这是AMD没有在热门芯片回答。
如果当前的设计迫使他们使用500平方毫米14nm死去,这将违背了AMD一贯的价格策略,以及最终的产品将是昂贵的。
但考虑到禅宗的诞生伴随着目标调整,很难确定AMD下一代CPU现在能维持多少。
40%在纸上,2%在现实中
也就是说,终端用户其实很难用PPT来播放,你吹吹数字建筑,好像它要下雨花,无非两点:第一,能够以合适的价格购买;第二,加上实际的感觉不慢。
AMD在热门芯片有2016参与者进行搅拌机运行点,3ghz 8核心禅3GHz的8个核心broadwell-e.相同的多线程自定义负载下,禅是2%的速度比她。但AMD还没有透露更多的细节。在执行PPT上升的记录时,言论的选择只能谨慎谨慎,消除公众的猜疑不是一件简单的事。
如果这个时候AMD可以在2017批禅宗第一季度成功(批其实现在这个时候谈论,已经反弹,定于今年十月),当消费者有可能发现新的CPU品牌在机械图。也许他们可以借此重返高端的x86 CPU的战场机会再次与英特尔在同一阶段,但至少要保证自己在面对老对手,有卡可以打它,但不要跳。