随着大型3D游戏和高清电影的发展,他们喜欢娱乐享受的消费者越来越对显卡的要求,这使得视频卡发展迅速。目前,基于GDDR2 / 3的GPU内存卡,新的内存技术跳过GDDR4,和使用GDDR5。对gddr1发展GDDR5的过程是什么这篇文章将详细解释。



gddrmdash;mdash;记忆和记忆形式分离



事实上,特殊GDDR存储器芯片,第一代,在技术和DDR没有差异,也使用bit预取技术,频率GDDR理论高于DDR数。但在GDDR晚工艺改进具有良好的PCB图形支持,GDDR存储器的900MHz和DDR冲刺到最高,记忆只能达到600MHz,记忆和记忆逐渐拉开差距。





TSOP封装的GDDR 16bit:








8mtimes;16bit TSOP封装4.0ns GDDR,单16MB,理论频率500MHz


9550、fx5700等128bit端卡需要配8把128bit

TSOP封装的GDDR颗粒,外观规格不不同于DDR内存颗粒,因此在许多人看来,GDDR和DDR可以等同起来。事实上,有一些差异。





GDDR采用4K环32ms刷新周期,而DDR使用8K 64ms周期刷新周期。





GDDR是不耽误为了追求GPU的宽的频率非常敏感。





GDDR颗粒大,容量小,通常8times;16bit(16MB)的规格,和DDR颗粒,容量大,宽度小,虽然有16bit粒子,但最常见的是8位和4位,32MB或64MB容量。





为了实现更大的宽度,并进一步提高GDDR的性能,许多厂家使用MBGA封装了更好的电气性能,也有采用MBGA封装的内存颗粒,但规格有较大的差异,主要是不同粒子的宽度。





32bit MBGA封装GDDR:










4mtimes;32bit 2.2ns MBGA封装GDDR,单16MB,理论900MHz工作频率


8 128Mb的256bit规格是gddr1最后的辉煌

单位MBGA封装GDDR首次达到32bit,然后mark GDDR和DDR 32bit规格正式分道扬镳,GDDR2 / 3 / 4 / 5仍在使用。

两种封装:封装TSOP GDDR存储器和水平分布,一旦统一图形市场。虽然GDDR已经退出历史舞台,32bit的中高端和低端16位的主要目标,这是延续至今。



GDDR2第一版:高烧、短期早产儿高烧



GDDR2来自DDR2技术,即为4bit预取的使用,相对于DDR1代双频率。虽然技术原理是相同的,但GDDR2早于近两年的DDR2,第一个支持DDR2内存915p主板发布于2004,而fx5800ultra的GDDR2记忆中第一次是在2003年初发布,但往往是短命的早产儿。

Nvidia仍在NV30芯片设计128Bit显存接口,为了提高带宽必须使用高频率的内存,700mhz GDDR已经无法满足需求,因此冒险GDDR2,GDDR2第一代是由制造工艺有限,且电压规格为DDR / GDDR相同。虽然2.5V几乎增加到1GHz,功耗高得惊人。




4mtimes;32bit MBGA封装2.0ns 144ball GDDR2、单16MB,理论频率1000mhz


对GDDR2第一版只有两种速度和2.0ns 2.2ns

的GDDR2的第一个版本已经出现在fx5800 /超fx5600ultra三显卡(包括相应的专业卡和个人非公版卡)。ATI也很少9800pro用GDDR2。高压、高热、高能耗、高成本的很差,fx5900转向GDDR、GDDR2 256bit,很快就忘记了。




fx5800ultra是专门用于散热器的安装所需的沉重的记忆

对于GDDR2失败的主要原因是NVIDIA GeForce FX系列的架构和性能问题,甚至在切换到256bit频率GDDR(此时GDDR频率已经升级到850-900mhz、GDDR2、fx5950ultra 9800xt)仍然不是对手。当然,对自己的缺陷有GDDR2规格也就无法停留在中低端显卡,被时代抛弃。

GDDR2有很多坏习惯,但它也具有一些新的特点,例如,芯片电阻的第一次使用,和PCB设计比GDDR更简洁。此功能是通过持续的GDDR2和GDDR3之后。







GDDR2第二版:统一低端显卡永远







由于第一代GDDR2失败,高端显卡的显存直接跳从GDDR GDDR2 GDDR3,但并没有消失,而是开始转变。对改变GDDR2规格和特性的几个DRAM制造商(即DDR2内存版本的GDDR2版本),在图形阶段正式二今天的中低端显卡仍然是积极的。

对GDDR2版第一第二版的主要改进如下:







工作电压从2.5V至1.8V,功耗大大降低。





改进了制造工艺,进一步降低了功耗,降低了成本,提高了良率和容量。





粒子的宽度从32位到16bit,只适合低端显卡的使用;





封装形式从144ball MBGA改84ball FBGA,看起来从正方形矩形或长条形外观。










所有的大厂商GDDR2颗粒

由于电压下降,第二代GDDR2频率低于第一代GDDR2,主要基于2.5ns规格(800MHz)和2.2ns(900MHz),当然2.8ns(700mhz)。后期的制造过程后,对GDDR2第二代突破1000MHz 1.8V电压达到1200MHz,赶上了第一代高压GDDR2。

经典的图形的GDDR2内存:7300gt,7600gs,x1600pro,8500gthellip;hellip;很多低端显卡。




注意三星官方网站的内存分类

我相信很多朋友都注意到的第一个字母,这个页面是小写的,这是在他们的官方网站和PDF的DRAM制造商的书面,以区别GDDR2。我们可以这样认为:资本是显示卡专用,32bit的高端版本,而小写g是图形卡优化,16bit定位低端版本是从内存颗粒的本质不同。

事实上,这是GDDR3显存和GDDR3相同关系,稍后我们再做具体的介绍。

GDDR从DDR、GDDR2和GDDR3从DDR2,频率与DDR3性能比较类似,所以很多人认为GDDR3是对DDR3内存的版本,这是一个很大的误区。




















































GDDR3:一代帝王的GDDR3来自DDR2技术



无论GDDR或GDDR2,因为没有太多的差异,从DDR、DDR2技术,GDDR不是频率远高于DDR,GDDR2失败后,两巨头Nvidia和ATI显卡的蜗牛般的标准制定过程中已经变得越来越沮丧,JEDEC,不能适应GPU内存发展快速的产品更新换代的周期节奏,所以Nvidia和ATI的员工积极参与JEDEC组织起草标准的制定和加速记忆。

双方一致认为,内存和存储在数据存储中的应用是完全不同的,在内存的核心频率(电容器的刷新率)的改善情况,提高我 / O频率获得高带宽是不现实的。因此,必须有一个我/ O接口定义的高速点环境。所以GDDR3诞生了,这是第一个真正完全设计内存的GPU。



GDDR3和GDDR2 / DDR2都4bit预取架构。GDDR3主要提高了GDDR2的高功耗、高发热的缺点,提高了传输效率,减轻高艳迟的负面影响。







点对点的DQS,阅读和写作不需要等待







GDDR2只有一个数据选择脉冲(DQS),这是个双向的,而GDDR3有两个独立的DQS读取和写入,和点对点的设计,这样做的好处是,如果是阅读后立即写的,它不必等待DQS的方向改变,从而快速切换的读写操作的实现。





用GDDR2 / DDR2相比,读写开关动作的GDDR3可以减少一个时钟周期。如果我们需要读写数据到一个连续的块的同时,对GDDR3显存速度将两倍的GDDR2一样快。

由于存储单元的特性,存储器粒子的逻辑库不能同时读取和写入数据。没有全双工理论,但GDDR3的改进可以使读和写sequentially.gpu缓存内存本身很小,和之间的数据交换非常频繁,读写操作的点缀,所以GDDR3点DQS的设计可以使存储效率提高。但对CPU、读写切换不GPU和CPU的频繁,有两或三级缓存容量大,所以GDDR3设计可以大大提高了内存带宽,也不是引入下一代DDR3。







改进I/O接口,简化数据处理,控制功耗















同时,对我/ O控制电路和端阻力变化的GDDR3,它不再是用推式GDDR2(推拉)接收,并转换成一个虚拟的极模式(伪开漏逻辑),和传输的所有数据信号标准的三相电路,简化数据处理,将直流电压到最低,只有低总线将搬到电力消费的逻辑,从而控制功耗和发热。

的GDDR3显存频率可以和现在一样高,但它没有对过程的持续改进,增加暴力的频率的诀窍。一个年龄稍大的玩家资格应该知道,GDDR3 2004首次亮相,6600GT内存频率仅为1GHz,高于GDDR2,过去的5年中,在1路可达2GHz甚至2.5ghz GDDR3,一直延续着生命。

在了解原理和技巧的GDDR3,看实物again.gddr3和gddr1相似,并且有两形式封装:

144ball MBGA封装,为了与GDDR、GDDR2兼容

使用144ball MBGA封装的GDDR3,GDDR、GDDR2首先出场的是完全相同的,方形,三类似的支持GDDR3显存的电气性能也可以使用GPU的GDDR存储器、PCB电路,只需做少量调整。




三星2.0ns 8mtimes;32bit GDDR3显存颗粒

144ball封装GDDR3 8mtimes 32bit只;规范,所以8内存256MB 256bit,或4 128Mb 128Bit显存是mainstream.5700ultra用GDDR3首次取代GDDR2。

144ball封装的GDDR3主要包括两个速度的2.0ns(1000mhz)和1.6ns(1250mhz)。对1.4ns产量不高,而且使用频率最高的是停在1400mhz。它已经被7800gtx / GT,6800gs,6600gt广泛应用,通讯x850 / / X800 X700等显卡,144ball封装和PCB电路有限频率增强,GDDR3快速地切换到一个更好的电气136ball FBGA封装包。



136ball FBGA封装,频率能力上升



In order to improve the electrical performance and environmental protection level, from 2005, GDDR3 began to use a new 136Ball FBGA package and unleaded packaging technology.The new packaging made the graphics card PCB redesigned, but it also paved the way for GDDR3's takeoff.




三星0.8ns GDDR3内存16mtimes 32bit规格;

对136ball GDDR3封装的优点如下:





规格不再局限于8mtimes;32bit,16mtimes;32bit成为主流,32mtimes;32bit已在大量使用;





随着制造工艺的进步,额定电压从2.0V到1.8V进一步减少,但高频率的粒子可以适当加压。





速度从1.4ns,发展到通过1.2ns 0.8ns和0.7ns,1.1ns和1.0ns。以最快的速度可以突破2500mhz,但在延迟,费用还好,GPU是不耽误太敏感。





当GDDR3显存频率达到首次2000mhz,很多人认为从极限不远了,所以关注的GDDR4的开发规范,但没想到DRAM厂商的努力和新的技术支持,GDDR3的寿命延长,0.8ns 0.7ns模型已经批量生产,大能力32mtimes;32bit颗粒也成为主流,基本上能够满足所有高中低端显卡的需要。




最快的0.77ns GDDR3显存颗粒,理论频率可以达到2600mhz

2.2ns GDDR是900MHz的同时,与核心频率和我/ O 450MHz频率停止。经过5年的发展,已取得突破性进展,GDDR3核心频率和我/ O频率与新技术。核心频率可达600MHz,和我/ O频率超过1200mhz。此时,过多的I/O频率已经成为一个新的瓶颈。

4bit GDDR3采用DDR2预取技术,所以只有使用DDR3内存8bit序列命名gddr4.gddr4预取在GDDR3显存的基础上发展起来的。它继续的GDDR3两主要技术特征,但核心使用DDR3的8bit预取技术,并增加了一些新的技术来提高频率。




















































对GDDR4 u2022技术特点:







8bit预取技术的DDR3是用来在一个较低的核心频率达到更高的带宽,但延迟的增加。









采用数据总线转位(DBI,数据总线倒置,下面介绍)来提高数据的精度和降低功耗。









地址线只有一半的GDDR3。多余线用于电源和接地,有利于提升频率,但延迟增加。









多个同步码(多序言)技术已被用来解决GDDR3爆发(爆发限制)。









从1.8V至1.5V的电压下降;









频率相同的功耗降低了75%,和2400MHz的GDDR4功耗只有一半的2000mhz GDDR3。









136ball FBGA封装,单32,向下兼容GDDR3;










GDDR4是真的好,但性能是有限的。

由于采用了8bit预取技术,对GDDR4核心频率在同一频率只有GDDR3的一半。在理论上,对GDDR4的最高频率可以达到两倍GDDR3。但值得注意的是,虽然核心频率通过8bit预取技术减少了一半,我 / O GDDR4和GDDR3显存频率是相同的。因此,对GDDR4频率提升的瓶颈在于频率我 / O而不是核心频率。

由于条件限制,制造工艺和技术水平,虽然三星官方已经宣布,他们已经产生大于3GHz GDDR4,实际装船GDDR4只有2ghz-2.5ghz。之后,技术改进后的GDDR3显存也达到了相同的水平,在相同频率下,GDDR4比GDDR3而热功率低,但延迟性能较弱,再加上制作的小成本高,GDDR4遭受冷不奇怪。



非技术原因导致GDDR4失败



GDDR3是联合开发的JEDEC的内存组织Nvidia和ATI的标准,和GDDR4在标准制定过程中都有大differences.nvidia更保守。据认为,DDR2 4bit预取技术应保持不变,我 / O控制器应加强频率。ATI是更根本的,它直接使用DDR3 8bit预取技术。

双方争执的结果是,德高望重的ATI在JEDEC组织胜(一个高大的ATI声称是在JEDEC的顶部位置),而Nvidia显然不支持GDDR4。所以GDDR4实际上是由ATI设计的一方面,但没有NVIDIA支持GDDR4立即失去了超过6的市场,导致DRAM厂不急于生产。

只有少量的三星GDDR4显存的生产,其他公司都在wait-and-see.of课程,其他DRAM厂商也没有闲着,他们的精力投入在深GDDR3显存的潜力,所以我们看到的GDDR3显存频率上升,在没有成本优势GDDR4,没有频率的优势,只是在时间的一个卡这一代人没有性能优势,GDDR4是路的尽头。

只有ATI显卡配备GDDR4已经产生,虽然不是很多,但跨越了三代产品:x1950xtx,hd2600xt和hd3870(包括相应的专业卡)mdash;mdash,这等于在滑铁卢的脸在year.nvidia NVIDIA使用视频卡数量果断弃GDDR2,和ATI GDDR4难以释怀,三年,三代产品都在使用,但它始终是主流。

GDDR4的失败不是技术原因。随着今年GDDR2相比,它已经成熟了很多。为什么不提升的主要原因是对手太强:ATI的竞争对手Nvidia很强,和GDDR4的GDDR3太顽强。

即使8bit预取技术,GDDR4仍然从GDDR3没有区别,因为瓶颈在我/而不是为核心控制器,和GDDR5是用来解决这一瓶颈。




















































GDDR5:怎么是恐怖的频率达到



像GDDR4、GDDR5采用DDR3的8bit预取技术,和核心频率显然不是一个瓶颈。如何提高我的频率是重中之重。但是GDDR5不双的我/ O的频率,而采用两平行DQ总线双接口的带宽。




的GDDR5总线工作频率示意图

双DQ总线从GDDR3 / 4 136ball到170ball GPU内存控制器的引脚GDDR5数的结果,需要重新design.gddr5内存有多达16的实体银行,这些银行被分为四组,对照组四DQ双母线跨银行,实现实时的读写操作,一举将数据传输率提高到超过4ghz!



在过去,数据总线的gddr1 / 2 / 3 / 4 / 2 / 3 DDR1是DDR技术,其传输数据一个接一个的上升沿和下降沿通过差分时钟。官方标称频率X2是数据传输率,也就是我们通常所说的等效频率。但是GDDR5是不同的。它有两个数据总线,这相当于Rambus的QDR技术,所以官方标称频率X4的数据传输速率,例如,官方HD4870 700内存频率为900MHz,我们曾经叫3600mhz。



失败是成功之母,GDDR5帮助RV770挑战GTX200冒险使用



对GDDR4没有故障停了ATI的进展。实现GDDR4频率提升的瓶颈后,GDDR5草案的制定提上日程。ATI和Nvidia的技术人员聚集开展合作plan.gddr5学会了很多前任的优点,这是它的本质丢弃的本质,并没有更多的矛盾双方在改善我/ O。

技术问题不难解决,最难的是时间和progress.ati R600在上述风险512bit内存控制器以提高内存带宽,它是如此rv670遭受一个大的,回到256bit,导致性能piaffe.gddr4相比GDDR3无频率优势,因此ATI需要GDDR5生产来满足一新一代GPU RV770,需要只有256bit,需要高频率的内存支持。

竞争对手NVIDIA对于GDDR5当然很感兴趣,但不着急,保守的NVIDIA GDDR3 GTX200决定坚持的核心,对512bit内存控制器来提高带宽的使用。随着R600的环形总线相比,NVIDIA的交叉总线从256bit到384bit到512bit步步显然是更成熟。

反对512bit对256bit,ATI只能充电芯片GDDR5,因此在GDDR5标准已完全建立,ATI已经如火如荼的性能测试,并促使DRAM厂投入运行。可以说,是一个早熟的孩子喜欢GDDR5 GDDR2 / 4,但失败是成功之母。与支持完善的技术规范和制造工艺,GDDR5是非常令人印象深刻的她出生时。

由于GDDR5数据传输速率提高一倍,HD4870 700选择256bit到448bit GTX260,迫使NVIDIA反击通过降低价格,提升规范和提高的过程。128bit和9600gt的HD4770性能256bit也赢得9800gt。

对GDDR3 / 4的优良特性的基础上,GDDR5有很多改进和新功能,以下是他们的具体分析。









数据与地址总线换位技术:高信号质量、低功耗





在1byte数据的8个值,如果超过一半的数据是0,那么GDDR5将自动执行换位传输,把0到1和1到0,然后确定数据流是正向还是反向的1个额外的DBI(数据总线转位值)。GDDR5技术的不断发展从GDDR4。



当DRAM传输数据时,只有0会消耗功率,并将传输量减少0。它不仅可以保证信号质量,而且降低了内部终端电阻的功耗和外接电路。GDDR5的地址总线也采用了类似的技术型数据流通过额外的ABI的渠道,从而降低信号噪声和降低功耗。





智能化可编程I/O控制接口:简化pcb设计和成本





GDDR5已经做了很多改进,我 / O控制器,加入了新的引擎,自动校准,确保GDDR5显存颗粒更好地适应GPU内存控制器需要确保稳定和可靠的数据传输。



自动校准引擎可以监控电压和温度的变化,补偿数据通过校验数据输出驱动器的性能和ODT端的电阻值,以及数据、地址、指令终端电阻可以通过软件或驱动程序控制。




GDDR5更具有针,但布线更简洁。

另外,也可以支持GDDR5的时延和信号强度调整,灵活的数据同步协调,通过蛇形延迟线平衡以前的方法去彻底成为历史,GDDR5没有这样的顾虑,所以PCB可以简化布线和成本大大降低,有利于更高频率的影响。





数据覆盖技术:降低数据总线压力





GDDR5的突发长度(相邻的存储单元的连续数据传输的数量)是8bit,也就是说,256bit GDDR5颗粒传输数据一次至少一次,但很多时候,不是所有的数据都需要被改写,导致无效的数据传输。

为此,GDDR5使用的一种数据隐藏技术,通过地址线保护信息。所有受保护的数据将不会被改写,在传输过程中,只有暴露的数据将被写入新的数据。此后,GDDR5的数据线的压力已经减少很多,和功耗得到进一步控制。





误差补偿技术:提高传输效率,避免灾难性错误





为了保证高速传输数据的有效性,一个新的错误检测和校正技术的加入gddr5.gddr5采用成熟的CRC(循环冗余校验),通过DQ和DBI总线,检查错误在真正的时间,并在第一时间发送数据。

这种技术对于高频传输数据尤为重要。它能有效地降低数据传输错误引起系统失效的概率,大大减少所引起的一系列问题超频或高的温度,并在一定程度上提高了数据传输的效率。





折叠方式:32bit颗粒用以16位





GDDR5作为专用的视频卡的高端显卡,只有32bit GDDR5颗粒。因为有两个并行数据总线,GDDR5的工作方式更加灵活。它可以在32位模式或16bit模式工作。这样一个32位的内存控制器可以控制两GDDR5内存,内存容量可以轻松翻倍。



事实上,GDDR3 / 4这样可以扩大存储容量,但原则是完全不同的。GPU内存控制器必须支持在设计的双行模式可以支持更多的内存颗粒。现在,共有8 256bit 128bit GPU GDDR5内存可以使用,从而简化了内存控制器的设计是一个很好的例子,HD4770。