三种使用PCI Express IP的节能技术.docx

上传人:lao****ou 文档编号:874727 上传时间:2024-07-08 格式:DOCX 页数:6 大小:85.13KB
下载 相关 举报
三种使用PCI Express IP的节能技术.docx_第1页
第1页 / 共6页
三种使用PCI Express IP的节能技术.docx_第2页
第2页 / 共6页
三种使用PCI Express IP的节能技术.docx_第3页
第3页 / 共6页
三种使用PCI Express IP的节能技术.docx_第4页
第4页 / 共6页
三种使用PCI Express IP的节能技术.docx_第5页
第5页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《三种使用PCI Express IP的节能技术.docx》由会员分享,可在线阅读,更多相关《三种使用PCI Express IP的节能技术.docx(6页珍藏版)》请在第一文库网上搜索。

1、三种使用PCIExpressIP的节能技术摘要将PC1EXPreSS用于计算应用(服务器、组网、笔记本电脑等)的连通性方面在一段时间内相当流行,同时,在较小的、电池动力装置(电话、平板电脑、手表等)内的使用正变得更加广泛。由于计算应用环境下设备之间数据通值量的增加,产生较大的功率要求,正是由于该原因,设计人员致力于寻找降低其SOC在低强度或空闲时期功率的方法。较小的、电池动力装置常处于空闲和深度睡眠模式,但对于这类深度节电模式,其代价是,切换回正常工作模式时恢复时间较长。对于使用PC1EXPreSS的设计人员,通过将PC1ExpressIP集成在其SOC中,对其目标应用的功率产生了积极的影响,

2、这是因为除了协议所提供的节能技术之外,还有高级功率管理技术可以控制功耗。采用时针门控技术可以处理动态功耗事宜,但对静态功耗无任何作用。电遮门控技术是实现最大程度节能的理想选择,这是因为它能降低因缩小的特征尺寸而导致更大的静态功耗。在深度节电模式下,电源门控PC1ExpressIP在典型情况下需要PC1EXPreSS链路再训练或再配置,并将延长恢复时间,这在很多情形下是不希望的,所以是一项重大挑战。在本文中,以PC1ExpressIP为例,介绍了三种节能技术,以及设计人员如何使用协议和设计工具的功率管理特性来为需要快速恢复的装置提供高能效SoC的方法。1 .时钟门控技术:综合工具现代综合工具提供

3、了数种时钟功率管理技术,如传统的时钟门控和自门控。在传统时钟门控方面,综合工具寻找条件,将其组合在一起以形成时钟使能(EN),这样可以关断时钟到触发器的通路。这里介绍集成式时钟门控(KG)单元,使用EN,对系列触发器的时钟进行关断,如图1所示。对于自门控技术,如果触发器的输入不变,将关断触发器时钟;触发器的的输出与输入异或,用作ICG中的时钟使能(EN)o图1.传统的时钟门控(左)与自门控(右)本策略导致了高能效CE,但由于额外的逻辑开销,面积略有增大。综合工具通常在插入传统时钟门后使用自门控,以增强CE,针对面积权衡,进一步降低能耗。使用功率分析工具,可对该自动方法进行评估和优化,它能通报已

4、有时钟门的效率,并揭示进一步插入时钟门的机会。对于数种使用情形,这类报告可用于进一步优化时钟门插入。优化的传统时钟门控和PC1ExpressIP能实现至少40%的节能效果,并会将28纳米技术节点上的面积降低约9%o传统时钟门插入之后的自门控策略能够降低至少5%的能耗,并会使面积增大约1%o在16纳米FinFET(16FF)技术节点上,综合工具时钟门控(传统时钟门控+自门控)能达到25%的节能效果。图2。图2.时钟门控工具的节能效果2 .时钟门控技术:PCIExpressIP虽然工具插入式时钟节能技术能够显著降低功耗,它们并未完全考虑设计层次。从设计方面获取的CE仅作用于触发器上,仅在每一触发器

5、的时钟输入处选通时钟,如图3所示。存在这方面的抱怨,工具插入式时钟门控过于“细微”,未考虑穿过整个层次的时钟树。时钟树包括分布在整个设计中的时钟驱动和时钟门控单元,切换与驱动逻辑无关。对于高度复杂的设计,时钟树会消耗至少25%的待机功耗。在层次结构的根部关断时钟,可降低功耗,原因在于时钟树切换,这是一种需要考虑到架构的设计决定。C1KnetworkRegbank图3.时钟脉冲门插入后的典型设计作为示例,考虑PC1ExpressIP设计和ARMAMBA接口以及3个时钟域,如图4所示。AMBA主设备接收PC1EXPreSS请求,并将其转换为AMBA事务,所述事务将被发送至AMBA主时钟上的应用层。

6、AMBA从设备处理从应用层传出的AMBA事务,在AMBA从时钟上将其转换为PC1EXPreSS请求。剩余块执行具体的PCIExpress功能,对在核时钟或参考时钟线上的往返请求进行处理。AMBA母钟本机核心时钟图4.PCIExpressIP和3个时钟域存在多种具有AMBA主/从空闲的场景,完全独立于PC1EXPreSS链路状态:1 .对于从线路来的入站请求,需要本地核时钟域和AMBA主时钟域,以保持运行,同时关断AMBA从时钟。2 .对于来自应用层的出站请求,需要AMBA从时钟和本地核时钟域保持运行,同时关断AMBA主时钟。3 .对于不需要应用逻辑干预的入站/出站请求,仅需要本地核时钟域,与此

7、同时,可关断AMBA主和从时钟。结构模块中的时钟门控不需要遵守PC1EXPreSS的链路功率管理状态。如果在特定方向上没有未决请求,可断开待机结构模块的时钟。在AMBA主从时钟块中,可在根部关断时钟,从而降低特定时钟树消耗的功率。对于情形3,在PCIExpressIP中实施相同方案能够节省至少10%的功率,并将待机处理效率提局至少10%o在表1中,介绍了满负荷通信和待机状态下的功耗,采用和未采用结构化时钟门控实施。PowerConsumption功耗无结构化时钟门控有结构化时钟门控0%通信0.75P0.64Q100%通信(P(100)-P(C表1关于结构化时钟门控实施的功耗比较3.时钟门控和电

8、源门控技术:PCIEXPreSS协议PCIEXPreSS协议允许实施功率优化,其方式是通过更精细的链路状态实现,1011(子状态)和12/13,根据规范将其定义为功率管理状态。要想退出12和13状态,需恢复电源并再次对链路进行训练,从而导致更长的恢复时间。在1O和11(子状态)下,采用时钟门控技术以便将恢复时间降至最低。考虑在章节2中介绍的Pe1ExpressIP设计,在1O下,可选通AMBA主从时钟,具体情况取决于1O下的路径方向,而在11子状态下不需要参考时钟。因此,即使在不停止锁相环(P11)的情况下也能断开本地核心时钟,P11可生成核心时钟以避免重启P11时的延迟。该情形下的功耗是所有

9、时钟门控技术中最低的,仅在数字和模拟电路中存在泄漏功率。如果能够容忍高至5倍的恢复时间,就能在1I.1子状态下断开P11和发送器/接收器,与仅具有时钟门控的111子状态相比,可实现高至97.5%的节能效果。如果能够容忍高至15倍的恢复时间,在112子状态下甚至能断开共模电压,将功耗降至0.05%OPCIEXPreSS提供了基于消息的系统功率处理协助技术,如延迟容许通报(1TR)和优化缓冲清除/填满(OBFF)O使用1TR,能够将下游装置容许的最大延迟传递到上游,使得主机软件能够了解无缝链路操作所需的恢复时间。使用OBFF,主机软件能够将系统状态传输至具有主线总控能力的下游装置,使用它们来优化传

10、输排程,并使系统在节能模式下工作的时间更长。例如,如果系统处于低功率状态,例行于IA传输会出现延迟。对于从1TR收集的信息,它能用于决定将待机时间延长多少,以便允许更高的貌似可行的节能。结论在具有预期快速恢复时间的零散通信和待机过程中,功率管理对于装置尤为重要。采用基于工具的皿相去和协议相关时钟门控技术,对于诸如PC1EXPreSS的接口IP设计,可实现最大节能。当需要近乎为零的恢复时间时,时钟门控解决方案可达到优异的结果。通过避免PC1EXPreSS链路再训练和再配置,可实现最大节能和更快的恢复时间。对于SynOPSyS针对PC1EXPreSS技术的DeSignWareIP解决方案,它利用了基于工具的时钟门插入技术的优点。包括依赖并独立于PCIExpress链路功率状态的结构化时钟门控块;支持11子状态下的PC1EXPreSS时钟功率管理;提供电源门控解决方案,以及针对11.2子状态的功率岛和蚤住翟保持方法(避免链路再训练),支持功率管理协助特性,如延迟容许通报(1TR)和优化缓冲清除/填满(OBFF)O支持所有的PC1EXPreSS功率管理功能,包含更长的恢复时间,如动态上下链路配置和12/13功率门控。使用支持这些特性的PC1ExpressIP,可帮助设计人员提供高能效SoC。https:W

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服