一种基于与非锥簇架构fpga输入交叉互连设计优化方法-黄志洪.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《一种基于与非锥簇架构fpga输入交叉互连设计优化方法-黄志洪.pdf》由会员分享,可在线阅读,更多相关《一种基于与非锥簇架构fpga输入交叉互连设计优化方法-黄志洪.pdf(8页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第 38卷 第 9期 电 子 与 信 息 学 报 Vol.38No.92016年 9月 JournalofElectronics&InformationTechnology .Setp.2016一种基于与非锥簇架构FPGA输入交叉互连设计优化方法黄 志 洪 李 威 杨 立 群 江 政 泓 魏 星 林 郁 杨 海 钢 * (中 国 科 学 院 电 子 学 研 究 所 北 京 100190) (中 国 科 学 院 大 学 北 京 100190)摘要:该 文 针 对 与 非 锥 (And-InverterCone,AIC)簇 架 构 FPGA开 发 中 面 临 的 簇 面 积 过 大 的 瓶 颈 问
2、 题 , 对 其 输入 交 叉 互 连 设 计 优 化 进 行 深 入 研 究 , 在 评 估 优 化 流 程 层 次 , 首 次 创 新 性 提 出 装 箱 网 表 统 计 法 对 AIC簇 输 入 和 反 馈资 源 占 用 情 况 进 行 分 析 , 为 设 计 及 优 化 输 入 交 叉 互 连 结 构 提 供 指 导 , 以 更 高 效 获 得 优 化 参 数 。 针 对 输 入 交 叉 互 连模 块 , 在 结 构 参 数 设 计 层 次 , 首 次 提 出 将 引 脚 输 入 和 输 出 反 馈 连 通 率 分 离 独 立 设 计 , 并 通 过 大 量 的 实 验 , 获 得 最
3、优 连 通 率 组 合 。 在 电 路 设 计 实 现 层 次 , 有 效 利 用 AIC逻 辑 锥 电 路 结 构 特 点 , 首 次 提 出 双 相 输 入 交 叉 互 连 电 路 实 现 。相 比 于 已 有 的 AIC簇 结 构 , 通 过 该 文 提 出 的 优 化 方 法 所 得 的 AIC簇 自 身 面 积 可 减 小 21.21%, 面 积 制 约 问 题 得 到了 明 显 改 善 。 在 实 现 MCNC和 VTR应 用 电 路 集 时 , 与 Altera公 司 的 FPGA芯 片 StratixIV(LUT架 构 )相 比 ,采 用 具 有 该 文 所 设 计 的 输 入
4、 交 叉 互 连 结 构 的 AIC架 构 FPGA, 平 均 面 积 延 时 积 分 别 减 小 了 48.49%和 26.29%; 与传 统 AIC架 构 FPGA相 比 , 平 均 面 积 延 时 积 分 别 减 小 了 28.48%和 28.37%, 显 著 提 升 了 FPGA的 整 体 性 能 。关键词:与 非 锥 (AIC);AIC簇 ; 装 箱 网 表 统 计 法 ; 连 通 率 ; 分 类 独 立 设 计 ; 双 相 输 入 交 叉 互 连中图分类号:TN402文献标识码:A文章编号:1009-5896(2016)09-2397-08DOI:10.11999/JEIT1512
5、16An Input Crossbar Optimisation Method forAnd-inverter Cone Based FPGAHUANGZhihong LIWei YANGLiqun JIANGZhenghong WEIXing LINYu YANGHaigang (Institute of Electronics, Chinese Academy of Sciences, Beijing 100190, China) (University of Chinese Academy of Sciences, Beijing 100190, China)Abstract: In o
6、rder to break through the bottleneck of the huge cluster area in AIC (And-Inverter Cone)architecture based FPGA, the research on the optimisation of the input crossbar architecture is carried on. Apost-pack netlist statistics method is creatively proposed to analyze the utilization of AIC cluster in
7、puts andfeedbacks and to guide the input crossbar design. And on the architecture parameter design level, it is firstlyproposed to separately design the connective probability of the AIC cluster inputs and feedbacks. Throughsubstantial experiments, optimum connective probability combination is deriv
8、ed. From the circuit implementview,dual-phasesmultiplexerinputcrossbarispresentedaccordingtothecharacteristicsofAIC.TheareaoftheAICcluster,optimizedthroughtheproposedapproach,achieves21.21%smallerthantheoriginalone,thehugearea problem is markedly ameliorated. When implementing the MCNC and VTR bench
9、marks, compared toStratixIV,LUTbasedFPGAfromAltera,thearea-delayproductoftheAICFPGAafteroptimisationisreducedby 48.49% and 26.29%, respectively. Compared to the original AIC-based FPGA architecture, the area-delayproductisreducedby28.48%and28.37%,respectively.Key words:And-InverterCone(AIC);AICclust
10、er;Post-packnetliststatistics;Connectiveprobability;Separatelydesign;Dual-phasesmultiplexerinputcrossbar1引言FPGA(Field-Programmable Gate Arrays)自1984年 诞 生 以 来 , 发 展 至 今 已 成 为 数 字 电 路 系 统 的收 稿 日 期 : 2015-11-25; 改 回 日 期 : 2016-04-27; 网 络 出 版 : 2016-04-14*通 信 作 者 : 杨 海 钢 基 金 项 目 : 国 家 自 然 科 学 基 金 (61271
11、149)FoundationItem:TheNationalNaturalScienceFoundationofChina(61271149) 核 心 器 件 。 FPGA灵 活 的 可 编 程 能 力 使 得 其 能 够 实现 各 种 逻 辑 功 能 , 满 足 不 同 领 域 用 户 的 功 能 需 求 ,其 开 发 周 期 短 , 容 易 升 级 的 特 点 更 适 用 于 技 术 不 断革 新 的 市 场 应 用 1,2。 当 前 主 流 的 商 用 FPGA器 件基 本 都 采 用 孤 岛 型 结 构 3, 逻 辑 功 能 普 遍 通 过 查 找表 (LookupTable,LUT)
12、结 构 4实 现 , k 位 输 入 的 查找 表 能 够 实 现 22 k 种 功 能 。 查 找 表 结 构 逻 辑 单 元 强 大的 可 编 程 能 力 推 动 了 FPGA 的 快 速 发 展 和 广 泛 应2398 电 子 与 信 息 学 报 第 38卷用 , 然 而 其 高 度 灵 活 性 也 带 来 了 面 积 和 性 能 的 开 销 ,且 其 本 身 的 可 扩 展 性 约 束 也 随 着 工 艺 节 点 的 不 断 进步 逐 渐 凸 显 , 如 何 改 进 LUT结 构 进 一 步 提 升 FPGA性 能 一 直 是 学 术 界 和 工 业 界 的 研 究 焦 点 5 7-
13、。2012年 , 文 献 8,9提 出 了 一 种 基 于 与 非 锥 结 构的 新 型 FPGA逻 辑 单 元 。 其 核 心 思 想 是 利 用 综 合 工具 如 abc10中 的 BooleanSAT技 术 方 案 11, 使 得 电路 在 映 射 成 为 有 向 无 环 图 AIG(And-InverterGraph)时 能 够 在 不 同 深 度 上 找 到 大 量 可 复 用 的 子 图 , 而AIC架 构 FPGA能 够 提 供 可 复 用 的 逻 辑 单 元 , 从 而最 大 程 度 地 提 高 逻 辑 资 源 利 用 率 。2014年 第 22届 FPGA 国 际 会 议 上
14、 , 文 献 12首 次 尝 试 通 过 标 准 CMOS 工 艺 实 现 基 于 AIC架 构的 FPGA电 路 设 计 , 通 过 实 验 仿 真 获 得 性 能 参 数 ,并 提 供 结 构 参 数 和 模 型 输 入 VTR13架 构 评 估 工 具 ,以 获 得 待 评 估 电 路 集 中 不 同 电 路 的 面 积 、 时 延 性 能 ,并 得 出 结 论 : LUT和 AIC结 构 在 不 同 应 用 电 路 上 各有 优 劣 , 基 于 AIC架 构 的 FPGA在 平 均 时 延 性 能 上更 优 , 但 面 积 相 对 较 大 。 文 献 12中 输 入 交 叉 互 连 模
15、块 (input crossbar)占 到 了 整 个 逻 辑 簇 面 积 的62.77%, 而 真 正 的 功 能 逻 辑 和 时 序 电 路 模 块 仅 占 到AIC簇 面 积 的 10.3%, 庞 大 的 输 入 交 叉 互 连 模 块 直接 导 致 AIC架 构 逻 辑 簇 面 积 过 大 的 缺 陷 。本 文 首 次 采 用 统 计 方 法 对 映 射 装 箱 后 的 应 用 电路 网 表 资 源 利 用 率 进 行 计 算 分 析 , 利 用 分 析 结 果 指导 输 入 交 叉 互 连 结 构 设 计 , 并 提 出 将 AIC簇 的 输 入引 脚 和 输 出 反 馈 连 通 率
16、 分 离 独 立 设 计 , 在 电 路 实 现层 次 , 提 出 一 种 双 相 输 出 交 叉 矩 阵 , 以 优 化 AICFPGA的 实 现 性 能 。 通 过 集 成 了 改 进 的 面 向 AIC结构 映 射 工 具 14的 完 整 高 效 FPGA架 构 评 估 流 程 , 经过 大 量 的 仿 真 、 优 化 和 实 验 , 获 得 一 种 优 化 的 适 用于 AIC簇 架 构 FPGA的 输 入 交 叉 互 连 结 构 。2 AIC逻辑簇及输入交叉互连模块AIC基 本 单 元 的 结 构 如 图 1中 BAE(BasicAICElement)所 示 , 多 级 AIC逻 辑
17、 锥 由 多 层 次 的 基 本 单元 BAE组 成 , 其 中 , 第 1级 采 用 改 进 型 可 编 程 AIC单 元 (EnhancedAICElement,EAE)即 在 各 输 入 端加 入 正 反 信 号 选 择 模 块 , 使 第 1级 AIC即 能 实 现 AB,AB, AB, AB, +A B, +A B , +A B, +A B 8种逻 辑 功 能 。根 据 德 摩 根 律 15, 任 何 函 数 功 能 通 过 逻 辑 运 算都 能 够 通 过 运 算 转 换 成 与 非 单 元 的 组 合 表 达 式 。 因而 可 将 任 意 的 函 数 映 射 到 AIC组 合 结
18、 构 上 。图 1 AIC逻 辑 单 元 及 AIC逻 辑 锥AIC逻 辑 锥 区 分 于 传 统 查 找 表 结 构 的 一 个 重 要特 点 是 其 在 各 级 中 间 层 次 可 具 有 多 个 输 出 , 因 而 能够 最 大 程 度 上 复 用 资 源 实 现 映 射 生 成 的 重 复 子 图 单元 , 从 而 在 提 高 资 源 利 用 率 的 同 时 提 升 性 能 。AIC逻 辑 簇 是 由 一 个 或 者 多 个 AIC锥 通 过 局 部互 连 组 成 的 可 编 程 逻 辑 模 块 , 与 基 于 LUT结 构 的LAB模 块 相 对 应 。 在 文 献 12中 为 了
19、实 现 与 主 流 商用 FPGA 进 行 比 对 , 采 用 了 全 定 制 设 计 方 法 , 在Cadence的 Virtuso设 计 平 台 上 , 通 过 40nm标 准CMOS工 艺 实 现 了 Altera公 司 Stratix-IV的 逻 辑 功能 簇16作 为 对 比 的 参 照 基 准 , 性 能 与 实 际 芯 片 数 据相 近 。该 AIC逻 辑 簇 由 3个 层 次 为 6的 AIC逻 辑 锥(AIC6)组 成 , 每 个 AIC6有 64个 输 入 端 , 由 第 2级开 始 输 出 , 称 为 AIC6_2。 通 道 提 供 了 64个 输 入 引脚 , 经 过
20、输 入 交 叉 互 连 模 块 选 择 后 , 为 3个 AIC6_2提 供 192个 输 入 。 每 个 AIC6_2共 31个 输 出 , 通 过中 间 交 叉 互 连 模 块 选 择 后 , 可 选 择 是 否 连 接 到 寄 存器 DFF实 现 时 序 或 者 直 接 提 供 组 合 逻 辑 输 出 , 再 经过 输 出 交 叉 互 连 模 块 将 数 目 减 少 到 20并 最 终 输 出到 全 局 互 连 通 道 资 源 。文 献 12中 的 AIC逻 辑 簇 与 传 统 LUT结 构 逻 辑簇 相 比 , 在 平 均 延 时 性 能 上 有 一 定 优 势 , 但 电 路 实现
21、平 均 面 积 较 差 。 深 入 分 析 该 AIC簇 结 构 , 由 于AIC簇 拥 有 多 输 入 多 输 出 的 结 构 特 点 , 使 得 其 能 较快 处 理 多 输 入 信 号 , 而 且 多 层 次 中 间 节 点 输 出 的 存在 使 得 其 能 够 复 用 逻 辑 运 算 模 块 的 中 间 结 果 , 从 而提 高 逻 辑 运 算 密 度 和 利 用 率 。 但 丰 富 的 局 部 布 线 资源 也 意 味 着 资 源 的 冗 余 和 面 积 、 延 时 代 价 。 统 计 结果 可 得 , 文 献 12中 局 部 互 连 资 源 (input/middle/output
22、 crossbar)占 整 个 AIC 簇 结 构 中 面 积 的79.89%, 延 时 占 AIC簇 总 延 时 43.3%至 70.7%。由 于 映 射 工 具 受 限 等 因 素 , 如 原 映 射 工 具 在 映射 阶 段 没 有 合 理 考 虑 不 同 单 元 的 映 射 代 价 , 且 仅 支第 9期 黄 志 洪 等 : 一 种 基 于 与 非 锥 簇 架 构 FPGA输 入 交 叉 互 连 设 计 优 化 方 法 2399持 AIC每 个 层 次 都 需 输 出 , 直 接 导 致 输 出 数 目 的 倍增 , 限 制 制 约 了 AIC簇 设 计 的 灵 活 性 。 针 对 这
23、 些 问题 , 我 们 基 于 开 源 的 abc软 件 对 新 的 工 艺 映 射 工 具进 行 了 开 发 14, 引 入 了 映 射 单 元 库 , 建 立 映 射 代 价函 数 , 在 映 射 阶 段 即 考 虑 不 同 映 射 结 果 的 代 价 , 并在 大 量 的 候 选 映 射 划 分 中 , 选 择 最 优 的 映 射 方 案 ,同 时 实 现 AIC逻 辑 簇 的 输 入 、 输 出 层 次 、 输 出 个 数独 立 可 调 节 , 使 得 结 构 设 计 能 有 更 大 的 自 由 空 间 ,选 择 更 为 合 理 的 方 式 。通 过 限 制 AIC6从 第 3级 开
24、始 输 出 ,并 简 称 该 与非 锥 为 AIC6_3, 其 输 出 数 目 即 可 降 为 15, 原 AIC逻 辑 簇 中 的 中 间 输 出 交 叉 互 连 和 输 出 交 叉 互 连 即 可移 除 , AIC逻 辑 簇 结 构 改 进 部 分 为 图 2阴 影 部 分 所示 。 限 制 AIC6输 出 级 数 后 可 以 移 除 中 间 和 输 出 交叉 互 连 模 块 , 但 输 入 交 叉 互 连 模 块 仍 然 必 须 保 留 ,以 保 障 为 AIC逻 辑 功 能 块 提 供 丰 富 的 输 入 资 源 。 而此 时 , 输 入 交 叉 互 连 模 块 占 用 整 个 AIC
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 非锥簇 架构 fpga 输入 交叉 互连 设计 优化 方法 黄志洪
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内