可重构结构下卷积神经网络加速研究与设计
朱育琳,蒋 林 ,王 欣 ,刘 帅
西安科技大学 电气与控制工程学院;西安科技大学 通信与信息工程学院
2024-06-27
针对卷积神经网络(CNN)推理过程中计算量大、耗时长及硬件资源消耗高的问题,提出基于可重构阵列处理器的 CNN 加速设计方案。利用神经网络信息分布式存储特点,将处理元(PE)作为重构基本模块设计输入数据复用模式,减少内存访问次数从而加速网络推理过程,并实现不同规格卷积操作在可重构阵列处理器上灵活部署。在 Virtex—6 开发板上的测试结果表明:相比基于现场可编程门阵列(FPGA)实现 CNN,本文实验 LUTs 资源消耗减少 70 % ,FF 资源消耗减少 50 % 。时钟频率达到 113 MHz,峰值运算速度达到 1. 8 GOP/ s,与领域专用可重构处理器相比,运算性能提升 19. 7 % 。
  • 卷积神经网络
  • 可重构结构
  • 数据复用
  • 并行化
年份: 2023年
下载文档 2.00元
引用
分享
来源期刊
内容目录
  • 引 言

  • 1、CNN

  • 2、CNN 可重构实现

    • 2.1可重构阵列处理器硬件结构

    • 2.2CNN 加速设计

    • 2.3可重构结构下 CNN 实现

  • 3、实验结果分析

    • 3.1实验测试方案

    • 3.2运算性能分析

  • 4、结束语

核心点推荐
  • 神经网络