如何利用锐龙人工智能技术将 RGB 图像优化转换为负像的实例操作
扫描二维码
随时随地手机看文章
本次演示展示了如何利用“跟踪”功能,通过使用 AMD Ryzen AI Phoenix 中的 AIE 语言和 AIE API,高效地实现彩色图像的“反向”处理。
要求/条件
AMD Ryzen AI Phoenix. 基于 Linux® 的开发环境。Python®(用于测试自动化和结果验证)。IRON API 和基于 MLIR 的 AI 引擎工具链。OpenCV(开源计算机视觉库)
项目简介
该系统级芯片(SOC)旨在加快 AIE-ML 算法的运行速度,以实现卓越的出色性能。而神经处理单元(NPU)组件则具有……
•16 个人工智能核心用于计算任务
•4 快速内存访问用的内存模块
•4 沙姆 DMA 用于在 L3 内存中进行数据的读入和写入操作
问题陈述
在该 3 核设计中,这些核心大多处于“锁步”状态,从而浪费了宝贵的计算能力。
三核设计模式
3 个核心设计
•锁止持续时间:1286000纳秒
•核心执行时间:156000 纳秒
•处理一行数据所需的总时间为 1442000 纳秒。
解决方案
在对这些痕迹进行分析之后,人们发现……
•R、G 和 B 三个通道的处理过程可以集中在同一个核心上进行。
•用于输入和输出的乒乓缓冲区可以通过减少整体内存占用来转换为单个输入缓冲区和单个输出缓冲区。
•仅有一个 S2MM 和 MM2S 通道与 BD 链路及锁相结合,用于调控数据流和核心执行过程。
如何优化“AMD锐龙人工智能神经网络单元将彩色图像转换为负图像”的功能
结构
计算的数据流
1 核设计模式
•单个组件的锁止持续时间为 320000 纳秒
•核心执行时间:单个组件 190000 微秒
•3 行数据(R、G、B)的执行时间 - 1528000 纳秒,与 1442000 纳秒较为接近 - 采用 3 核设计的单行处理方式。
然后,核心部分会对每个像素进行取反操作,接着将转换后的像素重新传输至 L3 内存。
输入图像
输出图像
结论
本次课程将演示如何利用“跟踪”功能来分析程序的执行情况并对其进行优化。
简要描述这两种实现方式之间的相似之处:
* 仅捕获与 AIE 核相关的信息参数
本文编译自hackster.io





