利用尖端图像处理对超高速过程实现基于图像的控制
一组来自哥伦比亚大学、德雷塞尔大学、费米实验室和理海大学的研究人员,借助 Euresys 采集卡及其 CustomLogic功能,在基于相机的高速托卡马克等离子体控制回路中极大缩短了信号采集与控制指令之间的时间,开发出聚变能源的新功能。
在另外一个“视觉闭环”例子中,该等离子体控制系统在此等复杂控制逻辑下达到了前所未有的速度水平。
应用
托卡马克是一种利用磁场将高温等离子体约束成甜甜圈形状(科学家称之为环)的机器。聚变能源科学家认为,对于未来的聚变发电厂而言,托卡马克目前是主流的等离子体约束概念之一。
磁约束聚变装置中的主动反馈控制可以减轻等离子体的不稳定性,实现稳健可靠、高性能的运行。光学高速相机提供强大的非侵入式诊断功能,因而适合这些应用。

图 2 – 哥伦比亚 HBT-EP 托卡马克装置 – © D. Shiraki
在相关论文中,研究小组描述了在哥伦比亚大学的 HBT-EP 聚变实验中,如何利用现场可编程门阵列 (FPGA) 硬件,以超过 100,000 fps 的速率快速处理相机数据,来实施等离子体控制。其目的在于跟踪磁流体动力学 (MHD) 不稳定性的演变,并实时生成控制请求。为此,研究小组在采集卡内置的 FPGA 中采用卷积神经网络 (CNN) 模型,实现了 17.6 µs 的触发-输出延迟和高达 120,000 fps 的吞吐量。

图 3 – 不同处理流程的数据速率与计算时间对比 – 科学领域的快速机器学习 – © N. Tran

解决方案
硬件平台配置:
- AMETEK Phantom S710™ 相机(支持高达 7 Gpx/秒(87.5 Gbps)的流式传输能力,例如在 1280×800 分辨率下可达到 7,275 fps),
- Euresys Coaxlink Octo采集卡适配该相机的输出。
在这种情况下,如果将数据传输至 CPU 乃至 GPU 进行集中处理,将无法满足该项应用要求达到的 10 µs 级响应要求。
借助 Euresys CustomLogic,研究人员得以在 Coaxlink Octo 采集卡中直接编程实现等离子控制算法(CNN 推理),来获得与等离子动力学相匹配的延迟性能。

利用 AMD Vivado™ 开发工具可以进行 Coaxlink CustomLogic编程。FPGA 资源分配涵盖三大功能模块:
- CoaXPress 协议,
- 板卡内部管理,
- 用户自定义的 CustomLogic(本例中为控制算法的神经网络模型和控制输出请求的计算)。
在采集卡 FPGA 芯片资源受到限制的情况下,团队攻克了强化控制算法的实现难题。为此,他们采用开源的“高级机器学习综合工具”(hs4ml)[iii]对模型进行转换优化,然后将其综合并部署到采集卡 FPGA。
Coaxlink Octo 通过 I/O 接口直接与等离子体控制系统(外部硬件正在开发中)交互,同时图像数据经由 PCIe 总线传输至主机,用于控制回路之外的后期处理。

该方案最终实现了这些成果:CNN 模型推理延迟 7.7 µs,从采集触发到输出控制请求总延迟 17.6 µs,并且能以高达 120 kfps 的帧率运行流程,满足托卡马克装置中磁流体动力学 (MHD) 不稳定性的实时控制要求。

使用的工具
除 AMD Vivado™ 工具外,开发人员还广泛运用了 Euresys 的其它工具:
- 通用 I/O 接口:通过 10MHz RS422 差分 I/O(如上所示)实现固件模型延迟与吞吐量的便捷基准测试。
- Memento 事件记录工具:提供带时间戳事件的精确时间线,同时呈现上下文信息与逻辑分析视图。该工具在应用开发和调试过程中极具价值。
- 控制/状态接口,有助于用户通过 Coaxlink Driver API 读写用户逻辑中的寄存器。
- Coaxlink CustomLogic SDK 随附的参考设计,可作为模板使用。参考设计公开提供了用户可用的所有接口。
结论
这种 CustomLogic 实施方案印证了 Euresys 解决方案如何为研究人员提供通往尖端图像处理的渠道,助力其实现定制化算法。
允许第三方在 FPGA 层级实现底层高速自定义逻辑(而非基于 CPU/GPU 的高级编程),Coaxlink 采集卡成功帮助用户克服流程控制中的时序限制难题。
这种特性不仅适用于本文讨论的领域,同样适用于众多其他受到时间约束的应用领域。
在一个环环相扣的流程中,每次突破一个瓶颈,就会为更前沿、更严苛的应用场景与技术规范开辟道路。Euresys 已经通过提升铜缆/光纤传输能力,为实现更高精度的控制铺平道路。而 Euresys 提供的图像传输处理链路,将凭借更高的铜缆或光纤连接能力来满足这些需求。
项目详情见 ArXivportal
https://arxiv.org/abs/2312.00128,实施方案的入门教程见 GitHub。
Euresys 采集卡和 CustomLogic 的详情见: https://www.euresys.com/zh/products/serie/coaxpress/
[i] 美国能源部 (DOE) 科学办公室
[ii] 基于 FPGA 机器学习实现的托卡马克低延迟光学模式追踪 [Y. Wei、R.F.Forelli、C. Hansen、J. P. Levesque、N. Tran、J. C. Agar、G. Di Guglielmo、M. E.Mauel、G. A. Navratil]
[iii] 欢迎访问 hls4ml 文档! — hls4ml 0.8.1 文档 (fastmachinelearning.org)
[iv] Euresys,D209ET-Coaxlink CustomLogic 用户指南-eGrabber 16.0.2.2128,Euresys S.A.,比利时瑟兰 (2021)