UFM Telemetry实时监控
UFM Telemetry 平台可提供网络验证工具,监控网络性能和状况,同时还能捕获丰富的实时网络遥测信息、应用工作负载使用情况以及系统配置,并将其流式传输至本地或基于云的数据库,以便进一步分析。
平台:软件容器或专用设备
主要特性:
交换机、适配器和线缆遥测
系统验证
网络性能测试
将遥测信息流式传输到用户自建的或云上的数据
UFM Enterprise网络可视化和控制
UFM Enterprise 平台将 UFM Telemetry 的优势与增强的网络监控和管理相结合。该平台可实现自动化网络发现和调配、流量监控和拥塞发现,还支持作业调度调配,并能够与 Slurm 和 Platform Load Sharing Facility (LSF) 等行业领先的作业调度器以及云和集群管理器集成。平台:软件容器或专用设备
主要特性:
包含 UFM Telemetry 的功能
自动化网络发现和验证
安全线缆管理
拥塞追踪以诊断流量瓶颈
问题识别和解决
全球软件更新
与 Slurm 和 Platform LSF 集成并支持作业调度器调配
高级报告和丰富的 REST API
基于 Web 的丰富的 GUI
UFM Cyber-AI网络智能和分析
UFM Cyber-AI 平台可增强 UFM Telemetry 和 UFM Enterprise 的优势,提供预防性维护和网络安全,从而降低超级计算运营支出。
平台:本地专用 UFM Cyber-AI 设备
主要特性:
包含 UFM Telemetry 和 UFM Enterprise 的功能
分析随时间推移的性能退化或应用模式特征
检测异常集群行为
使用 AI 建立现象之间的相关性(可能看似不相干)
报告预防性维护的警报
借助持续的系统数据采集,优化可预测性


