查看我们产品的最新动态
生产就绪的核心引擎,改进隔离与可移植性
2025/12/31
up_limit >= 100 时跳过 hooks 安装(透传模式)。分区调度、无锁设备扩展与硬隔离里程碑
2025/11/30
integral_decay_factor,遗忘旧 clamp 数据。计算隔离模式(软/硬/共享)、弹性速率限制器与 VRAM 硬隔离
2025/10/31
nvidia.com/gpu limits 简化迁移。ld.so.preload is not an ELF file 问题(更改 conf 路径)。ld.so.conf.d 管理动态库路径(替代 LD_LIBRARY_PATH)。so.1 回退,兼容检测 libcuda.so.1 的应用。自动伸缩、Karpenter 节点扩展与 GPU worker 抢占
2025/09/30
up_limit >= 100 时跳过 kernel launch 限制,支持透传场景。大规模基准测试、RDMA 支持与 hypervisor 探针
2025/08/31
Karpenter 集成、渐进式迁移与 hypervisor/TUI 增强
2025/07/31
dlsym 钩子与 NVML hook 设备限制(替代环境变量方式)。调度框架重构、告警集成与 NVIDIA 远程能力里程碑
2025/06/30
ngpu 模式。支持多 GPU 申请、GPU 型号过滤,以及基于 UUID 的单卡限额
2025/05/31
TensorFusionWorkload 状态/条件表达与组件更新流程。支持灰度发布,并强化 limiter 基础(内存 hook、运行时环境工具)
2025/04/30
cuMemCreate),支持更严格的内存限制。add-path 支持 TF_PREPEND_* 前置模式,优化库加载顺序控制。基于 TFLOPs 的资源限制、工作负载生命周期增强与更丰富的设备指标
2025/03/31
集群 Reconcile 加固与控制面稳定性提升
2025/02/28
指标体系打底与早期调度/可观测性能力建设
2025/01/31