LogoTensorFusion 文档
LogoTensorFusion 文档
首页

快速开始

TensorFusion概览在Kubernetes安装在虚拟机/服务器安装(K3S)Helm本地安装在宿主机/虚拟机安装TensorFusion架构

应用操作

创建AI应用配置自动扩缩容迁移现有应用最佳实践

自定义AI基础设施

生产级部署指南QoS级别与计价云厂商集成(BYOC)管理许可证

维护与优化

组件更新配置告警GPU热迁移预加载模型优化GPU效率

故障排除

问题处理手册链路追踪/性能分析查询指标和日志

参考

对比

与NVIDIA vGPU比较与MIG/MPS对比与趋动科技对比与 Run.AI 对比与HAMi的对比

链路追踪/性能分析

高级问题排查工具,包括vGPU调用追踪/性能分析,Hypervisor TUI等。

🚧 Under Construction

Step 1. Enable Logging

Add the following environment variable to both business container and worker:

- name: TF_ENABLE_LOG
  value: '1'
# Log level, error/warn/info/trace
- name: TF_LOG_LEVEL
  value: 'warn'

# Log into file rather than stdout
- name: TF_LOG_PATH
  value: '/tmp/tensor-fusion/tf.log'

Logs will be output to the container and collected by vector, sink to TSDB.

问题处理手册

TensorFusion常见问题处理手册

查询指标和日志

从GreptimeDB查询原始监控指标和日志数据

目录

Step 1. Enable Logging