
2026/01/18
公安视频分析如何实现“数据不动、算力动”并降低响应延迟
某市公安局通过 TensorFusion 池化 GPU 资源,实现低延迟告警与更高利用率。
客户画像
某市公安局负责城市级视频分析系统,要求数据不出辖区,同时需快速响应重大事件。
业务问题
- 8,000+ 路视频流带来不稳定推理负载。
- 区域资源割裂,GPU 资源分布不均。
- 高峰期告警延迟达 5–7 秒,影响处置效率。
基线指标:
| 指标 | 基线 |
|---|---|
| 告警 P95 延迟 | 5–7 秒 |
| GPU 利用率 | 22–30% |
| 案件回溯排队时间 | 20–30 分钟 |
| 年度 GPU 成本 | 100%(基线) |
TensorFusion 方案
- 跨辖区 GPU 池化,数据不动,算力动。
- 空闲 GPU 组成虚拟大卡,进行流水线推理。
- 本地请求到达时优雅退出,保障本地优先级。
- 事件级策略调度,保证重大活动优先。
结果
| 指标 | 优化前 | 优化后 |
|---|---|---|
| 告警 P95 延迟 | 6 秒 | 1.5 秒 |
| GPU 利用率 | 26% | 68% |
| 案件回溯排队时间 | 25 分钟 | 8 分钟 |
| 年度 GPU 成本 | 100% | 58% |


