🖥️

Triton Inference Server

NVIDIA 模型推理与服务 免费开源 ⭐ 4.7

工具简介

Triton Inference Server是NVIDIA推出的企业级AI推理服务器,支持多种框架(TensorRT、ONNX、PyTorch等)、多种硬件(GPU/CPU/ARM)、动态批处理和模型流水线。是GPU集群推理部署的标准方案。

1 浏览量
0 收藏
4.7 评分