🔄

ONNX Runtime 跨平台推理

模型推理部署 👤 李思涵

方案简介

ONNX Runtime是微软开源的跨平台推理引擎,支持将不同框架训练的模型导出为ONNX格式后在CPU/GPU/NPU上高效运行。提供模型量化和优化工具,适合需要在多种硬件平台上部署AI模型的场景。

技术标签

跨平台 标准化 微软
❤️ 45 收藏
👁️ 3 浏览量
💬 0 评论