ONNX Runtime 跨平台推理
方案简介
ONNX Runtime是微软开源的跨平台推理引擎,支持将不同框架训练的模型导出为ONNX格式后在CPU/GPU/NPU上高效运行。提供模型量化和优化工具,适合需要在多种硬件平台上部署AI模型的场景。
技术标签
❤️ 45
收藏
👁️ 3
浏览量
💬 0
评论