🦙

本地大模型部署实战

进阶 79元 ⏱ 20 课时 👥 2,800 人已学

立即购买 - 79元加入收藏

📖 课程简介

深入讲解大语言模型的本地部署技术，覆盖Ollama、vLLM、TGI三大主流推理引擎。学习模型量化（GGUF/GPTQ/AWQ）、CPU/GPU混合推理、多GPU张量并行等高级部署技术。

🎯 学习收获

✅ 掌握Ollama/vLLM/TGI三大推理引擎的部署

✅ 学会模型量化和GPU加速技术

✅ 理解不同推理引擎的适用场景和性能对比

✅ 能够根据需求选择合适的推理方案

✅ 具备生产级LLM服务部署能力

📋 前置要求

• 已完成AI平台从零搭建课程或有Docker基础

• 了解基本的LLM概念

• 拥有一台带GPU的服务器（或足够大的CPU内存）

👥 适合人群

👤 已入门AI部署的进阶学习者

👤 需要部署LLM服务的开发者和运维人员

👤 对模型推理性能有要求的AI应用开发者

🛠️ 技术栈

LLM Docker GPU