7月 26
即将开始 线下Meetup

AI模型量化与优化技术沙龙

📍 深圳·南山区科技园 📅 2026-07-26 👥 34人已报名 / 60人 💰 免费

📖 活动介绍

深入探讨LLM推理优化技术:量化(GPTQ/AWQ/GGUF)、KV Cache优化、Continuous Batching等。适合有推理部署经验的技术人员。

📋 活动议程

14:00 模型量化技术对比与选型
14:45 vLLM性能优化实践
15:45 茶歇
16:00 TensorRT-LLM部署实战
17:00 互动讨论:推理优化最佳实践
17:30 结束