7月
26
即将开始
线下Meetup
AI模型量化与优化技术沙龙
📖 活动介绍
深入探讨LLM推理优化技术:量化(GPTQ/AWQ/GGUF)、KV Cache优化、Continuous Batching等。适合有推理部署经验的技术人员。
📋 活动议程
14:00
模型量化技术对比与选型
14:45
vLLM性能优化实践
15:45
茶歇
16:00
TensorRT-LLM部署实战
17:00
互动讨论:推理优化最佳实践
17:30
结束