🔍
🦙
LLM 本地部署

Ollama + Open WebUI 一键部署

5分钟搭建本地AI聊天平台,无需GPU也能运行开源大模型。

🐳
容器化 面板

1Panel + Docker 极简部署方案

小白也能上手的AI部署方案,可视化面板管理容器。

❄️
PaaS 部署

Coolify 个人AI应用托管

类Vercel体验的自托管PaaS平台,一键部署AI应用。

💻
桌面端 本地

LM Studio 桌面端本地模型

图形化操作,在个人电脑上运行开源语言模型。

推理 高性能

vLLM 高性能推理服务集群

生产级LLM推理服务部署,PagedAttention极致性能。

🔥
NVIDIA 优化

Triton + TensorRT-LLM 推理优化

NVIDIA企业级推理方案,充分释放GPU算力。

🔄
跨平台 标准化

ONNX Runtime 跨平台推理

微软开源推理引擎,一次导出多处运行。

📚
RAG 知识库

Dify + FastGPT 企业知识库

开箱即用的AI知识库平台,私有化部署企业文档。

🌊
RAG 文档

RAGFlow + MaxKB 深度文档理解

企业级RAG引擎,精准解析复杂文档内容。

🔗
AI绘画 工作流

ComfyUI 工作流搭建平台

节点式AI绘画工作流平台,灵活可控的创作工具。

🔀
低代码 RAG

Flowise + Langflow 低代码AI应用

拖拽式AI应用开发平台,零代码构建智能应用。

☸️
K8s 集群

Kubernetes + GPU 集群部署

弹性AI推理集群,支持自动扩缩容和多租户。