这个站点正式上线,用于持续整理我在 AI Infra 与高效推理方向的项目实践、论文进展和工程笔记。 后续会重点更新以下内容: 多模态高效推理的实验记录与结论 模型压缩与部署过程中的工程经验 AI Infra 系统设计与落地复盘