中文 | English
PaddleSlim是一个模型压缩工具库,包含模型剪裁、定点量化、知识蒸馏、超参搜索和模型结构搜索等一系列模型压缩策略。
对于业务用户,PaddleSlim提供完整的模型压缩解决方案,可用于图像分类、检测、分割等各种类型的视觉场景。 同时也在持续探索NLP领域模型的压缩方案。另外,PaddleSlim提供且在不断完善各种压缩策略在经典开源任务的benchmark, 以便业务用户参考。
对于模型压缩算法研究者或开发者,PaddleSlim提供各种压缩策略的底层辅助接口,方便用户复现、调研和使用最新论文方法。 PaddleSlim会从底层能力、技术咨询合作和业务场景等角度支持开发者进行模型压缩策略相关的创新工作。
pip install paddleslim -i https://pypi.tuna.tsinghua.edu.cn/simple
如果在ARM和GPU上预测,每个版本都可以,如果在CPU上预测,请选择Paddle 2.0对应的PaddleSlim 1.2.0版本
- Paddle 1.7 系列版本,需要安装PaddleSlim 1.0.1版本
pip install paddleslim==1.0.1 -i https://pypi.tuna.tsinghua.edu.cn/simple
- Paddle 1.8 系列版本,需要安装PaddleSlim 1.1.1版本
pip install paddleslim==1.1.1 -i https://pypi.tuna.tsinghua.edu.cn/simple
- Paddle 2.0 系列版本,需要安装PaddleSlim 1.2.0版本
pip install paddleslim==1.2.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
- 快速开始:通过简单示例介绍如何快速使用PaddleSlim。
- 进阶教程:PaddleSlim高阶教程。
- 模型库:各个压缩策略在图像分类、目标检测和图像语义分割模型上的实验结论,包括模型精度、预测速度和可供下载的预训练模型。
- API文档
- 算法原理: 介绍量化、剪枝、蒸馏、NAS的基本知识背景。
- 视觉模型压缩
- TensorRT部署: 介绍如何使用TensorRT部署PaddleSlim量化得到的模型。
数据: ImageNet2012; 模型: MobileNetV1;
压缩策略 | 精度收益(baseline: 70.91%) | 模型大小(baseline: 17.0M) |
---|---|---|
知识蒸馏(ResNet50) | +1.06% | - |
知识蒸馏(ResNet50) + int8量化训练 | +1.10% | -71.76% |
剪裁(FLOPs-50%) + int8量化训练 | -1.71% | -86.47% |
压缩方法 | mAP(baseline: 76.2%) | 模型大小(baseline: 94MB) |
---|---|---|
知识蒸馏(ResNet34-YOLOv3) | +2.8% | - |
剪裁 FLOPs -52.88% | +1.4% | -67.76% |
知识蒸馏(ResNet34-YOLOv3)+剪裁(FLOPs-69.57%) | +2.6% | -67.00% |
压缩方法 | mAP(baseline: 29.3%) | 模型大小 |
---|---|---|
知识蒸馏(ResNet34-YOLOv3) | +2.1% | - |
知识蒸馏(ResNet34-YOLOv3)+剪裁(FLOPs-67.56%) | -0.3% | -66.90% |
数据:ImageNet2012; 模型:MobileNetV2
硬件环境 | 推理耗时 | Top1准确率(baseline:71.90%) |
---|---|---|
RK3288 | -23% | +0.07% |
Android cellphone | -20% | +0.16% |
iPhone 6s | -17% | +0.32% |
本项目的发布受Apache 2.0 license许可认证。
我们非常欢迎你可以为PaddleSlim提供代码,也十分感谢你的反馈。