简介

PaddleSlim是一个专注于深度学习模型压缩的工具库，提供剪裁、量化、蒸馏、和模型结构搜索等模型压缩策略，帮助用户快速实现模型的小型化。

版本对齐

PaddleSlim	PaddlePaddle	PaddleLite	备注
1.0.1	<=1.7	2.7	支持静态图
1.1.1	1.8	2.7	支持静态图
1.2.0	2.0Beta/RC	2.8	支持静态图
2.0.0	2.0	2.8	支持动态图和静态图

PaddleSlim支持以下功能，也支持自定义量化、裁剪等功能。

Quantization	Pruning	NAS	Distilling
QAT PACT PTQ-Static PTQ-Dynamic Embedding Quant	SensitivityPruner FPGMFilterPruner L1NormFilterPruner L2NormFilterPruner SlimFilterPruner OptSlimFilterPruner	Simulate Anneal based NAS Reinforcement Learning based NAS DARTS PC-DARTS *Once-for-All Hardware-aware Search	FSP DML *DK for YOLOv3

注：*表示仅支持静态图，**表示仅支持动态图

PaddleSlim在典型视觉和自然语言处理任务上做了模型压缩，并且测试了Nvidia GPU、ARM等设备上的加速情况，这里展示部分模型的压缩效果，详细方案可以参考下面CV和NLP模型压缩方案:

表1: 部分模型压缩加速情况

注:

本项目的发布受Apache 2.0 license许可认证。