基于Paddle复现

1. 论文简介

论文名称：Polarized Self-Attention: Towards High-quality Pixel-wise Regression

作者基于OCRNet_msacle-HRNetV2_W48设计了两种新的通道注意力和空间注意力模块：顺序模块和并行模块，并应用于HRNet的Basic模块上，使用train+val进行训练，使得结果在Cityscapes验证集上达到了SOTA精度，miou精度分别达到了86.7和86.9。本项目使用Paddle复现了并行模块，并且在Cityscapes val set上达到了miou=87.15的精度。

2.复现精度

注意：本文复现环境是在baiduaistudio上的notebook环境，所以有些配置参数也是基于notebook环境的。如果想完全跑通该repo在其他环境下也可自行更改一些路径配置，比较简单此处不在啰嗦。

在Cityscapes的测试集的测试效果如下表,达到验收指标，miou=87.15 满足精度要求 miou=86.7，为了使工作更具有规范性，本项目提供了使用train训练，val验证，得到的miou=84.66的模型。

模型名称	数据集	论文精度（miou）	复现精度（miou）	预训练模型	log
OCRNet-HRNet+psa	Cityscapes(train+val训练，val验证)	86.7	84.66	Mappilary训练200个epoch	train.log

本论文是基于NVIDIA的OCRNet_msacle-HRNetV2_W48模型，预训练模型同样来源于OCRNet_msacle-HRNetV2_W48模型的预训练模型——在Mappilary数据集上训练200个epoch得到的模型，并将Pytorch的.pth文件转化为Paddle的.pdparams文件
上面表格中预训练模型给到的链接是我已经处理好的预训练文件pretrained.pdparams，下载以后放到的位置见第6部分代码详细结构说明
精度和loss可以在train.log中看到训练的详细过程

3.环境依赖

硬件：Tesla V100 x 4
框架：PaddlePaddle == 2.2.2

4.数据集介绍

Cityscapes数据集拥有5000张在城市环境中驾驶场景的图像，它具有19个类别的密集像素标注（97％coverage），其中8个具有实例级分割，一共包含5000张图片，训练集、验证集和测试集分别有2975、500和1525张图片。
运行代码时数据集放置的位置及结构，见第6部分代码详细结构说明。

5. 快速开始

克隆本项目

git clone https://github.com/marshall-dteach/psanet-main.git
cd psanet-main

安装第三方库

pip install -r requirements.txt

训练模型

单卡训练

python train.py --config configs/psanet/psa_hrnetv2_psa_cityscapes_1024x2048_150k.yml --do_eval --save_interval 3000 --save_dir output --log_iters 100 --precision fp16

多卡训练

python -m paddle.distributed.launch train.py --config configs/psanet/psa_hrnetv2_psa_cityscapes_1024x2048_150k.yml --do_eval --save_interval 3000 --save_dir output --log_iters 100 --precision fp16

验证模型

python val.py --config configs/psanet/psa_hrnetv2_psa_cityscapes_1024x2048_150k.yml --model_path output/best_model/model.pdparams

备注：model_path 可以根据自己保存模型的位置自定义

TIPC

bash test_tipc/prepare.sh ./test_tipc/configs/psanet/train_infer_python.txt 'lite_train_lite_infer'
bash test_tipc/test_train_inference_python.sh ./test_tipc/configs/psanet/train_infer_python.txt 'lite_train_lite_infer'

动态推理图

比较模型预测与ground truth

6. 代码详细结构说明

PaddleSeg
├── configs         # My model configuration stays here.  
├── test_tipc       # test_tipc stays here.
├── deploy          # deploy related doc and script.
├── data            # the dataset is here
│    └── cityscapes
│        ├── leftImg8bit
│        │   ├── train
│        │   └── val
│        └── gtFine
│            ├── train
│            └── val
├── paddlelseg  
│   ├── core        # the core training, val and test file.
│   ├── datasets  
│   ├── models      # my model is here
│   ├── transforms  # the online data transforms
│   └── utils       # all kinds of utility files
├── pretrained
│   ├── pretrained.pdparams  # the pre-train model is here
├── export.py
├── tools           # Data preprocess including fetch data, process it and split into training and validation set
├── train.py
├── val.py
|—— predict.py

7.模型信息

信息	描述
模型名称	OCRNet-HRNet+psa
框架版本	PaddlePaddle==2.2.2

8. 说明

感谢百度提供的算力，以及举办的本场比赛，让我增强对paddle的熟练度，加深对模型的理解！

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
README.assets		README.assets
configs/psanet		configs/psanet
deploy		deploy
images		images
log		log
paddleseg		paddleseg
test_tipc		test_tipc
tests		tests
tools		tools
.copyright.hook		.copyright.hook
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.style.yapf		.style.yapf
.travis.yml		.travis.yml
LICENSE		LICENSE
README.md		README.md
export.py		export.py
predict.py		predict.py
requirements.txt		requirements.txt
setup.py		setup.py
train.py		train.py
val.py		val.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

基于Paddle复现

1. 论文简介

2.复现精度

3.环境依赖

4.数据集介绍

5. 快速开始

克隆本项目

安装第三方库

训练模型

单卡训练

多卡训练

验证模型

TIPC

动态推理图

6. 代码详细结构说明

7.模型信息

8. 说明

About

Releases

Packages

Languages

License

marshall-dteach/MscaleOCRNet-HRNet_w48-psa-main

Folders and files

Latest commit

History

Repository files navigation

基于Paddle复现

1. 论文简介

2.复现精度

3.环境依赖

4.数据集介绍

5. 快速开始

克隆本项目

安装第三方库

训练模型

单卡训练

多卡训练

验证模型

TIPC

动态推理图

6. 代码详细结构说明

7.模型信息

8. 说明

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages