-
训练集损失曲线
![训练集损失曲线](images/Screenshot from 2019-10-05 17-23-44.png)
如上图所示,研究曲线后发现,模型在训练前期过早收敛,后期收敛缓慢,因而认为学习率可能过大。
-
验证集损失曲线和dice曲线
![验证集损失曲线](images/Screenshot from 2019-10-05 17-24-09.png)
![验证集DICE](images/Screenshot from 2019-10-05 17-24-01.png)
观察损失曲线和dice曲线,可以发现:
- 学习率有点高
- 验证集的指标仍在上升
0.89005
设备:LZD
- 降低学习率,1e-4
- 多跑几个epoch,75
-
训练集损失曲线
![](images/Screenshot from 2019-10-05 17-47-24.png)
训练前期,曲线下降过快,后期缓慢,掉入局部最小点。
-
验证集损失曲线和Dice曲线
![](images/Screenshot from 2019-10-05 17-47-55.png)
![](images/Screenshot from 2019-10-05 17-47-37.png)
验证集曲线比较正常。
0.90092
设备:MXQ
- 降低学习率,1e-4
- 增加训练epoch,70 epoch
-
训练集损失曲线
![](images/Screenshot from 2019-10-05 18-19-45.png)
由于batch_size比较小的原因,模型的训练损失曲线很震荡,同时也有点过早收敛。
-
验证集损失曲线和Dice曲线
![](images/Screenshot from 2019-10-05 18-20-10.png)
![](images/Screenshot from 2019-10-05 18-19-54.png)
观察验证集的损失曲线,很容易发现发生了过拟合现象。
- TTA: 0.90268
- w/ TTA:0.90222
设备:HWP
需要解决batch_size过小和过拟合问题。
-
batch_size
- 使用GN(分组归一化)
- 用MXQ的设备
-
过拟合
- 早停,45个epoch
- 权重衰减,5e-4
-
稍微降低学习率
4e-4 -> 4e-5