京东-优惠雷达
新人页面
精选商品
首月0月租体验,领12个月京东PLUS
自营热卖

创新实训总结 2019-4-7

落叶漂鸿 1年前   阅读数 110 0
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_44633882/article/details/89075627

创新实训总结 2019-4-1 ~ 2019-4-7

本篇用于记录街景翻译APP的开发过程,我在团队中负责的是文字检测部分。

本周完成的部分

  • 模型训练部分demo完成 70%
  • 模型使用部分demo完成 70%(文本行合并算法未完成)

效果

  • 图片训练集数据:3421张图片和对应标签

  • batch大小设置为1,训练了45500个batch

  • 学习率: 0.000010

  • model loss 0.0693, total loss 0.3127, 0.05s一张图片

模型识别图片效果

可以看出来,模型中右上角有误识别,左下角也有。

再看几张!

总结

我实现的比较简单,在loss和梯度下降上都只是简单的使用,得到的loss值开始就是1.几,训练了45000个batch之后降到了0.4左右,但由于batch大小为1,哦,这其实不算批训练。loss的波动很大。之后考虑在loss和梯度下降等细节上完善完善。
这里的学习率我也固定了,但在我参考的代码里,学习率是随着训练也进行优化的。

现在的模型我会保存下来,然后等加入了文本行合并算法之后,看看框框会变成什么样。
本周总结完成。


注意:本文归作者所有,未经作者允许,不得转载

全部评论: 0

    我有话说: