美剧《硅谷》深度学习APP获艾美奖提名:使用TensorFlow和GPU开发(11)

  • 没有使用SELU

    。我们简单做了个调查,iOS和Android版本之间使用SELU导致结果与PELU非常相似。我们怀疑SELU不应该作为激活函数被单独使用,而是正如其论文的标题所暗示的那样,作为狭义(narrowly-defined)SNN架构的一部分。

  • 使用ELU维持BN

    。有许多迹象表明BN应该是不必要的,但是,在没有BN的情况下运行的每个实验都完全无法收敛。这可能是由于架构很小造成的。

  • 在激活之前使用了BN

    。虽然现在关于这一点有所争议,但他们的小型网络在激活后做BN的实验也未能收敛。

  • 为了优化网络,使用了Cyclical Learning Rates和Brad Kenstler的Keras实现。