接上一篇描述RNN网络说道gradient vanish的问题,要解决这个问题,那么gru/lstm是解决其问…
我们假设我们有两个相关的任务A和B,依赖一个共享的隐藏层表示F。 1、Implicit data augmen…