s2s learning as beam-search optimization

这周自己做的水报
16年的文章,感觉好像应用的并不多
然后文章里的loss缺陷也很明显..约束不足,感觉只适合微调
最近真的好忙啊…
争取下几周能搞点质量高的
反正先发上来

这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述