最近一直在搞video qa
这是一个比较新的方向,论文总共找到不到三篇,天池的视频问答比赛似乎也是全球第一届
大家都是新手,一起开荒
前天和鹏哥聊着聊着看他有啥想法 .
最后聊到trick和创新度的问题
鹏哥说一篇好的论文不能缺少创新度,纯堆trick是不行的
我同意,但是,究竟哪些是创新点那些算trick呢
我做的六七个上分的大工作里排除已有的工作
私以为我的工作里并没有啥trick
或许我对trick的理解不大一样吧
如果在不太严格的条件下具有一定解释性的trick算不算创新点呢
我觉得算的
我认为的trick都是一些magic的leak
这些leak对实际意义起不到任何用处,但他就是能上分.
一些不具备通用性的调参技巧也算trick
现在大部分论文都靠搜索模型再加后向解释水了一个又一个会议
很难看到除模型之外的地方
2017 VQA Challenge 冠军的比赛报告是我比较喜欢的一篇文章
https://arxiv.org/pdf/1708.02711.pdf
除模型之外我个人认为的创新点有
- 涉及到了zero-shot思想的初始化
- 检测模型做 hard attention
- 先进的采样算法
还有一些就是模型中的不具备通用性的trick了
例如特定情况下适用的激活函数
聊到最后
其实我就是认为不管你学不学习,只要不作弊考到好分数都是好学生
trick具备通用性且后向解释能解释的通就好
通用性是前提,解释性可以稍稍靠后