【云从科技&上海交大的跨模态技术成果：探索多层关系的REMNLP 2021

按关键词阅读：

文章插图

6.可视化结果

最后，研究者们还通过可视化的例子展现了模型的能力。
云从科技&上海交大的跨模态技术成果：探索多层关系的REMNLP 2021 | 研究者们

文章插图

结论

针对基于语言查询的视频片段定位这个任务，云从-上交的联合研究团队提出了，将视频片段定位类比为自然语言处理中的多项选择阅读理解，同时建模了视频片段-句子层面和视频片段-单词层面的关系，并且提出了一种稀疏连接的图网络高效地建模了不同视频片段之间的关系，在公开数据集上取得了SOTA表现。
更多的技术细节请参考[RaNet: arxiv paper](https://arxiv.org/abs/2110.05717)。

参考文献

[1] Songyang Zhang, Houwen Peng, Jianlong Fu, and Jiebo Luo. 2020b. Learning 2d temporal adjacent networks for moment localization with natural language.In Proceedings of the AAAI Conference on Artificial Intelligence, volume 34, pages 12870–12877.

[2] Mengmeng Xu, Chen Zhao, David S. Rojas, Ali Thabet, and Bernard Ghanem. 2020. G-tad: Sub-graph localization for temporal action detection. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

[3] Zilong Huang, Xinggang Wang, Lichao Huang, Chang Huang, Yunchao Wei, and Wenyu Liu. 2019. Ccnet: Criss-cross attention for semantic segmentation. In

2019 IEEE/CVF International Conference on Computer Vision (ICCV), pages 603–612.

文章插图

雷锋网

稿源：(雷锋网)

【傻大方】网址：http://www.shadafang.com/c/11159612A2021.html

标题：云从科技&上海交大的跨模态技术成果：探索多层关系的REMNLP 2021 | 研究者们( 三 )

傻大方

云从科技&上海交大的跨模态技术成果：探索多层关系的REMNLP 2021 | 研究者们( 三 )

研究所|拒绝赛博朋克：斯坦福HAI报告警示“科技巨头垄断AI研究已成威胁”，力挺「国家安全云」计划

云从科技&上海交大的跨模态技术成果：探索多层关系的REMNLP 2021 | 研究者们

双十一|汽车圈的双十一，为何热不起来？

漫画|日漫《转生成为史莱姆》竟然还有“社畜”版，你别说还挺好看的

灵感|国外艺术家灵感爆发，将流行文化角色绘成日漫画风，这画风爱了

我妻善逸|鬼灭之刃十大呼吸法排名，第一毋庸置疑，水之呼吸居然排不上前五

游戏|《鬼灭之刃：火之神血风谭》全新游戏截图公开

同人|伽古拉的3款奥特曼形态，月牙元素被保留，还是黑田笔下的最优质

乔巴|海贼王981话：尾田公然开车，连兔子都不放过，娜美罕见正经一回

读书|孩子，我不欠你的吃不吃读书苦，决定你以后靠脑子还是靠力气吃饭