中国投稿量第二,接收率却仅有13.2% ? 十张图带你读懂EMNLP 2020开幕式!

陈大鑫 AI科技评论 昨天

作者 | 陈大鑫

昨晚,EMNLP 2020在线上正式开幕啦!

作为国际语言学会(ACL)下属的 SIGDAT 小组主办的自然语言处理领域的顶级国际会议。EMNLP 每年举办一次,去年则与 IJCNLP 联合,在香港举办,今年由于疫情转为线上举办。

也许很多小伙伴昨晚错过了开幕式,不急,AI科技评论现带大家全方位读懂EMNLP 2020开幕式!


1

大会投稿数据一览
据EMNLP 2020大会程序联合主席,英国沃里克大学教授Yulan He介绍,EMNLP 2020大会共收到投稿3677份,其中有效投稿为3359份。
图注:Yulan He教授


论文投稿数据:

上图展示了2017年以来 EMNLP 论文投稿的情况,从上图数据不难看出,这几年来EMNLP的投稿量每年都在疯狂递增,相较于去年,今年的投稿量增加了了16%, 如果按照这个增长率,明年EMNLP的投稿量毫无疑问将会超过4000。

论文接收率:

上图展示了2017年以来EMNLP论文总接受率和长/短篇的接受率,一眼望去整体数据相差不多。

但从上图不难看出无论是总接收率(蓝色柱体)还是长篇(橙色柱体)或短篇(白色)论文的接受率,今年的接受率都是近四年以来最低。

本次EMNLP 2020在主会上共接受了752篇论文,其中长篇602篇、短篇150篇。

其中,长篇论文接受率为24.6%,和前几年相差不多,而短篇论文接受率却明显低于过去几年。
以国家为单位的论文投稿/接收率排名:

本次大会共有来自57个不同的国家的投稿,上图仅展示了论文投稿数量超过十篇的国家。
论文投稿数量的前七名国家分别是:
美国、中国、英国、德国、印度、加拿大、日本......
另外和去年一样,中美两国本次都有超过1000篇论文投稿,稳居世界前两名。
然而上图数据中,中美两国的论文接收率却不是前两名,反而是英国、新加坡和丹麦,这三个国家位居前列,拥有30%左右的接受率,而美国也有26.6%的接受率。
反观中国,论文接受率仅有13.2%,远低于大会的平均接收率。

2

更多数据

今年,EMNLP 2020带来了一项创新:“Findings of ACL: EMNLP 2020”。

这是一种新的接收论文类型,EMNLP表示,这将使更多高质量的论文(短篇和长篇)被接收。它用于刊登在主会上未被接收,但经过程序委员会评估为足够solid的工作,其实质、质量和新颖性有足够保证。这些论文将作为ACL选集的一部分被收录。

AI科技评论曾对Findings做过详细介绍,感兴趣的读者可以移步EMNLP 2020 录取结果已出,听说你中的是Findings?一文。

主会和Findings对比数据:

上图展示了主会和《Findings》接受论文的平均评审得分。

可以看出,大多数主会论文有超过3.67的平均评审得分,平均分超过3.5的论文有很大的概率被主会接收。
而论文平均分在3.17-3.5之间的论文更有可能被《Findings》接收。
大会论文主题分类数据:
今年的投稿被大会分为20个主题,其中有8类主题都收到了超过200篇投稿。
NLP机器学习NLP应用最多,有超过300篇投稿,机器翻译、信息抽取、对话系统、语言生成和句级语义分析随后,也都超过了20篇。
另外在今年,NLP可解释性和模型分析主题的投稿数量有显著上升,这是ACL2020新引入的主题,ACL2020共收到95篇论文投稿。这一数字在EMNLP 2020上翻了倍,这展现了社区对NLP可解释性和模型分析这一主题上的兴趣增长十分迅速。
主会上所以主题的接收率都超过了20%,可解释性和模型分析这一主题的接受率有27%,小的主题如语音学、形态学和字词分割、句法学、词汇语义学和语言理论也有超过27%的接受率。

3

审稿过程
图注:Trevor Cohn
在大会程序联合主席Yulan He之后,本次大会的另一程序主席,墨尔本大学教授Trevor Cohn介绍了本次会议的审稿过程。
本次评审会有超过3000名成员,评审工作按照分级结构开展:
大会要求所有论文至少提名一位作者作为审稿人,并把他们分入不同的研究领域。
对每位审稿人也使用他们的学术资料数据来抓取他们的论文/出版物记录,以识别出更多的高级审稿人。
审稿人发表论文的情况:

上图显示了每位审稿人过去出版物的数量,与ICLR 2019将近一半的审稿人没有在相应领域发过论文的事实相比,EMNLP 2020的审稿人情况似乎要好很多。
Findings:

被《Findings》接收的论文会在workshop展示,为了检验《Findings》这一创新是否成功,组委会在超过100篇的Findings投稿中询问作者是否要撤回稿件,最后,有86%的作者并没有选择撤回。


4

中国/华人高产学者

AI科技评论不完全统计,达摩院自然语言智能实验室邴立东博士团队Salesforce AI的 Xiong Caiming 团队在本年度EMNLP大会上有9篇论文入选主会,成为全球入选主会论文最多的作者。

与此同时,清华大学刘知远团队有8篇论文入选主会,哈工大刘挺教授团队有7篇主会论文入选,韩家炜教授、周明教授、黄萱菁教授团队各自有6篇论文入选。

以下AI科技评论对这几位学者本次EMNLP 2020 论文录取情况做简单介绍。

达摩院邴立东

邴立东博士目前在达摩院自然语言智能实验室,他于香港中文大学获得博士学位,曾是卡耐基梅隆大学机器学习博士后研究员。他的研究兴趣包括低资源自然语言处理、情感分析、文本生成/摘要、信息提取、知识库等。

个人主页:https://lidongbing.github.io/

以下是邴立东博士团队所有主会录取论文:

1、《ENT-DESC: Entity Description Generation by Exploring Knowledge Graph》Liying Cheng, Dekun Wu, Lidong Bing, Yan Zhang, Zhanming Jie, Wei Lu and Luo Si.


2、《APE: Argument Pair Extraction from Peer Review and Rebuttal via Multi-task Learning》Liying Cheng, Lidong Bing, Qian Yu, Wei Lu and Luo Si.

3、《DAGA: Data Augmentation with a Generation Approach forLow-resource Tagging Tasks》 BOSHENG DING, Linlin Liu, Lidong Bing, Canasai Kruengkrai, Thien Hai Nguyen, Shafiq Joty, Luo Si and Chunyan Miao.

4、《Lightweight, Dynamic Graph Convolutional Networks for AMR-to-Text Generation》Yan Zhang, Zhijiang Guo, Zhiyang Teng, Wei Lu, Shay B. Cohen, ZUOZHU LIU and Lidong Bing.

5、《Feature Adaptation of Pre-Trained Language Models across Languages and Domains with Robust Self-Training》Hai Ye, Qingyu Tan, Ruidan He, Juntao Li, Hwee Tou Ng and Lidong Bing.

6、《Partially-Aligned Data-to-Text Generation with Distant Supervision》Zihao Fu, Bei Shi, Wai Lam, Lidong Bing and Zhiyuan Liu.

7、《Position-Aware Tagging for Aspect Sentiment Triplet Extraction》Lu Xu, Hao Li, Wei Lu and Lidong Bing.

8、《An Unsupervised Sentence Embedding Method by Mutual Information Maximization》Yan Zhang, Ruidan He, ZUOZHU LIU, Kwan Hui Lim and Lidong Bing.

9、《Aspect Sentiment Classification with Aspect-Specific Opinion Spans    Lu Xu, Lidong Bing, Wei Lu and Fei Huang》 Lu Xu, Lidong Bing, Wei Lu and Fei Huang.


清华大学刘知远

刘知远,清华大学计算机科学与技术系长聘副教授。他分别于2006年和2011年从清华大学计算机科学与技术系获得工学学士学位和博士学位。他的研究兴趣包括自然语言处理与社会计算。他已经在国际期刊与会议上发表了超过90篇论文,包括ACM Transactions、IJCAI、AAAI、ACL和EMNLP等 。

个人主页:http://nlp.csai.tsinghua.edu.cn/~lzy/

以下是刘知远团队EMNLP 2020录取论文:

1、《Coreferential Reasoning Learning for Language Representation》Deming Ye, Yankai Lin, Jiaju Du, Zhenghao Liu, Peng Li, Maosong Sun and Zhiyuan Liu.

2、《Dynamic Anticipation and Completion for Multi-Hop Reasoning over Sparse Knowledge Graph》 

Xin Lv, Xu Han, Lei Hou, Juanzi Li, Zhiyuan Liu, Wei Zhang, YICHI ZHANG, Hao Kong and Suhui Wu.

3、《Learning from Context or Names? An Empirical Study on Neural Relation Extraction》Hao Peng, Tianyu Gao, Xu Han, Yankai Lin, Peng Li, Zhiyuan Liu, Maosong Sun and Jie Zhou.

4、《Exploring and Evaluating Attributes, Values, and Structures for Entity Alignment》Zhiyuan Liu, Yixin Cao, Liangming Pan, Juanzi Li, Zhiyuan Liu and Tat-Seng Chua.

5、《MAVEN: A Massive General Domain Event Detection Dataset》Xiaozhi Wang, Ziqi Wang, Xu Han, Wangyi Jiang, Rong Han, Zhiyuan Liu, Juanzi Li, Peng Li, Yankai Lin and Jie Zhou.

6、《Partially-Aligned Data-to-Text Generation with Distant Supervision》

 Zihao Fu, Bei Shi, Wai Lam, Lidong Bing and Zhiyuan Liu. 

7、《Train No Evil: Selective Masking for Task-Guided Pre-Training》Yuxian Gu, Zhengyan Zhang, Xiaozhi Wang, Zhiyuan Liu and Maosong Sun.

8、《Denoising Relation Extraction from Document-level Distant Supervision》Chaojun Xiao, Yuan Yao, Ruobing Xie, Xu Han, Zhiyuan Liu, Maosong Sun, Fen Lin and Leyu Lin.


Xiong Caiming
目前,Xiong Caiming是Salesforce AI的高级研究总监。2014年6月至2015年9月,他于加州大学洛杉矶分校(UCLA)担任博士后研究员。2014年他在纽约州立大学布法罗分校计算机科学与工程系获得博士学位(由Jason J. Corso教授指导)。他分别于2005年和2007年在华中科技大学获得计算机科学学士学位和硕士学位。
个人主页:http://cmxiong.com/
以下是Xiong Caiming团队EMNLP 2020录取论文:

1、《VD-BERT: A Unified Vision and Dialog Transformer with BERT》 作者:Yue Wang, Shafiq Joty, Michael Lyu, Irwin King, Caiming Xiong and Steven C.H. Hoi.

2、《TOD-BERT: Pre-trained Natural Language Understanding for Task-Oriented Dialogue》. 作者:Chien-Sheng Wu, Steven C.H. Hoi, Richard Socher and Caiming Xiong.

3、《Discern: Discourse-Aware Entailment Reasoning Network for Conversational Machine Reading》. 作者:Yifan Gao, Chien-Sheng Wu, Jingjing Li, Shafiq Joty, Steven C.H. Hoi, Caiming Xiong, Irwin King and Michael Lyu.

4、《Probing Task-Oriented Dialogue Representation from Language Models》. 作者:Chien-Sheng Wu and Caiming Xiong.

5、《Universal Natural Language Processing with Limited Annotations: Try Few-shot Textual Entailment as a Start》. 作者:Wenpeng Yin, Nazneen Fatema Rajani, Dragomir Radev, Richard Socher and Caiming Xiong.

6、《Evaluating the Factual Consistency of Abstractive Text Summarization》. 作者:Wojciech Kryscinski, Bryan McCann, Caiming Xiong and Richard Socher.

7、《Discriminative Nearest Neighbor Few-Shot Intent Detection by Transferring Natural Language Inference》. 作者:Jianguo Zhang, Kazuma Hashimoto, Wenhao Liu, Chien-Sheng Wu, Yao Wan, Philip Yu, Richard Socher and Caiming Xiong.

8、《The Thieves on Sesame Street are Polyglots - Extracting Multilingual Models from Monolingual APIs》.作者:Nitish Shirish Keskar, Bryan McCann, Caiming Xiong and Richard Socher.

9、《Simple Data Augmentation with the Mask Token Improves Domain Adaptation for Dialog Act Tagging》.作者:Semih Yavuz, Kazuma Hashimoto, Wenhao Liu, Nitish Shirish Keskar, Richard Socher and Caiming Xiong.


哈工大刘挺

刘挺,哈尔滨工业大学教授,现任哈工大计算学部主任兼计算机学院院长,国家“万人计划”科技创新领军人才 。中国计算机学会理事,中国中文信息学会常务理事/社会媒体处理专委会(SMP)主任 ,曾任国际顶级会议ACL、EMNLP领域主席。

主要研究方向为人工智能自然语言处理和社会计算。2012-2017年在自然语言处理领域顶级会议发表的论文数量列世界第8位(据剑桥大学统计)。

以下是刘挺团队本次EMNLP 2020主会录取论文:

1、《Discourse Self-Attention for Discourse Element Identification in Argumentative Student Essays》. Wei Song, Ziyao Song, Ruiji Fu, Lizhen Liu, Miaomiao Cheng and Ting Liu.

2、《Profile Consistency Identification for Open-domain Dialogue Agents》. Haoyu Song, Yan Wang, Wei-Nan Zhang, Zhengyu Zhao, Ting Liu and Xiaojiang Liu.

3、《Recall and Learn: Fine-tuning Deep Pretrained Language Models with Less Forgetting》. Sanyuan Chen, Yutai Hou, Yiming Cui, Wanxiang Che, Ting Liu and Xiangzhan Yu.

4、《Counterfactual Off-Policy Training for Neural Dialogue Generation》. Qingfu Zhu, Wei-Nan Zhang, Ting Liu and William Yang Wang.

5、《Combining Self-Training and Self-Supervised Learning for Unsupervised Disfluency Detection》. Shaolei Wang, Zhongyuan Wang, Wanxiang Che and Ting Liu.

6、《Multi-Stage Pre-training for Automated Chinese Essay Scoring》. Wei Song, Kai Zhang, Ruiji Fu, Lizhen Liu, Ting Liu and Miaomiao Cheng.

7、《Is Graph Structure Necessary for Multi-hop Question Answering?》. Nan Shao, Yiming Cui, Ting Liu, Shijin Wang and Guoping Hu.


伊利诺伊大学韩家炜


韩家炜,美国伊利诺伊大学香槟分校计算机系教授,IEEE和ACM院士,美国信息网络学术研究中心主任。曾担任KDD、SDM和ICDM等国际知名会议的程序委员会主席,创办了ACM TKDD学报并任主编。在数据挖掘、数据库和信息网络领域发表论文600余篇,在数据挖掘领域具有极高的威望。

个人主页:http://hanj.cs.illinois.edu/

以下是韩家炜团队本次EMNLP 2020主会录取论文:


1、《Multi-document Summarization with Maximal Marginal Relevance-guided Reinforcement Learning》

. Yuning Mao, Yanru Qu, Yiqing Xie, Xiang Ren and Jiawei Han.


2、《Near-imperceptible Neural Linguistic Steganography via Self-Adjusting Arithmetic Coding》

. Jiaming Shen, Heng Ji and Jiawei Han.


3、《SynSetExpan: An Iterative Framework for Joint Entity Set Expansion and Synonym Discovery》.

 Jiaming Shen, Wenda Qiu, Jingbo Shang, Michelle Vanni, Xiang Ren and Jiawei Han.


4、《Understanding the Difficulty of Training Transformers》

. Liyuan Liu, Xiaodong Liu, Jianfeng Gao, Weizhu Chen and Jiawei Han.


5、《Text Classification Using Label Names Only: A Language Model Self-Training Approach》

. Yu Meng, Yunyi Zhang, Jiaxin Huang, Chenyan Xiong, Heng Ji, Chao Zhang and Jiawei Han.


6、《Weakly-Supervised Aspect-Based Sentiment Analysis via Joint Aspect-Sentiment Topic Embedding》

. Jiaxin Huang, Yu Meng, Fang Guo, Heng Ji and Jiawei Han



微软亚洲研究院周明


周明,微软亚洲研究院副院长、国际计算语言学协会(ACL)主席、中国计算机学会理事、中文信息技术专委会主任、术语工作委员会主任、中国中文信息学会常务理事、哈尔滨工业大学、天津大学、南开大学、山东大学等多所学校博士导师。

个人主页:https://www.microsoft.com/en-us/research/people/mingzhou/

以下是周明团队本次EMNLP 2020主会录取论文:


1、《Pre-training for Abstractive Document Summarization by Reinstating Source Text》

. Yanyan Zou, Xingxing Zhang, Wei Lu, Furu Wei and Ming Zhou.


2、《Neural Deepfake Detection with Factual Structure of Text》.

 Wanjun Zhong, Duyu Tang, Zenan Xu, Ruize Wang, Nan Duan, Ming Zhou, Jiahai Wang and Jian Yin.


3、《Tell Me How to Ask Again: Question Data Augmentation with Controllable Rewriting in Continuous Space》

. Dayiheng Liu, Yeyun Gong, Jie Fu, Yu Yan, Jiusheng Chen, Jiancheng Lv, Nan Duan and Ming Zhou.


4、《Leveraging Declarative Knowledge in Text and First-Order Logic for Fine-Grained Propaganda Detection》

. Ruize Wang, Duyu Tang, Nan Duan, Wanjun Zhong, Zhongyu Wei, Xuanjing Huang, Daxin Jiang and Ming Zhou.


5、《BERT-of-Theseus: Compressing BERT by Progressive Module Replacing》.

 Canwen Xu, Wangchunshu Zhou, Tao Ge, Furu Wei and Ming Zhou.


Short Papers

6、《Improving the Efficiency of Grammatical Error Correction with Erroneous Span Detection and Correction》

Mengyun Chen, Tao Ge, Xingxing Zhang, Furu Wei and Ming Zhou.



黄萱菁


黄萱菁,复旦大学计算机科学学院教授,2008年至2009年,UMass Amherst CIIR的访问学者。她的研究兴趣包括自然语言处理、信息检索、人工智能深度学习等。她在顶级会议上发表了数十篇论文,包括SIGIR、ACL、ICML、IJCAI、AAAI、CIKM、ISWC、EMNLP、WSDM和COLING。她曾担任NLPCC 2017、CCL 2016、SMP 2015和SMP 2014的PC联合主席......

谷歌学术主页:https://scholar.google.com/citations?user=RGsMgZA4H78C&hl=en

以下是黄萱菁团队本次EMNLP 2020主会录取论文:

1、《Tasty Burgers, Soggy Fries: Probing Aspect Robustness in Aspect-Based Sentiment Analysis》.

 Xiaoyu Xing, Zhijing Jin, Di Jin, Bingning Wang, Qi Zhang and Xuanjing Huang.


2、《A Knowledge-Aware Sequence-to-Tree Network for Math Word Problem Solving》. 

Qinzhuo Wu, Qi Zhang, Jinlan Fu and Xuanjing Huang.


3、《Uncertainty-Aware Label Refinement for Sequence Labeling》. 

Tao Gui, Jiacheng Ye, Qi Zhang, Zhengyan Li, Zichu Fei, Yeyun Gong and Xuanjing Huang.


4、《Leveraging Declarative Knowledge in Text and First-Order Logic for Fine-Grained Propaganda Detection》

. Ruize Wang, Duyu Tang, Nan Duan, Wanjun Zhong, Zhongyu Wei, Xuanjing Huang, Daxin Jiang and Ming Zhou.


5、《PathQG: Neural Question Generation from Facts》

. Siyuan Wang, Zhongyu Wei, Zhihao Fan, Zengfeng Huang, Weijian Sun, Qi ZHANG and Xuanjing Huang.


6、《RethinkCWS: Is Chinese Word Segmentation a Solved Task?》

. Jinlan Fu, Pengfei Liu, Qi Zhang and Xuanjing Huang.




最后,AI科技评论祝中国学者在EMNLP 2020最佳论文上获得好的成绩~




点击阅读原文,直达EMNLP小组!