KDD最佳论文:中国拿下Research Track最佳学生论文

kdd 2018,中科大、苏州大学与微软合作的《小冰乐队》获得了research track最佳学生论文。清华大学的唐杰和uic的刘兵教授分别获得杰出共享奖和创新奖。除了论文接收和参会的华人数量,本届大会组委会中也出现更多中国学者的名字。新智元第一时间带来kdd18 会议亮点报道。
又是一年kdd。
这个知识挖掘和数据决策领域全球最顶级的学术盛会,也差不多成了华人在伦敦的聚会。
据统计,今年kdd接收的所有近300篇论文中,华人/中国人作者的有189篇,占比64.5%。
最关键的会议组织管理者层面,在kdd 2018组委会的55人中,华人/中国人有20人,占比约36%。其中,大会主席之一是帝国理工学院的yike guo(郭毅可),而大会副主席则是清华大学副教授唐杰。在主委会其他成员中,也见到了大批的中国人/华人的名字,这比论文接收更能体现着中国的学术影响力。
人物奖项:清华唐杰获得杰出贡献奖,
清华大学的唐杰副教授获得了本次kdd 杰出贡献奖。
最受关注的另一个奖项——kdd 2018创新大奖得主不是别人,正是新智元采访过的acm、aaai & ieee 三院会士(fellow)、伊利诺伊大学计算机科学教授刘兵。
最佳论文:中国拿下research track最佳学生论文
那么,话不多说,首先来看最佳论文。
research track 最佳论文
adversarial attacks on classification models for graphs
对图分类模型的对抗性攻击
论文地址:https://arxiv.org/abs/1805.07984
作者:daniel zügner (technical university of munich); amir akbarnejad (technical university of munich); stephan günnemann (technical university of munich)
摘要:图深度学习模型在节点分类任务中取得了很好的性能。尽管图深度学习模型越来越多,但目前还没有研究探索它们对对抗性攻击的鲁棒性。然而,在可能使用它们的领域中,例如网络,对抗是很常见的。
图深度学习模型是否很容易被愚弄呢?在这项工作中,我们介绍了第一个针对属性图( attributed graphs)的对抗性攻击的研究,特别关注利用图卷积思想的模型。除了测试时的攻击外,我们还研究了更具有挑战性的中毒/诱发攻击,这些攻击集中在机器学习模型的训练阶段。我们针对节点的特征和图结构生成对抗性扰动,从而获取实例之间的依赖关系。此外,我们通过保留重要的数据特征来确保这些扰动不会被察觉。
为了解决底层离散域问题,我们提出一种利用增量计算的有效算法 nettack。我们的实验研究表明,即使只进行少量的扰动,节点分类的准确率也会显著下降。更重要的是,我们的攻击是可迁移的:学习的攻击可以推广到其他最先进的节点分类模型和无监督方法,即使只给出很少的关于图的知识,也同样能成功。
图1:对图结构和节点特征的小小扰动导致目标的分类错误。
research track 最佳学生论文
xiaoice band: a melody and arrangement generation framework for pop music
小冰乐队:流行音乐的旋律与编曲框架
论文地址:http://www.kdd.org/kdd2018/accepted-papers/view/xiaoice-banda-melody-and-arrangement-generation-framework-for-pop-music
作者:hongyuan zhu (ustc); qi liu (ustc); nicholas jing yuan (microsoft); chuan qin (ustc); jiawei li (soochow university); kun zhang (ustc); guang zhou (microsoft); furu wei (microsoft); yuanchun xu (microsoft); enhong chen (ustc)
摘要:随着音乐创作知识的发展和近年来需求的增加,越来越多的公司和研究机构开始研究音乐的自动生成。但以往的模型在应用于歌曲生成时存在局限性,这既需要旋律,又需要编曲。此外,许多与歌曲质量有关的关键因素没有得到很好的解决,例如和弦进行和节奏模式。特别是。如何确保多音轨音乐的和谐,这仍然是一个有待探索的问题。
为此,我们对流行音乐的自动生成进行了重点研究,其中,我们考虑了旋律生成的和弦和节奏的影响,以及音乐编排的和声。我们提出了一种端到端的旋律和编曲生成框架,称为“小冰乐队”(xiaoice band),该框架产生了由几种乐器演奏的几个伴奏曲目组成的旋律音轨。
具体来说,我们设计了一种基于和弦的节奏和旋律交叉生成模型(crmcg),以生成带有和弦进行的旋律。然后,我们提出一种基于多任务学习的多乐器协同编曲模型( multi-instrument co-arrangement model ,mica)。最后,我们在一个真实数据集上进行了广泛的实验,结果证明了xiaoice band的有效性。
research track 论文图示,接收率仅18.4%
ads track 最佳论文
real-time personalization using embeddings for search ranking at airbnb
在airbnb上使用嵌入搜索排名的实时个性化
论文地址:http://www.kdd.org/kdd2018/accepted-papers/view/real-time-personalization-using-embeddings-for-search-ranking-at-airbnb
作者:mihajlo grbovic (airbnb); haibin cheng (airbnb)
摘要:搜索排名和推荐是主要互联网公司关注的基本问题,包括网络搜索引擎、内容发布网站和市场。然而,尽管有一些共同的特征,但这个领域并不存在一刀切的解决方案。由于需要进行排名、个性化和推荐的内容存在很大差异,每个市场都有一些独特的挑战。
airbnb是一个短期租赁市场,它的搜索和推荐问题也是非常独特的。它是一个双边市场,同时需要优化房东的偏好和客户的偏好;用户很少两次预定同一个房间,另一方面,一个房间在特定的日期只能接受一个客人的预定。
在这篇论文中,我们描述了一种列表和用户嵌入(listing and user embedding)技术,其目的是实现搜索排名和相似项目推荐的实时个性化。这两个channel可以驱动99%的转换。嵌入模式是专门为airbnb市场定制的,能够捕捉客户的短期和长期利益,提供有效的房间推荐。我们对嵌入模型进行了严格的离线测试,然后进行了成功的在线测试,最后将其完全部署到生产环境中。
ads track 最佳学生论文
activeremediation: the search for lead pipes in flint, michigan
activeremediation:在密歇根州弗林特寻找铅制水管
论文链接:http://www.kdd.org/kdd2018/accepted-papers/view/activeremediation-the-search-for-lead-pipes-in-flint-michigan
作者:jacob abernethy (georgia institute of technology); alex chojnacki (university of michigan); arya farahi (university of michigan - ann arbor); eric schwartz (university of michigan); jared webb (brigham young university)
摘要:在这篇论文中,我们详细介绍了在密歇根州弗林特市正在进行的探测铅和其他有害金属管道的工作。在居民饮用水中检测到铅含量升高后,随后该地区发生儿童血铅含量上升事件,州和联邦政府下令投入超过1.25亿美元更换供水管道。
由于缺乏准确的记录,并且确定埋在地里的管道材料的成本很高,我们开发了一些预测和程序工具,以帮助搜索和清除铅制的基础设施。除了这些统计学和机器学习方法之外,我们还描述了我们与政府官员在建议对房屋进行检查和更换时的互动,重点是适应新信息的统计模型。最后,根据联邦政府增加基础设施建设支出的讨论,我们探讨了我们的方法可以如何推广到弗林特以外的其他城市。
最佳博士论文讲
经典论文奖
factorization meets the neighborhood: a multifaceted collaborative filtering model
中文:因式分解与最邻近:多方面协作过滤模型
作者:yehuda koren
机构:at&t labs – research
social impact research
1、training the next generation of african data scientists
作者:isaac markus,audrey cheng
机构:ibm research(非洲)及 the moringa school
奖金:30,120美元
2、budding data scientists hackathon
作者:hui xiang chua
机构:新加坡华侨中学(hwa chong institution)
奖金:20,500美元
3、data science for social good solve (solve.dssg.io)
作者:rayid ghani,mohak shah
机构:美国芝加哥大学数据科学与公共政策中心
奖金:50,000美元
4、community perspectives on the use of algorithm by govenment
作者:anna brown
国家:新西兰国家研究大学高等经济学院社会数据分析中心
奖金:50,000美元
5、women data science leaders in russia
作者:alena suorova,valena a. ivaniushina
国家:俄罗斯
奖金:13,600美元
6、summer academy in data science for high school students
作者:bamshad mobasher,lucia dettori,raffaella settimi,daniela raicu
机构:美国德保罗大学
奖金:50,000美元
7、empowering community members to understand and use big data and big data methods
作者:lisa schilling,md, msph
机构:科罗拉多大学医学院普通内科
奖金:35,785美元
机构统计:微软以23篇论文居首,中国影响力不容小觑
kdd2018 affiliation statistics 统计了2018年、近三年、近五年各机构在kdd会议中发表论文数量排名,下图展示了2018年排名前十的机构及论文发表数量:
我们的统计显示,前20名中有微软、阿里巴巴、百度等6所机构是企业界的,尤其是第一名微软发表了23篇论文之多,由此可见kdd在企业界的影响力。前20名中又有清华大学、上海交通大学等8所机构是中国的,中国在国际会议上的影响力不容小觑。
2018年论文发表数量排名前二十的作者,几乎清一色是华人:
首先注意到的是前二十名几乎清一色全是华人,前五十名中,华人的数量也占到了80%,可见华人在学术界的影响力,至少是在kdd这个会议上的影响力之大。
排名并列第一的朱文武教授和崔鹏教授都来自清华大学的媒体与网络实验室。
论文情况:research track接收率仅18.4%,其中华人oral超78%
kdd 2018特别强调主流应用的ai开发,并举办了主题是预测伦敦和北京等城市的空气质量的kdd cup竞赛,全球共有4173支队伍参赛。其中,中国团队 getmax 包揽三项大奖,获得两项第一,一项第二的好成绩。
下表总结了kdd 2018的论文接收数量和接受率。
本届kdd共评审了1440篇论文,分为research和applied data science两个track,其中,research track评审了983篇论文,接收181篇,接收率为18.4%;applied data science track评审了497篇论文,接收112篇,接收率为22.5%。
在这些接收论文中,华人/中国人作者参与的oral尤其多,达到了78.5%:
research track papers oral:84篇,占比78.5%
research track papers poster:43篇,占比58.1%
applied data science track oral:22篇,占比55%
applied data science track poster:40篇,占比55.6%
华人/中国人作者总接收论文189篇,占比64.5%
会议管理层:55人里华人有20人,包括一名大会主席和副主席
至于最关键的kdd 2018组织委员会,在所有55人中,华人/中国人有20人。
大会主席:
yike guo(郭毅可),帝国理工学院
faisal farooq, ibm
副主席:
唐杰,清华大学
主委会其他:
chih‑jen lin(林智仁),***大学
熊辉,罗格斯大学/百度研究院
kai sun,帝国理工学院
沈抖,百度
浣军,百度研究院
李天瑞,西南交通大学
张平,ibm
郑宇,京东金融
shipeng yu,ibm
xiaben''hu(胡侠),德州农工大学
王晓光,阿里巴巴
jiliang tang,密歇根州立大学
hang zhang,微软
王薇,加州大学洛杉矶分校
hanghang tong,亚利桑那州立大学
李磊,字节跳动
谢幸,微软
ping huang,帝国理工大学
kdd 初创公司奖(start-up awards):两家中国ixin'h
中国的智能一点和智信科技(crarddix)这两家都榜上有chu'we'mei名。
kdd cup 2018:中国团队getmax包揽三项大奖
kdd cup素有“大数据世界杯”之美誉,吸引全球各地的工程师、开发者和学生参与。今年的题目是预测伦敦与北京的空气质量,获奖团队见上图。
值得一提,今年由罗志鹏,黄坚强,胡可组成的getmax中国团队获得两项第一,一项第二,是唯一包揽三项大奖的团队。去年,以getmax的胡可为队长的convolution团队,也包揽了kdd cup 2017的双料冠军。
赞助商:中国巨头科技公司与创业公司大幅出镜
kdd 2018的赞助商名单也比较有趣,白金级别如下:
金牌赞助商则以一家中国ai创业公司的名字居首:
银牌赞助:
铜牌赞助:

大数据与品牌价值之间是什么关系
Java程序员把机器学习作为主攻方向,未来会有更多的发展机会
51单片机数字钟温度计的编程实例
汽车芯片最厉害的公司
外国用华为设备安全吗 华为:零件70%来自全球
KDD最佳论文:中国拿下Research Track最佳学生论文
最新无人驾驶技术排行榜:百度完爆苹果和特斯拉
工业物联网在生产过程管理体系中应用优势
汽车T-Box方案概述
在AR/VR中使用算法实现帧对齐
万物互联:研发、工程、市场、孵化的一体化功能平台问世
联想凌拓推ThinkSystem DM5100F全闪存阵列,为企业打造数据引擎
SMART常用的运动控制子程序的应用详解
如何构建差动放大器并对其性能进行优化?
变压器绕组的直流电阻测量方法
Allegro SPB15.2进行多人协作布局布线的方法
电容的Q值与D值
发展芯片产业必要性
国产GaN控制芯片在快充领域的优势与不足
木林森、三安光电纷纷发布喜讯,宣布子公司获得上亿元政府补贴