墨尔本2019年2月18日电 /美通社/ -- 2月15日,在澳大利亚墨尔本圆满闭幕的第12届网络搜索与数据挖掘国际会议(WSDM 2019)上,卧龙大数据AI团队陈维龙获得 WSDM Cup 挑战赛第一名的成绩,这是中国企业参赛者首次在该赛事上取得的最高名次(去年WSDM 2018大赛上阿里AliOS 算法团队获得第二名)。
WSDM 被誉为信息检索领域顶级的会议之一,会议的关注点为搜索、数据检索、数据挖掘、算法设计、算法分析、经济影响方面的实际且严谨的研究,以及对准确率和运行速度的深入实验探究,今年已经是 WSDM 的第十二届会议。
本次 WSDM Cup 有来自全球 744 支队伍参赛,论文接收率约为16%。此次比赛的赛题内容是预测短视频APP应用在用户快速增长阶段中的用户留存率,从而进一步挖掘提高用户留存率及影响用户留存的原因。
卧龙大数据陈维龙设计了一种实用的机器学习方法来应对这样的挑战,包括特征工程、Lightgbm、CatBoost等决策树方法,RNN-ManyToMany等深度学习的方法,以及学习模型的堆叠。决策树对于特征工程的挖掘具有非常好的效果体现,而RNN-ManyToMany相对于传统方式,不需要过多地处理输入序列,可以直接输入各种行为序列。通过余弦退火快照集成,从而以非常低的成本获得大量不同的局部最优值。通过多次优化完善,陈维龙最终算法组件和可解释性组件综合得分第一,取得冠军。
在此之前,卧龙大数据已经深度研究过该类问题并制定了解决方案,去年卧龙大数据就已经和本地运营商合作,建模研究运营商在网用户的离网概率和离网原因,最终获得了极高的准确率,并将之拓展应用到运营商、金融等多个领域的用户分析研究之中。