江离团队安泰跨境电商智能算法大赛方案简述
来源: | 作者:木贼 | 发布时间: 2020-01-07 | 2221 次浏览 | 分享到:
安泰跨境电商智能算法大赛

(注:此演示文稿为原始版本,与决赛时所采用版本略有不同)

演视文稿下载链接

代码链接




  天池安泰杯跨境电商智能算法大赛也是江离参加的「天池四赛」之一。这场比赛比较突出的特点是主办方是少见的合格的数据挖掘竞赛主办者,因而这场比赛也是天池近期的比赛中公平性较强的一场。

  一个合格的数据挖掘竞赛主办者应该充分维护比赛公平和公正性、充分尊重客观事实,不因自己的主观意愿而篡改成绩,不把学术界和工业界的不正之风带入比赛中。这场比赛的主办方上海交通大学安泰经济与管理学院虽然并非研究数据挖掘方向的学院,却有着远强于各种号称「专业做机器学习和AI算法」的组织的数据挖掘精神,他们对科学的严谨态度值得称赞。数据挖掘界需要更多的安泰学院。




关于我们的方案

  我们的方案实在是没什么好讲的。 简单来说,我们构建了两个模型,一个用来预测用户历史交互过的商品,一个用来预测历史未交互的商品,其中后者是用我们设计的规则选取的候选;我们提取了各种统计特征,并分别训练了两个lightgbm模型,然后用这两个模型做出预测。这些可以参考我们的演示文稿。


图0 这一页可能比较重要