第二届世界克莱登杯深度学习大赛
状态总奖池截止时间参赛人数
已结束¥180,00002022-06-20
62897
  • 赛制
  • 赛题
  • 排行榜
  • 公告

赛题背景
近年来,国内各大数据挖掘竞赛平台举办了越来越多的高质量、高水准的数据挖掘竞赛。大量优质的算法在这些竞赛中被设计和创造出来,不断地推动了数据挖掘技术的发展,一代又一代的深度学习算法为社会创造了越来越高的价值。但与此同时,每一场比赛中都有一些队伍用一些没有价值的方案来取得好成绩,他们或是用一些简单的规则和树模型,或是直接在基线的基础上做些简单改动。他们中的一部分甚至取得了比其他人更高的成绩,恶意地抢走了其他人的名次。为找出这些毫无意义的算法,江离俱乐部收集了近200场比赛的近2000支队伍的PPT,希望本场比赛的参赛者能够建立优秀的垃圾方案识别神经网络,找出这些垃圾方案


赛程安排

2022/01/01 比赛开始
2022/04/01~2022/05/08 初赛
2022/05/12~2022/06/20 复赛
2022/07/03 决赛


初赛
2022/04/01发布初赛数据,同时开放提交。选手生成结果后,可以将结果以邮件的形式发送至官方邮箱,官方将进行评测并将成绩显视在团队成绩页面。每支队伍每天可以提交5次结果。
2022/05/02 00:00截止报名、组队。请在此时间之前完成实名认证。
2022/05/08 00:00初赛截止提交,排名前1000的团队晋级复赛。


复赛
2022/05/12发布数据,同时开放提交。每支队伍每天可以提交5次结果。
2022/06/20 00:00复赛截止提交,排名前5的队伍进入决赛。


决赛
决赛以线下答辩的形式于2022/07/03在江离俱乐部总部举行,组委会为每支队伍提供500元的交通、食宿报销额度,实报实销。
决赛将邀请江离俱乐部成员木贼、泽漆、土豆、重楼、番茄等国际顶级深度学习大师担任评委。在决赛中,选手需按要求提前制作演视文稿,并在答辩现场进行答辩,每队有5分钟的陈述时间和20分钟的评委提问时间。
评委将根据选手的答辩表现进行评分,分数范围为0~100。最终排名由线上F1成绩和答辩成绩共同决定,其中线上成绩占比40%,答辩成绩占比60%。



奖项
冠军 10万元人民币(1万元现金+9万元江离代金券)
 5万元人民币(5000元现金+45000元江离代金券
2万元人民币(2000元现金+18000元江离代金券
优胜奖(2支 500元人民币代金券
成绩特别突出的队伍可以取得江离面试绿色通道,并有机会获得最高160万元的研究经费。



报名与组队
本次比赛对所有人开放,不限年龄、身份和国籍。江离俱乐部成员可以参赛,但不参与评奖。所有参赛选手都应遵守其所在国家、地区的的相关法律。
参赛选手可以自由组队,每队人数上限为5人。



主办方
江离俱乐部第二届世界克莱登杯深度学习大赛组委会


本比赛规则的最终解释权归大赛组委会所有。

数据
(报名后可下载)
train_20220512.csv (4KB)
train_ppt_20220512.zip (12055KB)

test_20220512.csv (1KB)
test_ppt_20220512.zip (3571KB)
test_final_20220619.csv (1KB)
test_ppt_final_20220619.zip (3571KB)

sample_submission.csv (200B)




赛题
本赛题提供基本信息数据和ppt数据各两份,分别为训练集和测试集,其中训练集包含标签,要求本次比赛的参赛者预测测试集中哪些方案是垃圾方案。


数据结构如下
列名 含义
SolutionId 解决方案标识
CompetitionId
竞赛标识
SlideId 幻灯片标识
Score 成绩
Rank 排名
NLinesOfCode 行数
Label 标签,是否是垃圾方案
基本信息数据

列名 含义
SolutionId 选手标识
Label 预测标签
提交数据

本次比赛在江离数据平台上进行,所有参赛团队必须在该平台上完成数据处理和建模等操作并生成结果。

20220521更新:
由于江离数据平台故障,为协助各位参赛选手完成比赛,现开放数据下载。参赛团队可以在线下生成结果并提交。


评价函数
本赛题采用F1评测。同时,主办方希望选手设计出稳定可靠的方案,会取消过拟合的方案的成绩。



队名 成绩 最优成绩提交日
1 ↑748
神经网络真是太强了 0.993 2022-06-20
2 ↑367
不超过OTTO不改名 0.991 2022-06-20
3 ↑9
OTTO天才帮联合战队
0.988 2022-06-20
4 ↑809
I'm American 0.988 2022-06-20
5
木匠 0.985 2022-06-20
6 ↑491
摇奖赛 0.983 2022-06-20
7 ↑67
我爱神经网络
0.978 2022-06-20
8 ↓3
我是OTTO大号 0.978 2022-06-20
9 ↑551
TOTO 0.978 2022-06-20
10 ↑29
龙泉寺法师 0.978 2022-06-20
11 ↑334
摸奖专家 0.975 2022-06-20
12 ↑81
???????????????? 0.974 2022-06-20
13 ↓6
真是野鸡赛 0.972 2022-06-20
14 ↑170
oTT0 0.971 2022-06-20
15 ↓1
顶级赛事 0.970 2022-06-20
16 ↑323
僵梨 0.970 2022-06-20
17 ↓16
野鸡赛 0.966 2022-06-20
18 ↓2
菜鸡主办方 0.963 2022-06-20
19 ↑218
稳健棍 0.961 2022-06-20
20 ↓14
T0野鸡赛 0.960 2022-06-20

上一页  [1]  ...  100  下一页

2022/07/03 决赛结果公视
冠军 OTTO天才帮联合战队
亚军 I'm American
季军 不超过OTTO不改名
优胜奖 我爱神经网络
oTT0

2022/06/24
 复赛结果公视
 
主办方已询问各团队的训练成绩并对各团队的过拟合程度进行判断,取消了其中过拟合团队的成绩。
排名

线上成绩 训练成绩 审核结果

神经网络真是太强了
0.9934 0.9926 采用简单规则,成绩无效
1 不超过OTTO不改名 0.9908 0.9912 成绩有效
2 OTTO天才帮联合战队 0.9883 0.9920 成绩有效
3
I'm American
0.9880 0.9917 成绩有效

木匠 0.9846 0.9944 代码乱码,成绩无效

摇奖赛 0.9829 0.9868 队名含有侮辱性词汇,取消成绩
4
我爱神经网络 0.9783 0.9810 成绩有效

我是OTTO大号 0.9782 0.9905 过拟合,成绩无效

TOTO 0.9777 0.9894 成绩无效

龙泉寺法师
0.9775 0.9937 未提交代码,成绩无效

摸奖专家
0.9751 0.9701 过拟合,成绩无效

????????????????
0.9741
未回复训练成绩,成绩无效

真是野鸡赛
0.9723 0.9808 队名含有侮辱性词汇,取消成绩
5 oTT0
0.9709 0.9710 成绩有效

2022/04/16 公告
近期「整河」团队恶意分享基线方案,该方案直接利用PPT页数进行预测,得到较高的成绩。该方案毫无算法价值,给其他团队做出了糟糕的视范。经组委会讨论决定,取消该团队本次比赛的参赛资格。希望大家引以为戒,在接下来的比赛中认真遵守比赛规则