状态 | 总奖池 | 截止时间 | 参赛人数 |
已结束 | ¥180,0000 | 2022-06-20 | 62897 |
近年来,国内各大数据挖掘竞赛平台举办了越来越多的高质量、高水准的数据挖掘竞赛。大量优质的算法在这些竞赛中被设计和创造出来,不断地推动了数据挖掘技术的发展,一代又一代的深度学习算法为社会创造了越来越高的价值。但与此同时,每一场比赛中都有一些队伍用一些没有价值的方案来取得好成绩,他们或是用一些简单的规则和树模型,或是直接在基线的基础上做些简单改动。他们中的一部分甚至取得了比其他人更高的成绩,恶意地抢走了其他人的名次。为找出这些毫无意义的算法,江离俱乐部收集了近200场比赛的近2000支队伍的PPT,希望本场比赛的参赛者能够建立优秀的垃圾方案识别神经网络,找出这些垃圾方案。
赛程安排
2022/01/01 比赛开始
2022/04/01~2022/05/08 初赛
2022/05/12~2022/06/20 复赛
2022/07/03 决赛
初赛
2022/04/01发布初赛数据,同时开放提交。选手生成结果后,可以将结果以邮件的形式发送至官方邮箱,官方将进行评测并将成绩显视在团队成绩页面。每支队伍每天可以提交5次结果。
2022/05/02 00:00截止报名、组队。请在此时间之前完成实名认证。
2022/05/08 00:00初赛截止提交,排名前1000的团队晋级复赛。
复赛
2022/05/12发布数据,同时开放提交。每支队伍每天可以提交5次结果。
2022/06/20 00:00复赛截止提交,排名前5的队伍进入决赛。
决赛
决赛以线下答辩的形式于2022/07/03在江离俱乐部总部举行,组委会为每支队伍提供500元的交通、食宿报销额度,实报实销。
决赛将邀请江离俱乐部成员木贼、泽漆、土豆、重楼、番茄等国际顶级深度学习大师担任评委。在决赛中,选手需按要求提前制作演视文稿,并在答辩现场进行答辩,每队有5分钟的陈述时间和20分钟的评委提问时间。评委将根据选手的答辩表现进行评分,分数范围为0~100。最终排名由线上F1成绩和答辩成绩共同决定,其中线上成绩占比40%,答辩成绩占比60%。
奖项
冠军 10万元人民币(1万元现金+9万元江离代金券)
亚军 5万元人民币(5000元现金+45000元江离代金券)
季军 2万元人民币(2000万元现金+18000元江离代金券)
优胜奖(2支) 500元人民币代金券
成绩特别突出的队伍可以取得江离面试绿色通道,并有机会获得最高160万元的研究经费。
报名与组队
本次比赛对所有人开放,不限年龄、身份和国籍。江离俱乐部成员可以参赛,但不参与评奖。所有参赛选手都应遵守其所在国家、地区的的相关法律。
参赛选手可以自由组队,每队人数上限为5人。
主办方
江离俱乐部第二届世界克莱登杯深度学习大赛组委会
本比赛规则的最终解释权归大赛组委会所有。
(报名后可下载)
train_20220512.csv (4KB)
train_ppt_20220512.zip (12055KB)
test_20220512.csv (1KB)
test_ppt_20220512.zip (3571KB)
test_final_20220619.csv (1KB)
test_ppt_final_20220619.zip (3571KB)
sample_submission.csv (200B)
赛题
本赛题提供基本信息数据和ppt数据各两份,分别为训练集和测试集,其中训练集包含标签,要求本次比赛的参赛者预测测试集中哪些方案是垃圾方案。
数据结构如下
列名
含义
SolutionId
解决方案标识
CompetitionId
竞赛标识
SlideId
幻灯片标识
Score
成绩
Rank
排名
NLinesOfCode
代码行数
Label
标签,是否是垃圾方案
提交数据
列名
含义
SolutionId
选手标识
Label
预测标签
本次比赛在江离数据平台上进行,所有参赛团队必须在该平台上完成数据处理和建模等操作并生成结果。
20220521更新:
由于江离数据平台故障,为协助各位参赛选手完成比赛,现开放数据下载。参赛团队可以在线下生成结果并提交。
评价函数
本赛题采用F1评测。同时,主办方希望选手设计出稳定可靠的方案,会取消过拟合的方案的成绩。
队名
成绩
最优成绩提交日
1
↑748
神经网络真是太强了
0.993
2022-06-20
2
↑367
不超过OTTO不改名
0.991
2022-06-20
3
↑9
OTTO天才帮联合战队
0.988
2022-06-20
4
↑809
I'm American
0.988
2022-06-20
5
木匠
0.985
2022-06-20
6
↑491
摇奖赛
0.983
2022-06-20
7
↑67
我爱神经网络
0.978
2022-06-20
8
↓3
我是OTTO大号
0.978
2022-06-20
9
↑551
TOTO
0.978
2022-06-20
10
↑29
龙泉寺法师
0.978
2022-06-20
11
↑334
摸奖专家
0.975
2022-06-20
12
↑81
????????????????
0.974
2022-06-20
13
↓6
真是野鸡赛
0.972
2022-06-20
14
↑170
oTT0
0.971
2022-06-20
15
↓1
顶级赛事
0.970
2022-06-20
16
↑323
僵梨
0.970
2022-06-20
17
↓16
野鸡赛
0.966
2022-06-20
18
↓2
菜鸡主办方
0.963
2022-06-20
19
↑218
稳健棍
0.961
2022-06-20
20
↓14
T0野鸡赛
0.960
2022-06-20
上一页 [1] 2 3 4 ... 100 下一页
冠军
OTTO天才帮联合战队
亚军
I'm American
季军
不超过OTTO不改名
优胜奖
我爱神经网络
oTT0
2022/06/24 复赛结果公视
主办方已询问各团队的训练成绩并对各团队的过拟合程度进行判断,取消了其中过拟合团队的成绩。
排名
线上成绩
训练成绩
审核结果
神经网络真是太强了
0.9934
0.9926
采用简单规则,成绩无效
1
不超过OTTO不改名
0.9908
0.9912
成绩有效
2
OTTO天才帮联合战队
0.9883
0.9920
成绩有效
3
I'm American
0.9880
0.9917
成绩有效
木匠
0.9846
0.9944
代码乱码,成绩无效
摇奖赛
0.9829
0.9868
队名含有侮辱性词汇,取消成绩
4
我爱神经网络
0.9783
0.9810
成绩有效
我是OTTO大号
0.9782
0.9905
过拟合,成绩无效
TOTO
0.9777
0.9894
成绩无效
龙泉寺法师
0.9775
0.9937
未提交代码,成绩无效
摸奖专家
0.9751
0.9701
过拟合,成绩无效
????????????????
0.9741
未回复训练成绩,成绩无效
真是野鸡赛
0.9723
0.9808
队名含有侮辱性词汇,取消成绩
5
oTT0
0.9709
0.9710
成绩有效
2022/04/16 公告
近期「整河」团队恶意分享基线方案,该方案直接利用PPT页数进行预测,得到较高的成绩。该方案毫无算法价值,给其他团队做出了糟糕的视范。经组委会讨论决定,取消该团队本次比赛的参赛资格。希望大家引以为戒,在接下来的比赛中认真遵守比赛规则。