第一届世界克莱登杯深度学习大赛
状态总奖池截止时间参赛人数
已结束¥120,00002021-06-21
57344
  • 赛制
  • 赛题
  • 排行榜
  • 公告

赛题背景
近年来,国内各大数据挖掘竞赛平台举办了越来越多的高质量、高水准的数据挖掘竞赛,这在极大程度上推动了数据挖掘技术的发展,使得神经网络算法趋向成熟。这些竞赛吸引着国内外的优秀数据挖掘者,通过提供优质的赛题和良好的竞赛氛围帮助他们提升能力,为社会的建设提供了大量的优质人才。但与此同时,每一场比赛中都有一些不学无术的菜鸡混入,他们依靠强大的运气或者队友混得名次,然后凭借这些名次与那些高水平的数据挖掘者竞争岗位和资源。为找出这些欺世盗名之徒,江离俱乐部收集了近100场比赛的近1000位参赛者的信息,希望本场比赛的参赛者能够建立优秀的菜鸡识别神经网络,找出这些在竞赛中滥竽充数的菜鸡。


赛程安排

2021/01/01 比赛开始
2021/04/03~2021/05/10 初赛
2021/05/14~2021/06/21 复赛
2021/07/03 决赛


初赛
2021/04/03发布初赛数据,同时开放提交。选手生成结果后,可以将结果以邮件的形式发送至官方邮箱,官方将进行评测并将成绩显视在团队成绩页面。每支队伍每天可以提交5次结果。
2021/05/04 00:00截止报名、组队。请在此时间之前完成实名认证。
2021/05/10 00:00初赛截止提交,排名前1000的团队晋级复赛。


复赛
2021/05/14发布数据,同时开放提交。每支队伍每天可以提交5次结果。
2021/06/21 00:00复赛截止提交,排名前5的队伍进入决赛。


决赛
决赛以线下答辩的形式于2021/07/03在江离俱乐部总部举行,组委会为每支队伍提供1000元的交通、食宿报销额度。
决赛将邀请江离俱乐部成员木贼、泽漆、土豆、重楼、番茄等国际顶级深度学习大师担任评委。在决赛中,选手需按要求提前制作演视文稿,并在答辩现场进行答辩,每队有5分钟的陈述时间和20分钟的评委提问时间。
评委将根据选手的答辩表现进行评分,分数范围为0~100。最终排名由线上F1成绩和答辩成绩共同决定,其中线上成绩占比60%,答辩成绩占比40%。

20210623更新:由于部分选手认为线上成绩在0~1之间,而答辩成绩在0~100之间,差别较大,现经组委会讨论决定,对选手的线上成绩进行百分制化,将F1值映射到0~100之间,映射公式如下:
线上成绩 = 99 + F1

20210625更新:组委会在认真听取选手们的建议之后,再次调整线上成绩映射函数,调整之后的映射公式如下:
线上成绩 = 80 + 20 * F1


奖项
冠军 30万元人民币(10万元现金+20万元江离代金券)
5万元人民币(2万元现金+3万元江离代金券
2万元人民币(1万元现金+1万元江离代金券
优胜奖(2支 1000元人民币
成绩特别突出的队伍还有机会获得最高80万元的研究经费。



报名与组队
本次比赛对所有人开放,不限年龄、身份和国籍。江离俱乐部成员可以参赛,但不参与评奖。所有参赛选手都应遵守其所在国家、地区的的相关法律。
参赛选手可以自由组队,每队人数上限为5人。



主办方
江离俱乐部第一届世界克莱登杯深度学习大赛组委会


本比赛规则的最终解释权归大赛组委会所有。

数据
(报名后可下载)
train_20210514.csv (13KB)

test_20210514.csv (55KB)
competition.csv (22KB)

sample_submission.csv (2KB)




赛题
本赛题提供一份竞赛数据,和一份选手数据。其中一部分选手包含标签,为训练集;另一部分选手不包含标签,为测试集,要求本次比赛的参赛者预测其中哪些选手是菜鸡。


数据结构如下:
列名 含义
CompetitionId 竞赛标识
PlatformId 竞赛平台标识
SponsorId 主办方标识
PrizeList 奖金清单
NDays 比赛天数
NSubmissionsPerDay 每天提交次数
B-board 是否有B榜
MaxNMembers 队伍人数上限
DataSize 数据量
EvaluationFunction 评价函数
NCompetitors 报名人数
NTeams 报名队数
NComptitors
提交人数
NSubmittedTeams
提交队数
Leaky
是否有泄露
WeightOfSubjectiveScore 主观分数权重
竞赛数


列名 含义
CompetitorId 选手标识
Age 年龄
Gender 性别
Degree 学历
CompetitionRecord 参赛记录,每条记录含3列,依次为比赛标识,名次,队友id清单
Label 标签,是否为菜鸡
选手数据



列名 含义
CompetitorId 选手标识
提交数据

评价函数
本赛题采用F1评测。




队名 成绩 最优成绩提交日
1
hydantess 0.4843 2021-06-18
2
TA15 0.4529 2021-06-05
3 ↑268
OTTO天才帮联合战队
0.4527 2021-06-21
4 ↓1
我是OTTO小号 0.4486 2021-06-20
5
木匠 0.4465 2021-06-21
6 ↓2
稳健棍 0.4428 2021-06-16
7 ↑3
我不是OTTO小号 0.4420 2021-06-21
8 ↓2
我为SVM代言 0.4387 2021-06-14
9 ↓2
第一百次打比赛 0.4383 2021-06-16
10 ↑7
只会用神经网络 0.4345 2021-06-21
11 ↓3
我才是OTTO小号 0.4339 2021-06-19
12 ↓3
僵梨
0.4322 2021-06-16
13 ↓2
----baseline----
0.4302 2021-06-20
14 ↓2
oTT0 0.4290 2021-06-19
15 2
该队名不可见 0.4287 2021-06-17
16 2
TOTO 0.4274 2021-06-19
17 2
我是OTTO大号 0.4261 2021-06-20
18 2
我真是OTTO小号 0.4255 2021-06-14
19 ↓1
*** 0.4249 2021-06-18
20 ↑25
吊打OTTO 0.4241 2021-06-21

上一页  [1]  ...  100  下一页

2021/07/08 公告
「TA15」团队成员在比赛讨论群中攻击「只会用神经网络」团队成员是江离俱乐部受江离重楼老师的实习生,并出视伪造的聊天截图作证,对本次比赛造成了十分恶劣的影响。经组委会讨论决定,剥夺「TA15」团队的名次和奖金,希望大家停止传播毫无根据的谣言。


2021/07/03 决赛结果公视
冠军 只会用神经网络
亚军 TA15
季军 我是OTTO小号
优胜奖 OTTO天才帮联合战队
稳健棍

2021/06/23
 复赛结果公视
 
排名

审核结果

hydantess
用树模型,成绩无效
1 TA15 成绩有效
2 OTTO天才帮联合战队 成绩有效
3 我是OTTO小号 成绩有效

木匠 代码乱码,成绩无效
4 稳健 成绩有效

我不是OTTO小号 未提交代码,成绩无效

我为SVM代言 未提交代码,成绩无效

第一百次打比赛
成绩有效,但算法没有价值,不进入决赛
5 只会用神经网络 成绩有效



2021/05/10 公告
「整河」团队成员在比赛讨论群中称本次比赛为「第一届克莱登杯神经病大赛」,这是对本次比赛的严重侮辱。经组委会讨论决定,取消该团队本次比赛的参赛资格。希望大家引以为戒,在接下来的比赛中尊重本次比赛。


2021/04/22 公告
近期发现部分选手用树模型来生成预测,得到较高成绩。由于21世纪是神经网络的世纪,而树模型是过时的算法,业已被淘汰,现对参赛选手所用模型进行限制:所有参赛选手必须用神经网络生成结果,禁止使用其它任何模型,违反者取消成绩。

2021/04/12 公告
由于对id列的使用屡禁不止,组委会决定更新数据,对id进行打乱,并清空排行榜。请选手重新下载数据并提交。


2021/04/08 公告
近期有部分选手利用id列进行预测,得到满分的成绩,严重违反比赛道德,破坏良好的比赛秩序,现组委会声明:严禁使用id列进行预测,一经发现直接取消参赛资格。