Menu
Sign In Search Podcasts Charts People & Topics Add Podcast API Pricing
Podcast Image

量化好声音

「量化好声音」02 我如何赢得了Citadel比赛?

02 Jul 2025

Description

量化好声音睡前听一听欢迎大家我是Flora我是Aaron常常有粉丝来问啊我很想入行量化但是简历过不了关怎么办呢Aaron你也招过一些量化研究员了你能不能给大家支个招说说你作为面试官愿意招什么样的人呢好的这方面可以分享的招数啊比较多那今天呢先给大家讲一招就是打比赛打比赛什么样的比赛能够具体讲一讲吗可以那其实量化界有很多个重要的比赛比如简街千禧年他们都有比赛那今天我们给大家介绍的呢是Citadel的DatathonCitadel我知道就是城堡投资嘛它的创始人是肯尼斯·格里芬这可是个传奇人物大学起他就开始投资到今年年初呢他们管理了650亿美元的资产这是世界上最赚钱的对冲基金之一了所以他们组织的比赛含金量可想而知那赢得了这个比赛基本上就拿到了顶级私募的门票确实如此那Citadel的Datathon到底是个什么样的比赛我们应该怎么报名呢Citadel Datathon它是一个数据科学竞赛那这个名字呢来自于马拉松的一个仿造词儿类似的仿造词儿呢还有hackathon等等我知道的hackathon是面向极限编程的一种挑战所以说从名字上听起来这个比赛就挺够劲儿的对这个比赛在量化和数据科学圈子里啊关注度其实还挺高的那今天呢我们整合了一些资料像是官方介绍还有论坛上的一些讨论甚至呢还有一位冠军的经验分享对所以我们今天的目标啊就是要详细介绍这个比赛以及怎么报名参加又如何能成功的脱颖而出好那咱们就直接切入主题啊我们先来说说报名的事儿好的我这边查了一些资料Citadel一年常常会举行好几次的Datathon分布在全球各个地区先是在各个地区举行分赛最后这些分赛的获胜者甚至有可能被邀请到美国总部去参加最后的决赛那今年怎么样现在报名还来得及不到目前为止今年还只是在2月份举办了一次欧洲女性的Datathon其他地区的Datathon目前还没有安排一般来说啊全年会有好几次的Datathon所以距离国内选手可以参加的亚洲Datathon很可能是越来越近了大家可以随时准备着那如果我想要参加今年的Datathon我从哪里可以得到报名的通知信息一般来说我们随时关注Citadel官网主页就好了在Citadel官网主页有一个叫做careers的栏目找到其中的programs & events再到undergraduates菜单下面就可以找到Datathon活动了听起来要找到这个活动页面并不难不过呢你等会会把公众号上面啊会提供一个链接信息对吧是的那对报名者会有哪些要求对国内的选手来说啊要求是在读本科、满18周岁并且学业表现良好预计呢在26年12月到28年6月期间毕业就可以参加这个比赛了那如果你是博士生就要参加博士数据马拉松这个没有毕业时间的要求只要学业良好就可以了这里的学业表现良好是什么意思要求必须是985吗这是个好问题Datathon并没有对国内参赛者的学校做出要求不过啊从过往的数据来看985学校的学生参赛呀确实是会有一些主场优势的这个怎么理解比赛不是在线上进行的吗是的从国内之前的比赛经验来看啊先是线上申请报名这个报名可能会跟前程无忧这样的招聘网站合作申请者在线提交简历和参加评估然后啊官方会从中选择一部分选手邀请他们参加线下的比赛那线下比赛的举办地点呢就会是像在北大清华复旦和华科这样的学校了而且这些学校还会通过自己的渠道发布赛程通知那这么说起来985学校和北京上海武汉等一线城市确实会享受到一些主场的优势对的甚至如果学校在外地会不会主办方在邀请参赛上考虑会务安排难度而减少名额那这个我们就不得而知了对所以啊如果你没有进入Datathon的比赛的这样一个机会怎么办那么其实对普通人来讲呢还有很多去进入量化这一行的机会那这部分呢我们就在后面的节目中再来介绍一句话啊只要有创新的思维办法总比困难多好的刚刚Aaron你提到了在线提交简历的事儿以及在线评估的事情这方面你也给大家介绍一下吧好那这个评估需要一个小时内完成题目呢大概是15道选择和填空题那目前有一些真题泄露出来吗有内容比较多那这些内容呢我们就放在播客对应的资料当中了题目呢大概是两类一类呢是报名环节的在线评估真题我们提供了一个2024年的真题供大家参考另外一类呢是比赛环节的试题这部分的题目啊我们有10套左右都有答案哦那这些题目的难度怎么样呢可不可以透露一些大致有哪些方向呢题目整体上看不算难以数理统计、机器学习和Python编程为主听上去这好像都是我们匡醍课程覆盖的内容啊哈哈现在这是广告时间了对那试题呢我们放在Quantide research platform这个平台上了大家可以在订阅之后进行查看假设我们过了评估阶段那么要如何准备正式的比赛呢一方面可以从我们收集到的历年的试题当中去进行挖掘比如呢这些题他要求使用什么样的技术数据又会以什么样的格式来提供因为比赛他是有时间要求的如果呢我们对数据集的格式不熟悉在数据预处理阶段我们就会花很多时间那显然就会在进度上显著落后于他人这点呢在我们后面的分享中还会看到非常有道理其实这些我们从过往的真题中应该都能够看出来有哪些是必须掌握的基本功除了这些之外有没有真正参加过比赛的人可以分享一下经验呢还真有那这里呢我们采访了David Veitch他赢得了2021年的博士数据马拉松冠军他是多伦多大学的统计学博士现在担任美国银行的固收交易员他是啊 2021年的PHD Datathon作为博士呢他是一般要求是独立参赛啊而不是组队了解了那这里你可能要给大家再介绍一下组队的事儿对博士阶段的比赛一般是独立参赛其他阶段的Datathon官方要求呢还是组队参赛组队呢可以自己组织也可以由官方指派当然了如果是自己组队的话可能合作上会更默契也会从而就更有优势那比赛时间是多久最后提交的成果又是什么样的呢以David参加的比赛为例啊那一年呢比赛是时间是一周最后要求提交一份15页左右的报告参赛的题目是利用气候相关数据来发现和分析与全球变暖成因及影响相关的模式听起来这个是属于生态学的范畴了呀那大家可能会关心如果说我们碰到这样的题目它是属于自己之前没有接触过的领域那怎么办呢对通常来说试题都会超过你博士阶段的研究范围而且呢时间只有一周所以你必须充分利用自己啊已有的技能那对David Veitch来讲他对时间序列分析非常熟悉所以在比赛当中啊一开始就打定主意要利用平稳时间序列分析来分析和研究数据以期呢找到一个结论同时呢他也啊对R语言是掌握得非常熟练那么这对他清洗数据以及啊得出最终的结论以及结论的可视化都起到了关键的作用对那从David的介绍来看在这个过程当中懂得如何搜索特别是找到那些补充数据集也是非常重要的那比如说David在进行了几天的研究之后啊发现他的模型需要一个雨水数据集这个可是主办方没有提供的好在他很快通过谷歌搜索找到了一个雨水数据集并且呢还附赠了一个更好的温度数据集与组织方提供的数据集相比啊多出了一类非常重要的数据就是最高温度所以David他在面对问题的时候非常灵活办法也很多对的但是在处理这两个数据集时其实David还是遇到了很多问题的这些数据是以他没有见过的格式存储的好在最后他在网上找到了如何去解析这种格式的文章所以这就看出来我们平时多练习的重要性了在解决工程问题上你花时间多了那么在最重要的分析构建模型上面花的时间必然就会少是的这些是hard skill方面的技巧那最后呢David还分享了一个没有证据但是他自己认为是非常重要的观点就是你不能假设评委什么都懂或者他有足够的时间来研究你的报告他的原话是这样的我知道评委的注意力有限因此啊他对可视化是非常重视的所以David的经验总结起来首先呢你要熟悉一门编程语言尤其是跟统计相关的库是的从David的例子来看是这样子的时间序列分析呢是他的专长对我们熟悉Python的听众来说呢可能需要掌握一下Scipy和statsmodels这两个库另外在这种级别的比赛中可能也需要掌握机器学习库比如Sklearn另外他也提到我知道评委的注意力有限这也是很有意思的一句话那实际上我觉得这是一个非常重要的经验因为不止在这样一个大赛当中有评委在工作当中我们的领导和用户他们都是评委而他们呢都有一个共同点就是注意力有限如何把我们的工作更好的呈现出来这也很重要还有一点就是平常我们也需要多关注在什么地方你可以找到有用的数据结那尽管我们可以临时去搜索但毕竟呢比赛它是有时间限制的如果有自己一些熟悉的站点这样就不容易跑空对的我记得我们在因子挖掘与机器学习策略这门课中也讲到了去哪里找数据对吧对毕竟机器学习最重要的部分之一就是数据data song比赛的奖项是怎么设置的呢一般各个地区赛他都会有一到三等奖不过名额不多最后的决赛呢一般只授予一个小组不过只要你进了决赛那即使拿不到奖金和证书各种现场照片新闻报道也不会少那这些都是可以记入自己的简历的对找工作非常有帮助好的那关于Datathon我们应该介绍的很全面了如果听众朋友们要想获取评估阶段和比赛阶段的真题这个资料啊我们对会员都是开放的那你要不要介绍一下会员都有哪些福利这个会员啊指的是Quantide Research platform我们在公众号发的一些文章许多都配有Notebook这些notebook都是在这个平台上可以查看和运行的对关于Datathon的真题我们也会陆续放进来好的以上就是本期的所有内容啦我们下期再见!再见!

Audio
Featured in this Episode

No persons identified in this episode.

Transcription

This episode hasn't been transcribed yet

Help us prioritize this episode for transcription by upvoting it.

0 upvotes
🗳️ Sign in to Upvote

Popular episodes get transcribed faster

Comments

There are no comments yet.

Please log in to write the first comment.