このレポジトリはNNNS (Numerai Neural Network Studies)という、neural networkを使ってNumerai Tournamentで勝ちたい人たちの勉強会(モブプロ会)の資料を置いておく場所です。
NumeraiはいまだKaggleのようにNN無双になっておらず、NNが活躍できる余地は十二分にあるように思えます。しかし、NNのNumeraiのようなテーブルデータにおける利用のベストプラクティスはまだまだないのが現状です。そのため、最新の技術を含めNNについて学びどんどん実装をしていくことで、Numerai Tournamentで勝てるNNを見つけていくことが本勉強会の狙いです。超えるぞXGB!
週1(?)1時間くらいでオンライン開催。モブプロ形式(5名程度参加?初心者と経験者両方いるのがBest)で実装を行う?
- 画面共有 --> Google Meets (会直前にリンク共有)
- モブプロ --> VScode Live Share (Google Meets内でリンク共有)
簡単な自己紹介。
Goal、実装の方針を決める(書く)。
<モブ> 共有画面を見ながら、解決すべき課題や問題に集中し、解決策を考えてディスカッション、提案する <タイピスト> モブ全員の合意が取れた操作やコードを入力する
Goalが達成できたら、みんなで喜ぶ。
モブプロ終了時に、次回のモブプロに向けて振り返り。
- 心理的安全性
- Time keeping
GCP Deep Learning VM Imageを使う予定。Notebookいるか? このリポジトリでそのままコードをGit管理する
Numerai Tournament Legacy Data
使用データのdata_type
に準ずる (要はtime-series split)
Sharpe ratio...Numerai Diagnostics toolを使った方がいいかも
しない(あくまでNN力を高める目的のため)
kerasを予定(pytorchわからんので教えてくれる人いたらpytorchでも)
- Baseline model (simple MLP)
- Normalization
- Batch size
- Activation function
- Optimizer
- Learning rate scheduler (reducelronplateau, cosine annealing)
- Loss function (MSE, BCE, crossentropy, weighted kappa, corr)
- Wide & Deep
- Deep & Cross
- Gated residual and variable selection network
- Neural decision forest
- Tabnet
- TabTransformer
- Denoising Auto Encoder
- 1DCNN
- evojax
and more...