Kaggle Notebooks Ranking TOP5 になるまでを振り返る

このたび Kaggle Notebooks Ranking で TOP5 になることができたので振り返ります。

https://www.kaggle.com/yasufuminakama

はじめに

この記事では、自分が投稿してきた Kaggle Notebooks を振り返っていきたいと思います。現行コンペの Notebooks に関してはコンペ終了後に追記することにします。

はじめて投稿した Notebook

はじめて投稿した Notebook は DSB2019 での順序尺度のラベルを回帰で解く Notebook でした。投稿時点で回帰で解くような Notebook がなかったので、あくまでサンプルとして、大したスコアが出ないような Notebook として出したことを覚えています。自分は PetFinder コンペでこのテクニックを学んだので、誰かがいずれ共有するなら先に自分が共有しようと思って投稿しました。

[Public] DSB2019 LGBM Regression Sample | Kaggle

わざわざ [Public] と書いているのに初々しさを感じます笑。

このはじめての Notebook 投稿以来、Notebook を投稿することのハードルが下がったと感じているので、一歩踏み出す勇気は大事だと思いました。

Notebook を投稿するときの心がけ

Notebook を投稿するときは、「このアプローチでこれくらいの CV が出てこれくらいの LB が出るという目安になる」ような Notebook であるように心がけています。当たり前のことではありますが、それができていない Notebook も見てきたので...

Image Notebooks

PANDA コンペ

順序尺度のラベルを Classification で解く Notebook と Regression で解く Notebook を共有しました。

Cassava コンペ

ベースラインとなりそうな Notebook を共有しました。

RANZCR コンペ

ベースラインとなりそうな Notebook を共有しました。

Discussion で出ていたアイデアを実装した Notebook も共有しました。Kaggle の Resource を最大限活用できるように training は TPU でも動作するようにしました。

BMS コンペ

初めて取り組む Image Captioning でしたが、数日かけて作成したベースラインとなりそうな Notebook を共有しました。

Tabular Notebooks

MoA コンペ

テーブルデータに対する PyTorch NN のベースラインを公開しました。ここまで Upvote をもらえると思っていなかったので感謝。

単純な LGB のベースラインを共有しました。

OSIC コンペ

このコンペでは LGB と Ridge のベースラインを投稿していて、このコンペのデータに対しては LGB よりも Ridge の方が精度が出るということを共有しました。

終わりに

ここまでたくさんの Notebook を投稿してきて、Kaggle Notebooks Ranking で TOP5 になることができました。感謝のコメントはもちろん励みになるのですが、指摘のコメントももらえるのがとてもありがたいと感じています。まだ投稿することのできていない分野もあるので、引き続き頑張っていきたいと思います。